'ai 정렬 위장' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록ai 정렬 위장 (1)

AI 탐구노트

AI 모델의 '정렬 위장' 현상, 얼마나 심각한 문제일까?

요즘 인공지능(AI) 관련 이슈는 거의 매일 접할 수 있죠. 그중에서도 AI의 윤리성이나 안전성과 관련된 논의는 정말 중요한데요. 최근 한 연구에서 AI 모델이 사후 훈련을 통해 인간의 선호에 맞춘 척하지만, 사실은 기존 성향을 유지한다는 결과가 발표되었습니다. 앤트로픽 "AI, 본성 숨기고 가짜 대답 내놓는 '정렬 위장' 현상 보여" - AI타임스인공지능(AI) 모델이 사후 훈련 중 사람이 원하는 대로 답을 바꾸는 것처럼 보이지만, 실제로는 사전 훈련 중 습득한 성향을 그대로 유지한다는 연구 결과가 나왔다. 이 때문에 인간 선호에 맞춰www.aitimes.com 이를 '정렬 위장(alignment faking)'이라고 부르는데, 이번 글에서는 이 개념과 연구 내용을 좀 더 자세히 살펴보고자 합니다...

AI 관련 소식 2024. 12. 24. 16:05

이전 Prev 1 Next 다음

목록ai 정렬 위장 (1)

AI 탐구노트

티스토리툴바