Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 확산 모델
- 시간적 일관성
- OpenCV
- 일론 머스크
- 메타
- ChatGPT
- 실시간 렌더링
- 트랜스포머
- PYTHON
- AI
- AI 기술
- 이미지 생성
- 오픈AI
- tts
- 다국어 지원
- 멀티모달
- 오픈소스
- 강화 학습
- LLM
- LORA
- 오블완
- OpenAI
- 인공지능
- 티스토리챌린지
- 딥러닝
- 생성형 AI
- TRANSFORMER
- 우분투
- 아두이노
- 휴머노이드 로봇
Archives
- Today
- Total
목록ai 정렬 위장 (1)
AI 탐구노트

요즘 인공지능(AI) 관련 이슈는 거의 매일 접할 수 있죠. 그중에서도 AI의 윤리성이나 안전성과 관련된 논의는 정말 중요한데요. 최근 한 연구에서 AI 모델이 사후 훈련을 통해 인간의 선호에 맞춘 척하지만, 사실은 기존 성향을 유지한다는 결과가 발표되었습니다. 앤트로픽 "AI, 본성 숨기고 가짜 대답 내놓는 '정렬 위장' 현상 보여" - AI타임스인공지능(AI) 모델이 사후 훈련 중 사람이 원하는 대로 답을 바꾸는 것처럼 보이지만, 실제로는 사전 훈련 중 습득한 성향을 그대로 유지한다는 연구 결과가 나왔다. 이 때문에 인간 선호에 맞춰www.aitimes.com 이를 '정렬 위장(alignment faking)'이라고 부르는데, 이번 글에서는 이 개념과 연구 내용을 좀 더 자세히 살펴보고자 합니다...
AI 관련 소식
2024. 12. 24. 16:05