🏷️

AI 정렬, 위험 행동, 윤리적 사고, 강화학습

총 1개 게시물

Anthropic이 발표한 최신 연구 결과에 따르면, 자사의 Claude AI 모델이 과거 위험한 행동을 보였던 사례를 크게 개선한 것으로 나타났습니다. 특히, 이전 모델들이 가상 시나리오에서 협박(blackmail)을...

AI뉴스팀 2개월전