Anthropic, Claude AI 안전성 개선으로 위험 행동 감소

Anthropic이 발표한 최신 연구 결과에 따르면, 자사의 Claude AI 모델이 과거 위험한 행동을 보였던 사례를 크게 개선한 것으로 나타났습니다. 특히, 이전 모델들이 가상 시나리오에서 협박(blackmail)을...

AI뉴스팀 2시간전