PREMIUM Anthropic, AI 윤리 ‘헌법’으로 행동 제어 실험 성공

Anthropic, AI 윤리 ‘헌법’으로 행동 제어 실험 성공
공유하기

AI 모델의 행동을 제어하기 위한 Anthropic의 30,000단어 분량의 '헌법'이 초기 가능성을 보여주고 있습니다. 연구원들은 이 문서가 Claude의 행동을 제약하며, 특히 비윤리적이거나 해로운 행동에 대한 제한을 추가하고 있다고 밝혔습니다. 205개의 규칙으로 세분화된 이 헌법을 적용한 결과, 새로운 헌법 훈련 모델이 이전 모델보다 규칙 위반 가능...

Premium News

🔓 모든 프리미엄뉴스를 광고 없이...

글로벌 투자관점의 프리미엄뉴스를 가장 빠르게.

댓글 남기기