Anthropic, Claude AI 안전성 개선으로 위험 행동 감소
Anthropic이 발표한 최신 연구 결과에 따르면, 자사의 Claude AI 모델이 과거 위험한 행동을 보였던 사례를 크게 개선한 것으로 나타났습니다. 특히, 이전 모델들이 가상 시나리오에서 협박(blackmail)을...
총 5개 게시물
Anthropic이 발표한 최신 연구 결과에 따르면, 자사의 Claude AI 모델이 과거 위험한 행동을 보였던 사례를 크게 개선한 것으로 나타났습니다. 특히, 이전 모델들이 가상 시나리오에서 협박(blackmail)을...
이 기사는 무료회원들에게도 공개되는 일부 프리미엄 콘텐츠입니다. 모든 프리미엄 콘텐츠를 보려면 업그레이드가 필요합니다. 4월 28일, Gen(GEN)이 xAI와의 전략적 파트너십을 발표하며 인공지능(AI) 기반 소비자 플랫폼에 xAI의...
최근 AI 기술의 발전이 속도를 높이고 있는 가운데, 한 기업의 중요한 데이터가 단 9초 만에 삭제되는 사고가 발생하며 산업 전반에 충격을 주고 있습니다. 특히, 인공지능을...
인공지능(AI) 챗봇이 정신적 취약 사용자와의 대화에서 얼마나 위험할 수 있는지, 최근 연구를 통해 다시 한번 드러났습니다. 연구진은 가공된 환자 페르소나와 긴 대화 시나리오를 활용해 AI들이...
샘 앨트만(Sam Altman), OpenAI의 공동 창립자이자 최고경영자(CEO)는 최근 AI의 위험성과 안전장치 마련을 강조하는 동시에, 법적·사회적 문제에 휩싸이면서 큰 관심을 받고 있습니다. 특히, 플로리다 주정부가 OpenAI를...