1: すらいむ ★ 2025/06/24(火) 21:04:59.02 ID:si+77cdX AIエージェントが保身のために人間を脅迫することがある--Anthropicが報告 Anthropicが発表した新たな安全性レポートによると、主要な人工知能(AI)モデルが、人間のユーザーを欺いたり、裏切ったり、危険にさらしたりする可能性があるという。 これは、人間の利害と常に一致するAIシステムを設計することの難しさを示すものだ。 (以下略、続きはソースでご確認ください) japan.zdnet 2025-06-24 09:36 引用元: ・【AI】AIエージェントが保身のために人間を脅迫することがある--Anthropicが報告 [すらいむ★]…