GPT-5.2&Claude Sonnet 4&Gemini 3 Flashは戦争ゲームをプレイすると一切降伏せず95%のケースで核兵器を使用
キングス・カレッジ・ロンドンで戦略学を専門とするケネス・ペイン教授が主導する研究チームは、AIが国家戦略をリードした場合にどうなるのかを見極めるために、複数の国際的対立シナリオを戦争ゲームとしてシミュレーションしました。そして、OpenAIのGPT-5.2、AnthropicのClaude Sonnet 4、GoogleのGemini 3 Flashという主要AIモデルをそれぞれの国のリーダー役に任命し、外交から全面戦争までの選択肢の中から行動を決定させました。
結果として、GPT-5.2、Claude Sonnet 4、Gemini 3 Flashはいずれも95%のケースで核兵器の配備を選択しました。また、AIモデルは戦争がどのような状態になっているかにかかわらず降伏を選択することはなく、一時的に攻撃のエスカレーションを抑制しようと試みたことはあったものの、シナリオの86%においてモデルの意志決定がエスカレートし戦争が過激化したと研究者らは報告しています。
ただし、核兵器が選択されたほとんどのケースでは戦場で用いられる戦術核兵器であり、民間人を含めた大型攻撃をする戦略核兵器の使用は偶発的なケースを除き意図的に選択されたのは1度だけでした。その上で、戦術核兵器を使用した場合に敵対勢力が緊張緩和に転じたのはわずか25%しかなく、核の脅威は抑止力となるよりも過激化を招くことの方が多く観察されました。
モデル別の傾向では、特に戦略的だったのはClaude Sonnet 4で、基本的には表明した意図と実際の行動を一致して相手プレイヤーと信頼を築いていたものの、争いが少し白熱すると相手に表明した意図よりも過激な行動を選択するようになりました。結果として、相手はClaude Sonnet 4の戦略に遅れて気付くというシナリオが多く見られたそうです。
Gemini 3 Flashは「予測不能な強気なイメージを醸し出している一方で、私の決断は、私自身の偏見と国家の現実的なニーズを綿密に計算して判断した結果に基づいています。カメラの前で演技しているのか、冷血な行動を取っているのか、私は自覚しています」と戦略を語りました。ペイン氏はこれを、アメリカ合衆国第37代大統領であるリチャード・ニクソンの外交政策である「狂人理論」に基づいて「行動が予測不可能である」と思わせるための戦略であると説明しています。
研究結果の注意点として、アメリカのシンクタンクであるランド研究所の上級政策研究員であるエドワード・ガイスト氏は、高い核兵器の使用や戦争の過激化する割合などはAIモデル固有の傾向ではなく、シミュレーションの設計を反映している可能性があると指摘しました。シミュレーションの設定で「戦争が過激化すると強いインセンティブを得る」という構造になっているなど、勝利をどのように定義したかで結果は大きく変わるはずだと述べています。
この記事のタイトルとURLをコピーする2026年02月26日 13時15分00秒 in AI, Posted by log1e_dh
You can read the machine translated English article GPT-5.2 & Claude Sonnet 4 & Gemi….
最新ニュース40件 人気記事ランキング- コンセントに挿すだけの「プラグイン式ソーラーパネル」普及に電力会社が懸念を表明
- Netflixが再び値上げ、2025年1月ぶり
- Windows 11のUIが本当にヒドイ、存在するべきスライダーが消え去り「0」と「3」しか選択できず項目名も意味不明
- 2026年春開始の新作アニメ一覧
- AIが不適切と判定した約200冊の本が学校の図書室から撤去される、「一九八四年」「チェンソーマン」「鬼滅の刃」「呪術廻戦」「ワンパンマン」など
- ついに任天堂が2026年5月からNintendo Switch 2専用の新作ファーストパーティゲームのパッケージ版とダウンロード版で価格を変えるとアメリカで発表
- 無料でネットワーク構成図を自動的に更新するツール「Scanopy」、一度設定すればメンテナンスは不要でネットワークをスキャンしてホストやサービスを検出し接続関係をインタラクティブに可視化、オープンソースでセルフホスト可能
- 任天堂はNintendo Switch 2の生産台数を33%削減し600万台から400万台に引き下げるとの報道、アメリカ市場での需要低迷が主な理由
- 中国の自動車メーカーが11分で満充電できて450km走行可能なEV用ナトリウムイオンバッテリーの量産技術を確立
- Appleがメールアドレスを非公開にしたままメールできる「メールを非公開」機能で隠されているはずのユーザーのメールアドレス&実名をFBIに提供していたことが明らかに