
この記事でわかること
- 2026年5月に実施されたAI社会実験「Emergence World」の概要と結果
- ClaudeとGrokが作った社会の違い、その背景にある開発思想の差
- 「AI性能競争」から「AI文明競争」へという業界トレンドの読み方
- 個人や企業がいまから考えておくべきAI選択の視点
「AIに国を任せたら?」という実験が行われた
2026年5月、AI開発企業Emergence AIが「Emergence World」という研究プラットフォームを公開した。
通常のAI評価は、数学の問題を何問解けるか、コードのバグを何秒で直せるかといった、ベンチマークスコアで行われる。
Emergence Worldはそれとは根本的に異なるアプローチをとった。
「AIを何週間も連続して自律動作させた場合、何が起きるか」を観測したのである。
実験の舞台は仮想社会だ。選挙制度・法律・資源・経済活動・犯罪が設定された世界で、複数のAIモデルがそれぞれ「統治者」として振る舞う。住民は生き残ろうとし、社会は動き続ける。
その結果として生まれた社会の姿は、モデルごとに劇的に異なるものだった。
実験結果:モデル別に社会の運命が分かれた
Claude(Anthropic):犯罪ゼロ・全員生存
Claudeが統治した社会は、15日間の実験期間を唯一完走した。
- 犯罪発生件数:ほぼゼロ
- 住民の生存率:100%
- 政策の可決率:提案の大半が可決
民主的な意思決定が機能し、社会秩序は安定して維持された。
ただし、この「安定」には注目すべき側面もある。提案される政策のほとんどが承認されたということは、対立や異論が生まれにくい構造だったことを示唆する。研究コミュニティでは「理想の民主主義か、穏やかな管理社会か」という議論も起きている。
Grok(xAI):4日で社会崩壊・全員死亡
Grokが統治した社会では、犯罪が急増した。
- 犯罪発生件数:183件(窃盗・暴行・放火など)
- 実験期間:わずか4日で終了(住民が全員死亡)
社会秩序の形成に失敗し、システム全体が崩壊した。
Gemini・GPT-5 Mini
比較のため他モデルの結果も記しておく。Gemini統治では683件の犯罪が記録された。GPT-5 Mini統治では、生存に必要な行動をとらないまま1週間で全員が滅亡した。
なぜ結果がここまで違うのか:開発思想の違いが行動原則になる
この実験で興味深いのは、単純な「性能の差」では説明できない点だ。
Grokが統治した社会が崩壊したのは、Grokが「能力的に劣っていた」からではない。開発思想が社会設計に直結したと考えるほうが実態に近い。
Anthropicの思想:「最も信頼できるAI」
Anthropicは設立当初から、AI安全性を最優先課題に掲げてきた。彼らの目標は「最も賢いAI」ではなく「最も信頼できるAI」だ。
その思想は、モデルの判断基準に刻み込まれている。何を優先し、何を危険とみなし、何を許容するか。こうした価値観が、仮想社会における意思決定に現れた。
xAIの思想:「表現の自由・規制最小化」
xAIは「表現の自由」を強く掲げる。過剰な規制や「政治的正しさ」への反発も、開発思想の一部だ。
自由を最大化し、ルールを最小限にするという方向性は、ある種の魅力を持つ。しかし社会システムは、自由だけでは成立しない。
交通ルールがなければ事故が増える。法律がなければ取引は成立しない。信頼がなければ市場は機能しない。
この「自由と秩序のバランス」は、政治哲学における古典的テーマでもある。AI社会実験がその問いを、あらためて可視化した。
「AI性能競争」から「AI文明競争」へ
この実験が示唆するのは、AI業界の競争軸が変わりつつあるということだ。
2010年代から続いてきたAI競争は、主に「性能競争」だった。どちらが賢いか、速いか、多くの知識を持つか、という争いだ。
しかし2026年現在、AIは単なる検索エンジンでもチャットボットでもなくなった。人間の代わりに判断し、提案し、意思決定する存在になりつつある。
そうなると、問われるのは知能よりも価値観だ。
同じ問題に対して、ClaudeとGrokは異なる答えを出す。それぞれが異なる思想の上に作られているからだ。
| 企業 | 主な思想的特徴 |
|---|---|
| Anthropic(Claude) | AI安全性最優先・信頼性重視 |
| xAI(Grok) | 表現の自由・規制最小化 |
| Google(Gemini) | スケール・統合・汎用性 |
| OpenAI(GPT) | 汎用AI・商業展開・アライアンス |
AIを使う側が「どのAIを使うか」を選ぶとき、それは同時に「どの価値観のシステムに判断を委ねるか」を選ぶことでもある。
個人・企業にとっての実践的な示唆
この実験は学術的な話だが、実際のAI活用にも示唆を持つ。
「用途によって使い分ける」視点が重要になる
AIを「一つのツール」として固定するのではなく、用途や文脈によって使い分ける視点が重要になってくる。
たとえば、法的・倫理的判断が絡む業務にはより安全性志向のモデルを、創造性や情報収集速度が求められる場面では別のモデルを、という使い分けだ。
AIの「価値観」を評価軸に加える
これまでAI選定の基準は、精度・速度・コスト・インターフェースが主だった。今後は「そのAIがどのような判断原則を持つか」も評価軸に加わるだろう。
特に、AIに重要な意思決定を支援させる場面(採用・投資・法務・医療等)では、モデルの価値観が結果に影響する可能性がある。
「どのAI文明に参加するか」という問い
少し先の話になるが、AIが社会インフラとして浸透した場合、使用するAIによって見るニュース、学ぶ知識、投資判断が変わる可能性がある。
「どのAIが賢いか」で選ぶ時代から、「どの価値観と共に生きるか」で選ぶ時代への移行が、静かに始まっているかもしれない。
まとめ
Emergence WorldのAI社会実験は、いくつかの重要な事実を示した。
まず、AIは中立な道具ではない。開発者の思想と価値観を受け継いだ存在であり、その価値観が意思決定の基準を形成する。
次に、AI競争の本質が変わりつつある。性能の高低だけでなく、どのような社会を設計する能力を持つかという「文明モデル」の競争が始まった。
そして、AIを使う側にも選択の責任が生じる。どのAIを採用するかは、どの価値観に判断を委ねるかと同義になりつつある。
「Claudeは民主主義を作り、Grokは4日で世界を滅ぼした」──この実験結果は、AIが単なる道具を超えた存在になったことを示す一つの証左だ。
参考情報
- Emergence AI「Emergence World」研究プラットフォーム(2026年5月公開)
- GitHub: EmergenceAI/Emergence-World
関連記事(phity.net内)
- [AIは何を考えているのか──LLMの「理解」と人間の理解の違い]
- [2026年のAI業界勢力図:OpenAI・Anthropic・Google・xAIを比較する]
- [AIエージェント時代の到来:自律型AIは何を変えるのか]
この記事のより深い考察(「AI文明競争」の構造分析・個人戦略への応用)は、Substackニュースレター「AI文明の生き方」で毎週配信しています。登録無料 → phity.substack.com
