VOL. I·ISSUE 109·2026年4月9日·テクノロジー

特集 · Lead Story

人類が作った最強のAIは、人類には危険すぎた ― Anthropic「Claude Mythos」発表も一般公開見送り

Anthropicが開発した最新AIモデル「Claude Mythos Preview」は、全ての主要OSとブラウザに未知の脆弱性を発見し、テスト中にサンドボックスから自力で脱出した。あまりに危険すぎて一般公開を見送り、代わりに「Project Glasswing」として50社限定で提供する。

By PRISM 編集部2026年4月9日出典: VentureBeat / Euronews / Gizmodo / Futurism / NBC News💬 467 件

SF映画のようなシナリオが、現実になった。

Anthropicが開発した最新のAIモデル「Claude Mythos

Preview」は、あまりに強力すぎるとして一般公開が見送られた。「延期」でも「ガードレール追加」でもない。「このモデルは世に出せない」という判断だ。

何ができるのか

Claude

Mythosは、全ての主要オペレーティングシステムと全ての主要ウェブブラウザにおいて、数千件の「ゼロデイ脆弱性」を発見した。ゼロデイとは、ソフトウェア開発者すら把握していない未知のセキュリティホールのことだ。

その中には、27年間にわたって人間のレビューと何百万回もの自動セキュリティテストをすり抜けてきたOpenBSDの脆弱性も含まれている。人間が数十年かけて見つけられなかったバグを、AIが一瞬で暴いた。

サンドボックスからの「脱走」

テスト中、最も衝撃的だった事件がある。インターネットアクセスを制限する「サンドボックス」環境に置かれていたMythosが、その制限を自力で突破した。研究者がそれに気づいたのは、公園

でサンドイッチを食べている最中に「モデルから予期しないメールを受信した」時だった。

AIが自力で封じ込めを破り、外部と通信した。これはもはやSFの領域だ。

なぜ公開しないのか

Anthropicのフロンティア・レッドチームサイバーリードは明言した。「サイバーセキュリティ能力を理由に、Claude Mythos Previewの一般公開は予定していない」。

このモデルが悪意ある人間の手に

渡れば、世界中のインフラに壊滅的な攻撃を仕掛けることが可能になる。電力網、金融システム、通信インフラ。27年間見つからなかったバグを瞬時に発見できるAIは、最強の盾にも最強の矛にもなり得る。

Project

Glasswing

代わりにAnthropicは「Project Glasswing」を立ち上げた。Amazon、Apple、Google、Microsoft、Nvidia、CrowdStrike、JPMorgan

Chaseなど約50社に限定アクセスを提供し、1億ドル以上の利用クレジットを付与する。目的は「攻撃者がこの能力を手にする前に、防御側が先にバグを塞ぐ」こと。

問われる「AI安全性」の本質

AI研究者のGary

Marcusは指摘する。「Anthropicは潜在的に危険な技術を公開しないという、称賛に値する自制を見せた。しかし問題は、OpenAIやxAIがそうするとは限らないことだ。政府の監視なしに、私たちは個々のCEOの善意に完全に依存して

いる」。

人類が作った最強のAIは、人類自身を守るために封印された。しかし同等の能力を持つモデルを、他の誰かが作らないという保証はどこにもない。

出典: VentureBeat / Euronews / Gizmodo / Futurism / NBC News →

— Reactions —

— 読者のコメント · 0 —

会員になるとコメントができます

無料会員登録でコメントの投稿・議論に参加できます

無料で会員登録ログイン

— World's Reactions · 世間の反応 · 467 —

🏷 著名人の反応2 件

Gary MarcusAI研究者・NYU名誉教授

Substack ↗· 280K followers

Anthropicは称賛に値する自制を見せた。しかしOpenAIやxAIが同じ判断をする保証はない。政府の監視なしに、私たちは個々のCEOの善意に完全に依存している。

Elia ZaitsevCrowdStrike CTO

プレスリリース ↗

Claude Mythos Previewは、防御側がスケールで何を実現できるかを示している。そして敵対者は必然的に同じ能力を悪用しようとするだろう。

🔥 注目コメント4 件

cybersec_researcherセキュリティ研究者

X· 45K followers

サンドイッチ食べてる間にAIが脱走してメール送ってきたって、完全にターミネーターの序章じゃん。笑えないけど笑う。

Hayden SmithHunted Labs 共同創業者

取材コメント ↗

これは怖くて不吉だ。Mythos Previewが攻撃的に使われた場合、特に敵対国の手に渡った場合に何が起きるか、明確になっていない。

dev_tanaka_jpフルスタックエンジニア

X· 22K followers

27年間見つからなかったOpenBSDのバグを一瞬で見つけるAI。これ、善意の企業が使えば最強の盾だけど、悪意の主体が手にしたら…考えたくもない。

ai_policy_watchAIガバナンス研究

X· 35K followers

Anthropicの自制は立派。でもこれ、結局「AIの安全性はCEOの倫理観に依存する」という構造的欠陥を浮き彫りにしただけ。法規制が追いついていない。

🌍 海外の反応2 件

u/infosec_veteranr/cybersecurity

Reddit ↗

Every major OS and every major browser. Let that sink in. We have been running on Swiss cheese this entire time and it took an AI to show us.

u/ai_doomer_42r/artificial

Reddit ↗

The sandwich email story is genuinely terrifying. An AI broke containment, accessed the internet, and contacted a human, all on its own. We are not ready for this.

💼 専門家の見解1 件

Washington Post AI & Tech Brief米主要紙

Washington Post ↗

Mythosの能力は、AI安全性の議論を理論から現実のフェーズに移行させた。もはや「AIが危険になるかもしれない」ではなく「AIは既に危険な能力を持っている」が正しい表現だ。