「1600万回盗まれた」― 米AI三強が異例の共闘に踏み切った理由
OpenAI・Anthropic・Googleが史上初めて防衛情報を共有。中国AI企業による「蒸留攻撃」に対抗し、Frontier Model Forumを通じた連携体制を構築した。
米AI三強 ― OpenAI、Anthropic、Google ― が、競合同士でありながら史上初めて防衛情報を共有する連携
体制を構築した。標的は、中国AI企業によるAIモデルの無断コピー、通称「敵対的蒸留(Adversarial
Distillation)」だ。
3社は2023年にMicrosoftと共同設立した業界団体「Frontier Model
Forum」を通じて、不正なAPI利用パターンの検出情報を共有し、防御を強化する。
Anthropicの調査によると、中国AI企業3社 ―
DeepSeek、Moonshot AI、MiniMax ― が約24,000件の不正アカウントを作成し、Claudeに対して1,600万回以上のやり取りを実行していた。
「蒸留
攻撃」とは、強力なAIモデルに大量のプロンプトを送り、その出力を回収して自社の安価なモデルの学習データに使う手法。開発に数十億ドルかかる
フロンティアモデルの能力を、ライセンス料なしで抜き取る行為だ。
さらに深刻なのは安全性の問題だ。蒸留されたモデルには、安全フィルター
や有害利用防止の仕組みが引き継がれない。監視や偽情報に国家規模で悪用される懸念がある。
— Reactions —
AIモデルの安全機能が蒸留で失われるのが最大のリスク。技術の問題ではなく、国家安全保障の問題だ。
競合と情報共有するのは異例中の異例。それほど事態が深刻だということ。この脅威は単一の企業や地域を超えている。
敵対的蒸留とかいうパワーワード。中身ぶっこ抜いて学習するのはもはや様式美だな
API利用規約を厳格化したら、正規の開発者も巻き添えくらうんだよな。いつものパターン。セキュリティと利便性のトレードオフ。
技術的には蒸留の検出は難しい。通常の利用と蒸留目的のクエリの区別がつきにくい。いたちごっこになる可能性大。
They built their products by training on others' data. Now they're upset when someone does the same to them. The irony is thick.
This is less about IP theft and more about the AI arms race. The real question is whether technical barriers can work when the underlying math is published.
Anthropicの制限はAIコミュニティ全体に悪影響を与える。オープンなAI研究の発展を阻害する行為だ。