Knowledge Distillation ― 2025年02月03日 00:04
【概要】
アメリカ合衆国の商務長官指名候補であるハワード・ラトニック氏は、杭州に拠点を置く人工知能(AI)企業DeepSeekがアメリカの技術を盗み、アメリカの輸出規制を回避して高性能のNvidiaチップを取得したと非難した。ラトニック氏は、2025年1月29日のアメリカ上院での指名公聴会において、DeepSeekが大量のNvidiaチップを購入し、Metaのオープンプラットフォームからデータを盗んでAIモデルを「非常に安価」に作成していると述べた。
ラトニック氏は、中国は自国の利益のみを考えてアメリカに害を与えようとしているとし、アメリカは自国の革新を守り、彼らへの支援を止めるべきだと強調した。彼はまた、産業安全保障局(BIS)の輸出規制や関税を強化し、中国がアメリカの技術を使ってアメリカと競争するのを防ぐ必要があると述べた。
DeepSeekは、AIモデルのトレーニングに使用したNvidiaのH800チップは2,000個に過ぎないと主張しているが、ラトニック氏は、DeepSeekが第三国を通じて輸出規制を回避し、高性能チップを手に入れた可能性を示唆している。報道によれば、シンガポールの一部の機関がNvidiaのA100チップを購入し、中国の学生にそれを持ち帰らせたという事例もある。
また、アメリカの元PayPal最高執行責任者であり、ホワイトハウスのAIおよび暗号通貨に関するアドバイザーであるデビッド・サックス氏は、DeepSeekが「蒸留法」と呼ばれる手法を用いて、MicrosoftのOpenAIモデルからデータを抽出したとの証拠があると述べている。「蒸留法」は、より大規模なAIモデルの出力を用いて、より小さなモデルを訓練し改善する技術であり、AIトレーニングにおいて一般的に使用されている。
中国のIT専門家の一部は、DeepSeekが「蒸留法」を使用してモデルを作成したと認めており、特に2024年12月に発表されたDeepSeek V-3はこの技術を用いてトレーニングされたと指摘している。また、DeepSeekは、AlibabaのTongyi Qianwen(Qwen)やMetaのLlamaなどから抽出したデータを使用して、DeepSeek-R1というAIモデルをトレーニングし、そのパフォーマンスはChatGPT-o1と同等だと主張している。
さらに、DeepSeekは、高度なNvidiaのH100チップを50,000個所有している可能性があるとする見解も存在するが、これに対して一部の中国のIT専門家は、DeepSeekがAIの計算能力を無限に高めるのではなく、ソフトウェアや新しいITフレームワークを駆使して競争を勝ち抜くと予測している。
アメリカは、2022年10月に中国へのA100およびH100チップの輸出を禁止し、2023年10月にはA800およびH800チップの輸出も制限した。その後、Nvidiaは中国市場向けに性能が低いH20チップを開発した。2025年1月14日には、バイデン政権がアメリカのAIチップやモデルの輸出を制限するための規制枠組みを発表し、これが1月31日から施行された。この規制強化の段階的な進行に対しては、中国が高性能AIチップを蓄積する時間を与えすぎたとの指摘もある。
【詳細】
アメリカ合衆国の商務長官指名候補であるハワード・ラトニック氏は、2025年1月29日に行われたアメリカ上院の公聴会で、杭州に拠点を置くAI企業DeepSeekがアメリカの技術を盗み、アメリカの輸出規制を回避して高性能なNvidiaのチップを大量に入手したと非難した。ラトニック氏は、DeepSeekがMetaのオープンプラットフォームからデータを不正に取得し、大量のNvidiaチップを使用してAIモデルを非常に安価に開発していると指摘した。この問題を解決するために、ラトニック氏は、アメリカ合衆国が自国の革新を守り、中国への支援を停止する必要があると主張した。
DeepSeekは、トレーニングに使用したNvidiaのH800チップは約2,000個だと述べているが、ラトニック氏は、中国が第三国を通じて輸出規制を回避し、チップを調達した可能性があると懸念している。実際、シンガポールの一部の機関がNvidiaのA100チップを購入し、中国の学生にそれを持ち帰らせたという報道もある。このような回避手段を使って、DeepSeekがチップを蓄積した可能性がある。
1. 「蒸留法」技術とその利用
ラトニック氏の非難に対し、アメリカの元PayPal最高執行責任者であり、ホワイトハウスのAIおよび暗号通貨に関するアドバイザーであるデビッド・サックス氏は、DeepSeekが「蒸留法」という手法を使用して、MicrosoftのOpenAIモデルからデータを抽出したとする「十分な証拠」があると述べている。この「蒸留法」は、AIトレーニングでよく使われる技術であり、大規模なAIモデルの出力を用いて小規模なモデルをトレーニングする手法である。この方法により、DeepSeekはChatGPTのような大規模なモデルをトレーニングすることなく、少ない計算リソースで同等の性能を持つAIモデルを作成したとされている。
「蒸留法」の利点は、非常に高性能なAIをトレーニングするために必要な計算力が少なくて済む点にある。具体的には、ChatGPTのようなモデルをゼロからトレーニングするには膨大な計算資源が必要だが、蒸留法を使用すれば、既存の大規模AIモデル(例えばChatGPTやMetaのLlama)から得た知識を利用して、より効率的に小型のAIモデルを構築することができる。
2. DeepSeekのモデルと性能
DeepSeekは、2024年12月26日にDeepSeek V-3を発表した際、このモデルが「蒸留法」を利用してトレーニングされたとされている。中国のIT専門家の一部は、このモデルがChatGPTのような大規模モデルの出力を用いて訓練されたことを確認しており、その結果として、DeepSeek V-3はChatGPTのような能力を持つとされている。特に、DeepSeekはAlibabaのTongyi Qianwen(Qwen)やMetaのLlamaのデータを蒸留し、より高いパフォーマンスを発揮するモデルを作成したと主張している。これにより、DeepSeekはChatGPT-4oを超える性能を持つAIを実現したとされている。
3. チップの蓄積と輸出規制の回避
DeepSeekが使用したチップについては、DeepSeek自身がH800チップを2,000個だけ使用したと主張しているが、実際にはさらに多くのチップを蓄積している可能性があるとラトニック氏は疑っている。特に、DeepSeekの親会社である中国のヘッジファンド「High Flyer」は、2022年10月にアメリカがA100チップの輸出を中国に対して禁止した前に、10,000個のA100チップを蓄積していたとされている。さらに、ラトニック氏は、DeepSeekが第三国を通じてチップを調達した可能性を指摘しており、シンガポールを経由した不正なチップ調達ルートも報じられている。
アメリカの規制は、中国への高性能チップの輸出を段階的に制限してきた。2022年10月にはA100およびH100チップ、2023年10月にはA800およびH800チップが輸出禁止となり、その後、Nvidiaは中国市場向けに性能の低いH20チップを開発した。しかし、これらの規制が強化される過程で、中国企業は既に大量の高性能チップを蓄積していたとされ、これがDeepSeekの急成長に寄与した可能性がある。
4. アメリカの規制強化とその影響
2025年1月14日、バイデン政権はアメリカのAIチップおよびAIモデルの輸出に関する規制枠組みを発表し、この規制は2025年1月31日から施行された。この新たな規制は、中国に対する技術流出をさらに防ぐためのものであるが、規制の導入が遅れたことにより、中国はすでに十分な高性能チップを手に入れており、DeepSeekのような企業はそれを活用しているとされている。
このように、DeepSeekの急成長は、アメリカの輸出規制を回避する手法や「蒸留法」などの効率的な技術に依存しており、アメリカの技術産業に対する挑戦となっている。
【要点】
・ハワード・ラトニック氏の指摘
2025年1月29日の上院公聴会で、ラトニック氏はDeepSeekがアメリカの技術を盗み、輸出規制を回避して高性能なNvidiaチップを大量に入手したと非難。
・DeepSeekの不正行為
DeepSeekは、Metaのオープンプラットフォームからデータを不正に取得し、Nvidiaのチップを使用してAIモデルを安価に開発している。
・「蒸留法」技術の使用
DeepSeekは「蒸留法」技術を利用し、MicrosoftのOpenAIモデルなどからデータを抽出。これにより、高性能なAIモデルを少ない計算リソースで構築。
・DeepSeek V-3の性能
・DeepSeekは2024年12月にV-3を発表。蒸留法により、ChatGPTのような大規模AIモデルをトレーニングせずに、同等の性能を実現。
・チップの蓄積と輸出規制回避
DeepSeekはNvidiaのH800チップを2,000個使用したとされるが、実際にはさらに多くのチップを蓄積し、第三国を通じて輸出規制を回避している可能性がある。
・シンガポールを経由したチップ調達
シンガポールの機関がNvidiaのA100チップを購入し、中国に持ち込む不正な調達ルートが報じられている。
・アメリカの規制強化
アメリカは中国への高性能チップの輸出規制を強化(2022年10月、2023年10月)。これにより、中国企業は規制前にチップを蓄積していた。
・2025年1月14日の新規制発表
バイデン政権はAIチップおよびモデルの輸出規制を強化。規制は2025年1月31日から施行されたが、中国企業はすでに大量のチップを持っていたとされる。
・DeepSeekの急成長と影響
DeepSeekはアメリカの規制を回避し、技術革新を進めており、アメリカの技術産業に対する挑戦となっている。
【参考】
☞ 蒸留法(Knowledge Distillation)とは
蒸留法(Knowledge Distillation)とは、大規模なAIモデル(教師モデル)から小規模なAIモデル(生徒モデル)へ知識を転送する技術である。これにより、生徒モデルは教師モデルの性能を近い精度で再現しながら、計算コストを削減できる。
蒸留法の仕組み
1.教師モデルの出力を活用
・事前に学習済みの大規模モデル(例: ChatGPT、Llamaなど)を利用し、入力データに対する出力(予測結果)を取得する。
・これにより、生徒モデルが教師モデルの判断基準を学習する。
2.生徒モデルの学習
・教師モデルの出力を「正解」として用い、生徒モデルをトレーニングする。
・伝統的な学習方法(ラベル付きデータ)よりも効率的にモデルの精度を向上できる。
3.ソフトターゲットの活用
・教師モデルの出力には、通常の「正解ラベル」だけでなく、「確率分布」も含まれる。
・例えば、ある画像認識タスクでは「猫」の確率が90%、「犬」が8%、「ウサギ」が2%といった分布が得られる。
・これを生徒モデルに学習させることで、より柔軟で精度の高い推論が可能となる。
蒸留法の利点
1.計算コストの削減
・大規模AIモデルを直接利用するよりも、学習・推論に必要な計算資源を大幅に削減できる。
2.軽量なAIモデルの開発
・モデルのサイズを縮小しながら、性能を維持できるため、モバイル端末やエッジデバイスでの利用が可能となる。
3.データ効率の向上
・既存の大規模AIモデルの知識を活用することで、新たに大規模なデータセットを収集する必要がない。
DeepSeekと蒸留法の関係
・DeepSeekは、MetaのLlamaやAlibabaのQwenといった大規模AIモデルの出力を利用し、独自のAIモデルを開発。
・「DeepSeek-R1-Distill-Qwen」は、蒸留法によってChatGPT-4oと同等の性能を達成したと主張。
・この方法により、高性能なAIを低コストで開発し、アメリカのAI企業に対抗できる技術基盤を確立。
懸念点
1.知的財産権の問題
・MetaやMicrosoftは、DeepSeekが蒸留法を用いて違法にデータを取得した可能性を指摘。
2.規制回避の手法としての利用
・アメリカの技術規制が強化される中、中国企業は蒸留法を活用して、高性能なAIモデルを独自に構築している。
まとめ
蒸留法は、大規模AIモデルの知識を軽量モデルに転送する手法であり、計算コストの削減や小型デバイスでの運用に役立つ。しかし、DeepSeekの事例では、アメリカの知的財産権の侵害や技術規制の回避手段として問題視されている。
☞ 米国企業が蒸留法を問題として訴訟に持ち込める可能性は低い。以下の理由から、蒸留法そのものを法的に争うことは困難である。
1. 蒸留法(Distillation)は一般的な技術であり、特許侵害になりにくい
・蒸留法は、知識蒸留(Knowledge Distillation)というAI分野の標準技術の一つであり、多くの研究機関や企業が活用している。
・すでに論文やオープンソースで広く知られており、特定企業の独占技術とは言えない。
・もし米国企業が訴訟を起こすとしても、蒸留法そのものではなく、特定の実装やアルゴリズムが特許を侵害しているかどうかが争点になる。
2. 既存のAI企業(OpenAI、Googleなど)も蒸留法を使用している
・OpenAI、Google、Meta、Anthropicなど、米国の主要AI企業も蒸留法を用いたモデルの軽量化・効率化を行っている。
・もし蒸留法自体が問題視されるなら、米国企業も自らの技術が訴訟対象になりかねないため、訴訟を起こす動機が薄い。
3. 知財侵害訴訟の可能性は「訓練データ」にある
・米国企業が訴訟を起こすとすれば、蒸留法自体ではなく、モデルの訓練データの使用に関する問題(著作権・データライセンス違反)の方が有力である。
・例えば、DeepSeekが米国企業のデータ(OpenAIのGPTモデル、GoogleのBardなど)を無断で使用して学習した場合、著作権侵害やデータ不正取得の訴訟が起こされる可能性がある。
・実際、米国では作家団体やニュースメディアがOpenAIを訴えているが、これは訓練データの使用が問題視されているケースであり、蒸留法自体が争点ではない。
4. 政治・規制の影響で米国が対抗措置を取る可能性
・米国政府がDeepSeekの影響を懸念し、規制を強化する可能性はある。
・例えば、NVIDIAのGPU輸出規制のように、AIモデルの開発や展開を制限する措置が取られる可能性がある。
・しかし、これは法的な訴訟というよりも、米国の国家安全保障や競争政策に基づく規制の問題となる。
結論
・蒸留法そのものを理由に米国企業が訴訟を起こすのは難しい(一般的な技術であり、特許侵害にはなりにくい)。
・訓練データの使用や知的財産の問題で訴訟が起こる可能性はある(特に米国のデータを無断で学習した場合)。
・法的な争いよりも、米国政府が規制強化を通じてDeepSeekに対抗する可能性が高い(AI規制や輸出管理の強化など)。
したがって、蒸留法そのものを問題視した訴訟は考えにくいが、データの出所や政府の規制の方が今後の焦点になると思われる。
☞ 訓練データの使用に関する著作権問題は、米国企業が訴訟を起こせる可能性がある分野である。
ただし、AIモデルの訓練自体が違法と断定されるかどうかは、法的なグレーゾーンであり、現在も議論が続いている。
1. AI訓練データの著作権問題
(1) 著作権のあるデータを無断で使用した場合
・AIの学習には大量のテキスト・画像・コードが使われるが、それらの多くは著作権で保護されている可能性がある。
・特に、書籍、ニュース記事、プログラムコード(GitHubなど)、映画の脚本などを無断で学習データに含めた場合、著作権侵害に該当する可能性がある。
・米国では、著作権保有者(作家団体、ニュースメディア、ソフトウェア開発者)がOpenAIを訴えているが、これはAIの訓練に使われたデータが著作権を侵害していると主張しているためである。
(2) フェアユース(Fair Use)の適用
・米国著作権法では、「フェアユース」という例外規定があるため、AIの訓練が必ずしも違法とは言えない。
・フェアユースが適用されるかどうかは、以下の4要素で判断される:
1.使用の目的(商業目的か、教育目的か)
2.著作物の性質(事実情報か、創作物か)
3.使用された量と本質的部分
4.市場への影響(元の著作物に対する競争的影響)
・OpenAIは「AIの訓練はフェアユースである」と主張しているが、著作権者側は「AIが既存の作品を模倣し、創作者の市場に悪影響を及ぼしている」と反論している。
・裁判の結果次第では、AIの訓練そのものが違法と判断される可能性もある。
2. DeepSeekの訓練データに関するリスク
(1) DeepSeekが無断で米国企業のデータを使用した場合
・もしDeepSeekがOpenAIやGoogleのAIモデルの出力をデータとして利用している場合、知的財産権の侵害を問われる可能性がある。
・蒸留法(Distillation)を用いてGPT-4などの出力を学習データとして利用しているならば、「派生作品の無断利用」として著作権侵害に問われる可能性がある。
・特に、訓練データの出所が不明瞭である場合、米国企業が「不正な手段でデータを収集した」として訴訟を起こす可能性がある。
(2) データ収集の方法が問題視される可能性
・AIの訓練データは通常、ウェブスクレイピング(自動的にウェブサイトの情報を収集する技術)によって収集されるが、これも利用規約違反やデータ盗用と見なされる可能性がある。
・例として、OpenAIは「Reddit、Twitter(X)、ニュースサイトのデータを無断で収集していた」と指摘されている。
・DeepSeekが同じ方法でデータを収集していた場合、米国の企業や著作権団体が訴訟を起こす可能性がある。
3. 訴訟の可能性と影響
(1) 米国企業がDeepSeekを訴える場合
・米国企業(OpenAI、Google、Metaなど)は、DeepSeekが無断で米国のデータを使用している証拠を示せれば、著作権侵害として訴えることができる。
・ただし、AIの訓練データに関する法律は明確ではなく、現在の裁判(OpenAI vs. 作家団体など)が先例となる可能性がある。
・もし米国の裁判所が「AIの訓練データ使用はフェアユースではない」と判断すれば、DeepSeekも同様の問題に直面することになる。
(2) 政治的な影響
・米国政府がDeepSeekを規制対象とする可能性もある(例えば、米国企業との取引禁止、クラウドサービスの提供制限など)。
・AI分野では、国家安全保障の観点から技術の流出を防ぐための規制が強化されている(例:NVIDIAの高性能GPUの輸出制限)。
・もしDeepSeekが米国の技術を不正利用していると判断されれば、米国政府が制裁を加える可能性がある。
結論
・AI訓練データの使用に関する著作権問題は、米国企業が訴訟を起こす可能性のある領域である。
・AIの訓練がフェアユースに当たるかどうかは、現在の裁判(OpenAI vs. 著作権者)の結果次第で決まる。
・DeepSeekが米国のデータを無断で使用していた場合、著作権侵害やデータ盗用の訴訟リスクがある。
・米国政府がDeepSeekを規制対象とする可能性があり、技術的な制裁が行われる可能性もある。
つまり、AIの訓練自体が違法と確定したわけではないが、訴訟の結果次第ではAIの学習データの扱いが大きく変わる可能性がある。
☞ 現時点では、DeepSeekが明確に違反していると断定するのは難しいが、著作権侵害の可能性はある。
1. 違反の可能性がある点
(1) 訓練データの取得方法
・もしDeepSeekが著作権のある書籍・論文・コードを無断で使用しているなら、著作権侵害に該当する可能性がある。
・AI企業は通常、大規模なウェブスクレイピングを行ってデータを収集するが、一部のサイト(Reddit、Twitter、ニュースメディアなど)は無断でのデータ収集を禁止している。
・DeepSeekがこれらのデータを利用しているなら、米国企業や著作権者が訴訟を起こす可能性がある。
(2) 蒸留法(Distillation)による問題
・DeepSeekがOpenAIやGoogleのAIの出力を学習データに利用している場合、それは「著作権のあるモデルの派生作品」とみなされる可能性がある。
・OpenAIは「GPTの出力をそのまま学習することは知的財産の侵害になり得る」としており、DeepSeekがその手法を使っているならば問題視される可能性がある。
・ただし、蒸留法自体は技術的な手法であり、違法と明確に判断されるかどうかは未定である。
2. 違反ではない可能性がある点
(1) フェアユース(Fair Use)の適用
・米国著作権法では、AI訓練が「フェアユース」に該当する場合、著作権侵害にはならない可能性がある。
・もしDeepSeekがデータを単に統計的に分析し、新しい出力を生成するだけなら、フェアユースと認められる可能性がある。
・ただし、これは裁判の結果次第であり、明確に合法とは言えない。
(2) 訓練データが公開情報である場合
・DeepSeekが合法的にライセンスを取得したデータや、オープンデータを使用している場合、違反にはならない。
・例えば、Common Crawl(ウェブ上の公開データ)、政府の公開データ、パブリックドメインの書籍などを活用しているなら、著作権侵害には該当しない。
3. 米国企業が訴訟を起こす可能性
・証拠が揃えば、米国企業はDeepSeekを訴える可能性がある。
・特に、OpenAIやGoogleの技術を無断で模倣していると判断されれば、知的財産 権の侵害で提訴される可能性が高い。
・しかし、現時点ではDeepSeekがどのようなデータを使ったかの詳細が不明なため、違反と断定するのは時期尚早である。
結論
1.DeepSeekが無断で著作権のあるデータを使用していれば違反の可能性が高い。
2.蒸留法を使って既存AI(GPTなど)の出力を学習している場合、知的財産権の問題になる可能性がある。
3.ただし、フェアユースが適用される可能性もあり、現時点で違法と断定するのは難しい。
4.米国企業が訴訟を起こせば、裁判の結果次第で違法かどうかが決まる。
現時点では「違反の可能性があるが、まだ確定ではない」という状況である。
☞ DeepSeekは確かに画期的なことを成し遂げたといえる。以下の点で特に注目すべきである。
1. モデルの公開戦略とクラウド提供の革新性
・DeepSeekは、高度なLLM(大規模言語モデル)をクラウド上で一般公開し、誰でもアクセス可能にした。
・これにより、AIの民主化を加速し、企業や個人が容易に高度なAIを活用できる環境を作り出した。
・特に、米国の主要企業(OpenAI、Google、Anthropic)が慎重に展開している中、DeepSeekの果敢な公開戦略は画期的である。
2. 蒸留法によるコスト削減と高効率化
・DeepSeekは、「蒸留法(Distillation)」を活用して、高性能ながら計算コストを大幅に削減した。
・蒸留法とは、大規模モデル(Teacher Model)の知識を、より小型で効率的なモデル(Student Model)に圧縮する技術である。
⇨ これにより、計算資源を抑えながらも、競争力のある性能を実現している。
・既存のAI企業も蒸留技術を使っているが、DeepSeekは特にこれを活かしてクラウド提供を実現した点が革新的である。
3. オープン戦略とグローバル展開のスピード
・DeepSeekは、単にモデルを開発するだけでなく、短期間で世界市場に向けてクラウド提供を開始した。
・多くの国で利用可能になっており、AIアクセスの壁を低くしたことは大きな功績である。
・これにより、中国系AIの国際的なプレゼンスを大幅に高めることに成功している。
4. 中国発AIモデルとしての競争力
・これまで、AI分野では米国が圧倒的にリードしていたが、DeepSeekの登場により、中国のAI技術が国際競争力を持つことが明確になった。
・これは、中国が独自に高性能なAIモデルを開発・展開できることを証明した点で画期的である。
・今後、DeepSeekがさらに高度なモデルを開発すれば、米国企業と対等に競争する可能性も十分にある。
5. AI業界の競争環境を変える可能性
・DeepSeekの成功により、他のAI企業もクラウド展開を加速する圧力を受ける。
・これまでOpenAIやGoogleが慎重に進めていた領域でも、競争激化により、よりオープンな展開が進む可能性がある。
・AI市場の競争環境を根本的に変え、新たなイノベーションの波を生み出すきっかけとなる可能性がある。
結論
DeepSeekは、単なる新しいAIモデルの提供にとどまらず、クラウド提供、コスト削減、グローバル展開のスピードという点で画期的な成果を上げている。
・中国のAI競争力を示す重要な事例であり、AI市場全体の競争環境を変える可能性を持っている。
・米国企業にも影響を与え、今後のAI技術の発展に大きなインパクトを与えることは間違いない。
【参考はブログ作成者が付記】
【引用・参照・底本】
Too late, US Commerce nominee calls DeepSeek a technology ‘thief’ASIATIMES 2025.02.01
https://asiatimes.com/2025/02/too-late-us-commerce-nominee-calls-deepseek-a-technology-thief/?utm_source=The+Daily+Report&utm_campaign=f9f4c902f3-WEEKLY_02_02_2025&utm_medium=email&utm_term=0_1f8bca137f-f9f4c902f3-16242795&mc_cid=f9f4c902f3&mc_eid=69a7d1ef3c
アメリカ合衆国の商務長官指名候補であるハワード・ラトニック氏は、杭州に拠点を置く人工知能(AI)企業DeepSeekがアメリカの技術を盗み、アメリカの輸出規制を回避して高性能のNvidiaチップを取得したと非難した。ラトニック氏は、2025年1月29日のアメリカ上院での指名公聴会において、DeepSeekが大量のNvidiaチップを購入し、Metaのオープンプラットフォームからデータを盗んでAIモデルを「非常に安価」に作成していると述べた。
ラトニック氏は、中国は自国の利益のみを考えてアメリカに害を与えようとしているとし、アメリカは自国の革新を守り、彼らへの支援を止めるべきだと強調した。彼はまた、産業安全保障局(BIS)の輸出規制や関税を強化し、中国がアメリカの技術を使ってアメリカと競争するのを防ぐ必要があると述べた。
DeepSeekは、AIモデルのトレーニングに使用したNvidiaのH800チップは2,000個に過ぎないと主張しているが、ラトニック氏は、DeepSeekが第三国を通じて輸出規制を回避し、高性能チップを手に入れた可能性を示唆している。報道によれば、シンガポールの一部の機関がNvidiaのA100チップを購入し、中国の学生にそれを持ち帰らせたという事例もある。
また、アメリカの元PayPal最高執行責任者であり、ホワイトハウスのAIおよび暗号通貨に関するアドバイザーであるデビッド・サックス氏は、DeepSeekが「蒸留法」と呼ばれる手法を用いて、MicrosoftのOpenAIモデルからデータを抽出したとの証拠があると述べている。「蒸留法」は、より大規模なAIモデルの出力を用いて、より小さなモデルを訓練し改善する技術であり、AIトレーニングにおいて一般的に使用されている。
中国のIT専門家の一部は、DeepSeekが「蒸留法」を使用してモデルを作成したと認めており、特に2024年12月に発表されたDeepSeek V-3はこの技術を用いてトレーニングされたと指摘している。また、DeepSeekは、AlibabaのTongyi Qianwen(Qwen)やMetaのLlamaなどから抽出したデータを使用して、DeepSeek-R1というAIモデルをトレーニングし、そのパフォーマンスはChatGPT-o1と同等だと主張している。
さらに、DeepSeekは、高度なNvidiaのH100チップを50,000個所有している可能性があるとする見解も存在するが、これに対して一部の中国のIT専門家は、DeepSeekがAIの計算能力を無限に高めるのではなく、ソフトウェアや新しいITフレームワークを駆使して競争を勝ち抜くと予測している。
アメリカは、2022年10月に中国へのA100およびH100チップの輸出を禁止し、2023年10月にはA800およびH800チップの輸出も制限した。その後、Nvidiaは中国市場向けに性能が低いH20チップを開発した。2025年1月14日には、バイデン政権がアメリカのAIチップやモデルの輸出を制限するための規制枠組みを発表し、これが1月31日から施行された。この規制強化の段階的な進行に対しては、中国が高性能AIチップを蓄積する時間を与えすぎたとの指摘もある。
【詳細】
アメリカ合衆国の商務長官指名候補であるハワード・ラトニック氏は、2025年1月29日に行われたアメリカ上院の公聴会で、杭州に拠点を置くAI企業DeepSeekがアメリカの技術を盗み、アメリカの輸出規制を回避して高性能なNvidiaのチップを大量に入手したと非難した。ラトニック氏は、DeepSeekがMetaのオープンプラットフォームからデータを不正に取得し、大量のNvidiaチップを使用してAIモデルを非常に安価に開発していると指摘した。この問題を解決するために、ラトニック氏は、アメリカ合衆国が自国の革新を守り、中国への支援を停止する必要があると主張した。
DeepSeekは、トレーニングに使用したNvidiaのH800チップは約2,000個だと述べているが、ラトニック氏は、中国が第三国を通じて輸出規制を回避し、チップを調達した可能性があると懸念している。実際、シンガポールの一部の機関がNvidiaのA100チップを購入し、中国の学生にそれを持ち帰らせたという報道もある。このような回避手段を使って、DeepSeekがチップを蓄積した可能性がある。
1. 「蒸留法」技術とその利用
ラトニック氏の非難に対し、アメリカの元PayPal最高執行責任者であり、ホワイトハウスのAIおよび暗号通貨に関するアドバイザーであるデビッド・サックス氏は、DeepSeekが「蒸留法」という手法を使用して、MicrosoftのOpenAIモデルからデータを抽出したとする「十分な証拠」があると述べている。この「蒸留法」は、AIトレーニングでよく使われる技術であり、大規模なAIモデルの出力を用いて小規模なモデルをトレーニングする手法である。この方法により、DeepSeekはChatGPTのような大規模なモデルをトレーニングすることなく、少ない計算リソースで同等の性能を持つAIモデルを作成したとされている。
「蒸留法」の利点は、非常に高性能なAIをトレーニングするために必要な計算力が少なくて済む点にある。具体的には、ChatGPTのようなモデルをゼロからトレーニングするには膨大な計算資源が必要だが、蒸留法を使用すれば、既存の大規模AIモデル(例えばChatGPTやMetaのLlama)から得た知識を利用して、より効率的に小型のAIモデルを構築することができる。
2. DeepSeekのモデルと性能
DeepSeekは、2024年12月26日にDeepSeek V-3を発表した際、このモデルが「蒸留法」を利用してトレーニングされたとされている。中国のIT専門家の一部は、このモデルがChatGPTのような大規模モデルの出力を用いて訓練されたことを確認しており、その結果として、DeepSeek V-3はChatGPTのような能力を持つとされている。特に、DeepSeekはAlibabaのTongyi Qianwen(Qwen)やMetaのLlamaのデータを蒸留し、より高いパフォーマンスを発揮するモデルを作成したと主張している。これにより、DeepSeekはChatGPT-4oを超える性能を持つAIを実現したとされている。
3. チップの蓄積と輸出規制の回避
DeepSeekが使用したチップについては、DeepSeek自身がH800チップを2,000個だけ使用したと主張しているが、実際にはさらに多くのチップを蓄積している可能性があるとラトニック氏は疑っている。特に、DeepSeekの親会社である中国のヘッジファンド「High Flyer」は、2022年10月にアメリカがA100チップの輸出を中国に対して禁止した前に、10,000個のA100チップを蓄積していたとされている。さらに、ラトニック氏は、DeepSeekが第三国を通じてチップを調達した可能性を指摘しており、シンガポールを経由した不正なチップ調達ルートも報じられている。
アメリカの規制は、中国への高性能チップの輸出を段階的に制限してきた。2022年10月にはA100およびH100チップ、2023年10月にはA800およびH800チップが輸出禁止となり、その後、Nvidiaは中国市場向けに性能の低いH20チップを開発した。しかし、これらの規制が強化される過程で、中国企業は既に大量の高性能チップを蓄積していたとされ、これがDeepSeekの急成長に寄与した可能性がある。
4. アメリカの規制強化とその影響
2025年1月14日、バイデン政権はアメリカのAIチップおよびAIモデルの輸出に関する規制枠組みを発表し、この規制は2025年1月31日から施行された。この新たな規制は、中国に対する技術流出をさらに防ぐためのものであるが、規制の導入が遅れたことにより、中国はすでに十分な高性能チップを手に入れており、DeepSeekのような企業はそれを活用しているとされている。
このように、DeepSeekの急成長は、アメリカの輸出規制を回避する手法や「蒸留法」などの効率的な技術に依存しており、アメリカの技術産業に対する挑戦となっている。
【要点】
・ハワード・ラトニック氏の指摘
2025年1月29日の上院公聴会で、ラトニック氏はDeepSeekがアメリカの技術を盗み、輸出規制を回避して高性能なNvidiaチップを大量に入手したと非難。
・DeepSeekの不正行為
DeepSeekは、Metaのオープンプラットフォームからデータを不正に取得し、Nvidiaのチップを使用してAIモデルを安価に開発している。
・「蒸留法」技術の使用
DeepSeekは「蒸留法」技術を利用し、MicrosoftのOpenAIモデルなどからデータを抽出。これにより、高性能なAIモデルを少ない計算リソースで構築。
・DeepSeek V-3の性能
・DeepSeekは2024年12月にV-3を発表。蒸留法により、ChatGPTのような大規模AIモデルをトレーニングせずに、同等の性能を実現。
・チップの蓄積と輸出規制回避
DeepSeekはNvidiaのH800チップを2,000個使用したとされるが、実際にはさらに多くのチップを蓄積し、第三国を通じて輸出規制を回避している可能性がある。
・シンガポールを経由したチップ調達
シンガポールの機関がNvidiaのA100チップを購入し、中国に持ち込む不正な調達ルートが報じられている。
・アメリカの規制強化
アメリカは中国への高性能チップの輸出規制を強化(2022年10月、2023年10月)。これにより、中国企業は規制前にチップを蓄積していた。
・2025年1月14日の新規制発表
バイデン政権はAIチップおよびモデルの輸出規制を強化。規制は2025年1月31日から施行されたが、中国企業はすでに大量のチップを持っていたとされる。
・DeepSeekの急成長と影響
DeepSeekはアメリカの規制を回避し、技術革新を進めており、アメリカの技術産業に対する挑戦となっている。
【参考】
☞ 蒸留法(Knowledge Distillation)とは
蒸留法(Knowledge Distillation)とは、大規模なAIモデル(教師モデル)から小規模なAIモデル(生徒モデル)へ知識を転送する技術である。これにより、生徒モデルは教師モデルの性能を近い精度で再現しながら、計算コストを削減できる。
蒸留法の仕組み
1.教師モデルの出力を活用
・事前に学習済みの大規模モデル(例: ChatGPT、Llamaなど)を利用し、入力データに対する出力(予測結果)を取得する。
・これにより、生徒モデルが教師モデルの判断基準を学習する。
2.生徒モデルの学習
・教師モデルの出力を「正解」として用い、生徒モデルをトレーニングする。
・伝統的な学習方法(ラベル付きデータ)よりも効率的にモデルの精度を向上できる。
3.ソフトターゲットの活用
・教師モデルの出力には、通常の「正解ラベル」だけでなく、「確率分布」も含まれる。
・例えば、ある画像認識タスクでは「猫」の確率が90%、「犬」が8%、「ウサギ」が2%といった分布が得られる。
・これを生徒モデルに学習させることで、より柔軟で精度の高い推論が可能となる。
蒸留法の利点
1.計算コストの削減
・大規模AIモデルを直接利用するよりも、学習・推論に必要な計算資源を大幅に削減できる。
2.軽量なAIモデルの開発
・モデルのサイズを縮小しながら、性能を維持できるため、モバイル端末やエッジデバイスでの利用が可能となる。
3.データ効率の向上
・既存の大規模AIモデルの知識を活用することで、新たに大規模なデータセットを収集する必要がない。
DeepSeekと蒸留法の関係
・DeepSeekは、MetaのLlamaやAlibabaのQwenといった大規模AIモデルの出力を利用し、独自のAIモデルを開発。
・「DeepSeek-R1-Distill-Qwen」は、蒸留法によってChatGPT-4oと同等の性能を達成したと主張。
・この方法により、高性能なAIを低コストで開発し、アメリカのAI企業に対抗できる技術基盤を確立。
懸念点
1.知的財産権の問題
・MetaやMicrosoftは、DeepSeekが蒸留法を用いて違法にデータを取得した可能性を指摘。
2.規制回避の手法としての利用
・アメリカの技術規制が強化される中、中国企業は蒸留法を活用して、高性能なAIモデルを独自に構築している。
まとめ
蒸留法は、大規模AIモデルの知識を軽量モデルに転送する手法であり、計算コストの削減や小型デバイスでの運用に役立つ。しかし、DeepSeekの事例では、アメリカの知的財産権の侵害や技術規制の回避手段として問題視されている。
☞ 米国企業が蒸留法を問題として訴訟に持ち込める可能性は低い。以下の理由から、蒸留法そのものを法的に争うことは困難である。
1. 蒸留法(Distillation)は一般的な技術であり、特許侵害になりにくい
・蒸留法は、知識蒸留(Knowledge Distillation)というAI分野の標準技術の一つであり、多くの研究機関や企業が活用している。
・すでに論文やオープンソースで広く知られており、特定企業の独占技術とは言えない。
・もし米国企業が訴訟を起こすとしても、蒸留法そのものではなく、特定の実装やアルゴリズムが特許を侵害しているかどうかが争点になる。
2. 既存のAI企業(OpenAI、Googleなど)も蒸留法を使用している
・OpenAI、Google、Meta、Anthropicなど、米国の主要AI企業も蒸留法を用いたモデルの軽量化・効率化を行っている。
・もし蒸留法自体が問題視されるなら、米国企業も自らの技術が訴訟対象になりかねないため、訴訟を起こす動機が薄い。
3. 知財侵害訴訟の可能性は「訓練データ」にある
・米国企業が訴訟を起こすとすれば、蒸留法自体ではなく、モデルの訓練データの使用に関する問題(著作権・データライセンス違反)の方が有力である。
・例えば、DeepSeekが米国企業のデータ(OpenAIのGPTモデル、GoogleのBardなど)を無断で使用して学習した場合、著作権侵害やデータ不正取得の訴訟が起こされる可能性がある。
・実際、米国では作家団体やニュースメディアがOpenAIを訴えているが、これは訓練データの使用が問題視されているケースであり、蒸留法自体が争点ではない。
4. 政治・規制の影響で米国が対抗措置を取る可能性
・米国政府がDeepSeekの影響を懸念し、規制を強化する可能性はある。
・例えば、NVIDIAのGPU輸出規制のように、AIモデルの開発や展開を制限する措置が取られる可能性がある。
・しかし、これは法的な訴訟というよりも、米国の国家安全保障や競争政策に基づく規制の問題となる。
結論
・蒸留法そのものを理由に米国企業が訴訟を起こすのは難しい(一般的な技術であり、特許侵害にはなりにくい)。
・訓練データの使用や知的財産の問題で訴訟が起こる可能性はある(特に米国のデータを無断で学習した場合)。
・法的な争いよりも、米国政府が規制強化を通じてDeepSeekに対抗する可能性が高い(AI規制や輸出管理の強化など)。
したがって、蒸留法そのものを問題視した訴訟は考えにくいが、データの出所や政府の規制の方が今後の焦点になると思われる。
☞ 訓練データの使用に関する著作権問題は、米国企業が訴訟を起こせる可能性がある分野である。
ただし、AIモデルの訓練自体が違法と断定されるかどうかは、法的なグレーゾーンであり、現在も議論が続いている。
1. AI訓練データの著作権問題
(1) 著作権のあるデータを無断で使用した場合
・AIの学習には大量のテキスト・画像・コードが使われるが、それらの多くは著作権で保護されている可能性がある。
・特に、書籍、ニュース記事、プログラムコード(GitHubなど)、映画の脚本などを無断で学習データに含めた場合、著作権侵害に該当する可能性がある。
・米国では、著作権保有者(作家団体、ニュースメディア、ソフトウェア開発者)がOpenAIを訴えているが、これはAIの訓練に使われたデータが著作権を侵害していると主張しているためである。
(2) フェアユース(Fair Use)の適用
・米国著作権法では、「フェアユース」という例外規定があるため、AIの訓練が必ずしも違法とは言えない。
・フェアユースが適用されるかどうかは、以下の4要素で判断される:
1.使用の目的(商業目的か、教育目的か)
2.著作物の性質(事実情報か、創作物か)
3.使用された量と本質的部分
4.市場への影響(元の著作物に対する競争的影響)
・OpenAIは「AIの訓練はフェアユースである」と主張しているが、著作権者側は「AIが既存の作品を模倣し、創作者の市場に悪影響を及ぼしている」と反論している。
・裁判の結果次第では、AIの訓練そのものが違法と判断される可能性もある。
2. DeepSeekの訓練データに関するリスク
(1) DeepSeekが無断で米国企業のデータを使用した場合
・もしDeepSeekがOpenAIやGoogleのAIモデルの出力をデータとして利用している場合、知的財産権の侵害を問われる可能性がある。
・蒸留法(Distillation)を用いてGPT-4などの出力を学習データとして利用しているならば、「派生作品の無断利用」として著作権侵害に問われる可能性がある。
・特に、訓練データの出所が不明瞭である場合、米国企業が「不正な手段でデータを収集した」として訴訟を起こす可能性がある。
(2) データ収集の方法が問題視される可能性
・AIの訓練データは通常、ウェブスクレイピング(自動的にウェブサイトの情報を収集する技術)によって収集されるが、これも利用規約違反やデータ盗用と見なされる可能性がある。
・例として、OpenAIは「Reddit、Twitter(X)、ニュースサイトのデータを無断で収集していた」と指摘されている。
・DeepSeekが同じ方法でデータを収集していた場合、米国の企業や著作権団体が訴訟を起こす可能性がある。
3. 訴訟の可能性と影響
(1) 米国企業がDeepSeekを訴える場合
・米国企業(OpenAI、Google、Metaなど)は、DeepSeekが無断で米国のデータを使用している証拠を示せれば、著作権侵害として訴えることができる。
・ただし、AIの訓練データに関する法律は明確ではなく、現在の裁判(OpenAI vs. 作家団体など)が先例となる可能性がある。
・もし米国の裁判所が「AIの訓練データ使用はフェアユースではない」と判断すれば、DeepSeekも同様の問題に直面することになる。
(2) 政治的な影響
・米国政府がDeepSeekを規制対象とする可能性もある(例えば、米国企業との取引禁止、クラウドサービスの提供制限など)。
・AI分野では、国家安全保障の観点から技術の流出を防ぐための規制が強化されている(例:NVIDIAの高性能GPUの輸出制限)。
・もしDeepSeekが米国の技術を不正利用していると判断されれば、米国政府が制裁を加える可能性がある。
結論
・AI訓練データの使用に関する著作権問題は、米国企業が訴訟を起こす可能性のある領域である。
・AIの訓練がフェアユースに当たるかどうかは、現在の裁判(OpenAI vs. 著作権者)の結果次第で決まる。
・DeepSeekが米国のデータを無断で使用していた場合、著作権侵害やデータ盗用の訴訟リスクがある。
・米国政府がDeepSeekを規制対象とする可能性があり、技術的な制裁が行われる可能性もある。
つまり、AIの訓練自体が違法と確定したわけではないが、訴訟の結果次第ではAIの学習データの扱いが大きく変わる可能性がある。
☞ 現時点では、DeepSeekが明確に違反していると断定するのは難しいが、著作権侵害の可能性はある。
1. 違反の可能性がある点
(1) 訓練データの取得方法
・もしDeepSeekが著作権のある書籍・論文・コードを無断で使用しているなら、著作権侵害に該当する可能性がある。
・AI企業は通常、大規模なウェブスクレイピングを行ってデータを収集するが、一部のサイト(Reddit、Twitter、ニュースメディアなど)は無断でのデータ収集を禁止している。
・DeepSeekがこれらのデータを利用しているなら、米国企業や著作権者が訴訟を起こす可能性がある。
(2) 蒸留法(Distillation)による問題
・DeepSeekがOpenAIやGoogleのAIの出力を学習データに利用している場合、それは「著作権のあるモデルの派生作品」とみなされる可能性がある。
・OpenAIは「GPTの出力をそのまま学習することは知的財産の侵害になり得る」としており、DeepSeekがその手法を使っているならば問題視される可能性がある。
・ただし、蒸留法自体は技術的な手法であり、違法と明確に判断されるかどうかは未定である。
2. 違反ではない可能性がある点
(1) フェアユース(Fair Use)の適用
・米国著作権法では、AI訓練が「フェアユース」に該当する場合、著作権侵害にはならない可能性がある。
・もしDeepSeekがデータを単に統計的に分析し、新しい出力を生成するだけなら、フェアユースと認められる可能性がある。
・ただし、これは裁判の結果次第であり、明確に合法とは言えない。
(2) 訓練データが公開情報である場合
・DeepSeekが合法的にライセンスを取得したデータや、オープンデータを使用している場合、違反にはならない。
・例えば、Common Crawl(ウェブ上の公開データ)、政府の公開データ、パブリックドメインの書籍などを活用しているなら、著作権侵害には該当しない。
3. 米国企業が訴訟を起こす可能性
・証拠が揃えば、米国企業はDeepSeekを訴える可能性がある。
・特に、OpenAIやGoogleの技術を無断で模倣していると判断されれば、知的財産 権の侵害で提訴される可能性が高い。
・しかし、現時点ではDeepSeekがどのようなデータを使ったかの詳細が不明なため、違反と断定するのは時期尚早である。
結論
1.DeepSeekが無断で著作権のあるデータを使用していれば違反の可能性が高い。
2.蒸留法を使って既存AI(GPTなど)の出力を学習している場合、知的財産権の問題になる可能性がある。
3.ただし、フェアユースが適用される可能性もあり、現時点で違法と断定するのは難しい。
4.米国企業が訴訟を起こせば、裁判の結果次第で違法かどうかが決まる。
現時点では「違反の可能性があるが、まだ確定ではない」という状況である。
☞ DeepSeekは確かに画期的なことを成し遂げたといえる。以下の点で特に注目すべきである。
1. モデルの公開戦略とクラウド提供の革新性
・DeepSeekは、高度なLLM(大規模言語モデル)をクラウド上で一般公開し、誰でもアクセス可能にした。
・これにより、AIの民主化を加速し、企業や個人が容易に高度なAIを活用できる環境を作り出した。
・特に、米国の主要企業(OpenAI、Google、Anthropic)が慎重に展開している中、DeepSeekの果敢な公開戦略は画期的である。
2. 蒸留法によるコスト削減と高効率化
・DeepSeekは、「蒸留法(Distillation)」を活用して、高性能ながら計算コストを大幅に削減した。
・蒸留法とは、大規模モデル(Teacher Model)の知識を、より小型で効率的なモデル(Student Model)に圧縮する技術である。
⇨ これにより、計算資源を抑えながらも、競争力のある性能を実現している。
・既存のAI企業も蒸留技術を使っているが、DeepSeekは特にこれを活かしてクラウド提供を実現した点が革新的である。
3. オープン戦略とグローバル展開のスピード
・DeepSeekは、単にモデルを開発するだけでなく、短期間で世界市場に向けてクラウド提供を開始した。
・多くの国で利用可能になっており、AIアクセスの壁を低くしたことは大きな功績である。
・これにより、中国系AIの国際的なプレゼンスを大幅に高めることに成功している。
4. 中国発AIモデルとしての競争力
・これまで、AI分野では米国が圧倒的にリードしていたが、DeepSeekの登場により、中国のAI技術が国際競争力を持つことが明確になった。
・これは、中国が独自に高性能なAIモデルを開発・展開できることを証明した点で画期的である。
・今後、DeepSeekがさらに高度なモデルを開発すれば、米国企業と対等に競争する可能性も十分にある。
5. AI業界の競争環境を変える可能性
・DeepSeekの成功により、他のAI企業もクラウド展開を加速する圧力を受ける。
・これまでOpenAIやGoogleが慎重に進めていた領域でも、競争激化により、よりオープンな展開が進む可能性がある。
・AI市場の競争環境を根本的に変え、新たなイノベーションの波を生み出すきっかけとなる可能性がある。
結論
DeepSeekは、単なる新しいAIモデルの提供にとどまらず、クラウド提供、コスト削減、グローバル展開のスピードという点で画期的な成果を上げている。
・中国のAI競争力を示す重要な事例であり、AI市場全体の競争環境を変える可能性を持っている。
・米国企業にも影響を与え、今後のAI技術の発展に大きなインパクトを与えることは間違いない。
【参考はブログ作成者が付記】
【引用・参照・底本】
Too late, US Commerce nominee calls DeepSeek a technology ‘thief’ASIATIMES 2025.02.01
https://asiatimes.com/2025/02/too-late-us-commerce-nominee-calls-deepseek-a-technology-thief/?utm_source=The+Daily+Report&utm_campaign=f9f4c902f3-WEEKLY_02_02_2025&utm_medium=email&utm_term=0_1f8bca137f-f9f4c902f3-16242795&mc_cid=f9f4c902f3&mc_eid=69a7d1ef3c

