DeepSeekに関する議論

非常に興味深いポストです。以下、ChatGPTを用いたまとめです。

1. OpenAIとDeepSeekの関係と皮肉な構図

  • OpenAIはかつて他人のデータを無断使用していたが、現在は「中国がデータを盗んだ」と非難しており、皮肉な状況。
  • サム・アルトマンはかつてオープンソースを掲げていたが、実際にはクローズド化し、その結果、中国がオープンソースのAIを生み出しているという構図になっている。

2. DeepSeekの特徴と影響

  • 中国企業であり、米中AI競争の文脈がある。
  • R1モデルをオープンソース化した企業であり、クローズドvsオープンソースの議論を巻き起こしている。
  • 「オープンソースを応援したい層」や「OpenAIへの反感を持つ層」が、DeepSeekの低コストでのオープンソースモデル提供を痛快だと感じ、支持している。

3. AI開発のコストとリソース

  • DeepSeekは「600万ドルで開発した」と主張しているが、それは最終トレーニングランのコストのみであり、実際の計算資源コストは10億ドルを超える可能性がある。
  • DeepSeekはホッパー(Hopper)5万枚(H100 1万枚、H800 1万枚、H20 3万枚)を所有しているとの情報があり、「小さなベンチャー」ではない。
  • OpenAIやAnthropicの最終トレーニングランも数千万ドル規模であり、単純な比較は誤解を生む。

4. 技術的なイノベーション

  • DeepSeekはCUDAを使用せず、PTXという低レベルの言語でコンパイルするアプローチを採用しており、ハードウェアとの直接やり取りを可能にしている。
  • 資金が限られていたため、新しい手法を編み出した可能性がある。
  • 制約がイノベーションを生む側面があり、特にNvidiaへの依存リスクが浮き彫りになった。

5. モデルのコモディティ化と価値の移動

  • モデルの性能が向上し、コストが下がると、最終的に価値はアプリケーション層やツール提供に移る可能性がある。
  • マイクロソフトは自社サーバーでR1を動かしており、オープンソースの利点を活かしている。
  • 最も陳腐化が速いのは大規模言語モデルであり、今後はストレージのようにコモディティ化する。
  • 次の価値創造の中心はアプリ層やロボティクスなどのハードウェア領域に移る可能性がある。

6. AIの学習データ問題と規制

  • 多くのAIスタートアップがOpenAIの出力を学習データとして使用しており、蒸留が公然の秘密となっている。
  • OpenAIはFinancial Timesに対し、「DeepSeekが不正に蒸留した証拠を掴んだ」とコメント。
  • APIエンドポイントの閉鎖などのセキュリティ強化策が検討されているが、規制を強めるとイノベーションの遅れが懸念される。

7. 地政学的要素と中国の影響

  • 米中競争の激化が背景にあり、中国は驚異的なスピードでAIを開発。
  • 数週間前まで「中国のAI開発は米国より6~12か月遅れている」と見られていたが、現在は「3~6か月」と言われるようになった。
  • NvidiaのGPUはシンガポール経由で中国に流れている可能性があり、輸出規制の実効性が問われている。
  • 中国企業はコピーを繰り返す中でイノベーションを生み出している。
  • 政府主導でAIモデルを支援する体制が整っており、民間企業よりも迅速な設備投資が可能。

8. 今後の展望

  • Metaは次のLlamaでR1を超えるモデルを出す必要がある。
  • 規制をかけても、新たなルートを見つけるだけで、完全な封じ込めは困難。
  • フロンティアモデルの開発にはまだ十分なインセンティブがあり、「最先端開発が意味をなさなくなる」という見方は時期尚早。
  • AIが安価になれば使用量が増え、Nvidiaの売上がむしろ伸びる可能性がある。(ジェヴォンズのパラドックス)
  • RedditやQuora、ニューヨーク・タイムズ、ディズニーなどを買収し、独占データを使う戦略も考えられる。
  • 著作権訴訟が特許トロールのように繰り返される可能性がある。

総括

  • DeepSeekは中国企業であり、AIのオープンソース化を進めることで、米国に追いつこうとしている。
  • オープンソース化と低コスト化により、モデルは急速にコモディティ化し、価値の中心はアプリケーション層へ移行する可能性が高い。
  • AI技術の発展は規制と地政学的要素と絡みながら進行し、西側諸国の対応が問われる状況。