メインコンテンツへスキップ
  1. 記事一覧/

AIエージェントをゲームで鍛える:23億ドルの賭け

·6 分
著者
Alicia
AI・IT・ハードウェアの最新ニュースを自動配信するテックブログです。
目次
サムネイル

ビデオゲームがAIロボットの「脳」を育てるとしたら?

General Intuitionは、その大胆な仮説に23億ドル(約2,300億円)の企業評価額をかけて挑んでいます。

この記事で分かること
#

  • General Intuitionの資金調達と評価額の詳細
  • ゲームデータでAIを訓練する独自アプローチの仕組み
  • 実際のロボットへの応用事例
  • 創業者のユニークな倫理観と事業哲学

約6分で読めます(本文約3,000文字)


【結論】重要ポイント3選
#

  1. 3億2000万ドルを調達し、総調達額は4億5400万ドルに到達。Khosla VenturesやJeff Bezos、Eric Schmidtらが参加。
  2. ゲームの「操作ログ」がキー。映像だけでなく、プレイヤーがどのボタンをいつ押したかという行動データが、競合との最大の差別化要因。
  3. わずか8分のデータでロボットを制御。ゲームで鍛えたAIモデルを四足歩行ロボットへ転用することに成功。

General Intuitionとは?基本概念の解説
#

General Intuitionは、ニューヨークを拠点とするAIスタートアップです。

31歳のCEO、Pim de Witteが共同創業しました。

同社は、ビデオゲームのプレイデータを使って汎用AIエージェントを訓練することを中心事業としています。

「汎用AIエージェント」とは、特定タスクに限定されず、さまざまな環境で自律的に行動できるAIのことです。

このモデルは、ゲーム内の仮想空間から、シミュレーション、そして現実世界のロボット制御まで、同一の「頭脳」で対応できることを目指しています。

同社のルーツは、de Witteが運営するMedalというゲーム動画共有プラットフォームです。

Medalにはゲームプレイ映像が数億時間分アップロードされており、これがAI訓練の初期データセットとなりました。


主な特徴と技術仕様
#

ゲームデータ活用の核心:「操作ラベル」の存在
#

要素内容
データソースMedalにアップロードされたゲームプレイ映像
訓練内容空間・時間的推論(移動の仕方の学習)
差別化要因映像だけでなく「どのボタンをいつ押したか」の行動ログ
ロボット適応わずか8分の現実世界データでファインチューニング
訓練環境内製ワールドモデル(社内通称「ジム」)

de Witteが強調するのは、映像データだけでは不十分という点です。

「競合の多くは、映像だけから行動を推測しようとしている。それでは足りない」(de Witte)

同社のモデルは、行動ラベル付きデータにより、「自己」と「環境」を区別する能力を獲得するとしています。

これにより、壁は通り抜けられないこと、はしごは登るためにあること、影は太陽の動きに連動することなどを、モデルが自然に習得したと説明されています。

ワールドモデル(世界モデル)について
#

ワールドモデルとは、AIが現実や仮想空間の物理法則を内部的に再現する仕組みのことです。

General Intuitionにとって、このワールドモデルは販売製品ではなく訓練環境と位置付けられています。

最終的に販売するのは、そのジムで鍛えられたエージェントモデルそのものです。


業界への影響とメリット
#

なぜゲームデータがAI訓練に有効なのか?
#

現実世界のロボット訓練データは、収集に時間とコストがかかります。

General Intuitionの賭けは、ゲームプレイが現実データの「スケーラブルな近道」になるという仮説です。

Khosla Venturesの創業者、Vinod Khoslaはこう語ります。

「LLMで推論能力が突如として現れたように、ワールドモデルでも量子的跳躍が起きる。それが『直感』の出現だ。ゲームの人間行動データこそが、その鍵だ」

投資家が注目する「データの堀」
#

Khoslaがこの投資を「M&Aターゲットではなく、世代を超えた賭け」と表現する理由の一つが、Medalを通じた独自データの優位性です。

複数の大手ラボからMedalへの買収オファーがあったことも、このデータの価値を裏付けています。


実際の活用方法・導入のポイント
#

現在のロボット応用事例
#

取材時、General Intuitionのオフィスでは四足歩行ロボットが稼働していました。

  • ロボットは1台のカメラのみを頼りに周囲を探索
  • 道を覚えていない空間でも自律的に歩き回る
  • 街中で収集した8分間のデータでファインチューニング済み
  • オフィス内の椅子やゴミ箱に軽くぶつかりながらも歩行継続

この「オフィス外で取得したデータでオフィス内を歩ける」という汎化能力が、同社技術の核心といえます。

APIの一般公開予定
#

調達資金の一部は、夏の終わりまでにAPIをより広く利用可能にすることに充てられる予定です。

大部分の資金はComputeCapacityの拡張と次世代モデルの事前訓練に使われます。

クラウドインフラ企業CoreWeaveとの契約も締結済みです。


他社・従来技術との違い
#

比較項目General Intuition多くの競合
学習データゲーム映像+操作ログゲーム映像のみ
行動推定実際の操作記録を使用映像から推測
現実適応8分のデータで転用可能大量の現実データが必要
訓練環境独自ワールドモデル(ジム)詳細は元記事を参照
データ独自性Medal経由の専有データ詳細は元記事を参照

de Witteは、LLM(大規模言語モデル)との違いについてもこう述べています。

「スクリーン上の情報に反応して行動し、かつ現実の動態にも対応できる。LLMには決してできないことだ」


よくある質問(FAQ)
#

Q. General Intuitionはどのくらい資金を調達しているの?

A. 2026年6月に3億2000万ドルを調達しました。 企業評価額は23億ドルです。 前回の1億3400万ドルと合わせた総調達額は、4億5400万ドルとなっています。

Q. 誰が投資しているの?

A. Khosla Venturesがラウンドをリードしました。 General Catalyst、Jeff Bezos、Eric Schmidt、Nico Rosberg、Google DeepMindおよびMITの研究者が参加しています。

Q. 軍事・兵器利用はされるの?

A. CEO de Witteは明確に線引きをしています。 「人間を傷つけるためのエージェントは作らない」という立場です。 一方で、捜索・救助ミッションへの活用は問題ないとしています。

Q. ゲーマー向けの取り組みもある?

A. 同社はNerveというプラットフォームを立ち上げています。 ゲーマーが既存の機材を使って収入を得られる求人マーケットプレイスです。 データラベリングから始まり、ロボットの遠隔操作などへ発展できる仕組みです。


まとめ:押さえておくべき重要ポイント
#

  1. 23億ドル評価で3億2000万ドルを調達。総調達額は4億5400万ドルに到達。
  2. ゲームの「操作ログ」が最大の差別化。映像だけでなく行動データを活用する点が競合との違い。
  3. 8分のデータでロボット制御を実現。ゲームで訓練したモデルを現実のロボットへ転用することに成功。
  4. 倫理的な使途制限を明言。人を傷つけるエージェントは作らないという方針を創業者自ら表明。
  5. 夏の終わりまでにAPI一般公開予定。コンピュート拡張とモデル訓練に資金の大半を投じる計画。

General Intuitionの取り組みは、AIエージェントと物理ロボットの融合という次世代AIの最前線を走るものです。

今後のAPI公開や技術進化の動向は、引き続き注目が必要です。


参考元: General Intuition’s $2.3B bet that video games can train AI agents for the real world

関連記事

AIエージェント効率化:MITのMurakkab登場

·7 分
MITとMicrosoftが開発した「Murakkab」は、AIエージェントのワークフローを自動最適化し、エネルギー消費を約27%に削減。クラウド運用コストと計算資源の無駄を大幅に削減する新技術を解説。

Claude Tag:Slackで学習するAnthropicのAI

·7 分
AnthropicがSlack向け新機能「Claude Tag」をリサーチプレビューで発表。常時稼働のAIチームメイトとして組織のコンテキストを学習し、タスク自動実行や能動的な情報共有を実現します。