メインコンテンツへスキップ
  1. 記事一覧/

NVIDIA×Microsoft、エージェント型AI統合基盤発表

著者
Alicia
AI・IT・ハードウェアの最新ニュースを自動配信するテックブログです。
目次
サムネイル

エージェント型AIの新時代が到来
#

エージェント型AIの実装には優秀なモデルだけでなく、高速ハードウェア、セキュアランタイム、レスポンシブなデータレイヤー、そして長時間推論に最適化されたモデルが必要です。NVIDIAとMicrosoftは、Windows端末、Azureクラウド、ローカル展開にわたる包括的なスタックを開発者に提供すると発表しました。

この記事では、Microsoft Buildで発表された両社の拡張パートナーシップの詳細を約5分で解説します

【3分で理解】重要ポイント早見表
#

製品・技術特徴提供時期
RTX Spark1ペタフロップのAI性能、最大128GBメモリ今秋
DGX Station for Windows20ペタフロップのFP4性能、748GBメモリQ4
Nemotron 3 Ultraオープン推論モデル今月
OpenShellセキュアランタイムGitHub Copilotで利用開始

Windows PCのAIエージェント対応:革命的な二つの製品
#

RTX Spark:パーソナルエージェント専用PC
#

RTX Sparkは、世界初のパーソナルエージェント専用Windows PCとして設計されています。主な特徴は以下の通りです:

  • AI性能:1ペタフロップの処理能力
  • メモリ:最大128GBの統合メモリ
  • バッテリー:終日利用可能
  • 技術基盤:CUDA、RTX、DLSS、TensorRTなど30年以上のNVIDIA技術革新
  • 製造パートナー:Microsoft Surface、ASUS、Dell、HP、Lenovo、MSI

DGX Station for Windows:企業向けAIスーパーコンピューター
#

DGX Station for Windowsは、最も強力なデスクサイドAIスーパーコンピューターとして位置づけられています:

  • プロセッサー:NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip
  • メモリ:最大748GBのコヒーレントメモリ
  • 性能:20ペタフロップのFP4性能
  • 対応モデル:最大1兆パラメーターのフロンティアモデル
  • 提供企業:ASUS、Dell、GIGABYTE、HP、MSI、Supermicro

両製品ともNVIDIA OpenShellを搭載し、セキュアバイデザインのランタイムを提供します。

Microsoft Foundryでの企業規模エージェントワークフロー
#

多様なモデルエコシステム
#

Foundry Agent Serviceでは以下のモデルが利用可能です:

  • NVIDIAAnthropicOpenAIのモデル
  • Hermes特殊エージェント
  • 内蔵アイデンティティとガバナンス機能

Nemotronシリーズの拡充
#

NVIDIA Nemotron 3 Ultraは、コーディング、研究、企業ワークフローでの長時間エージェント向けの新しいオープン推論モデルとして今月提供開始されます。併せて以下も利用可能:

  • Nemotron 3.5 ASR:音声認識
  • Nemotron 3.5 Content Safety:コンテンツ安全性

物理AIの進展
#

NVIDIA Cosmos 3は、物理AI向けの初の完全オープンオムニモデルとして、視覚推論、世界シミュレーション、行動生成を提供します。

データインフラの高速化
#

Microsoft Fabric Data Warehouseの性能向上
#

NVIDIA加速コンピューティングがMicrosoft Fabric Data Warehouseに統合され、Microsoftの内部ベンチマークで以下の結果を達成:

  • CPUベースライン比:最大6倍高速なSQL実行
  • 他社クラウドデータウェアハウス比:高並行性ワークロードで最大7倍高速

これにより、データを継続的に照会・推論するAIエージェントのペースに対応できるようになりました。

物理AIと自律システムの進歩
#

統合プラットフォームの提供
#

Microsoftは以下を統合しています:

  • NVIDIAのオープンソース物理AIスキルとツール
  • Azureとの連携
  • Physical AI Toolchain

開発者は、Cosmos 3のミクスチャー・オブ・トランスフォーマーアーキテクチャを活用し、ロボット、自動運転車、産業システムなどの自律システムをシミュレーション、訓練、展開できます。

ローカル展開の強化
#

Foundry Local on Azure Local
#

MicrosoftはNVIDIA RTX PRO 6000 Blackwell Server Editionプラットフォーム上でFoundry Local on Azure Localを提供します:

  • Nemotronオープンモデルファミリーとの連携
  • オンプレミス、ハイブリッド、ソブリン環境でのAIワークロード実行
  • マルチノード展開とvLLMランタイムサポート
  • 製造業、エネルギー、ソブリンデータセンターでの遅延敏感シナリオに対応

GitHub Copilotでのセキュアエージェント開発
#

NVIDIA OpenShellの統合
#

NVIDIA OpenShellがGitHub Copilotに統合され、以下の機能を提供:

  • 各エージェントの独立サンドボックス実行
  • すべての外部呼び出しのポリシー評価
  • コードとしてのポリシー記述
  • リポジトリでのバージョン管理
  • Apache 2.0ライセンスのオープンソース
  • モデル非依存オンプレミス、ハイブリッド、クラウド環境に対応

AI工場の実現と次世代プラットフォーム
#

Fairwater Wisconsin AI工場
#

MicrosoftのFairwater Wisconsin AI工場が予定より早く稼働開始しました:

  • 数十万台のNVIDIA Grace Blackwellシステムを単一AI工場として運用
  • ジョージア州の類似AI工場と接続
  • 最も要求の厳しいフロンティアモデル向けスケーラブル分散AIシステム

NVIDIA Vera Rubin プラットフォーム
#

MicrosoftはNVIDIA Vera Rubin プラットフォームを検証済みで、現在完全生産中です:

  • メガワットあたり最大10倍の推論スループット
  • エージェント型トークンあたりのコストを桁違いに削減
  • NVIDIA Confidential Computingによる大規模推論時のモデル・データ保護
  • NVIDIA Dynamo推論フレームワークによるソフトウェア最適化

まとめ:押さえておくべき5つのポイント
#

  1. 統合エコシステム:WindowsからクラウドまでシームレスなAIエージェント開発環境
  2. 革新ハードウェア:RTX SparkとDGX Stationによる個人・企業両対応
  3. セキュリティ重視:OpenShellによる安全なエージェント実行環境
  4. 性能向上:データウェアハウスの劇的な高速化とコスト削減
  5. オープン戦略:オープンソースモデルとツールによる開発者フレンドリーなアプローチ

詳細は元記事を参照してください。

参考元: NVIDIA Partners With Microsoft on Unified Stack for Agentic AI Deployment, From Windows Devices to Cloud to Local

関連記事

【緊急】AI運用コスト危機が深刻化!Microsoft・Meta・Amazonが制限強化、エージェントAIで1000倍のトークン消費

大手テック企業でAI運用コスト急騰が深刻な問題に。従業員の「トークンマックス化」が裏目に出て、エージェントAIが従来の最大1000倍のトークンを消費する事態が発生。企業の対応策と影響を詳しく解説します。