NVIDIAがエージェント型AI開発を革新するオープンモデル「Nemotron 3」ファミリーを発表

Nemotron 3ファミリーの主な特徴

Nemotron 3モデルは、Nano、Super、Ultraの3サイズで展開され、画期的なハイブリッド潜在Mixture-of-Experts (MoE) アーキテクチャを採用しています。これにより、開発者はマルチエージェントシステム構築時の通信オーバーヘッド、コンテキストドリフト、高い推論コストといった課題に対応し、透明性の高いAIモデルを信頼して利用できるようになります。

NVIDIAの創業者兼CEOであるジェンスン フアン氏は、「オープンイノベーションはAIの進歩の基盤です。Nemotronを通じて、私たちは高度なAIをオープンプラットフォームへと変革し、開発者が大規模なエージェントシステムを構築するために必要な透明性と効率性を提供します」と述べています。

Nemotronは、ヨーロッパから韓国に至るNVIDIAのソブリンAIの取り組みを支援しており、各地域のデータ、規制、価値観に沿ったAIシステムの構築を可能にします。Accenture、ServiceNow、Perplexityなど多くの企業が、Nemotronファミリーのモデルを早期に導入し、製造、サイバーセキュリティ、ソフトウェア開発、メディア、通信など、さまざまな業界のAIワークフローを強化しています。

3つのサイズで展開されるNemotron 3モデル

Nemotron 3 MoEモデルファミリーは、それぞれの用途に合わせた3つのサイズで提供されます。

  • Nemotron 3 Nano: 300億パラメータの小型モデルで、一度に最大30億パラメータをアクティブ化し、ターゲットを絞った高効率タスクに最適です。ソフトウェアのデバッグ、コンテンツ要約、AIアシスタントワークフロー、推論コストの低い情報検索などに活用できます。独自のハイブリッドMoEアーキテクチャにより、Nemotron 2 Nanoと比較してトークンスループットが最大4倍向上し、リーズニングトークン生成が最大60%削減されることで、推論コストが大幅に削減されます。100万トークンのコンテキストウィンドウを備え、より正確で長時間かつ複数ステップのタスクにおける情報の関連付け能力が向上しています。独立機関Artificial Analysisは、このモデルを同規模のモデルの中で最もオープンで効率的であり、最高の精度を誇ると評価しています。

  • Nemotron 3 Super: 約1,000億パラメータを持ち、トークンあたり最大100億パラメータがアクティブになる高精度リーズニングモデルです。多数のエージェントが連携して複雑なタスクを低レイテンシで実行する必要があるマルチエージェントアプリケーションに優れています。

  • Nemotron 3 Ultra: 約5,000億パラメータを持ち、トークンあたり最大500億パラメータがアクティブになる大規模リーズニングエンジンです。綿密な調査と戦略的計画が求められる複雑なAIワークフローに適しています。

Nemotron 3 SuperおよびUltraは、NVIDIA Blackwellアーキテクチャ上でNVIDIAの超高効率な4ビットNVFP4トレーニングフォーマットを採用し、メモリ要件を大幅に削減してトレーニングを高速化しています。これにより、高精度フォーマットと比較して精度を犠牲にすることなく、既存のインフラ上でより大規模なモデルをトレーニングできます。

AIエージェントカスタマイズのための新しいオープンツールとデータ

NVIDIAは、特化型AIエージェントを構築するすべての人が利用できる、トレーニングデータセットと最先端の強化学習ライブラリのコレクションもリリースしました。

3兆トークンに及ぶNemotronの事前トレーニング事後トレーニング強化学習データセットは、高度な能力を持つドメイン特化型エージェントの作成に必要な、豊富なリーズニング、コーディング、複数ステップのワークフロー例を提供します。Nemotron Agentic Safety Datasetは、複雑なエージェントシステムの安全性を評価、強化する上で役立つ実世界のテレメトリを提供します。

開発を加速させるため、NVIDIAはオープンソースライブラリとして以下のものもリリースしました。

これらはNemotronモデルのトレーニング環境と事後トレーニングの基盤を提供し、モデルの安全性とパフォーマンスを検証するためのNeMo Evaluatorも提供します。これらのツールとデータセットは、GitHubとHugging Faceで公開されています。

Nemotron 3は、LM Studio、llama.cpp、SGLangvLLMでサポートされています。また、Prime IntellectとUnslothは、NeMo Gymのトレーニング環境をワークフローに統合し、強化学習トレーニングをより迅速かつ容易に利用できるようにしています。

提供状況

Nemotron 3 Nanoは、本日よりHugging Faceおよび以下の推論サービスプロバイダーを通じて利用可能です。

また、NemotronはCouchbase、DataRobot、H2O.ai、JFrog、Lambda、UiPathなどのエンタープライズAIおよびデータインフラプラットフォームでも提供されます。パブリッククラウドを利用する顧客は、Amazon Bedrock(サーバーレス)経由でAWS上でNemotron 3 Nanoを利用できます。Google Cloud、CoreWeave、Crusoe、Microsoft Foundry、Nebius、Nscale、Yottaでも近日中にサポートが開始される予定です。

Nemotron 3 Nanoは、NVIDIA NIM™ マイクロサービスとしても提供され、NVIDIAアクセラレーテッドインフラ上のあらゆる場所に、プライバシーと制御を最大化しながら、安全かつスケーラブルに展開できます。

Nemotron 3 SuperおよびUltraは、2026年上半期に提供開始が予定されています。

最近の記事
PAGE TOP