ロボットの学習とリーズニングを前進させる新しいオープンモデル
現在、ロボット開発は高コストで単一タスクに特化し、プログラミングが難しいという課題を抱えています。NVIDIAは、開発者が次世代AIロボットや自律マシンの開発に集中できるよう、オープンモデル群を構築しました。これらのモデルはHugging Faceで提供されており、以下のものが含まれます。
-
NVIDIA Cosmos™ Transfer 2.5 (https://github.com/nvidia-cosmos/cosmos-transfer2.5) および NVIDIA Cosmos Predict 2.5 (https://github.com/nvidia-cosmos/cosmos-predict2.5):フィジカルAI向けシミュレーションにおける物理ベースの合成データ生成とロボットポリシー評価を可能にする、オープンで完全にカスタマイズ可能な世界モデルです。
-
NVIDIA Cosmos Reason 2 (https://github.com/nvidia-cosmos/cosmos-reason2):オープンなリーズニング視覚言語モデル (VLM) で、インテリジェントマシンが人間のように物理世界を見て、理解し、行動することを可能にします。
-
NVIDIA Isaac™ GR00T N1.6 (https://github.com/NVIDIA/Isaac-GR00T):オープンなリーズニング視覚言語行動 (VLA) モデルであり、ヒューマノイドロボット向けに構築されています。これは全身制御を可能にし、NVIDIA Cosmos Reasonを活用してより優れたリーズニングと文脈理解を実現します。
Franka Robotics、NEURA Robotics、Humanoidといった企業では、GR00T対応ワークフローを活用し、ロボットの新しい動作のシミュレーション、トレーニング、検証を進めています。Salesforce(https://www.salesforce.com/blog/the-new-frontier-of-physical-ai-how-salesforce-and-nvidia-turn-robots-into-enterprise-agents/)は、Agentforce、Cosmos Reason、NVIDIAの動画検索および要約用Blueprint(https://build.nvidia.com/nvidia/video-search-and-summarization)を組み合わせ、自社ロボットが撮影した映像データを分析し、インシデント解決時間をこれまでの半分に短縮しています。また、LEM Surgical(https://app.accessnewswire.com/login?redirectURL=%2Fviewarticle%3Fid%3D1122325)は、NVIDIA Isaac for Healthcare(https://developer.nvidia.com/isaac/healthcare)とCosmos Transferを活用し、NVIDIA Jetson AGX Thor™(https://www.nvidia.com/ja-jp/autonomous-machines/embedded-systems/jetson-thor/)とHoloscanを搭載したDynamis手術ロボットの自律アームをトレーニングしています。XRLabs(https://www.xrlabs.ai/post/xrlabs-nvidia-jetson-thor-isaac-healthcare)は、外科用スコープにThorとIsaac for Healthcareを活用し、外科医にリアルタイムAI分析によるガイダンス機能を提供します。
ロボット開発を加速する新たなオープンソースフレームワーク
ロボットのトレーニングと評価にはスケーラブルなシミュレーションが不可欠ですが、現在のワークフローは断片化され、管理が難しい状況でした。NVIDIAは、複雑なパイプラインを簡素化し、研究から実世界への移行を加速する新たなオープンソースフレームワークをGitHubで公開しました。
-
NVIDIA Isaac Lab-Arena (https://developer.nvidia.com/isaac/lab-arena):シミュレーション環境における大規模なロボットポリシー評価とベンチマークのための協調システムを提供するオープンソースフレームワークです。Lightwheel(https://lightwheel.ai/media/robofinals-isaac-lab)との連携により設計されています。Isaac Lab-Arena(https://developer.nvidia.com/blog/simplify-generalist-robot-policy-evaluation-in-simulation-with-nvidia-isaac-lab-arena/)は、LiberoやRobocasaといった業界をリードするベンチマークと接続し、テストを標準化することで、物理ハードウェアへの展開前にロボットスキルが堅牢かつ信頼性が高いことを保証します。
-
NVIDIA OSMO (https://developer.nvidia.com/osmo):クラウドネイティブなオーケストレーションフレームワークで、ロボット開発を単一の使いやすいコマンドセンターに統合します。開発者はワークステーションから複数のクラウドインスタンスに至るまで、合成データ生成(https://www.nvidia.com/en-us/glossary/synthetic-data-generation/)、モデルトレーニング、ソフトウェアインザループのテストといったワークフローを定義、実行することができ、開発サイクルを加速します。OSMOは本日より利用可能で、Hexagon Roboticsなどのロボット開発者によって活用され、Microsoft Azure Robotics Acceleratorツールチェーンに統合されています。
NVIDIAとHugging FaceがオープンソースのフィジカルAI開発を加速
ロボティクスはHugging Faceにおいて最も急速に成長している分野の一つであり、NVIDIAのオープンモデルとデータセットがトップのダウンロード数を占めています(https://aiworld.eu/story/how-nvidia-is-powering-robotics-with-open-models-and-data)。NVIDIAはHugging Faceと協力し、オープンソースのIsaacおよびGR00T(https://developer.nvidia.com/blog/simplify-generalist-robot-policy-evaluation-in-simulation-with-nvidia-isaac-lab-arena/)テクノロジを主要なオープンソースロボティクスフレームワークであるLeRobotに統合しています。これにより、統合されたソフトウェアおよびハードウェアツールへの効率的なアクセスを提供し、エンドツーエンドの開発を加速します。GR00T N1.6とIsaac Lab-ArenaがLeRobotライブラリで利用可能になり、ファインチューニングや評価が容易になります。
Hugging FaceのオープンソースヒューマノイドReachy 2はNVIDIA Jetson Thor™ ロボティクス コンピューター(https://www.nvidia.com/ja-jp/autonomous-machines/embedded-systems/jetson-thor/)との完全な相互運用が可能で、開発者はGR00T N1.6を含むあらゆるVLAを実行できます。また、Hugging Faceのオープンソース卓上ロボットReachy Miniは、NVIDIA DGX Spark™(https://www.nvidia.com/ja-jp/products/workstations/dgx-spark/)と完全な相互運用が可能となり、NVIDIAの大規模言語モデルやローカルで動作する音声およびコンピュータービジョン向けオープンモデルを活用したカスタム体験を構築できます。
ヒューマノイドロボット開発におけるNVIDIA Jetson Thorの採用
NVIDIA Jetson Thorは、リーズニング機能を備えたヒューマノイドロボット(https://www.nvidia.com/ja-jp/glossary/humanoid-robot/)の膨大な演算要件を満たします。CESでは、ヒューマノイド開発者たちがJetson Thorを統合した最先端のロボットを披露しています。
-
NEURA Roboticsは、Porscheデザインの第3世代ヒューマノイドに加え、精密な操作向けに最適化された小型ヒューマノイドを投入します。
-
Richtech Roboticsは、複雑な作業環境での高度な操作と移動を実現する移動型ヒューマノイドDexを発表しています。
-
AGIBOTは、産業用および民生用のヒューマノイドと、Isaac Sim(https://developer.nvidia.com/isaac/sim)と統合されたロボットシミュレーションプラットフォーム、Genie Sim 3.0を導入します。
-
LG Electronicsは、屋内での家事を幅広くこなせるように設計された新しい家庭用ロボットを発表しました。
-
Boston Dynamics、Humanoid、RLWRLDの各社は、既存のヒューマノイドロボットにJetson Thorを統合し、ナビゲーションと操作能力を強化しています。
フィジカルAIを産業用エッジへ
NVIDIA Jetson Orin™(https://www.nvidia.com/ja-jp/autonomous-machines/embedded-systems/jetson-orin/)ユーザーにコスト効率に優れた高性能アップグレードパスを提供する新しいNVIDIA Jetson™ T4000モジュール(https://developer.nvidia.com/blog/accelerate-ai-inference-for-edge-and-robotics-with-nvidia-jetson-t4000-and-nvidia-jetpack-7-1/)が提供開始されます。NVIDIA Blackwellアーキテクチャを自律型マシンおよび汎用ロボティクスにもたらし、1,000個購入時の単価は1,999ドルとなります。1,200 FP4 TFLOPSと64GBメモリを備え、前世代の4倍の性能を発揮し、省電力が求められる自律システムに最適な70W内に構成可能です。
今月後半に提供開始予定のNVIDIA IGX Thor(https://www.nvidia.com/ja-jp/edge-computing/products/igx/)は、産業用エッジ領域にロボティクスを拡張し、エンタープライズソフトウェアのサポートと機能安全に対応した高性能AIコンピューティングを提供します。ArcherはIGX Thorを使用してAIを航空分野に導入し、航空機の安全性、空域統合、自律動作対応システムにおける重要な機能を前進させています。
以下のパートナーは、エッジAI、ロボティクス、組み込みアプリケーション向けにThor搭載システムを提供しています。
-
AAEON
-
Connect Tech
-
EverFocus(https://www.everfocus.com/news-detail/eac-100t6-nvidia-jetson-t4000/)
-
ForeCR(https://www.forecr.io/blogs/news-press-releases/jetson-thor-platform-support-to-nvidia-jetson-t4000)
-
RealTimes
-
Syslogic
-
Vecow(https://www.vecow.com/dispPageBox/vecow/VecowCP.aspx?ddsPageID=NEWS_EN&&dbid=5098113225)
-
YUAN(https://www.yuan.com.tw/news/preview-news?id=212&t=d74eb353274d4fd78e460600ae11a561)
さらに、CaterpillarはNVIDIAとの協業を拡大し、建設および鉱業分野の設備や作業現場に高度なAIと自律性を導入する予定です。CaterpillarのCEOであるJoe Creed氏は、1月7日(水)の基調講演(https://www.ces.tech/schedule/caterpillar-keynote/)において、NVIDIAのロボティクスおよびエッジAI担当バイスプレジデントであるディープゥ タラ氏と共に詳細を発表する予定です。
詳細については、NVIDIA Live at CES(https://www.nvidia.com/ja-jp/events/ces/)をご覧ください。
NVIDIA(https://www.nvidia.com/ja-jp/)はAIとアクセラレーテッドコンピューティングの世界的なリーダーとして、今回の発表を通じてAI駆動型ロボティクスによる多くの産業革新を可能にしています。