手術室に「頭脳」をもたらす!Direavaが外科特化型生成AI「Surgical VLM」を開発
Direava株式会社は、手術室に「頭脳」をもたらす画期的な外科特化型生成AI「Surgical VLM」を開発しました。このAIは、手術状況をリアルタイムに理解し、外科医と高度な対話を行うことが可能です。NEDOと経済産業省が推進する生成AI開発力強化プロジェクト「GENIAC(Generative AI Accelerator Challenge)」の一環として開発され、すでに手術現場での実証に成功しています。
従来のAIを超えた「医師の頭脳」
これまで外科領域で活用されてきた生成AIは、患者の臓器や患部の画像認識(目の機能)を補助するにとどまっていました。しかし、今回開発された「Surgical VLM」は、手術状況から「次にどうすべきか」を「医師の頭脳」のように理解し、外科医と対話できる点が大きな特徴です。
2026年2月20日には、慶應義塾大学病院において胃癌の手術現場で実証試験が行われました。この試験では、医療教育現場が求める解剖学的正確性、臨床的有用性、文章の流暢性といった要求水準をクリアし、その有用性が確認されました。

GENIACプロジェクトとDireavaの挑戦
この開発は、NEDOが2024年度から経済産業省とともに推進するGENIACプロジェクトの一環として行われました。GENIACは、汎用基盤モデルからさまざまな領域特化の基盤モデル開発を支援しており、2026年3月末時点で53社が生成AI基盤モデルの開発に取り組んでいます。
Direavaは、慶應義塾大学医学部発の医療系スタートアップ企業であり、これまでにAIを搭載したプログラム医療機器「手術映像認識プログラム・キノスラ」の製造販売承認を取得するなど、医療系AIの開発実績を持っています。2025年7月にGENIACに採択され、自社開発した基盤モデルをベースに大量の術中画像と自然言語キャプションのデータセットを学習させることで、「Surgical VLM」を開発しました。
手術の文脈を理解する「頭脳」
「Surgical VLM」は、大量の高品質な術中画像と構造説明文のペアデータセットを学習した、視覚・言語統合型AI基盤モデルです。術中画像を入力として解剖構造や手術状況を認識し、日本語による説明文を自動生成します。
このAIの最大のポイントは、手術の進捗をリアルタイムに把握し、外科医や医学生と対話できるモデルを構築したことです。これは現在商用化されている既存の外科領域AIシステムにはない機能であり、世界でも類を見ない外科特化型生成AIの開発と言えるでしょう。
臨床現場での高い評価
慶應義塾大学病院での実証試験では、臨床有用性や教育効果を検証するため、手術教育に必要とされる評価項目を設定しました。結果として、解剖学的正確性84.7%、臨床的有用性82.9%、文章の流暢性97.4%と、全ての目標値を満たしました。これにより、AIが外科手術の進行状況を正確に認識し、手術現場で求められる適切な情報提示や、専門用語を用いた自然な対話が成立することが実証されました。
今後の展望と医療への貢献
Direavaは、「Surgical VLM」の事業化に向けて研究開発と実証を継続し、2026年中のサービス提供開始を目指しています。今後は、対応可能な症例の拡大やシステム操作性の向上に向けた追加の実証実験も進められます。
この生成AIは、日本の専門医が監修した高品質な医療データのみを厳選して学習させており、生成AI特有のハルシネーション(もっともらしい「嘘」の情報生成)を極限まで排除した安全な「日本発特化型モデル」です。
「Surgical VLM」の社会実装を通じて、医療データの安全保障を確保しつつ、日本が世界に誇る「外科技術」の継承や外科教育の高度化に寄与し、将来的な医療現場全体の安全性向上に貢献することが期待されます。
NEDOのポスト5G情報通信システム基盤強化研究開発事業に関する詳細はこちらをご覧ください。