ブログ

AI動画生成「Vidu」が大規模アップデートを発表！音声・映像統合生成「Vidu Q3」で制作プロセスを劇的に変革

2026.02.02

Vidu Q3：ストーリーテリングのための音声・映像統合生成

今回発表された「Vidu Q3」は、最大16秒のネイティブ音声と映像を単一パスで生成できる長編AI動画モデルです。ナラティブ（物語）制作に特化して設計されており、音声と映像をモデルレベルで直接統合することで、完全に同期されたストーリーテリングを実現します。

Vidu Q3は、多言語音声生成、精密なリップシンク、映画的カメラ制御、シームレスなショット遷移、そしてネイティブ1080p出力に対応しています。テキストも後処理ではなく視覚構成の一部として生成されるため、アニメーションやショートドラマ、映画制作といった物語主導のフォーマットでその真価を発揮するでしょう。

主な機能
- 音声・映像の同時生成：最大16秒のネイティブ音声・映像を単一パスで出力
- 多言語対応リップシンク：中国語・日本語・英語に対応し、キャラクターの口の動きが発話内容と完全同期
- 映画的カメラ制御：ドリー、パン、チルトの詳細指定、シームレスなカット割り制御
- ネイティブ1080p（フルHD）出力：看板・字幕・UI要素などのテキスト情報も正確に表現
- ストーリーボード編集：時間経過とテンポ調整が単一カット内で可能

詳しくは、Viduの公式サイトをご覧ください。
Vidu Q3 詳細

Vidu Q2 Reference-to-Video Pro：制御可能なクリエイションの実現

同時に発表された「Vidu Q2 Reference-to-Video Pro」は、「あらゆるものを参照素材として活用できる」世界初の動画モデルです。これにより、AI動画生成は一発生成から、構造化された参照駆動型のワークフローへと進化しました。クリエイターは、人物、シーン、アクション、表情、エフェクト、テクスチャなどの要素を組み合わせた入力を行い、全体を再生成することなく部分的な修正が可能です。これにより、制作の制御性、一貫性、効率が格段に向上します。

主な機能
- 複数参照の同時活用：2つの動画 + 4つの画像を統合ワークフロー内で参照可能
- 要素の追加・削除・変更：全体を再生成せずに部分修正が可能
- 表情・感情転写：参照動画の表情や感情の流れを別の人物へ転写
- 動作再現：ダンスなどの動作を異なるキャラクターで再現
- スタイル変換：動画全体を日本アニメ風、ピクサー風、クレイアニメーション風などに一括変換

詳しくは、Viduの公式サイトをご覧ください。
Vidu Q2 Reference-to-Video Pro 詳細

その他の主要アップデート

Reference Hub：世界初のAI動画主体ベース制作コミュニティ

Reference Hubは、Viduの参照駆動型動画生成フレームワークを基盤とした、世界初のAI動画主体ベース制作コミュニティです。クリエイターは、8つの構造化された主体カテゴリから選択することで、一貫性と効率を向上させたプロフェッショナルグレードの動画を制作できます。ローンチ時点で、200種以上の厳選された主体が利用可能です。

詳しくは、Viduの公式サイトをご覧ください。
Reference Hub 詳細

Vidu Agent 1.0：ワンクリック動画制作を実現

Vidu Agent 1.0は、インテリジェントなプランニングとリアルタイム生成により、ワンクリックでの動画制作を可能にします。ユーザー独自のBGMアップロードやナレーション削除機能、ストーリーボードベースの編集が自動実行されます。清華大学と共同開発した高速化フレームワーク「TurboDiffusion」により、動画生成速度は最大200倍に高速化されています。

詳しくは、Viduの公式サイトをご覧ください。
Vidu Agent 1.0 詳細

研究開発から実装までの「速度」を競争力に

Viduは、最先端の研究成果を実用可能なシステムへ迅速に転換し、制作ワークフローに直接組み込む「研究開発の実装速度」を競争力の源泉としています。この開発思想は、「China Speed」として知られる、製品開発サイクルの圧倒的短縮による市場優位性の獲得を体現しています。清華大学との共同研究によるTurboDiffusionがその核心技術となり、グローバル競合との差別化要因となっています。

ベンチマーク評測でグローバル第2位を獲得

AI評測機関「Artificial Analysis」が発表した最新のText-to-Videoリーダーボードにおいて、「Vidu Q3 Pro」はELOスコア1,241を獲得し、グローバル第2位にランクインしました。これは、Runway Gen-4.5（3位）、Google Veo 3.1（5位）、OpenAI Sora 2 Pro（10位）といった主要な競合を上回る結果であり、Viduが世界トップレベルの動画生成プラットフォームとしての地位を確立していることを示しています。

詳しくは、Artificial Analysisのリーダーボードをご覧ください。
Artificial Analysis Text-to-Video Leaderboard