AI動画生成「Vidu」が大規模アップデートを発表!音声・映像統合生成「Vidu Q3」で制作プロセスを劇的に変革

Vidu Q3:ストーリーテリングのための音声・映像統合生成

今回発表された「Vidu Q3」は、最大16秒のネイティブ音声と映像を単一パスで生成できる長編AI動画モデルです。ナラティブ(物語)制作に特化して設計されており、音声と映像をモデルレベルで直接統合することで、完全に同期されたストーリーテリングを実現します。

Vidu Q3は、多言語音声生成、精密なリップシンク、映画的カメラ制御、シームレスなショット遷移、そしてネイティブ1080p出力に対応しています。テキストも後処理ではなく視覚構成の一部として生成されるため、アニメーションやショートドラマ、映画制作といった物語主導のフォーマットでその真価を発揮するでしょう。

  • 主な機能

    • 音声・映像の同時生成:最大16秒のネイティブ音声・映像を単一パスで出力

    • 多言語対応リップシンク:中国語・日本語・英語に対応し、キャラクターの口の動きが発話内容と完全同期

    • 映画的カメラ制御:ドリー、パン、チルトの詳細指定、シームレスなカット割り制御

    • ネイティブ1080p(フルHD)出力:看板・字幕・UI要素などのテキスト情報も正確に表現

    • ストーリーボード編集:時間経過とテンポ調整が単一カット内で可能

詳しくは、Viduの公式サイトをご覧ください。
Vidu Q3 詳細

Vidu Q2 Reference-to-Video Pro:制御可能なクリエイションの実現

同時に発表された「Vidu Q2 Reference-to-Video Pro」は、「あらゆるものを参照素材として活用できる」世界初の動画モデルです。これにより、AI動画生成は一発生成から、構造化された参照駆動型のワークフローへと進化しました。クリエイターは、人物、シーン、アクション、表情、エフェクト、テクスチャなどの要素を組み合わせた入力を行い、全体を再生成することなく部分的な修正が可能です。これにより、制作の制御性、一貫性、効率が格段に向上します。

  • 主な機能

    • 複数参照の同時活用:2つの動画 + 4つの画像を統合ワークフロー内で参照可能

    • 要素の追加・削除・変更:全体を再生成せずに部分修正が可能

    • 表情・感情転写:参照動画の表情や感情の流れを別の人物へ転写

    • 動作再現:ダンスなどの動作を異なるキャラクターで再現

    • スタイル変換:動画全体を日本アニメ風、ピクサー風、クレイアニメーション風などに一括変換

詳しくは、Viduの公式サイトをご覧ください。
Vidu Q2 Reference-to-Video Pro 詳細

その他の主要アップデート

Reference Hub:世界初のAI動画主体ベース制作コミュニティ

Reference Hubは、Viduの参照駆動型動画生成フレームワークを基盤とした、世界初のAI動画主体ベース制作コミュニティです。クリエイターは、8つの構造化された主体カテゴリから選択することで、一貫性と効率を向上させたプロフェッショナルグレードの動画を制作できます。ローンチ時点で、200種以上の厳選された主体が利用可能です。

詳しくは、Viduの公式サイトをご覧ください。
Reference Hub 詳細

Vidu Agent 1.0:ワンクリック動画制作を実現

Vidu Agent 1.0は、インテリジェントなプランニングとリアルタイム生成により、ワンクリックでの動画制作を可能にします。ユーザー独自のBGMアップロードやナレーション削除機能、ストーリーボードベースの編集が自動実行されます。清華大学と共同開発した高速化フレームワーク「TurboDiffusion」により、動画生成速度は最大200倍に高速化されています。

詳しくは、Viduの公式サイトをご覧ください。
Vidu Agent 1.0 詳細

研究開発から実装までの「速度」を競争力に

Viduは、最先端の研究成果を実用可能なシステムへ迅速に転換し、制作ワークフローに直接組み込む「研究開発の実装速度」を競争力の源泉としています。この開発思想は、「China Speed」として知られる、製品開発サイクルの圧倒的短縮による市場優位性の獲得を体現しています。清華大学との共同研究によるTurboDiffusionがその核心技術となり、グローバル競合との差別化要因となっています。

ベンチマーク評測でグローバル第2位を獲得

AI評測機関「Artificial Analysis」が発表した最新のText-to-Videoリーダーボードにおいて、「Vidu Q3 Pro」はELOスコア1,241を獲得し、グローバル第2位にランクインしました。これは、Runway Gen-4.5(3位)、Google Veo 3.1(5位)、OpenAI Sora 2 Pro(10位)といった主要な競合を上回る結果であり、Viduが世界トップレベルの動画生成プラットフォームとしての地位を確立していることを示しています。

詳しくは、Artificial Analysisのリーダーボードをご覧ください。
Artificial Analysis Text-to-Video Leaderboard

グローバルでの広がり

2024年4月のローンチ以降、Viduは200以上の国と地域で展開され、4,000万人以上のクリエイターと10,000以上の開発者・企業顧客にサービスを提供しています。プラットフォーム上で生成された動画は5億本以上に達し、その70%以上が商業プロジェクトで活用されているとのことです。

動画市場の背景とViduが目指す解決策

日本国内の動画配信サービス市場は拡大を続け、グローバルでもAI動画生成市場は2032年には25.629億米ドル規模に成長する見込みです。特にショート動画の視聴回数は急増しており、制作現場では時間やコスト、音声と映像の同期精度、多言語対応、カメラワーク制御といった課題が山積しています。

ShengShu Technologyは、独自開発のU-ViTアーキテクチャを用いたマルチモーダル大規模基盤モデル技術を活かし、「音声と映像を一括生成し、制作工程を統合する」ことで、これらの課題解決を目指しています。

提供開始日および料金プラン

新機能は2026年1月30日より順次展開されています。無料プランで80クレジット相当の機能試用が可能で、有料プランとしてはスタンダード、プレミアム、アルティメット、エンタープライズ(カスタマイズ対応)が用意されています。

詳細な料金およびクレジット体系については、公式サイトで確認できます。
Vidu 料金プラン

関連リンク

最近の記事
PAGE TOP