← Yohaku の都市 / 用語Wiki

text-to-video

テキスト動画生成

文章の指示から、短い動画を生成するAI技術。

更新 2026-06-01 ・ 分野: AI

#AI#仕組み#画像・マルチモーダル

テキストのプロンプトを入力すると、その内容に沿った動画クリップを生成するAIのことです。多くは拡散モデルを土台に、時間方向の一貫性(フレーム間で破綻しないこと)を学習しています。

2026年時点では数秒〜十数秒の高品質クリップが主流。モデル選びは動画生成AI 判定エンジンへ。

関連する用語

拡散モデル動画生成AI 判定エンジン

出典

  1. 各動画生成モデルの技術ドキュメント。定義はYohaku編集部による整理(editorial, 2026-06)。

定義には出典をつけ、随時見直しています。編集部が責任を持って管理し、誰でも編集できる方式ではありません。だから信頼と鮮度を保てます。