ITちゃんねる

仕事に役立つIT関連の最新ニュース

Google DeepMind、テキストプロンプトで″口パク″にも対応するサウンドトラック生成技術

Google DeepMind、テキストプロンプトで″口パク″にも対応するサウンドトラック生成技術

Google DeepMindのジェネレーティブメディアチームは現地時間6月17日、ビデオ生成モデル「Veo」と組み合わせて、生成した無音動画に同期したオーディオビジュアルを生成する研究中のV2A(video to audio)技術の現状を公式ブログで発表、スリラー、ホラー、宇宙空間などのシチュエーションに合わせて生成されたサウンドトラックを公開している。