通義萬相 Wan2.6 画像から動画生成モデル(wan2.6-i2v)を使用して、先頭フレーム画像とテキストプロンプトから滑らかな動画を生成します。自動音声合成、カスタムオーディオ、マルチショットナラティブをサポート
API Tokenを使用して認証を行ってください
タスクパラメータ
先頭フレーム画像 URL(必須) 公衆インターネット URL(HTTP/HTTPS)または Base64 エンコードをサポート 画像形式:JPEG、JPG、PNG(透明チャンネル非対応)、BMP、WEBP 画像解像度:幅と高さの範囲は[360, 2000]ピクセル ファイルサイズ:10MB以下
"https://media.sinancode.com/uploads/20251217/a6aa177e82d58f6738109807a0548605.webp"
オーディオを追加するかどうか(オプション、デフォルト true) audio_url が空の場合に有効 true:ビデオに自動でオーディオを追加 false:オーディオを追加せず、無音ビデオを出力
オーディオファイル URL(オプション、wan2.5-i2v-preview のみサポート) モデルはこのオーディオを使用してビデオを生成し、音と映像を同期させます 形式:wav、mp3、長さ:3~30秒、ファイルサイズ:15MB以下
ビデオの長さ(オプション、デフォルト 5 秒) wan2.6-i2v:選択可能な値は 5、10、15
5, 10, 15 モデル名(オプション、空欄推奨) 空欄の場合は最新バージョンのモデルを使用し、今後のモデルアップグレードは自動的に適用されます 現在のデフォルト:wan2.6-i2v
wan2.6-i2v ネガティブプロンプト(オプション、最大 500 文字) ビデオ映像に含めてほしくない内容を記述するために使用します
500テキストプロンプト(オプション、最大 2000 文字) 生成される画像に含めてほしい要素や視覚的特徴を記述するために使用します ビデオエフェクトパラメータ(template)を使用する場合、promptパラメータは無効です
2000プロンプトのインテリジェントリライトを有効化するかどうか(オプション、デフォルト true) 有効にすると、大規模言語モデルを使用して入力プロンプトをインテリジェントにリライトします
解像度レベル(オプション、デフォルト 1080P) wan2.6-i2v:選択可能な値 720P、1080P(480Pは非対応)
720P, 1080P ランダムシード(オプション、範囲 0-2147483647)
0 <= x <= 2147483647ショットタイプ(オプション、デフォルト single、wan2.6-i2v のみサポート) prompt_extend=true の場合のみ有効 single:シングルショットビデオ multi:マルチショットビデオ(複数のショット切り替えをサポートし、被写体の一貫性を維持)
single, multi ビデオエフェクトテンプレート名(オプション) エフェクトを使用する場合、prompt パラメータは無効です モデルによってサポートするエフェクトテンプレートが異なります
ウォーターマークを追加するかどうか(オプション、デフォルト false) ウォーターマークはビデオの右下に表示され、テキストは固定で「AI生成」です
OK
タスクID
"01234567-89ab-cdef-0123-456789abcdef"