画像から音声を生成するAIジェネレーター

VeoNanoで、画像をAI生成のオーディオ、環境音、効果音、そしてシーンに最適化されたサウンドスケープへと変換します。

Model

Source Image

Drop image file

or click to browse

Music PreferencesOptional

AI will analyze your image and combine it with your preferences

Negative PromptOptional

SeedOptional (0 = Random)

Your image to audio AI result will appear here—generate and replay anytime.

VeoNanoでテキストから動画、画像から動画、またはAI画像生成ワークフローを開始するには、ショットの説明を入力するか画像をアップロードしてください。

映画のようなビデオ生成、画像作成、オーディオツールを組み合わせることで、カメラワーク、シーンの雰囲気、そして視覚的な再現性を精緻に調整します。

広告、ソーシャルキャンペーン、ピッチ、ウェブサイト、ストーリーボードに最適な、洗練されたクリップ、キーフレーム、ビジュアル素材をダウンロードできます。

当社のAIが画像の雰囲気、構図、被写体を分析し、そのシーンに最適なオーディオを生成します。また、プロンプトを入力することで、スタイルや楽器を指定して出力を調整することも可能です。

MMAudio（2クレジット）は、一般的な用途に適したバランスの良いオーディオ生成を提供します。SFX（3クレジット）は、効果音の生成に特化しています。ThinkSound（10クレジット）は、より豊かなディテールを備えた高度な音声合成を可能にします。

はい。オーディオ設定フィールドを使用して、希望する雰囲気や楽器を指定してください。モデルがそれらの情報を画像解析の結果と組み合わせて生成します。

PNG、JPG、JPEG、WEBP、GIF形式に対応しています。最適な結果を得るために、画像サイズは最大10MBまでを推奨します。

モデルや動画の長さによりますが、一般的な生成時間は30秒から60秒程度です。

もちろんです。異なるモデルやプロンプトを使用して、複数のバージョンを生成することが可能です。生成ごとにクレジットが消費されます。

VeoNano や Veo 3.1、Nano Banana Pro、Nano Banana 2 を含むすべてのワークフローにおいて、待ち時間の短縮、高解像度化、動画生成時間の延長、およびクレジット増量をご利用いただけるアップグレードプランが登場しました。