Image to SFX 線上AI模型,分析圖像產生音效
現在有許多生成式 AI 工具可用來產生所需內容,而且這類應用越來越廣泛,例如,寫一則主題描述就能生成 PPT 簡報和影片。本文介紹的 Image to SFX 是一種生成音效的人工智慧模型,它與 Image to Music 相似,都是分析圖像後自動產生音訊,只需提交一張圖片,就能獲得與圖像主題相符的聲音檔。



Image to SFX 可以幫助影片、遊戲創作者快速取得音效,像是一張拳擊照片會產生 10 秒的打鬥聲音。這款 AI 模型是託管在 Hugging Face 平台,開放免費使用,無須註冊,產生音訊後可下載 .wav 檔案,若是遇到多人同時提交圖片則需要排隊。

名稱:Image to SFX
語言:英文
網址:https://huggingface.co/.../Image2SFX-comparison

如何使用 Image to SFX 生成音效:

1. 打開 Hugging Face 網站的 Image2SFX Comparison 頁面,會看到一張範例圖片,先點擊「X」移除圖片。
Image to SFX 線上AI模型,分析圖像產生音效

2. 接著上傳圖片和選擇音訊生成模型,有 MAGNet、AudioLDM-2、AudioGen、Tango 四種模型。
Image to SFX 線上AI模型,分析圖像產生音效

3. 點擊「Submit」開始處理,下方會顯示執行時間、預估時間。(註:若有多人同時提交圖片會看到排隊人數。)
Image to SFX 線上AI模型,分析圖像產生音效

4. 處理完成會出現 Audio Output,有音訊播放器可線上聆聽音效,點擊「下載」按鈕儲存 .WAV 檔案。
Image to SFX 線上AI模型,分析圖像產生音效

創作者可利用 Image to SFX 取得所需的聲音,以下是筆者使用 Image to SFX 的幾個範例(圖片對應音訊)。
Image to SFX 線上AI模型,分析圖像產生音效


Image to SFX 線上AI模型,分析圖像產生音效


Image to SFX 線上AI模型,分析圖像產生音效


Image to SFX 線上AI模型,分析圖像產生音效


Image to SFX 線上AI模型,分析圖像產生音效