Buzz 免費 AI 語音轉文字軟體
Buzz 是一款免費開源的語音轉文字軟體,可以轉錄影片和音訊產生逐字稿,基於 OpenAI 的 Whisper 自動語音辨識模型,能夠準確辨識各國語言,支援多種影音格式,包括 MP3、WAV、M4A、OGG 音訊和 MP4、WEBM、MOV、OGM 影片,可輸出 SRT、TXT 和 VIT 檔案,介面簡潔易於操作。


使用 Buzz 軟體可選擇 Tiny、Base、Small、Medium、Large 五種模型,執行語音轉錄處理會先下載 AI 模型,取得模型後可以離線使用,語音轉錄文字過程都在電腦上運行。轉錄處理速度會因所選模型而有差異,以 Tiny 模型最為迅速卻可能出現偏差,選擇 Large 模型的處理時間最久,相對地文字稿的準確度較高。

軟體名稱:Buzz
授權型式:免費開源
介面語言:英文
作業系統:Windows、Mac
官方網站:https://github.com/chidiwilliams/buzz
軟體下載:【Windows】【MacOS】

(2024/03/16 軟體更新 0.9.0 版本)

Buzz 使用說明:

Buzz 是在 GitHub 網站上成立開源專案,打開發布頁面即可下載 Windows、Mac 版本軟體。
Buzz 免費 AI 語音轉文字軟體

Windows 電腦下載完成後,打開檔案執行安裝,如果看到 Microsoft Defender 警告阻止未知應用程式的執行,點選仍要執行。
Buzz 免費 AI 語音轉文字軟體

Buzz 軟體介面簡潔,目前只有英文版本,點選「File」→「Import Media File」或「+」按鈕選擇檔案,預設是瀏覽音訊檔案,可在右下方變更檔案類型。
Buzz 免費 AI 語音轉文字軟體

開啟影片或音訊檔案會出現設置,可選擇 AI 模型、任務(翻譯/轉錄)、語言和輸出格式,目前任務中的翻譯功能只限翻譯為英文,語言預設是自動偵測不用更改。
Buzz 免費 AI 語音轉文字軟體

設置完成後,點擊「Run」按鈕會先下載相應的 AI 模型。
Buzz 免費 AI 語音轉文字軟體

接著主畫面就會顯示處理進度。
Buzz 免費 AI 語音轉文字軟體

等待轉錄完成,軟體會根據所選格式在原路徑儲存文本檔案,點擊「Open Transcript」會開啟轉錄文本可轉存其他格式。
Buzz 免費 AI 語音轉文字軟體

Buzz 是採用 Whisper 自動語音辨識模型可轉錄各種語言,處理時間會因 AI 模型而有差異,如下圖,相同影片筆者選擇 Tiny、Small、Medium 模型,處理時間分別是 53 秒、4 分鐘、9 分鐘。
Buzz 免費 AI 語音轉文字軟體

延伸閱讀:
Google 即時轉錄 App 準確辨識語音產生逐字稿(Android) Windows 11 新增即時字幕,播放影片/音訊同步顯示字幕 pyTranscriber 轉錄影片和音訊輸出字幕,語音轉文字軟體