
語音轉文字識別(Speech To Text)是由電腦將人類語音內容轉換為相應的文字,自從 OpenAI 釋出 Whisper 自動語音辨識模型,有許多開發者利用這個模型製作出免費語音轉錄工具,而「Whisper JAX」進一步優化處理速度並提供線上演示模型,可以免費轉錄音訊檔和 YouTube 影片生成文本。
服務介紹:
Whisper JAX 是一個免費開源的語音轉文字工具,基於 Whisper 自動語音辨識模型,使用 Google JAX 高性能數值計算的 Python 庫進行優化,能夠在 GPU、TPU 設備上快速將語音轉錄為文字,處理速度提升 70 倍。
開發者在 Hugging Face 平台上建立演示模型,無須註冊免費使用,支援錄音、音訊檔和 YouTube 影片轉文字,能夠準確辨識 40 多種語言。介面簡潔易於使用,只需上傳音訊檔案或輸入 YT 影片連結即可生成逐字稿,並提供時間標記選項,可選擇輸出純文字或帶有時間戳記的文本,要將會議錄音轉文字稿或生成影片字幕都能快速完成。
Whisper JAX 使用說明:







延伸閱讀:
0 留言