Whisper JAX 免費線上語音轉文字工具
語音轉文字識別(Speech To Text)是由電腦將人類語音內容轉換為相應的文字,自從 OpenAI 釋出 Whisper 自動語音辨識模型,有許多開發者利用這個模型製作出免費語音轉錄工具,而「Whisper JAX」進一步優化處理速度並提供線上演示模型,可以免費轉錄音訊檔和 YouTube 影片生成文本。


服務介紹:

Whisper JAX 是一個免費開源的語音轉文字工具,基於 Whisper 自動語音辨識模型,使用 Google JAX 高性能數值計算的 Python 庫進行優化,能夠在 GPU、TPU 設備上快速將語音轉錄為文字,處理速度提升 70 倍。

開發者在 Hugging Face 平台上建立演示模型,無須註冊免費使用,支援錄音、音訊檔和 YouTube 影片轉文字,能夠準確辨識 40 多種語言。介面簡潔易於使用,只需上傳音訊檔案或輸入 YT 影片連結即可生成逐字稿,並提供時間標記選項,可選擇輸出純文字或帶有時間戳記的文本,要將會議錄音轉文字稿或生成影片字幕都能快速完成。

名稱:Whisper JAX
語言:英文
網址:https://huggingface.co/spaces/sanchit-gandhi/whisper-jax

Whisper JAX 使用說明:

開啟 Whisper JAX 網頁,先在頁面上方選擇音訊來源,有麥克風錄音、音訊檔案、YouTube 三個語音轉錄工具。
Whisper JAX 免費線上語音轉文字工具

點選「Audio File」可用拖曳方式或點擊選擇檔案加入音訊。
Whisper JAX 免費線上語音轉文字工具

開啟音訊檔案會出現播放器,點擊「Edit」按鈕有修剪功能,處理任務可選擇轉錄、翻譯,勾選「Return timestamps」產生有時間標記的文本。
Whisper JAX 免費線上語音轉文字工具

設置完成後,點擊「Submit」開始處理,頁面右側會顯示進度。
Whisper JAX 免費線上語音轉文字工具

Whisper JAX 的處理速度很快,十分鐘以內的音訊不用一分鐘即可轉錄完成,下圖左/右分別是有無時間標記,點擊「複製」按鈕就能將文本用於其他地方。
Whisper JAX 免費線上語音轉文字工具

音訊來源選擇「YouTube」並貼上影片連結,點擊「Submit」即可轉錄 YT 影片產生逐字稿,支援辨識 40 多種語言。
Whisper JAX 免費線上語音轉文字工具

Whisper JAX 的 Task (處理任務)雖然有提供翻譯選項,但是只能翻譯為英文。
Whisper JAX 免費線上語音轉文字工具

延伸閱讀:
Google 即時轉錄 App 準確辨識語音產生逐字稿(Android) Buzz 免費 AI 語音轉文字軟體,轉錄影片/音訊產生逐字稿 Windows 11 新增即時字幕,播放影片/音訊同步顯示字幕 pyTranscriber 轉錄影片和音訊輸出字幕,語音轉文字軟體