Whisper JAX 免費高速轉錄音訊檔、YouTube 影片產生逐字稿

語音轉文字識別（Speech To Text）是由電腦將人類語音內容轉換為相應的文字，自從 OpenAI 釋出 Whisper 自動語音辨識模型，有許多開發者利用這個模型製作出免費語音轉錄工具，而「Whisper JAX」進一步優化處理速度並提供線上演示模型，可以免費轉錄音訊檔和 YouTube 影片生成文本。

服務介紹：

Whisper JAX 是一個免費開源的語音轉文字工具，基於 Whisper 自動語音辨識模型，使用 Google JAX 高性能數值計算的 Python 庫進行優化，能夠在 GPU、TPU 設備上快速將語音轉錄為文字，處理速度提升 70 倍。

開發者在 Hugging Face 平台上建立演示模型，無須註冊免費使用，支援錄音、音訊檔和 YouTube 影片轉文字，能夠準確辨識 40 多種語言。介面簡潔易於使用，只需上傳音訊檔案或輸入 YT 影片連結即可生成逐字稿，並提供時間標記選項，可選擇輸出純文字或帶有時間戳記的文本，要將會議錄音轉文字稿或生成影片字幕都能快速完成。

名稱：Whisper JAX

語言：英文

網址：https://huggingface.co/spaces/hf-audio/whisper-large-v3-turbo

專案：https://github.com/sanchit-gandhi/whisper-jax