本文共1790字
當年丹麥的 Good Tape 讓全球記者「淚流滿面」,台灣本土新創 TaiLexi AI 則更進一步。不僅導入 OpenAI Whisper 技術,更針對台灣口音優化,並以「一小時 6.5 元」的驚人破壞價,掀起一場職場效率革命。
2023年,來自丹麥的 Good Tape 靠著 OpenAI 開源的 Whisper 模型,讓原本需要數小時苦思冥想的逐字稿,在幾分鐘內化為精準的文字,拯救了無數在衝突前線與編輯室熬夜的媒體人。當時,外界震驚於一家小型網媒公司,竟能「彎道超車」科大訊飛與雅婷等語音辨識巨頭。
然而,近期語音辨識的戰火延燒到了台灣本土。一個由台灣知名法律 AI 團隊 TaiLexi 研發的語音轉文字AI工具「Lexitranscript」,正悄悄在台灣律師圈內傳開。
它的殺手鐧很簡單:比 Good Tape 更懂台灣口音,且價格僅需其四分之一。
核心技術的「平民化」革命
為什麼語音轉文字在過去半年內進步得如此神速?
關鍵在於 OpenAI 釋出的 Whisper 神經網路模型。過去,語音辨識(ASR)需要大量的標註資料,但 Whisper 透過 68 萬小時的多語言訓練,具備了強大的抗噪能力與語意理解。
Lexitranscript 團隊形容:「Whisper 就像替大家準備好了一顆強大的引擎,但怎麼把這顆引擎裝進一輛真正好開的車,才是各家平台比拚的關鍵。」
Good Tape 的成功,在於簡約的介面設計與親民價格;而 TaiLexi AI 打造的 Lexitranscript,則選擇在「在地化」、「功能深度」與「價格競爭力」上持續發力。
針對台灣常見的中英混雜語句(例如:「我們明天要 call 一個 meeting」)以及特有的口音起伏,Lexitranscript 進行了專門優化。實測結果顯示,無論是在環境嘈雜的咖啡廳訪談,或是夾雜台語口音的中文語音,其辨識準確率皆可穩定維持在 97% 以上。
價格破壞者:從一小時 160 元到 6.5 元
在產業發展初期,語音轉文字是奢侈的服務。國內知名的「雅婷逐字稿」採自研模型,每小時收費約新台幣 160 元;Good Tape 則約每小時 24 元。
相比之下,Lexitranscript 將價格進一步壓低至每小時約 6.5 元。這種「價格破壞」並非來自犧牲品質,而是建立在雲端架構與運算資源調度的高度優化之上。
對於需大量處理逐字稿的律師事務所、企業法務部門或學術研究者而言,過去每月動輒數千元的轉錄成本,如今可縮減至百元以內,展現出 AI 技術真正落地後的「普惠效應」。
Lexitranscript 團隊指出:「這不只是單純的價格競爭,而是讓原本昂貴的生產力工具,真正成為人人都用得起的基礎設施。」
不只是轉文字:AI 精準修稿的獨門祕技
相較於單純追求速度與準確率,Lexitranscript 最令專業使用者驚豔的,是其「AI 精準修稿」能力。
傳統逐字稿軟體最大的痛點,在於滿篇「贅字」與語法凌亂的語句。Lexitranscript 在轉錄完成後,會進一步透過 AI 自動剔除口頭禪(如:「那個」、「然後」、「對」),修正語法結構,並可同步產出「AI 智慧摘要」。
這意味著,使用者拿到的不再是一串雜亂的語音片段,而是一份「已具可讀性」的文字草稿,大幅減少後續人工整理與編修的時間成本。
在資訊安全方面,Lexitranscript 採取「處理完即刪除」的嚴格政策。音檔與文字內容僅於運算期間暫時存取,不留存、不用於模型訓練,從源頭上降低資料外洩風險,確保受訪內容與使用者隱私的安全性。
速度:1 分鐘音檔,2秒處理完畢
效率是職人的生命線。Lexitranscript 的處理速度堪稱「秒殺」——平均每 1 分鐘的音檔僅需2秒即可完成。這對於需要在記者會後立刻發稿、或是在會議後需即刻彙整紀錄的上班族來說,是過去難以想像的體驗。
面對 AI 的浪潮,Good Tape 執行長 克理嘉特(Tav Klitgaard)曾說:「記者不會消失,不會用 AI 的記者才會消失。」
如今,這句話同樣適用於所有職場。當 Lexitranscript這樣的高效逐字稿AI工具讓「逐字稿地獄」消失時,專業人員得以將省下的數小時,拿來進行更有價值的思考、創意與深度分析。這場由 AI 驅動的效率革命,正從一卷錄音檔開始,改寫台灣職人的競爭力。
※ 歡迎用「轉貼」或「分享」的方式轉傳文章連結;未經授權,請勿複製轉貼文章內容



留言