UCSF台裔醫師張復倫突破BCI瓶頸！3秒語音輸出逼近自然語速

日期2025-04-01

(圖片來源:擷取自UCSF 影片)

A-
A+

加入收藏

近(31)日，加州大學舊金山分校(UCSF)台裔神經外科醫生張復倫(Edward Chang)團隊，改良了一款腦機介面(BCI, Brain-Computer Interface)，並結合人工智慧演算法，能夠即時偵測癱瘓患者的思考內容，並在3秒內轉換成語音。這項研究代表了腦機介面技術朝向實用化邁出重要的一步，研究結果發表在《Nature Neuroscience》。

過去的語音生成BCI類似於訊息往返交流，需要等待輸入與輸出，導致對話不夠流暢。而最新研發的即時串流語音BCI則能讓使用者更自然的表達語氣與重音，使溝通更加真實流暢，成為該研究領域邁向下一個技術層級的關鍵。

此次研究的受試者Ann在2005年因腦幹中風而喪失說話能力，18年後接受手術，在大腦皮層表面植入一塊253個電極的超薄矩形裝置，能夠同時紀錄數千個神經元的活動，以達到輔助語音輸出的作用。

在實驗中，Ann會默念螢幕顯示，由1024個單詞與50個片語的詞庫所組成的100句話。接著BCI每80毫秒監測她的腦部活動，並在默念開始前500毫秒開始讀取神經訊號，最後BCI以每分鐘47至90個單詞速率輸出語音。

雖然此次BCI輸出的速度，仍無法達到自然對話每分鐘160個單詞，但比起先前測試的舊版BCI、以及Ann目前使用、需要20秒以上才能生成一句話的輔助溝通設備相比，此技術已經展現了顯著的進步。

荷蘭馬斯垂克大學(Maastricht University)的計算科學家Christian Herff指出，目前的BCI在短句上表現良好，但相較自然對話仍有相當大的延遲。當語音延遲超過50毫秒時，對話者就會感到困惑。

張復倫表示，隨著感測器數量增加、精準度提升，以及訊號處理技術改進，這項技術未來會變得更快速且準確。這項突破讓腦機介面更接近幫助癱瘓者恢復語言的終極目標，使他們能透過自然思維進行交流，進而改善生活品質。

資料來源：
https://www.nature.com/articles/d41586-025-01001-6#

(編譯/實習記者康育華)