UCSF台裔醫師張復倫突破BCI瓶頸!3秒語音輸出逼近自然語速

日期2025-04-01
EnglishFrenchGermanItalianPortugueseRussianSpanish
(圖片來源:擷取自UCSF 影片)
近(31)日,加州大學舊金山分校(UCSF)台裔神經外科醫生張復倫(Edward Chang)團隊,改良了一款腦機介面(BCI, Brain-Computer Interface),並結合人工智慧演算法,能夠即時偵測癱瘓患者的思考內容,並在3秒內轉換成語音。這項研究代表了腦機介面技術朝向實用化邁出重要的一步,研究結果發表在《Nature Neuroscience》

過去的語音生成BCI類似於訊息往返交流,需要等待輸入與輸出,導致對話不夠流暢。而最新研發的即時串流語音BCI則能讓使用者更自然的表達語氣與重音,使溝通更加真實流暢,成為該研究領域邁向下一個技術層級的關鍵。

此次研究的受試者Ann在2005年因腦幹中風而喪失說話能力,18年後接受手術,在大腦皮層表面植入一塊253個電極的超薄矩形裝置,能夠同時紀錄數千個神經元的活動,以達到輔助語音輸出的作用。

在實驗中,Ann會默念螢幕顯示,由1024個單詞與50個片語的詞庫所組成的100句話。接著BCI每80毫秒監測她的腦部活動,並在默念開始前500毫秒開始讀取神經訊號,最後BCI以每分鐘47至90個單詞速率輸出語音。

雖然此次BCI輸出的速度,仍無法達到自然對話每分鐘160個單詞,但比起先前測試的舊版BCI、以及Ann目前使用、需要20秒以上才能生成一句話的輔助溝通設備相比,此技術已經展現了顯著的進步。

荷蘭馬斯垂克大學(Maastricht University)的計算科學家Christian Herff指出,目前的BCI在短句上表現良好,但相較自然對話仍有相當大的延遲。當語音延遲超過50毫秒時,對話者就會感到困惑。

張復倫表示,隨著感測器數量增加、精準度提升,以及訊號處理技術改進,這項技術未來會變得更快速且準確。這項突破讓腦機介面更接近幫助癱瘓者恢復語言的終極目標,使他們能透過自然思維進行交流,進而改善生活品質。

資料來源:
https://www.nature.com/articles/d41586-025-01001-6#


(編譯/實習記者 康育華)