過去的語音生成BCI類似於訊息往返交流,需要等待輸入與輸出,導致對話不夠流暢。而最新研發的即時串流語音BCI則能讓使用者更自然的表達語氣與重音,使溝通更加真實流暢,成為該研究領域邁向下一個技術層級的關鍵。
此次研究的受試者Ann在2005年因腦幹中風而喪失說話能力,18年後接受手術,在大腦皮層表面植入一塊253個電極的超薄矩形裝置,能夠同時紀錄數千個神經元的活動,以達到輔助語音輸出的作用。
在實驗中,Ann會默念螢幕顯示,由1024個單詞與50個片語的詞庫所組成的100句話。接著BCI每80毫秒監測她的腦部活動,並在默念開始前500毫秒開始讀取神經訊號,最後BCI以每分鐘47至90個單詞速率輸出語音。
雖然此次BCI輸出的速度,仍無法達到自然對話每分鐘160個單詞,但比起先前測試的舊版BCI、以及Ann目前使用、需要20秒以上才能生成一句話的輔助溝通設備相比,此技術已經展現了顯著的進步。
荷蘭馬斯垂克大學(Maastricht University)的計算科學家Christian Herff指出,目前的BCI在短句上表現良好,但相較自然對話仍有相當大的延遲。當語音延遲超過50毫秒時,對話者就會感到困惑。
張復倫表示,隨著感測器數量增加、精準度提升,以及訊號處理技術改進,這項技術未來會變得更快速且準確。這項突破讓腦機介面更接近幫助癱瘓者恢復語言的終極目標,使他們能透過自然思維進行交流,進而改善生活品質。
資料來源:
https://www.nature.com/articles/d41586-025-01001-6#
(編譯/實習記者 康育華)