AI 構建神經解碼器
隨著科技的發展,失去說話能力的人已經可以通過技術手段來進行交流,不過,這些技術依然需要他們做一些微小的動作,來控制在屏幕上選擇字母或單詞的光標。患有運動神經元疾病的英國物理學家斯蒂芬霍金就是一個例子。
現在,利用人工智能技術,科學家或許可以讓喪失語言能力的人開口“講話”。
這個聽上去有些天方夜譚的事情,近期在加州大學舊金山分校成功實現了,研究負責人 Edward Chang 表示:“為嚴重言語殘疾患者創造恢復溝通的技術是一項長期目標。這項研究提供了原理證明:可以從大腦活動中產生語音,特別是大腦的語音中心。”
注:Edward Chang 博士是加州大學舊金山分校的神經外科醫生,專門治療頑固性癲癇,三叉神經痛和腦腫瘤。他的研究重點是人類言語、運動和認知的大腦機制。他還是加州大學伯克利分校和加州大學舊金山分校的神經工程與假肢中心的聯合負責人,該中心匯集了工程,神經科學,神經科和神經外科,以開發最先進的生物醫學設備,以恢復神經殘疾患者的功能。
在文章中,Chang 對這項研究的進展進行了詳細地解析。
他解釋說,使用臉頰肌肉激活的發聲裝置的人必須逐字逐句地打印單詞,所以這些設備的速度非常慢,每分鐘最多能打印 10 個單詞,而普通人的自然口語速度為平均每分鐘 150 個單詞。所以,Edward Chang 和他的團隊決定在構建神經解碼器時對聲音系統進行建模。
研究人員在參與者的頭骨中植入與這些類似的電極來記錄他們的大腦信號
這項實驗的參與者,是 5 位正在加州大學舊金山分校醫療中心接受侵入性治療的癲癇患者。治療方式是將手掌大小的電極板直接植入在他們的大腦表面上,患者癲癇發作后,電極可以在大腦中發生的地方產生定位。一旦醫生確定了發病點,就可以通過移除大腦的病變部分以永久停止癲癇的發作。
當然,除了治療癲癇之外,這塊電極還有一些其他作用,即捕捉語言相關的腦信號。
首先,參與者需要大聲朗讀數百個句子,此時的大腦活動會被研究人員記錄下來,并確定哪些信號控制了所謂的發聲器官,包括嘴唇、舌頭、下頜、喉頭以及人們在沒有意識到的情況下移動的嘴和喉嚨的其他部位。通過參與者足夠的腦信號數據,科學家們能夠創建一個計算機模擬的聲道。
研究人員設計了一種循環神經網絡(RNN),可以將記錄的皮質神經信號轉化為聲道咬合關節運動,然后將這些解碼的運動轉化為口語句子。
研究小組對這些數據進行了深度學習算法的訓練,然后將程序整合到解碼器中。
很長一段時間以來,腦機交互被認為是計算機與腦科學發展的完美結合,無數科學家也在這一領域進行不懈的探索。
多年前,一位名叫 Phil Kennedy 的神經科學家曾經研究出了一種名為親神經電極的技術,這種技術可以讓電極長時間植入人腦,讓腦機接口有可能從實驗投入實際使用。1998 年,Phil Kennedy 找到了一位合適的實驗對象,通過植入電極,實現了讓這位曾經是植物人的癱瘓患者可以用意識打字。
但是由于后續的實驗遭遇了接連的失敗,接受實驗的患者要么傷口長期不能愈合,要么因為身體原因去世。Phil Kennedy 甚至在 2014 年在自己的身上進行了實驗,最后卻還是出現了傷口無法愈合的情況,最后以失敗告終。
而就在不久前,特斯拉 CEO 埃隆·馬斯克曾在推文中提到自己的公司 Neuralink 正在研發一種技術,能夠利用超小型植入式芯片,有效地將人類的大腦與計算機進行連接。馬斯克表示:“Neuralink 的長期目標,就是要實現與人工智能的共存,從而實現一種智能的民主化,確保這種技術在研發成功之后,人工智能將不再是政府和大型企業所壟斷的純數字形式。”
值得一提的是,據知情人士透露,馬斯克的這家公司與 Edward Chang 的團隊似乎在實驗項目上有不少的合作,Chang 團隊此次的實驗進展,似乎也得到了馬斯克方面的幫助。
自計算機出現以來,人們對于腦機接口就開始了漫長的追求,雖然 Edward Chang 和團隊的研究帶來了新的希望,但是他本人也表示,目前這項功能只存在于實驗室中,尚不能在現實中使用。
從原理上來說,Chang 團隊所做的工作并不是徹底將思想轉化為語言,而是通過捕捉人們發聲時候各個器官以及腦信號的活動,再將其合成語音,播放出來。
該團隊也明確表示:第一個成功的模型是在可以說話的人身上試驗成功的,至于是否會對失去語言能力的人有所幫助,尚有待發掘。
如果有讀者對該項研究感興趣,可以查看相關論文:
https://www.nature.com/articles/s41586-019-1119-1
來源:AI前線
策劃&編輯:Natalie
整理:Vincent