「AI化身」成手語翻譯官?Silence Speaks打入倫敦250個地鐵站
Silence Speaks的核心產品是一套以AI虛擬角色為基礎的手語翻譯系統。使用者輸入文字、語音或影片後,系統透過雲端模型分析語意,再由AI虛擬角色以英國手語(BSL)或美國手語(ASL)即時呈現。
與一般字幕或轉譯不同,這些AI虛擬角色不僅比劃動作,還能模擬表情、語氣與情緒,讓手語像真正的語言那樣流動起來。或許有人會問:既然有文字了,為什麼還要翻譯成手語?
其實對於許多聽障者而言,手語才是他們的母語,而非文字,因為他們在語言發展的關鍵期無法聽見口語語言,改以手語作為主要的溝通方式。
根據聾啞人和聽力障礙者委員會(Commission on the Deaf and Hard of Hearing)的資料,約有超過50萬人以美國手語(ASL)作為母語進行溝通。因此,這也說明了像Silence Speaks這樣的AI手語翻譯平台的重要性,因為它們能夠促進聽障人士在公共場合的溝通與參與。
英國新創Silence Speaks的核心產品是手語翻譯系統,使用者輸入文字、語音或影片後,系統會經由雲端模型分析語意,再由虛擬角色以手語即時呈現。 圖片來源:Silence Speaks官網
Silence Speaks的AI手語翻譯系統不僅提供了即時的手語翻譯,已應用於倫敦交通局旗下250個地鐵站。當聽障乘客掃描站內提示QR碼,即可即時觀看手語版的列車公告與安全提醒。
這樣的設計考量到手語使用者的語言習慣,不再需要依賴聽覺,也不必等待專業翻譯,更貼近他們需求的資訊傳遞方式。
此外,Silence Speaks提供跨平台支援,企業可透過API將其AI翻譯系統整合至自有網站與內部溝通系統。電信巨頭Vodafone正是其早期合作企業之一,曾導入其技術於客服服務測試中。除了交通與電信,醫療、教育與政務服務也是該公司積極拓展的應用方向。
不過,這項看似簡潔的系統背後,其實歷經數次方向轉換與研發挫折。創辦人Pavan Madduru表示:「Silence Speaks利用AI與機器學習演算法,準確地將手語轉換為文字,反之亦然,促進聽障與失語社群與聽人之間的無縫溝通與互動,從而營造一個包容的溝通環境。」
讓一套AI系統「看懂」手語不難,難的是「表達得像一個會手語的人」。那麼,這支團隊究竟是怎麼誕生的?
從Vodafone的AI工程師,到打造手語科技的創業者
Silence Speaks的創辦人Pavan Madduru曾在Vodafone擔任AI工程師,專注於聊天機器人與語言模型的應用。創業靈感來自與一位聽障工程師朋友的旅行經驗:他親眼見到朋友在公共場合中因無法獲得手語支援而無助,進而下定決心開發一套能真正解決問題的手語科技。
「Silence Speaks的誕生,源自於一個深刻的願望:為聽障與失語社群架起溝通的橋樑,確保科技進步能夠包容並惠及所有人。」Pavan說。
創業初期,團隊原本嘗試開發「手語轉文字」的技術,卻很快遭遇挑戰:全球超過200種手語在語速、語序、語法上差異極大,甚至連同一國內部也存在極端落差。
例如,愛丁堡手語使用者的速度比南安普敦快上近50%。於是他們調整方向,轉為開發「文字轉手語」的翻譯系統,並專注於英國與美國兩大主流手語。
為了確保產品從第一天開始就貼近手語使用者的真實需求,Pavan邀請了三位具備聽障背景的全端工程師加入創業團隊,從系統架構、動畫節奏,到手語動作細節都親自參與設計。
英國前科技大臣Chloe Smith擔任Silence Speaks董事會主席。 圖片來源:Rt Hon Chloe Smith的X平台
2024年,Silence Speaks獲得英國StartUp Awards的「StartUp For Good」獎項。與此同時,團隊也開始逐漸擴張,更找來英國前科技大臣Chloe Smith擔任董事會主席,正是她推動將英國手語納入法律,並持續倡議語言平權與包容性科技發展,為Silence Speaks帶來政策與制度層面的強力後盾。
「手語使用者經常被排除在外,而這是不對的。我們希望這款應用能幫助聽障社群與聽人社群更好地溝通。」Smith同時也是英國人力資源發展協會(CIPD)主席,關注職場包容議題多年,也進一步為這家新創爭取到更多組織端的支持與合作空間。
誰來爭奪這個靜音市場?
在AI手語翻譯這條路上,Silence Speaks並非唯一參賽者。來自美國的SignAloud曾開發出一款智慧手套,可將特定手語轉換為語音或文字;來自法國的MotionSavvy則主打以平板或筆電進行手語識別。
然而,這些系統多半仍停留在實驗或單向翻譯階段,要進一步拓展為企業級、跨場域應用,仍需面對技術複雜度與使用者習慣的門檻。
相較之下,Silence Speaks選擇了另一種進場策略。他們不是從穿戴裝置或錄影辨識切入,而是打造一個「能夠說手語」的AI角色,讓公共資訊不需改變流程,就能以視覺語言同步發送。
這種從輸出端下手的設計,避免了設備普及率與環境限制的問題,更適合部署在地鐵站、醫院大廳或網站等即時資訊場域。
Silence Speaks不是從穿戴裝置或錄影辨識切入,而是打造一個「能夠說手語」的AI角色。圖片來源:Unsplash
在職場環境中,無障礙溝通仍極具挑戰。英國皇家聾人協會指出,85%的聽障專業人士曾經歷職場排除。
而在教育系統中,全英國約有5萬名聽障學生,大多數就讀於主流學校,卻難以獲得完整的手語翻譯服務,多數學校即使有資源,也只能部分時段提供翻譯。這些缺口使得聽障學生容易在課堂上落後,Silence Speaks的技術有潛力大幅提升他們的學習參與度。
當然,這個領域也有許多新興技術提出不同解法,例如利用智慧眼鏡為聽障者提供即時字幕,或開發內建助聽功能的音訊裝置Google和Apple也已推出具備語音增強或字幕功能的穿戴設備。未來,Silence Speaks如何應對科技巨頭與後起之秀的挑戰,將成為觀察的重點。
參考資料:《Wired》、《Medium》、《Brainz》、《Multilingual Magazine》、Silence Speaks
※本文授權自創業小聚,原文:AI什麼語言都會,唯獨不會這一種?Silence Speaks打造AI手語翻譯平台,掀起無聲的溝通革命