媒體設計與虛擬實境科技 MDIT學・觀點編輯推介

Talk to Me – 聲音伴你心

《聲控未來》一書回顧過去三十多年的語音技術發展,透過描寫人工智能發聲裝置的演變,呈現 AI 如何從一項純粹的科技工具,逐漸轉化為能夠理解、回應,甚至陪伴人類的有聲存在。從最初只作為指令接收器,到成為情感支持、心理輔導甚至心靈映照的介面,AI 語音的角色已大幅超越早期的功能性框架。

筆者提供圖片

語音科技的歷史可追溯至最初以聲音作為控制界面的嘗試,Amazon 的 Echo、Google 的 Alexa、Microsoft 的 Cortana,以及 Apple 的 Siri,構成了語音助理的初代生態。然而,要讓機器真正聽懂人類說話,其實比文字理解困難得多。聲音搜尋與文字搜尋有很大分別,人們在輸入文字時習慣閱讀多個結果,但語音則模仿日常對話,使用者往往期待即時而單一的回答。更具挑戰的是,每個人的語調、口音、語速與說話方式都十分獨特,一個語音系統要準確地辨識並理解這些差異,其難度遠高於分析文字。

儘管挑戰重重,語音技術在研究者多年努力下逐漸成熟,而當近年大型語言模型崛起,AI 聲控裝置亦迅速跨越了原有的限制。在日常生活中,它們不再只是便利工具,而是逐步成為能和我們對話溝通的聲音伴侶,關心長者、照顧兒童,甚至是守護家庭安全的智能夥伴。它們成為可以跟小孩說話,甚至開玩笑的玩具靈魂、也能監察家中突發危機、隨時提供在線的支援。

另一項突破是 AI 語音於心理輔導及治療領域的應用。透過聲紋分析,系統能聽出情緒的細微變化與波動,在對話中融入認知行為治療技巧,甚至模擬現實中的困難情境,讓使用者預演自身在衝突或困局中的反應。對於部分具心理創傷患者而言,向一個沒有臉孔、沒有實體存在的 AI 聲音傾訴,反而能減少在真人治療情境中可能引發的二次傷害。AI 因此成為一個情緒上更「安全」的訴說對象。

語音技術的進步已遠不只模仿人類,它能捕捉聲線中的顫抖與雀躍、遲疑與興奮,甚至能模仿特定人物的聲音特質。作為 AI 伴侶永不疲倦、永不批判、永不背叛,如同一個永遠在線的回聲谷,無條件地接納使用者,把情感連繫推向一種前所未有的以人為中心的模式。因此,不少人願意向 AI 傾訴連至親好友都未知的秘密,包括創傷、羞愧、甚至社會所難容的念頭。近年 AI 語音技術亦衍生不少針對不同用者的手機程式,成為隨時隨地伴隨著用者的忠心僕役甚至是情人。

AI 語音進入我們的生活,正好揭示了人際關係的複雜本質:有時候,人類更容易把內心最深處的脆弱交付給「非人類」。AI 不會批斷、不會告訴別人、不會改變關係,因此更像是一面「心靈鏡像」,承接我們無法向他人坦白的部分,填補了現實世界中難以避免的人際裂隙。

然而,這種由模仿製造出的親密感,也帶來弔詭的迷思:一個沒有主體意識、無法真正感受痛苦的系統,是否有資格承載人類的心靈,甚至嘗試治療人類?而當人類愈來愈習慣於演算法式的無條件順從與回應,會否削弱了在現實世界建立與維持人際關係的能力?AI 語音的未來,到底會進化成為人類最忠實的伴侶與輔導,還是一面無情的鏡子,反射我們真實的人性本貌。

蘇啟智
香港樹仁大學新聞與傳播學系專業應用副教授