2023.03.01
|
聲音

大數據時代來臨,隱藏在話語中的心情AI都知道!

作者
聲藝編輯|用聲音讓你更出色

「 嘿Siri ! 」語音辨識功能的再升級

相信大家對手機的語音辨識功能都不陌生,只要對著手機說一句話,語音辨識系統就能精準地將你所說的話轉換為文字,這項功能使我們的生活便利了許多。這也讓我們不禁想像著,過去在科幻小說裡的機器人時代,是不是漸漸要實現了呢?

然而,目前的語音辨識系統,僅僅將語音轉換為文字的功能,能滿足特定的功能,常見例子是基本操作、語音輸入或者翻譯等,但是目前有許多研究慢慢將「情感」加入在語音辨識的功能裡,透過說話者的語氣、表情和肢體等偵測參數,來判斷出說話者真正的語意,提供更客製化且有溫度的服務。

 


 

人們複雜又細膩的情緒變化

在 1995 年由麻省理工大學(MIT)的教授羅莎琳.皮卡德(Rosalind Picard)提出「情感運算」這個概念,開始藉由偵測人類的生理反應、表情肢體來辨識情緒,只是情緒既主觀又抽象,每個人表現情緒的方式都不太一樣,再加上說出口的內容,搭配不同的口氣,也可能產生反諷、逞強的情緒,因此情緒辨識系統,就如同我們人類在社會化的過程一樣,藉由過去經驗的累積來找到應對進退的最佳方法與回答,相信許多伴侶、朋友就算長久相處,也仍有摸不透對方心思的感覺,對吧!

 

即便如此,早在20多年前就陸續有科學家投入語音情緒辨識系統的研究,並試著將這套系統應用在客服服務、心理諮商、電腦遊戲、機器人等領域。語音情緒辨識系統的運作,是先透過AI學習並建立一套「語音情緒資料庫」,裡面包含人類在快樂、憤怒、悲傷等不同情緒時可能會有的聲音表情。接著就能收集想辨識的語音樣本,並擷取語音中的重點部分讓電腦經過資料庫比對分析,最後就能找出說話者當下的情緒!

 

 


 

 

客戶服務

藉由分析客服電話中,顧客對談時的話語口氣來判斷情緒,比如:感到、不耐煩等等,而美國的 Cogito 公司便是以此技術來優化客服人員的訓練,藉由分析結果引導客服人員,如何進行最佳的溝通,提高客戶滿意度,語音情感辨識也可以用於根據顧客的情緒狀態,提供個性化推薦。例如:如果客戶感到快樂和放鬆,系統可能會推薦更奢華或享受性的產品或服務。相反,如果客戶感到壓力或焦慮,系統可能會推薦更平靜或放鬆的產品或服務。

 

醫療領域

語音情緒識別早已是被運用在輔助醫學、心理諮商的服務裡,例如:憂鬱症、焦慮症、自閉症以及阿茲海默症等疾病的診斷,透過蒐集患者的言語中的情緒特徵與表達模式,進行數據紀錄與分析。例如:美國史丹佛大學教授達西(Alison Darcy)研發出的一款聊天機器人「 Woebot 」它可以根據對話內容給予輔助,幫助你檢測心情,暫時趕走憂鬱的非理性想法。

當然這款聊天機器人無法取代心理諮商師所能提供的專業服務,但運用科技與醫療技術的搭配,就能將影響力擴大,各自發揮協助更多身陷疾病的人們。

 

教育領域

這項技術同樣也能被運用在教育上,像是語言學習,可以偵測你在練習第二外語口說的語調發音,提高語言學習的成果,或是輔助學習,透過偵測學生的情緒狀態與參與度,了解學生是否感到困惑、沮喪或是記憶力不足,並對此提供相對應的教材、教學模式。

 

娛樂領域

而如果應用在娛樂、遊戲領域,就能創造出更個人化、接近真實的使用體驗,例如在遊戲開發上,用來檢測恐怖遊戲,是否能讓玩家感到恐懼,或是配合玩家情狀態來調整遊戲難度,或是在音樂娛樂上,就可以判斷使用者當下的情緒,來推薦相對應的歌曲。

 

 


 

隱含在無限可能的問題

科技發展的同時,也會帶來相對應的倫理道德問題,除了常見的隱私疑慮以外,語音情感辨識也可能造成歧視的情況,由於文化語言上的差異,或是訓練數據中帶有的偏見,但重要的是,這些情況都不是我們樂見的,而目前也有研究正在致力於改善、解決這些潛在問題。


那雖然當前的語音辨識情感系統,還未完全成熟,不過目前的技術發展已經可以辨識出基本的情緒變化,全球各地也不斷地有新的平台在業界興起,可應用的領域非常多元,可以說是為語音辨識打開了一扇新的大門,仍然是未來極具發展性的新技術!

 

1. Mehmet Berkehan Akçay, Kaya Oğuz(2020). Speech emotion recognition: Emotional models, databases, features, preprocessing methods, supporting modalities, and classifiers. Speech Communication, 116, 56-76.
2. Meredith Somers(2019). Emotion AI, explained. MIT Sloan School of Management. Retrieved from https://mitsloan.mit.edu/ideas-made-to-matter/emotion-ai-explained(2021/10/14).
3. 李俊昇、黃珠娟、許馨仁、林明慧(2010)。語音情緒辨識技術與應用之研究。台灣感性學會研討會論文,D-03, 187-192。
4. 楊政霖(2018)。產業技術評析 情緒辨識應用案例分析。經濟部技術處。檢自https://www.moea.gov.tw/MNS/doit/industrytech/IndustryTech.aspx?menu_id=13545&it_id=184(2021/10/14)。
5. 林妤庭(2019)。讓機器讀懂我們的心情!臺灣AI情緒辨識技術再突破。檢自https://scitechvista.nat.gov.tw/Article/C000003/detail?ID=a08fc6e9-48fc-41bf-9944-0e8b31692d1c&fbclid=IwAR2bccHj8kRqMAcC2-Y7I_QdHBKmtmZAHKDTBz9Ms4NWH2HoOPZuu_zeDJg
© 本站所有文章未經事先書面授權,請勿任意利用、引用、轉載。

留言分享你的想法吧!
內容會寄至聲藝信箱,期待收到你的任何觀點或建議
姓名 |
信箱 |
內容 |