公務(wù)員期刊網(wǎng) 論文中心 正文

語言學(xué)下語音助手Siri語言能力評(píng)估

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了語言學(xué)下語音助手Siri語言能力評(píng)估范文,希望能給你帶來靈感和參考,敬請(qǐng)閱讀。

語言學(xué)下語音助手Siri語言能力評(píng)估

【提要】本文在語言學(xué)視域下評(píng)估語音助手siri語言能力。Siri在語言理解上只能處理最基本的情況,在語言生產(chǎn)上已較為完善。Siri和其他語音助手今后應(yīng)更加關(guān)注文字形式相同而語音不同的詞、不斷更新詞庫、關(guān)注方言問題、改進(jìn)對(duì)話模式、增強(qiáng)學(xué)習(xí)能力。

【關(guān)鍵詞】語音助手;語言能力;Siri

如今,人工智能迅速發(fā)展,智能語音助手是人工智能的重要應(yīng)用領(lǐng)域。Siri是最早的智能語音助手,其語言能力在各類語音助手中位于前列。盡管語音處理技術(shù)發(fā)展迅速,語音助手仍有很大提升空間。本文在不高于45分貝的安靜場(chǎng)景展開測(cè)試,從語音、詞匯、語法、語用等角度評(píng)估語音助手Siri的語言能力。

一、語言理解能力評(píng)估

(一)語音

Siri對(duì)人正常的發(fā)音識(shí)別準(zhǔn)確率較高,基本可以正確理解人說的內(nèi)容。Siri對(duì)于人在說話過程中產(chǎn)生的語流音變,如同化、弱化、增音現(xiàn)象基本可以正確理解。對(duì)Siri說“難免”“喇叭”“快啊”幾個(gè)詞后,Siri都能轉(zhuǎn)換成對(duì)應(yīng)文字。Siri對(duì)于連續(xù)變調(diào)以及普通話中“一”(陰平)和“不”(去聲)在去聲音節(jié)前一律變?yōu)殛柶竭@一現(xiàn)象可以理解。對(duì)Siri說“我想吃水餃”“一個(gè)”“不要”,Siri都可以正確識(shí)別說出的話。Siri無法理解強(qiáng)調(diào)重音對(duì)含義的影響,Siri對(duì)于“我想吃一個(gè)蘋果”和“我想吃一個(gè)蘋果”(加點(diǎn)表示重音)回答相同。表達(dá)說話人語氣或情緒而與區(qū)別意義無關(guān)的發(fā)音長(zhǎng)短不影響Siri對(duì)人說話含義的理解,換而言之,Siri無法感受并回應(yīng)人在情緒上的變化。對(duì)“我明天要去北京”(快且興奮)和“我明天要去北京”(慢且沮喪)的回答相同。Siri無法理解句調(diào)對(duì)含義的影響。對(duì)“我需要你的幫忙”(升調(diào))和“我需要你的幫忙”(降調(diào))回答相同。

(二)詞匯

Siri基本詞匯的詞匯量巨大,新造詞、古語詞、方言詞、外來詞等一般詞匯的詞匯量則有限。對(duì)“奧利給”回答“謝謝你,我會(huì)加油的”;對(duì)“你是打工人嗎”則無法回答。對(duì)“貓喜歡捉耗子嗎”提供的內(nèi)容是“貓為什么喜歡捉老鼠”;對(duì)“你是癟三嗎?”“你在耍什么把戲”則無法回答。此外,對(duì)于各種固定短語,Siri的掌握情況一般,通常調(diào)用搜索引擎進(jìn)行檢索。漢語中同音詞較多,因此對(duì)同音詞的判斷是語言能力中極其重要的一部分。人類在溝通時(shí)通??梢越柚Z境正確判斷同音詞,而Siri目前尚無法做出準(zhǔn)確率較高的判斷?!拔蚁矚g看bēijù”默認(rèn)理解為“杯具”。但當(dāng)語境充足時(shí):“我看了一場(chǎng)悲劇”“我買了一套杯具”,Siri則能做出判斷。Siri有時(shí)會(huì)通過用文字呈現(xiàn)出同音詞備選項(xiàng)的方式讓用戶對(duì)判斷錯(cuò)的詞進(jìn)行修改。由此來看,在判斷同音詞方面,Siri能力上不如人類,但一定程度上和人類具有同樣的思路——通過詢問的方式確定同音詞的具體情況。

(三)語法

Siri可以正確區(qū)分用戶不同語序的句子分別表示什么含義。對(duì)“我想吃飯”和“飯我想吃”均回答“好的請(qǐng)過目”并羅列飯店;對(duì)“我吃了一個(gè)香蕉”回答“好的。謝謝你愿意與我分享你的日?!保瑢?duì)“一個(gè)香蕉吃了我”則回答“我沒有聽明白你的意思”。Siri可以對(duì)用戶的不同句式做出正確回應(yīng)。Siri聽到“把通訊錄為我打開”會(huì)打開通訊錄。Siri能正確理解結(jié)構(gòu)簡(jiǎn)單、意義簡(jiǎn)單的句子。Siri可以正確回應(yīng)“給我講個(gè)笑話?!盨iri還能理解復(fù)雜結(jié)構(gòu)單句和復(fù)謂結(jié)構(gòu)單句。對(duì)“你認(rèn)為我是好人嗎”,回答“我還是不評(píng)論了”。此外,Siri也可以理解復(fù)句。對(duì)“因?yàn)槲医裉旄闪撕芏嗷钏晕液芾邸?,Siri雖不斷句,但正確回復(fù)了“聽我的,把ipad放下,先去睡一會(huì)兒吧,我會(huì)等著你”。Siri對(duì)用戶言語文字化過程中不加標(biāo)點(diǎn),可見其不能準(zhǔn)確區(qū)分用戶說出的內(nèi)容屬于哪種語言單位。用戶說出“我今天有點(diǎn)累,我想睡覺了”,Siri會(huì)處理成“我今天有點(diǎn)累我想睡覺了”。Siri不擅長(zhǎng)處理語法原因產(chǎn)生的歧義。對(duì)“幫我定下周四的鬧鈴(現(xiàn)在周四凌晨)”,回復(fù)“我無法設(shè)置一天以后的鬧鐘”,自動(dòng)將“下周四”劃為整體,而不考慮“定下”為整體。

(四)語用

Siri在特定情況下可以理解由語言因素構(gòu)成的上下文語境(在對(duì)話中表現(xiàn)為口語的前言后語)。Siri對(duì)“我明天下午四點(diǎn)要去上海出差”,回答“我想搞清楚……你是指十二月十日星期四還是十二月十一日星期五”,此時(shí)用戶可以做出回應(yīng)。如果不是由Siri針對(duì)用戶言語進(jìn)行提問,那么在用戶與Siri一來一回的對(duì)話后,用戶再說出的新的言語將被視作全新的對(duì)話,Siri在理解時(shí)不會(huì)將之前的對(duì)話納入該新對(duì)話的語境中。Siri對(duì)“我愛喝奶茶”,回答“了解”后,又對(duì)“請(qǐng)為我推薦一種飲品”,回答有關(guān)酒吧、茶餐廳的推薦,換而言之,Siri目前尚不具備多輪對(duì)話的能力。在特定情況下,Siri理解用戶言語會(huì)考慮情景語境,雖然Siri對(duì)場(chǎng)合、話題、以及用戶幾乎沒有了解,但對(duì)時(shí)間十分關(guān)注。凌晨時(shí)對(duì)“幫我訂一個(gè)明天早上七點(diǎn)的鬧鐘(周四)”,回答“鬧鐘已經(jīng)設(shè)置到上午七點(diǎn)(周四)”,而不是在周五設(shè)置鬧鐘。此外,根據(jù)測(cè)試來看,Siri幾乎不考慮文化語境與心理語境。Siri可以理解較為基礎(chǔ)的、有標(biāo)志的間接言語行為。對(duì)“你介意給我講個(gè)笑話嗎”,回答了一個(gè)笑話。但對(duì)于沒有提示標(biāo)志的就較為困難,其無法理解“我最近有點(diǎn)缺錢”暗示了我想借錢。綜上,Siri在語言理解上只能處理最基本的情況,還不能應(yīng)對(duì)口語中各式各樣的復(fù)雜情況,與人類語言理解能力差距較大。

二、語言生產(chǎn)能力評(píng)估

(一)語音

Siri的發(fā)音較人類更加標(biāo)準(zhǔn),不會(huì)造成理解困難。此外,Siri的發(fā)音具有許多人類的特征。Siri說話時(shí)會(huì)產(chǎn)生語流音變。Siri可以正確把握弱化現(xiàn)象,在引導(dǎo)Siri說出“喇叭”一詞后,Siri會(huì)自動(dòng)對(duì)“叭”字做輕聲處理。在連續(xù)變調(diào)以及普通話中“一”(陰平)和“不”(去聲)在去聲音節(jié)前一律變?yōu)殛柶竭@一現(xiàn)象上,Siri與人類相同。例如“肯愛千金輕一笑”中的“一”是陽平。Siri說話時(shí)會(huì)有節(jié)律重音。對(duì)“你有喜歡的人嗎”,回答“我對(duì)地球上這些錯(cuò)綜復(fù)雜的人際關(guān)系不是特別感興趣”。Siri說話基本沒有強(qiáng)調(diào)重音。Siri說話時(shí)會(huì)受到語氣或情緒的影響。對(duì)“快點(diǎn)”,回答“你看這么快可以嗎?我看我還是慢點(diǎn)的好”時(shí),前一句速度快,后一句速度慢。Siri說話時(shí)有句調(diào)變化。對(duì)“快點(diǎn)”,回答“你看這么快可以嗎?我看我還是慢點(diǎn)的好”,前一句是升調(diào),后一句是降調(diào)。Siri說話時(shí),停頓較為自然。Siri目前支持普通話和粵語兩種中文語音輸出形式。

(二)詞匯

Siri掌握的詞匯量足夠支持Siri表達(dá)出想表達(dá)的含義,且Siri會(huì)使用一定的固定短語。

(三)語法

Siri輸出的內(nèi)容以句子為主,基本沒有出現(xiàn)字、詞、短語、句組(不考慮例如“請(qǐng)為我朗誦一篇文章”之類的特殊要求)。Siri說出的句子在虛詞使用、語類選擇、語序安排、句式和語調(diào)使用上幾乎不會(huì)出現(xiàn)錯(cuò)誤。綜上,Siri在語言生產(chǎn)上已較為完善,基本不會(huì)影響正常交流,也具有了一定的人類特征。

三、總結(jié)

Siri雖是較優(yōu)秀的語音助手,能夠應(yīng)對(duì)簡(jiǎn)單對(duì)話,但與人類語言能力仍有較大差距。人類直接處理語音信息,而Siri處理語音轉(zhuǎn)化為文字后對(duì)應(yīng)的信息,故Siri對(duì)于文字形式相同而語音不同的詞的處理應(yīng)更謹(jǐn)慎,應(yīng)關(guān)注弱化、強(qiáng)調(diào)重音、與區(qū)別意義無關(guān)的發(fā)音長(zhǎng)短、句調(diào)、語法原因造成的歧義等問題。詞匯變化速度較快,Siri應(yīng)不斷更新詞庫。Siri在語音識(shí)別與詞匯量上都應(yīng)更加關(guān)注方言問題。此外,目前Siri只會(huì)被動(dòng)回答,不會(huì)主動(dòng)提問或開啟話題,這種對(duì)話模式不同于人類。Siri不具備學(xué)習(xí)能力,無法在與人的對(duì)話中不斷學(xué)習(xí)新的信息,無法進(jìn)行多輪對(duì)話。如果想使語音助手具備人格化特征則需要完善這兩點(diǎn)。Siri在評(píng)估中反映出來的不足是市場(chǎng)上多數(shù)語音助手共有的,如今市場(chǎng)上的語音助手均可據(jù)此進(jìn)一步提高語言能力。

參考文獻(xiàn)

耿立波、劉濤、俞士汶、孫茂松、楊亦鳴2014《當(dāng)代機(jī)器語言能力的研究現(xiàn)狀與展望》,《語言科學(xué)》第1期。

李四維、程貴鋒、何雙旺、張笛2019《語音助手能力評(píng)估研究及趨勢(shì)分析》,《廣東通信技術(shù)》第12期。

作者:楊智惠 單位:蘇州大學(xué)文學(xué)院