語音識(shí)別技術(shù)是未來

從你的話語中真能聽出你是怎樣的一個(gè)人嗎?其實(shí)答案甚至超出了人類大腦的想象。從你的聲音中可以察覺到你的情緒、社會(huì)地位、成長經(jīng)歷、年齡、種族、體重、身高,以及面部特征—此外還有你周圍的環(huán)境信息。
人耳無法察覺這些細(xì)微的信息。但是人工智能呢?那就是另外一回事情了。
經(jīng)常通過“以培訓(xùn)為目的”的客戶服務(wù)電話錄音來學(xué)習(xí)的軟件,目前可以從聲音中提取微觀特征,這些特征反映出了講述者的具體情況。這個(gè)概念被稱作“語音畫像”,2017年12月,卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)的研究人員實(shí)現(xiàn)了一個(gè)突破,他們利用人工智能,僅憑分析錄音,便創(chuàng)造出講述者面部的三維影像?!澳愕穆曇艟拖袷悄愕腄NA或指紋?!笨▋?nèi)基梅隆大學(xué)負(fù)責(zé)這項(xiàng)研究工作的麗塔·辛格(Rita Singh)說。
人類對(duì)語音分析的研究已經(jīng)持續(xù)了數(shù)十年,但是直到這一次,語音識(shí)別才開始進(jìn)入主流。如今,由于計(jì)算能力的大幅提高,以及算法的日益復(fù)雜,一大批語音技術(shù)蓬勃發(fā)展。
美國海岸警衛(wèi)隊(duì)(U.S. Coast Guard)正在利用卡內(nèi)基梅隆大學(xué)的人工智能技術(shù)對(duì)撥打惡作劇報(bào)警電話的人立案,這些惡作劇電話會(huì)讓實(shí)施營救的隊(duì)員撲空,從而造成時(shí)間和金錢的浪費(fèi)。海岸警衛(wèi)隊(duì)每年大約接到150個(gè)惡作劇電話。這項(xiàng)技術(shù)已經(jīng)在一起針對(duì)撥打此類電話的刑事案件中發(fā)揮了作用,不過目前還不清楚這樣的聲音指紋能否成為呈堂證供。
聲音指紋有可能幫你減少銀行的安全漏洞,因?yàn)樗滥闶悄?,而不是一母同胞的邪惡姊妹。它還能讓你的車認(rèn)識(shí)你,當(dāng)你坐進(jìn)駕駛座并且開口說話后,汽車會(huì)解除防盜報(bào)警,自動(dòng)調(diào)節(jié)座椅,并且根據(jù)你的喜好調(diào)節(jié)溫度。[寶馬(BMW)、奧迪(Audi)和福特(Ford)等汽車生產(chǎn)商正在與馬薩諸塞州伯靈頓(Burlington)的Nuance Communications公司合作開發(fā)這項(xiàng)技術(shù)。]
如果你向電視機(jī)詢問有什么好看的喜劇,聲音指紋也許會(huì)讓電視機(jī)打開一部R級(jí)的電影,而不是9歲的女兒提出同樣問題時(shí)打開的G級(jí)電影。法國的Orange TV正在與Nuance公司合作開發(fā)這樣的應(yīng)用程序軟件。
“這僅僅是開始?!盕uture Today Institute公司的創(chuàng)始人艾米·韋布(Amy Webb)說?!拔磥?0年,我們即將(在生物識(shí)別和語音技術(shù)方面)經(jīng)歷翻天覆地的變化。”Future Today Institute是一家技術(shù)公司,它預(yù)測(cè)未來的技術(shù)趨勢(shì)。
辛格希望有一天她的技術(shù)可以在醫(yī)生進(jìn)行遠(yuǎn)程醫(yī)療時(shí)發(fā)揮作用,為帕金森?。≒arkinson's disease)等疾病的早期患者確診。對(duì)于這項(xiàng)技術(shù)的潛能而言,這個(gè)應(yīng)用程序可能只是冰山一角。辛格說:“如果DNA可以定義你本人,那么從你的聲音中就可以捕獲你的完整人格?!保ㄘ?cái)富中文網(wǎng))
譯者:錢志清
-
熱讀文章
-
熱門視頻