伴隨著互聯(lián)網(wǎng)的個(gè)性蓬勃,人們開始面臨一個(gè)非常困擾的化定問(wèn)題,充斥在互聯(lián)網(wǎng)上的聲紋識(shí)別信息如海洋般豐富,如何快速查找到適合我們的技術(shù)信息呢?——千人千面的個(gè)性化定制應(yīng)運(yùn)而生。

說(shuō)到千人千面,最為用戶熟知的恐怕要屬今日頭條。依托先進(jìn)的大數(shù)據(jù)技術(shù),為不同年齡、不同性別、不同愛好的用戶推薦不同的新聞內(nèi)容,打造新聞資訊的千人千面,成為越來(lái)越懂你的新聞資訊客戶端,也博得了一大批用戶的喜愛。
數(shù)年前智能電視崛起,顛覆了傳統(tǒng)電視的形態(tài),搭載智能操作系統(tǒng)和視頻內(nèi)容,能按照用戶意愿下載各種第三方app,極大程度上拓展了電視的娛樂(lè)功能,延伸了家庭電視的內(nèi)涵,給萬(wàn)千用戶帶來(lái)更為新穎的視聽體驗(yàn)。隨著技術(shù)的發(fā)展和人工智能概念的應(yīng)用,眾多電視系統(tǒng)開發(fā)者不滿足于僅有的“操作系統(tǒng)”,而是花費(fèi)了更多心思用于“智能”操作系統(tǒng)的研發(fā)。這些“智能”操作系統(tǒng)不僅可以下載安裝各種APP,而且擁有語(yǔ)音交互、在線購(gòu)物、人臉識(shí)別、視頻通話、AR等功能,在此基礎(chǔ)上,進(jìn)一步實(shí)現(xiàn)了視頻內(nèi)容的千人千面和個(gè)性化定制,將周到的服務(wù)體驗(yàn)轉(zhuǎn)嫁到了電視層面。
那么問(wèn)題又來(lái)了。很多業(yè)內(nèi)人士都對(duì)智能電視的個(gè)性化定制提出了疑問(wèn)。電視的家庭屬性非常強(qiáng),一臺(tái)電視屬于爺爺奶奶、爸爸媽媽、兒子女兒,電視該如何判斷此刻是誰(shuí)在使用,該怎么為不同的家庭成員推薦不同的內(nèi)容,從而實(shí)現(xiàn)真正意義的個(gè)性化定制。
基于現(xiàn)有技術(shù)水平和電視機(jī)本身的構(gòu)造,要實(shí)現(xiàn)能夠識(shí)別用戶的個(gè)性化定制,方式主要有兩種:一是通過(guò)外置攝像頭,達(dá)到識(shí)別人臉的效果;二是通過(guò)話筒,實(shí)現(xiàn)聲紋識(shí)別。

今天我們主要說(shuō)一下聲紋識(shí)別。
在普通大眾眼中,聲紋識(shí)別和語(yǔ)音識(shí)別是兩個(gè)很容易混淆的概念,其實(shí)二者有著很大的區(qū)別。語(yǔ)音識(shí)別的重點(diǎn)在于“聽得懂說(shuō)什么”,聲紋識(shí)別的重點(diǎn)在于“聽得懂是誰(shuí)說(shuō)”。聲紋識(shí)別是一種基于人類“生物特征”的身份辨認(rèn)方法,與指紋、唇紋、虹膜等一樣,也被稱為“活體密碼”,擁有極高的安全性,例如微信就采用了聲紋作為密碼驗(yàn)證。
為什么聲紋識(shí)別有著越來(lái)越廣闊的前景呢?最主要的原因是,能夠使用語(yǔ)言是人類與動(dòng)物最主要的區(qū)別之一,語(yǔ)言也是人類生活中最廣泛的溝通方式,最天然的溝通入口,因此人類要訓(xùn)練機(jī)器,讓機(jī)器擁有聽懂和表達(dá)語(yǔ)言的能力,不但要聽懂“說(shuō)什么”,還要聽懂“是誰(shuí)說(shuō)”,如此一來(lái),人工智能便能成為人類的工具,服務(wù)于人,所以聲紋識(shí)別成為物聯(lián)網(wǎng)時(shí)代的風(fēng)口之一。
目前聲紋識(shí)別技術(shù)的工作流程主要有兩種,一種是“1對(duì)1”,可以用于密碼驗(yàn)證、身份驗(yàn)證等場(chǎng)景,比如微信語(yǔ)音密碼;另一種是“1對(duì)多”,這種技術(shù)比“1對(duì)1”更為復(fù)雜,因?yàn)樗梢跃珳?zhǔn)識(shí)別到每一位不同用戶,依賴的是機(jī)器學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò),從而為更廣闊的場(chǎng)景服務(wù)創(chuàng)造了無(wú)限可能。
與人臉識(shí)別所需要的攝像頭相比,聲紋識(shí)別只需要一個(gè)麥克風(fēng),如果在電視或智能家居設(shè)備上配備,顯然其成本因素更為低廉,因此也更容易受到廠商青睞。
除微信語(yǔ)音密碼驗(yàn)證外,聲紋識(shí)別已經(jīng)開始在智能電視或智能音箱上使用。比如9月20日暴風(fēng)電視剛剛發(fā)布的AI2.0,“進(jìn)一步深化對(duì)用戶行為數(shù)據(jù)的收集,充分沉淀用戶的使用習(xí)慣,完成對(duì)用戶行為和聲紋的分析,實(shí)現(xiàn)精準(zhǔn)化內(nèi)容推薦。針對(duì)不同的年齡段,不同性別的人群按需推薦內(nèi)容,滿足不同用戶在家庭場(chǎng)景中個(gè)性化需求。”
在暴風(fēng)電視的現(xiàn)場(chǎng)演示中,通過(guò)語(yǔ)音喚醒暴風(fēng)大耳朵后,它可以根據(jù)聲紋識(shí)別出此刻正在收看電視的具體用戶,從而為該用戶推薦合適的視頻內(nèi)容,這不但增加了人與設(shè)備之間的溝通,也更符合人類語(yǔ)言行為習(xí)慣,讓機(jī)器更懂人類,向人工智能邁進(jìn)新的一步。

除構(gòu)建智能化場(chǎng)景服務(wù)外,聲紋識(shí)別還可用于銀行安保、身份驗(yàn)證、公安破案等具體場(chǎng)景,為大眾帶來(lái)更方便、安全的生活服務(wù)。
當(dāng)然,聲紋識(shí)別也不是萬(wàn)能的,和其他技術(shù)一樣,也存在很多局限性。例如專業(yè)級(jí)別的技術(shù)門檻,只有擁有一定專業(yè)知識(shí)的技術(shù)人員才能實(shí)現(xiàn)聲紋識(shí)別功能;再例如周圍環(huán)境的噪音問(wèn)題、嘈雜的現(xiàn)場(chǎng)、數(shù)人同時(shí)說(shuō)話、遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別等難題,這些問(wèn)題的解決絕非一朝一夕,而是需要在長(zhǎng)久的行業(yè)磨合中,逐漸摸索出一條全面而完善的聲紋識(shí)別道路,“路漫漫其修遠(yuǎn)兮”,相信在不久的未來(lái),聲紋識(shí)別一定會(huì)像如今的指紋識(shí)別一樣,被大眾接受、普及。


相關(guān)文章




精彩導(dǎo)讀
熱門資訊
關(guān)注我們