物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

智能語音識別AI市場即將井噴,關(guān)鍵“芯元素”成引爆點(diǎn)

作者:易維訊
來源:來源網(wǎng)絡(luò)(侵權(quán)刪)
日期:2017-06-15 16:31:00
摘要:與去年阿法狗(AlphaGo)輕松擊敗李世石后人們紛紛驚嘆人類被機(jī)器人超越不同的是,前不久全球排位第一的柯潔再次完敗于人工智能(AI)的機(jī)器人后,人們明顯已經(jīng)逐漸接受了人工智能在很多領(lǐng)域超越人類的事實(shí),更多地從理性角度探討以人工智能為基礎(chǔ)的科技對人類社會的改變機(jī)遇。據(jù)今日頭條首份人工智能影響力報(bào)告表明,中國國民AI信心指數(shù)高達(dá)83,中國消費(fèi)者對人工智能的態(tài)度變得十分積極。
關(guān)鍵詞:AI語音識別

  與去年阿法狗(AlphaGo)輕松擊敗李世石后人們紛紛驚嘆人類被機(jī)器人超越不同的是,前不久全球排位第一的柯潔再次完敗于人工智能(AI)的機(jī)器人后,人們明顯已經(jīng)逐漸接受了人工智能在很多領(lǐng)域超越人類的事實(shí),更多地從理性角度探討以人工智能為基礎(chǔ)的科技對人類社會的改變機(jī)遇。據(jù)今日頭條首份人工智能影響力報(bào)告表明,中國國民AI信心指數(shù)高達(dá)83,中國消費(fèi)者對人工智能的態(tài)度變得十分積極。

  “事實(shí)上,人工智能正在逐漸走入我們生活,尤其作為人工智能非常重要的語音智能識別的研究上,世界范圍內(nèi)已經(jīng)做出了非常成功的創(chuàng)新應(yīng)用,而中國同樣也走在了前列。” 以電源和模擬半導(dǎo)體技術(shù)領(lǐng)先的深圳芯智匯科技有限公司(X-Powers Technology)產(chǎn)品經(jīng)理徐正弟近日對媒體表示。由于非??春没谡Z音的人工智能技術(shù)的應(yīng)用,芯智匯科技近日在國內(nèi)率先發(fā)布了專門針對人工智能熱門應(yīng)用的語音識別多陣列麥克風(fēng)前端ADC芯片AC108。“作為智能語音應(yīng)用中非常關(guān)鍵的入口信號拾取的AC108推出,我們期待以突破性的SNR(信噪比,108dB)性能和更優(yōu)化的設(shè)計(jì)助推企業(yè)在人工智能應(yīng)用領(lǐng)域搶占市場先機(jī)。” 徐正弟指出。

  圖1:中國國民AI信心指數(shù)高達(dá)83

  消費(fèi)者正習(xí)慣語音交互,Smart Home是首個(gè)突破口

  最新發(fā)布的《2017年互聯(lián)網(wǎng)趨勢報(bào)告》指出,在使用Google Assistant(谷歌語音助手)的智能手機(jī)用戶中,2016年5月僅20%的移動(dòng)查詢通過語音方式完成,而至2017年5月已有近7成的詢問是通過自然/交談?wù)Z言進(jìn)行的。僅僅一年時(shí)間已經(jīng)發(fā)生巨大改變,多數(shù)消費(fèi)者的移動(dòng)查詢習(xí)慣已開始偏向智能語音交互。

  圖2:消費(fèi)者正在習(xí)慣使用語音交互完成查詢等操作

  “智能語音首先會在垂直市場落地,在交互相對單一、場景相對固定,且用戶有剛需的應(yīng)用場景中,比如家電控制、車載電子就有大量的發(fā)展機(jī)會。”徐正弟在接受采訪時(shí)介紹道。這類場景的需求相對簡單,最需要的是一系列命令詞的識別,技術(shù)相對容易實(shí)現(xiàn)。與此同時(shí),在自動(dòng)駕駛成熟之前,車內(nèi)駕駛者都無法釋放出雙手,因此車內(nèi)語音控制也是剛需。就目前而言,智慧家居的語音控制顯然走得更前些,很明顯的例子就是Amazon Echo的風(fēng)靡!

  圖3:語音識別成物聯(lián)網(wǎng)智能化入口之一

  2016年下半年,Amazon將Echo Dot的售價(jià)從99美元下降到49美元,這意味著未來一年Echo相關(guān)產(chǎn)品的出貨量將大幅度提升。與此同時(shí),上游供應(yīng)鏈透露的消息稱,2017年Amazon已將智能音箱的訂單量增加至1,000萬臺,為2016年的三倍!在這場智能音箱的競賽中,Amazon、Google和Apple等全球領(lǐng)導(dǎo)企業(yè)正在推動(dòng)越來越多的互聯(lián)網(wǎng)公司發(fā)布類似的智能音箱產(chǎn)品,其中也不乏中國企業(yè)加入競逐,如京東智能的叮咚系列,這也為上下游各環(huán)節(jié)的供應(yīng)商帶來了巨大的機(jī)會。

  信號拾取前端處理很關(guān)鍵,108dB SNR解決遠(yuǎn)場語音設(shè)計(jì)最大挑戰(zhàn)

  事實(shí)上,像智能手機(jī)上Siri、Google Assistant這樣近距離的智能語音應(yīng)用已經(jīng)相對成熟(因?yàn)楦蛩惴?,“而目前最主要的智能語音應(yīng)用通常交互距離在3~5米,更遠(yuǎn)距離或者環(huán)境更嘈雜的遠(yuǎn)場智能語音信號處理是Smart Home應(yīng)用的關(guān)鍵,這是AC108推出的主要目標(biāo)市場。” 徐正弟表示,“這些應(yīng)用需要多陣列麥克風(fēng),必須解決多通道語音采集、高信噪比(SNR)以及低復(fù)雜度設(shè)計(jì)要求。”

  智能語音應(yīng)用的實(shí)現(xiàn)需要三個(gè)環(huán)節(jié):首先是拾取——將自然的語音信號轉(zhuǎn)化為數(shù)字信號;緊接是前處理——對采集到的語音信號進(jìn)行降噪、消回聲、去混響等處理,形成“干凈”的音頻信號;最后是本地或云端的語音識別引擎對“干凈”的語音信號進(jìn)行識別和語義分析,從而實(shí)現(xiàn)智能反饋。顯然,在完成算法層面的語音識別之前需要進(jìn)行遠(yuǎn)距離拾音,首當(dāng)其沖必須使用麥克風(fēng)陣列,配套語音前處理算法,如NS、AEC、De-reverb等,才能實(shí)現(xiàn)自然語言人機(jī)交互。

  在整套智能語音系統(tǒng)中,前端語音采集和處理,對語音識別高準(zhǔn)確率起到了決定性作用。從硬件元器件的層面分析,前端語音ADC芯片的性能表現(xiàn)是關(guān)鍵因素!一般而言,決定ADC芯片性能優(yōu)劣的其中一個(gè)重要參數(shù)是信噪比SNR,它表征了最大不失真聲音信號、即主觀上認(rèn)為的有用信號強(qiáng)度與噪音強(qiáng)度之間的比率,信噪比SNR越高,噪音越小,芯片性能表現(xiàn)越好。

  分析市場上幾款主流智能音箱產(chǎn)品的相關(guān)報(bào)告可以發(fā)現(xiàn)其前端語音ADC芯片SNR為98dB、101dB,而AC108宣稱的108dB是目前業(yè)內(nèi)同類產(chǎn)品中達(dá)到最高信噪比的ADC芯片。“AC108型號名稱凸顯了其性能優(yōu)勢——‘Audio Codec 108dB(SNR)’,108dB是目前滿足麥克風(fēng)陣列應(yīng)用的最高性能。同時(shí)AC108嚴(yán)格按照家電級標(biāo)準(zhǔn)進(jìn)行設(shè)計(jì)、生產(chǎn)、測試,從而保證良好品質(zhì)要求。”徐正弟介紹道。

人物訪談