物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

智能語音產業(yè)規(guī)模將破百億 普及面臨技術壁壘

作者:李舒來
來源:通信信息報
日期:2013-11-20 14:21:25
摘要:近日,由工業(yè)和信息化部電子科學技術情報所洪京一所長代表聯(lián)盟秘書處單位發(fā)布的《2013中國智能語音產業(yè)發(fā)展白皮書》指出,智能語音已經進入快速應用階段,預計到2017年,產業(yè)規(guī)模將達到101.4億元。而語音作為人類溝通和獲取信息最自然最便捷的方式,勢必會成為人機交互的未來趨勢。

  近日,由工業(yè)和信息化部電子科學技術情報所洪京一所長代表聯(lián)盟秘書處單位發(fā)布的《2013中國智能語音產業(yè)發(fā)展白皮書》指出,智能語音已經進入快速應用階段,預計到2017年,產業(yè)規(guī)模將達到101.4億元。而語音作為人類溝通和獲取信息最自然最便捷的方式,勢必會成為人機交互的未來趨勢。

  智能語音開啟移動互聯(lián)網(wǎng)發(fā)展新時代

  隨著移動互聯(lián)網(wǎng)時代的來臨,智能語音作為信息交互的重要入口之一,成為各大手機制造商、運營商和互聯(lián)網(wǎng)企業(yè)等巨頭爭相搶占的制高點。在過去的三年中,全球智能語音市場不斷擴大。日前,微軟也亮出其智能語音技術的最新成果:“實時語音翻譯系統(tǒng)”和“基于Kinect的手語翻譯系統(tǒng)”。此前,在“百度世界2013”大會上,百度宣布向開發(fā)者免費開放整個語音識別平臺。

  事實上,智能語音產業(yè)主要指通過語音合成技術和語音識別技術,為用戶提供各種服務的產業(yè)。一般來說,用戶只需要用說話的方式給服務終端發(fā)布命令,就能得到相應的服務。智能語音交互首先改變的是移動互聯(lián)網(wǎng)。以iPhone中內置的Siri為例,用戶以自然語言的方式對智能手機下達指令,而手機根據(jù)用戶語音和用戶當前的環(huán)境及上下文對用戶意圖進行理解,并按照用戶意圖執(zhí)行命令的過程。

  盡管目前智能語音產業(yè)規(guī)模相對較小,但業(yè)內人士普遍認為,語音技術在兩三年內,會徹底改變當前的人機交互方式。移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)技術的飛速發(fā)展,智能語音已由技術研發(fā)進入快速應用階段,產業(yè)規(guī)模大幅提升。根據(jù)工業(yè)和信息化部電子科學技術情報研究所數(shù)據(jù),2012年全球智能語音產業(yè)規(guī)模整體達到24.4億美元,同比增長24.0%。其中,中國智能語音產業(yè)規(guī)模近8.6億元,同比增長38.2%,帶動移動互聯(lián)網(wǎng)、智能家電、教育等相關產業(yè)規(guī)模增長100億元。

  智能語音應用漸成信息消費熱點

  目前,在全球電子設備制造業(yè)中,微型電聲元器件的應用較為廣泛,隨著下游手機、筆記本電腦、平板電視、數(shù)碼相機等個人消費類電子產品的持續(xù)發(fā)展,其市場需求將不斷快速增長。百度多媒體負責人余凱曾表示“如今的語音搜索不同于傳統(tǒng)搜索模式,不是基于無關聯(lián)的幾個關鍵詞來反饋結果,而是能夠理解用戶指令,完成一項完整的任務?!被诖耍Z音必將成為日后移動互聯(lián)網(wǎng)的入口之一。

  智能語音技術發(fā)展至今,市場上也涌現(xiàn)出越來越多的語音識別軟件,如語音類搜索應用Dragon Search、語音類聽寫功能整合軟件訊飛口訊、語音類音樂軟件Shazam、口語在線學習平臺思必馳AIChinese,以及語音控制軟件Siri等。在國外語音市場主要以語音識別為主,具有代表性的產品有Nuance的Dragon Dictation,蘋果新推出的Siri;而在國內,語音市場主要以語音合成為主,其中科大訊飛及捷通華聲基本占領了語音合成市場。

  市場規(guī)模的大幅提升為行業(yè)企業(yè)提供了巨大的市場空間。微信的微語音插件、搜狗語音助手、易信等,都采用了語音識別應用。另外,電視和機頂盒也是采用智能語音交互比較積極的行業(yè)。傳統(tǒng)的電視機和機頂盒的遙控操作都比較復雜,而采用智能語音交互技術,只需對著遙控器說話,就可以控制電視,輸入文字、打開應用、播放視頻都可輕松實現(xiàn)。汽車、玩具、穿戴設備也都對智能交互技術能提供的全新交互方式抱有很大的期待。語音技術作為一個已經漸漸成熟的基礎技術,用戶認知度和市場規(guī)模也正在逐漸擴大。

  智能語音產業(yè)如何破解技術壁壘?

  雖然人工智能技術是從計算機出現(xiàn)以來就開始研究,但智能語音離實際應用還有相當?shù)木嚯x,路還很長。據(jù)易觀智庫發(fā)布的數(shù)據(jù)顯示,語音助手類應用累積下載量排行中,沖動語音助手以29.8%占比第一,其次是智能360占25.2%,而科大訊飛旗下的訊飛語點由于靈犀的分流,排名第三,占到20.1%。據(jù)蟲洞語音助手創(chuàng)始團隊成員王向一透露,目前蟲洞語音助手總用戶為1600萬。按比例計算,國內所有語音助手總每月下載量僅為4442萬,用戶量總和僅5000萬。

  此外,一份國外最新的調查顯示,截至目前,約有85%的iOS 7用戶從未使用過Siri,在使用Siri的用戶中,有46%的用戶感到失望,認為Ssiri發(fā)揮的實際作用不大。這些數(shù)據(jù)都可以看出,智能語音技術離實際應用還很遠。當前,智能語音類應用在語音識別,語義解析,內容問答等方面存在較大的技術壁壘。在全球范圍內,將此技術與商業(yè)化完美結合的廠商也是寥寥無幾。人機交互式的語音技術僅是在諸如輸入法等產品中充當配角,真正的語音產品形態(tài)尚未出現(xiàn)。

  目前還沒有一個較為成功的前端語音產品可以主宰市場,功能上的同質化、用戶體驗的不流暢、語音識別的準確率不高等等問題嚴重影響其發(fā)展。如何突破技術壁壘實行商業(yè)化運作將是智能語音規(guī)模普及的關鍵。因此,在未來發(fā)展過程中,廠商仍應加強語音操控功能的技術完善。另外,還應著眼于提升用戶的綜合使用體驗,而不僅僅是技術層面的應用,切忌陷入單純的技術比拼怪圈。

人物訪談