物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

為什么說鍵盤輸入會被語音技術(shù)逐漸取代?

作者:承哲
來源:百度百家
日期:2016-03-25 12:06:54
摘要:在近期百度語音搜索舉辦的媒體開放日“盡在聽說之間”上,百度技術(shù)副總裁王海峰博士對百度當(dāng)前的語音技術(shù)進(jìn)展進(jìn)行了講解,而在此次對話中也展示了百度對未來語音商業(yè)環(huán)境的推演,相較于繁瑣的鍵盤,語音技術(shù)是最佳替代方案?而這背后是什么原因?

  語音技術(shù)正在如何發(fā)展?


  在近期百度語音搜索舉辦的媒體開放日“盡在聽說之間”上,百度技術(shù)副總裁王海峰博士對百度當(dāng)前的語音技術(shù)進(jìn)展進(jìn)行了講解,而在此次對話中也展示了百度對未來語音商業(yè)環(huán)境的推演,相較于繁瑣的鍵盤,語音技術(shù)是最佳替代方案?而這背后是什么原因?

  一,在人機(jī)交互上,語音技術(shù)正在占領(lǐng)市場

  先說一個例子,早期的蘋果將APP設(shè)計(jì)風(fēng)格全部定位為擬物風(fēng),其原因在于需要協(xié)助用戶使用習(xí)慣進(jìn)行過度,在蘋果之前,用戶與機(jī)器接觸列入打開廣播、打開手電筒、打開點(diǎn)燈,甚至用電腦打字等等統(tǒng)統(tǒng)需要與機(jī)器進(jìn)行“觸覺”上的交互,因此一塊屏幕的創(chuàng)新設(shè)計(jì)會讓用戶帶來極大的不適應(yīng),因此需要彌補(bǔ)用戶對于“觸覺”的喪失,而當(dāng)智能機(jī)占領(lǐng)絕對地位之后,其又將擬物風(fēng)改為了扁平風(fēng),其背后的關(guān)鍵原因在于用戶已經(jīng)適應(yīng)智能手機(jī)的操作。

  觸屏是“新”技術(shù),盡管讓用戶適應(yīng)需要一段時間,但其掌握了人機(jī)交互的方向,而語音技術(shù)也面臨著同樣情況。喬布斯曾經(jīng)說過優(yōu)秀的產(chǎn)品要簡單到可以讓傻瓜不用任何學(xué)習(xí)就能使用,無論小孩還是老人都能立即使用,而語音技術(shù)正是如此,在會上百度多模搜索總監(jiān)雯玉就提到,例如自己女兒現(xiàn)在找動畫片全都是通過語音搜索,你甚至不用交小孩就會,其次是像老人群體在文字輸入上不習(xí)慣,更傾向所說即所得,而百度方面也在對方言的語音技術(shù)進(jìn)行開發(fā),以符合更多方言搜索的需求。

  目前00與90后再語音搜索的用戶請求比例中占據(jù)了50%,這說明了語音搜索真正抓住了年輕人的需求,因此,看一項(xiàng)技術(shù)能否掌握未來,就看其是否能夠讓用戶更為簡單的實(shí)現(xiàn)自己需求,簡單到讓孩子和老人都可以掌握,而語音技術(shù)則具備這樣的優(yōu)勢。

  二,語音技術(shù)背后的人工智能與服務(wù),實(shí)用價值

  很多媒體都將簡單的將語音技術(shù)理解成為將語音翻譯成文字,而事實(shí)上并非如此簡單,每一句話的背后實(shí)際上都是用戶的一個或者多個需求,而將語音翻譯成文字只是一個環(huán)節(jié),更重要的是要將用戶的需求落地。

  1)人工智能

  王海峰演示了這么一個案例,他像機(jī)器問道“有沒有霧霾”,隨后機(jī)器就展現(xiàn)出對應(yīng)的當(dāng)前北京的霧霾圖表信息,這背后就用到了幾層機(jī)制,首先機(jī)器需要識別出用戶的地理位置信息,其次機(jī)器再根據(jù)地理位置信息調(diào)取相關(guān)數(shù)據(jù),再接著通過圖表展現(xiàn)。

  也就是說在這些對話中,用戶無需提供“地理位置”、“當(dāng)前時間”等諸多信息,人工智能可以通過各種收集來自行完成,因此語音技術(shù)并非只是一個環(huán)節(jié),而是一個人工智能服務(wù)的系統(tǒng),語音技術(shù)與人工智能的結(jié)合才是真正改變用戶習(xí)慣的組合。

  2)服務(wù)

  用戶還有一部分的搜索請求在于實(shí)際服務(wù)的需求,例如“北京到上海的機(jī)票”、“附近的餐館”、“附近的酒店”等等信息時有著潛在購買服務(wù)的需求,而這一塊又同樣需要線下O2O的支撐,而百度在這方面則更加具備優(yōu)勢,旗下的“攜程”“去哪兒”占領(lǐng)了旅游O2O行業(yè)的TOP1位置,而“百度糯米”、“百度外賣”則可以為用戶實(shí)現(xiàn)真正的支付與購買,有著極大的天然優(yōu)勢。

  因此,單單有語音技術(shù)是不夠的,語音技術(shù)的關(guān)鍵在于對于用戶整體需求的落地,,例如蘋果的智能語音系統(tǒng)SIRI,由于不具備國內(nèi)數(shù)據(jù)落地的能力,于去年與百度展開數(shù)據(jù)上的合作,使用百度的結(jié)果作為蘋果SIRI的支撐。而百度在整體落地方面有著搜索引擎加O2O的雙引擎支撐,因此也就比只有語音技術(shù)的公司更有“實(shí)用”價值。

  三,當(dāng)前語音技術(shù)的現(xiàn)狀與趨勢

  微信中的“語音發(fā)送”功能說明了語音搜索市場需求的真實(shí)不虛,用戶有著大量的需要縮短時間的需求,而微信該功能也在大量培養(yǎng)起了用戶大量發(fā)送語音的習(xí)慣。此外,由于當(dāng)前各種APP都提供了大量的服務(wù),用戶苦于在各種APP中頻繁切換,因此語音搜索請求等同于一個中心集中器,將用戶的需求全部整合到一起,成為一個中心入口。

  此外,凡是使用語音搜索超過一周以上時間的用戶,都會發(fā)現(xiàn)輸入變慢,而都會在各種APP中尋找語音服務(wù),因此語音技術(shù)需要的只是等待,等待那些習(xí)慣于鍵盤的輸入用戶一點(diǎn)點(diǎn)嘗試語音服務(wù),并實(shí)現(xiàn)不可逆的轉(zhuǎn)化。不要忘了此前百度的統(tǒng)計(jì),目前00與90后再語音搜索的用戶請求比例中占據(jù)了50%,這部分年輕原因嘗新的用戶真正代表了未來的趨勢。

  結(jié)語:

  語音技術(shù)在早期只是一項(xiàng)普通的翻譯技術(shù),而在當(dāng)前的移動時代與智能手機(jī)、搜索人工智能、O2O服務(wù)的結(jié)合,不僅讓其有了數(shù)據(jù)燃料,更讓其有了巨大的商業(yè)價值,其更傻瓜化的人機(jī)交互體驗(yàn)正在源源不斷的吸引著更多用戶,因此在未來某天其若是徹底取代了鍵盤輸入,并不會是一件令人驚訝的事情,正如同iphone取代功能機(jī)一樣,一切都在必然之中。

  此外在今年的《麻省理工評論》語音技術(shù)與生物技術(shù)、航天技術(shù)、自動駕駛技術(shù)等等并列被評選為十大突破技術(shù)中,而百度的Deep Speech2深度語音技術(shù)是唯一一家入選的中國企業(yè),我們值得期待更多。

人物訪談