物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊(cè)

機(jī)器學(xué)習(xí)領(lǐng)域創(chuàng)業(yè),你還有哪些機(jī)會(huì)?

作者:Libby Kinsey
來源:機(jī)器之心
日期:2016-07-14 09:14:06
摘要:機(jī)器學(xué)習(xí)已經(jīng)滲入進(jìn)幾乎所有的數(shù)據(jù)驅(qū)動(dòng)型商業(yè)領(lǐng)域,不過,大公司還未完全占領(lǐng)下面這些領(lǐng)域。
關(guān)鍵詞:機(jī)器學(xué)習(xí)

  機(jī)器學(xué)習(xí)與人工智能在數(shù)據(jù)驅(qū)動(dòng)型商業(yè)項(xiàng)目中發(fā)展迅猛,幾乎遍布每個(gè)角落。這里我選了幾個(gè)可能還未被大公司吞食的領(lǐng)域。


  「鋤頭和鏟子」 戲碼

  即在那次加利福尼亞州淘金熱中,鎬鍬承包商大賺了一筆(然而探礦者的貢獻(xiàn)被忽略了)。機(jī)器智能的鎬與鍬就是硬件、數(shù)據(jù)輸入端及(有爭(zhēng)議的)算法本身。

  1.很明顯,機(jī)器智能算法的開發(fā)大多數(shù)都是開源的。當(dāng)然也有例外——去年,哈佛大學(xué)申請(qǐng)了一項(xiàng)有效替代 BackProp 算法的專利,即 Feedback Alignment Algorithm ——我想知道,他們打算如何使之商業(yè)化?幫助人們方便利用學(xué)習(xí)算法的高質(zhì)量 SaaS 產(chǎn)品,會(huì)找到有這方面需要的用戶,而且 MetaMind,正將深度學(xué)習(xí)技術(shù)帶入數(shù)據(jù)集,它們就是這樣一家公司。另一個(gè)我喜歡的項(xiàng)目叫做自動(dòng)統(tǒng)計(jì)專家(The Automatic Statistician),它利用貝葉斯推理(Bayesian inference)找出數(shù)據(jù)擬合的最佳模型。Curious AI,是一家通用人工智能(General AI)公司,它們的第一個(gè)商業(yè)項(xiàng)目就是垃圾分類(中規(guī)中矩的盈利模式范本),據(jù)報(bào)道,公司旨在以工具包的形式出售人工智能軟件。

  2.大公司可以接觸到龐大數(shù)據(jù)庫(kù),還能獲取更多的數(shù)據(jù)。不過,到目前為止,大公司的關(guān)注點(diǎn)都集中在一些唾手可得的成果上,比如社交或商業(yè)數(shù)據(jù),因此,創(chuàng)業(yè)公司仍有機(jī)會(huì)在某些領(lǐng)域大展拳腳:難以獲得數(shù)據(jù)以及(或者)難以標(biāo)簽化數(shù)據(jù)的地方。Affectiva 的臉部表情回應(yīng)數(shù)據(jù)庫(kù)就是這個(gè)類型,還有 Pallas Ludens(端到端數(shù)據(jù)注釋服務(wù)),以及 opensensors.io(為傳感器數(shù)據(jù)公共資源附加價(jià)值)。基因和醫(yī)學(xué)圖像數(shù)據(jù)——受制于某些棘手的隱私問題——會(huì)讓個(gè)性化治療、護(hù)理以及更好的診斷成為可能。這方面,看 Genomics England 公司是個(gè)好例子。

  3. 硬件前沿,GPUs 已經(jīng)讓一些巨大進(jìn)展成為可能。(一張NVIDIA GeForce GTX Titan就能讓我檢測(cè)蝙蝠的音頻信號(hào)) 


  蝙蝠信號(hào)的聲譜圖(下圖)及ConVnet預(yù)測(cè)(上圖)。

  但是,這些只是圖像處理器。高效學(xué)習(xí)以及推理的 下一個(gè)拐點(diǎn),會(huì)來自為機(jī)器學(xué)習(xí)特別設(shè)計(jì)處理器這一領(lǐng)域。Graphcore 稱之為智能處理器單元(Intelligent Processor Units)。同時(shí),Nervana Systems, Teradeep(Yann LeCun 擔(dān)當(dāng)顧問)以及 Thinci 正在打造他們自己的定制硬件。將一些對(duì)教育有幫助的公司(Udacity, Coursera, Kaggle 等),或管理代碼庫(kù)和項(xiàng)目的公司(比如 Atlassian,上市準(zhǔn)備中)包括進(jìn)來,也是很有意義的。

  情感開發(fā)

  眾多初創(chuàng)公司在這個(gè)領(lǐng)域的表現(xiàn)都差強(qiáng)人意。正如 MIT 的情感計(jì)算小組(Affective Computing group)所言:

  情感對(duì)于人類體驗(yàn)來說至關(guān)重要,它影響認(rèn)知、觀念、以及學(xué)習(xí)、交流、甚至理性決策等日常活動(dòng)。然而,技術(shù)人員卻大大忽略了情感的作用并為用戶創(chuàng)造出一種經(jīng)常讓人感覺挫敗的體驗(yàn)...  


  用來訓(xùn)練一個(gè)微表情探測(cè)器的圖片

  第一個(gè)任務(wù)是訓(xùn)練識(shí)別人類情感的模型。Emotient,RealEyes 及 Affectiva,都使用了臉部表情來推理情感,目前(看起來)很大程度上是一種營(yíng)銷手段。Cogito Corp 及 Beyond Verbal 關(guān)注的是從語(yǔ)音中解讀情感線索,進(jìn)而展開市場(chǎng)調(diào)研,提供更好的用戶體驗(yàn)。

  接著是模仿情感行為,比如,為了和人類自然互動(dòng)。那個(gè)「友善」的機(jī)器人 Jibo,就是只用一只「眼睛」表達(dá)情感的絕佳的例子。盡管未能找到其他例子,不過,一定會(huì)出現(xiàn)比較便宜的、具有自適性和回應(yīng)性的機(jī)器人玩具(比如Paro,治愈系海豹機(jī)器人,不過僅供娛樂)。這些機(jī)器人的優(yōu)勢(shì)在于,避免了對(duì)話性機(jī)器人玩具隱私方面的擔(dān)憂,比如像 Toy Talk 及 Mattel 的 Hello BarbieTM,至少在聲音的本地化而非云端處理后。

  另一些應(yīng)用包括個(gè)性化保健與教育、沖突解決方案、協(xié)商訓(xùn)練,以及自適應(yīng)游戲。這些領(lǐng)域看起來很適合運(yùn)用機(jī)器學(xué)習(xí),因?yàn)榍楦畜w驗(yàn)是主觀和多變的。

  行業(yè)滲透

  機(jī)器智能是否會(huì)讓人類勞動(dòng)力顯得多余,對(duì)此,我持觀望態(tài)度,不過我會(huì)指出,它當(dāng)然會(huì)有望幫助人類完成許多專業(yè)任務(wù)(而且在這一過程中,能為消費(fèi)者在金錢方面提供更好的選擇和價(jià)值)。

  這些技術(shù)能做什么?拿法律行業(yè)為例,Ravn Systems 實(shí)現(xiàn)了法律工作中(重復(fù)而單調(diào)的)文件審查自動(dòng)化;Bitproof’s Peter 是一個(gè)人工智能法律助手,能請(qǐng)求簽名,生成合同以及證明文件;Premonition.ai 使用數(shù)據(jù)來搜索司法審判中的無意識(shí)偏見。

  在招聘,保險(xiǎn),財(cái)務(wù)管理等領(lǐng)域,類似工具能讓專業(yè)人士將更多的時(shí)間花在工作上更加讓人滿意的方面,諸如鍛煉判斷力,進(jìn)行決策以及娛樂客戶。

  醫(yī)療改革

  藥物發(fā)現(xiàn)總是昂貴而有風(fēng)險(xiǎn)的,需要相當(dāng)?shù)闹腔?。但是,加入你能用?shù)據(jù)減少風(fēng)險(xiǎn),找到更好的藥物研發(fā)目標(biāo),會(huì)怎樣?這是 Stratified Medical 的假設(shè),運(yùn)用深度學(xué)習(xí)進(jìn)行藥物發(fā)現(xiàn)。

  另外,Enlitic 和 Zebra Medical 尋求運(yùn)用深度學(xué)習(xí)來開發(fā)精確的診斷/決策支持工具,而 Your.MD 已經(jīng)與英國(guó)國(guó)家衛(wèi)生服務(wù)組織合作,開發(fā)提供個(gè)性化健康援助的 app。

  搜索優(yōu)化

  「什么電影來著,有個(gè)我妹妹喜歡的德國(guó)演員...和外星人有關(guān)...很朋克的那部?」

  搜索軟件需要處理不準(zhǔn)確、主觀和個(gè)人的信息,就像人類做的那樣。它需要幫助我們從一堆龐雜信息中,發(fā)現(xiàn)與之相關(guān)的內(nèi)容。這一過程包括學(xué)習(xí)文本和內(nèi)容特征。事實(shí)上,這需要一篇博文的篇幅來講清楚,不過,這里有些例子:

  Clarify 通過API使得音頻和視頻變得可檢索。它就是掃描文本,找關(guān)鍵詞來確定相關(guān)性,一個(gè)很贊的省時(shí)應(yīng)用。

  Lumi 根據(jù)瀏覽歷史來推測(cè)你的品味,提供相關(guān)流行內(nèi)容。

  Youssarian Lives 是一個(gè)能夠進(jìn)行側(cè)面連接的搜索引擎。

  EyeEm 已經(jīng)將機(jī)器學(xué)習(xí)用于圖片市場(chǎng),這樣,無需便簽就能進(jìn)行搜索特征,比如「愉快的」和「多雨倫敦」,而 Cortexica 及 Sentient Technologies / Shoes.com 也以類似的方式重新定義產(chǎn)品搜索。

  搜索相關(guān)性的一個(gè)必要方面,當(dāng)然是「值得信任(trustworthiness)」,這樣,社交媒體及新聞網(wǎng)站的內(nèi)容和主張的就能進(jìn)行驗(yàn)證或根據(jù)真實(shí)性評(píng)分。有人在做這個(gè)嗎?

  網(wǎng)絡(luò)安全

  網(wǎng)絡(luò)安全領(lǐng)域的機(jī)器學(xué)習(xí)已經(jīng)吸引了大批風(fēng)險(xiǎn)資本(例如,Lookout 的 2.82 億注資, Vectra Networks 獲得了 7800 萬(wàn),Darktrace 的 4000 萬(wàn),以及 Cybereason 的 8900 萬(wàn)),但是,一系列壞消息(比如最近 TalkTalk 用戶數(shù)據(jù)被黑)表明市場(chǎng)仍有相當(dāng)大的缺口。

  雖然就像任一片紅海一樣,但是,還是難以區(qū)分許多擁有表明相似產(chǎn)品的初創(chuàng)公司。在這方面我無疑有著更多的工作,也會(huì)密切留意網(wǎng)絡(luò)安全初創(chuàng)公司方面的加速器 Cyber London。

  有太多應(yīng)用領(lǐng)域了,很難去僅僅關(guān)注一兩個(gè)。

  對(duì)新數(shù)據(jù)集的研發(fā)和應(yīng)用的步伐正使得機(jī)器智能成為一個(gè)如此令人興奮的領(lǐng)域。尤其是,此刻的倫敦蘊(yùn)藏著真正意義上的動(dòng)力,靠近世界級(jí)學(xué)術(shù)機(jī)構(gòu)的東道主(倫敦帝國(guó)學(xué)院,英國(guó)倫敦大學(xué),哈佛和劍橋),擁有一個(gè)已經(jīng)建立起來的創(chuàng)業(yè)生態(tài)系統(tǒng)(例如,Entrepreneur First加速器積極擁抱機(jī)器學(xué)習(xí)型人才),還有成為目標(biāo)客戶中心——金融,法律及政治——的地理位置。

人物訪談