物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

射向人工智能的20顆子彈

作者:Zavain Dar,Lux Capital
來源:創(chuàng)業(yè)邦
日期:2015-07-09 09:55:10
摘要:數(shù)據(jù)科學(xué)和人工智能將如何吞噬世界?

  數(shù)據(jù)科學(xué)和人工智能將如何吞噬世界?

  1、之前二十多年的工作,主要涉及到數(shù)字化大數(shù)據(jù)集,建設(shè)基礎(chǔ)設(shè)施來管理大數(shù)據(jù)集,以及進行大數(shù)據(jù)集計算的范式。這些都是主要的驅(qū)動誘因,也可以解釋說,我們這個時代,首先強調(diào)的其實還是“數(shù)據(jù)科學(xué)”,然后才是“人工智能”。

  2、一旦我們實現(xiàn)數(shù)字化數(shù)據(jù),并獲得可編程的數(shù)據(jù),那么明眼人就能看出,下一步就是利用這些數(shù)據(jù)在未來實現(xiàn)自動化和預(yù)測功能。當(dāng)我們的預(yù)測能力變得越來越好,越來越“智能”,此時所謂的“數(shù)據(jù)科學(xué)”這個詞,才能逐漸的變成現(xiàn)在人們口中的“人工智能”。但事實上,兩者之間并沒有很很明顯的區(qū)別,“唯二的”區(qū)別,可能是在對新穎和難度的感知上有所不同。實際上,所謂新穎和難度,其實都會隨著時間而發(fā)生改變,今天的“人工智能”,就是明天的“數(shù)據(jù)科學(xué)”。

   射向人工智能的20顆子彈

  3、對數(shù)據(jù)進行學(xué)習(xí)的人工智能,被稱之為機器學(xué)習(xí)。傳統(tǒng)的機器學(xué)習(xí)使用的均是原始數(shù)據(jù),然后提取出可以被人識別的語義(也被人認為是功能),接著,機器學(xué)習(xí)會從這些功能中再學(xué)習(xí),繼而得出一個最終的機器學(xué)習(xí)模型。

   射向人工智能的20顆子彈

  4、過去的十年,神經(jīng)網(wǎng)絡(luò)開始復(fù)蘇,它是基于在哺乳類動物的大腦中那些松散的突觸鏈接,形成的一種機器學(xué)習(xí)架構(gòu)。神經(jīng)網(wǎng)絡(luò)提取語義,讓人類進行處理。當(dāng)然啦,在學(xué)習(xí)算法中導(dǎo)入的都是原始數(shù)據(jù),這些數(shù)據(jù)都是沒有經(jīng)過人類編輯的,于是,人們看似很隨意地就把它稱之為“機器學(xué)習(xí)”。

  5、深度學(xué)習(xí)技術(shù)和學(xué)習(xí)模型已經(jīng)存在了數(shù)十年,我們現(xiàn)在看到的,是一波理論創(chuàng)新的大潮,加上現(xiàn)在基礎(chǔ)設(shè)施和數(shù)據(jù)可用性愈發(fā)成熟,深度學(xué)習(xí)在經(jīng)驗上也獲得了突破。2006年,NVIDIA推出了針對GPU的CUDA計算平臺,這是一個真正的分水嶺。

   射向人工智能的20顆子彈

  6、主要是因為人類構(gòu)建的功能具有一定獨立性,深度學(xué)習(xí)是學(xué)習(xí)的自然工具。在數(shù)學(xué)推理上,人類技能的開發(fā)優(yōu)先于人類自身能力,比如有一些我們過去學(xué)到的技能,比如理解負載的數(shù)學(xué)和語義構(gòu)建的能力。有一些人類天生就擁有的技能集合,其實很難以一種高水準功能的形式,來準確地表達出來。

  高緯度數(shù)據(jù)問題,數(shù)據(jù)的維度越高,那么它對人類來說,依靠傳統(tǒng)的機器學(xué)習(xí)技術(shù)來靠直覺感知就會變得更加困難,同時構(gòu)建合適的功能也會變得難度更大。

  7、對于那些在我們有能力構(gòu)建復(fù)雜語義之前,已經(jīng)開發(fā)的技能,我們已經(jīng)在計算機視覺行業(yè)里中看到了令人印象深刻的結(jié)果,自然語言處理,甚至是玩兒視頻游戲。值得注意的是:這里我們所學(xué)習(xí)的所有技能都不需要數(shù)學(xué)推理,因此他們是能滿足獨立意識的高層次語義需要的。

  8、在廣義的高緯度深度學(xué)習(xí)問題上,深度學(xué)習(xí)已經(jīng)展示了突破性的成績,舉例包括基因組學(xué),石油和天然氣,數(shù)字病理學(xué),甚至是公開市場股市。

  9、最近,媒體在大肆宣傳人工智能,因此人工一般只能也引起了人們的關(guān)注,它是一種假想的計算機模擬人類智能代理。

  10、在很大程度上,人工一般智能是由那些基本擬人技能的深度學(xué)習(xí)成果尾風(fēng)所驅(qū)動的,到目前為止,我們似乎還沒有什么有意義的進展,當(dāng)然也沒有什么競爭力可言。從零到一,就像是在計算機視覺和自然語言處理上所作的努力一樣,也更好地說明了這個問題。

  11、在不久的將來,這些努力似乎只能在筒倉(silos)上存在,在一些特殊的領(lǐng)域里,一群人會孤立地進行工作。

  12、我們開發(fā)人工一般智能(AGI)的速度將不會受到任何一個筒倉的約束,但是我們有能力讓這些筒倉相互操作,并且通過合適的輸入和輸出渠道與外部世界聯(lián)系。首個人工一般智能可能不會是一個有人體表現(xiàn)的機器人,而是以一種實時在線的形式出現(xiàn),它可以訪問全世界的知識,并且有能力通過網(wǎng)絡(luò)來進行交流。

  13、人工一般智能將會模擬人類級別的智能,但是不會表現(xiàn)的“像人類”,知道我們了解、學(xué)習(xí)自己內(nèi)部更多的“目標函數(shù)”。目前,計算機正在被訓(xùn)練,它們會有專門的域來指定目標函數(shù),這樣能把錯誤減少到最小。直到我們能夠知道如何將我們自己內(nèi)部的目標函數(shù)校準,實現(xiàn)標準化,人工一般智能才會變得智能,甚至還會顯示出一些意識,但不會變得“像人類一樣”。

  14、2025年以后出生的孩子,他們會覺得軟件能有意識,這種現(xiàn)象可能會忽然出現(xiàn),速度也會比我們想象的要快得多。

  15、人工一般智能對好壞區(qū)分的能力將會受到一定比例的限制,因為只有人類才能控制輸入和輸出渠道。未來,可能會出現(xiàn)很多有趣的爭論,話題就是人工一般智能可能存在的潛在惡意行為。最早出現(xiàn),同時也是一個非常有力的實例就是,我們爭論過自動駕駛汽車。

  16、對于人工智能初創(chuàng)公司來說,我們正處在一個上升的創(chuàng)新周期,同時也能有資金支持。

  17、算法和人工智能學(xué)習(xí)技術(shù)商品化的速度,可能比我們預(yù)想的還要快。如果說這一領(lǐng)域里的初創(chuàng)公司想要獲得成功,那么就必須要不斷的用自己的人工智能模型和用戶、企業(yè)進行交互,然后尋找一些獨一無二的數(shù)據(jù),并且不斷鞏固自己的初期優(yōu)勢。最著名的就要數(shù)谷歌公司了,他們可以獲取點擊流數(shù)據(jù),隨著時間,用戶(特別是企業(yè)用戶)可以利用這個數(shù)據(jù)作為私人數(shù)據(jù)源,也可以進行學(xué)習(xí)交互,來提升自己的排名。

  18、雖然我們身處在人工智能的春天,但仍然是在早春階段。一旦有某個小團隊在人工智能領(lǐng)域里有所建樹,那么大型科技公司便會砸下重金,進行收購和兼并。這些人工智能領(lǐng)域里的新奇成就,如果說允許外部成熟一些,即便存在一定風(fēng)險,對于大型科技公司來說也是可控的,因此我們到目前為止,已經(jīng)看到了在人工智能領(lǐng)域里有較大規(guī)模的收購或兼并交易出現(xiàn)。

  19、人工智能工具公司將會需要構(gòu)建更具粘性的平臺,這樣才能在商品化相關(guān)產(chǎn)品的時候具有競爭力,同時也能讓風(fēng)投看到一些有價值的產(chǎn)出。

  20、最后,在未來五年,硅谷將會出現(xiàn)轉(zhuǎn)型過渡。如果那知名投資人Marc AndreeSSEn當(dāng)初的一句話“軟件正在吞噬世界”來類比形容,那么就是“數(shù)據(jù)科學(xué)和人工智能正在吞噬世界”。