物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

狂熱背后,你需要知道AI技術(shù)是如何發(fā)展起來的

作者:本站收錄
來源:公眾號/smartman163
日期:2017-12-12 15:58:13
摘要:上世紀40年代,人工智能的基本框架就已經(jīng)存在,自那以后,各種組織就一直在人工智能的發(fā)展上進行創(chuàng)新。近年來,大數(shù)據(jù)和先進的深度學(xué)習(xí)模型將人工智能的發(fā)展推向了前所未有的高度。這些新的技術(shù)成分最終會產(chǎn)生科幻小說中所設(shè)想的智能機器,還是維持目前的人工智能趨勢,只是“把相同的酒裝在了更高檔的瓶子里”?

  上世紀40年代,人工智能的基本框架就已經(jīng)存在,自那以后,各種組織就一直在人工智能的發(fā)展上進行創(chuàng)新。近年來,大數(shù)據(jù)和先進的深度學(xué)習(xí)模型將人工智能的發(fā)展推向了前所未有的高度。這些新的技術(shù)成分最終會產(chǎn)生科幻小說中所設(shè)想的智能機器,還是維持目前的人工智能趨勢,只是“把相同的酒裝在了更高檔的瓶子里”?

  “這實際上是新酒,但有各種各樣的瓶子,而且有不同的年份,”James Kobielus說,他是Wikibon的數(shù)據(jù)科學(xué)、深度學(xué)習(xí)和應(yīng)用開發(fā)的首席分析師。

  Kobielus補充說,實際上,大部分的舊酒仍然相當可口;新一代的人工智能的使用了以前的方法并建立在這些方法之上。例如,Apache的大數(shù)據(jù)框架Hadoop所運用的技術(shù)。

  然而,如今關(guān)于人工智能的狂熱,是由于一些前人工智能候選者缺乏特定的發(fā)展。根據(jù)Kobielus的說法,現(xiàn)有的技術(shù)使我們更接近那些看起來像人類一樣“思考”的機器。“其中最重要的是大數(shù)據(jù),”他在位于馬薩諸塞州馬爾伯勒的CUBE公司的工作室里說。為什么大數(shù)據(jù)激發(fā)了人們對人工智能的興趣?因為這對于訓(xùn)練深度學(xué)習(xí)模型來說是一個巨大的幫助,使其能夠做出更像人類的推斷。Kobielus和Dave Vellante一起在人工智能和機器智能領(lǐng)域有了技術(shù)突破。Dave Vellante是Wikibon的首席分析師,他還是SiliconANGLE的直播工作室的聯(lián)合主持人。

  人工智能革命將會被算法化

  人工智能在智能對話方面的長足進步,也反映了其飛速的營收增長。研究機構(gòu)Tractica LLC的調(diào)查顯示,2016年,人工智能軟件市場規(guī)模為14億美元,到2025年將增至598億美元。“人工智能在幾乎所有行業(yè)的垂直領(lǐng)域都有應(yīng)用和用例,被認為是下一個重大的技術(shù)轉(zhuǎn)變,類似于工業(yè)革命、計算機時代和智能手機革命等過去曾經(jīng)發(fā)生的轉(zhuǎn)變,”Tractica LCC的研究主管Aditya Kaul說。其中一些垂直領(lǐng)域包括金融、廣告、醫(yī)療、航天和消費領(lǐng)域。

狂熱背后,你需要知道AI技術(shù)是如何發(fā)展起來的

  下一場工業(yè)革命將圍繞人工智能軟件展開,這聽起來可能像一個想象力豐富的書呆子的幻想。但即使在硅谷之外,這種情緒也在蔓延?!稌r代》周刊最近專門刊登了一篇題為《人工智能:人類未來》的特稿。但是,這種人工智能的設(shè)想在科幻小說和科技圈的狂熱沼澤中已經(jīng)存在了幾十年。在過去的幾年里,這項技術(shù)發(fā)展得如此之快嗎?從今天的人工智能和可預(yù)見的未來,我們能從現(xiàn)實中得到什么?

  首先,人工智能是一個寬泛的標簽——實際上更多的是一個熱門短語,而不是一個精確的技術(shù)術(shù)語。Kobielus說,人工智能指的是“任何幫助機器像人類一樣思考的方法”。但是,從最嚴格的意義上來說,機器“思考”難道不是與人類大腦截然不同的思維嗎?機器不會真的思考,不是嗎?這要看情況。如果說“思考”的同義詞是“推斷”的話,那么機器可能被認為與大腦是對等的。

  當人們討論人工智能的時候,他們通常會談?wù)撊斯ぶ悄茏钍軞g迎的方式——機器學(xué)習(xí)。這是一種數(shù)學(xué)應(yīng)用,原理是從數(shù)據(jù)集中推斷出某種模式。Kobielus說:“很長時間以來,人們利用軟件從數(shù)據(jù)中推斷出模式。”一些已有的推理方法包括支持向量機、貝葉斯邏輯和決策樹。這些技術(shù)并沒有消失,并在日益增長的人工智能技術(shù)領(lǐng)域被繼續(xù)使用著。機器學(xué)習(xí)模型或在數(shù)據(jù)上訓(xùn)練的算法能夠做出自己的推斷,這通常被稱為人工智能的輸出或見解。這種推斷不需要預(yù)先編程到一個機器上,需要編程的只有模型本身。

  機器學(xué)習(xí)模型的推斷基于統(tǒng)計學(xué)的可能性,這在某種程度上類似于人類理解的過程。來自數(shù)據(jù)的推論可以以預(yù)測、相關(guān)性、分類、分類、識別異?;蜈厔莸刃问匠霈F(xiàn)。對于機器來說,學(xué)習(xí)模式是分層的。數(shù)據(jù)分類器名為“感知器”,通過對感知器進行分層,便形成了一個人工神經(jīng)網(wǎng)絡(luò)。感知器之間的這種神經(jīng)網(wǎng)絡(luò)關(guān)系激活了它們的功能,包括非線性的感知器,比如tangents。通過這個神經(jīng)過程,一個層的答案或輸出就成為了下一層的輸入。最后一層輸出的便是最終結(jié)果。

  神經(jīng)元的深層學(xué)習(xí)層

  深度學(xué)習(xí)網(wǎng)絡(luò)是有著大量的感知器層的人工神經(jīng)網(wǎng)絡(luò)。網(wǎng)絡(luò)的層次越多,它的深度就越大。這些額外的層會提出更多的問題,處理更多的輸入,并產(chǎn)生更多的輸出,從而抽象出更高層次的數(shù)據(jù)。

狂熱背后,你需要知道AI技術(shù)是如何發(fā)展起來的

  Facebook的自動人臉識別技術(shù)是由深度學(xué)習(xí)網(wǎng)絡(luò)驅(qū)動的。通過將更多圖層組合在一起,可以更豐富地描述圖像。“你可能會問,這不就是一張臉嗎?但是,如果它是一個場景識別深度學(xué)習(xí)網(wǎng)絡(luò),它可能會識別出這是一個與一個名叫戴夫的人對應(yīng)的臉,他碰巧也是這個家庭場景中的父親。”Kobielus說。

  現(xiàn)在已經(jīng)有了具備1,000個感知器層的神經(jīng)網(wǎng)絡(luò),軟件開發(fā)人員仍在探索更深層次的神經(jīng)網(wǎng)絡(luò)可以實現(xiàn)的功能。最新款蘋果iPhone的人臉檢測軟件依賴于一個20層的卷積神經(jīng)網(wǎng)絡(luò)。2015年,微軟公司的研究人員通過一個152層的深度殘差網(wǎng)絡(luò)贏得了ImageNet計算機視覺大賽。微軟研究主管彼得·李表示,得益于一種防止數(shù)據(jù)稀釋的設(shè)計,該網(wǎng)絡(luò)能夠從圖片中收集到的信息,超過了典型的20層或30層的深度殘差網(wǎng)絡(luò)。他說:“我們可以從中學(xué)到很多微妙的東西。”

  除了圖像處理之外,新的人工智能和深度學(xué)習(xí)用例也層出不窮,從執(zhí)法部門到基因組學(xué)都能找到相關(guān)應(yīng)用。在去年的一項研究中,研究人員利用人工智能預(yù)測了歐洲人權(quán)法院數(shù)百起案件的判決結(jié)果。他們預(yù)測人類法官最終決定的準確率達到了79%。

  具備了“思考”的能力,并且擁有豐富的資源,甚至還有機器比人更準確地得出結(jié)論。最近,斯坦福大學(xué)研究人員的深度學(xué)習(xí)算法比人類放射科醫(yī)生更擅長診斷肺炎。這種名為“CheXNet”的算法使用了一種121層的卷積神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)被訓(xùn)練在一組超過10萬張胸部X光圖像上。

  人工智能模型在學(xué)習(xí)中不斷進步

狂熱背后,你需要知道AI技術(shù)是如何發(fā)展起來的

  這突顯出深度學(xué)習(xí)的一個關(guān)鍵問題:算法本身和訓(xùn)練它們的數(shù)據(jù)一樣好。它們作出的預(yù)測的準確率基本上與訓(xùn)練它們的數(shù)據(jù)集的大小成正比。并且這個培訓(xùn)過程需要專家的監(jiān)督。Kobielus說:“你需要一個由數(shù)據(jù)科學(xué)家和其他擅長統(tǒng)計建模的開發(fā)人員組成的團隊,他們擅長獲取培訓(xùn)數(shù)據(jù),并對其進行標記(標簽在那里起著非常重要的作用),而且他們擅長于通過開發(fā)者操作以迭代的方式開發(fā)和部署某一種模型。”

  機器學(xué)習(xí)模型的標簽數(shù)據(jù)確實至關(guān)重要,但人類的眼睛仍然是工作的最佳工具。IBM公司去年表示,他們已經(jīng)在招聘很多人,只是為了給人工智能標記數(shù)據(jù)。多倫多大學(xué)的研究人員Parham Aarabi和Wenzhi Guo探索出了人類的大腦和神經(jīng)網(wǎng)絡(luò)結(jié)合在一起的方式。他們開發(fā)了一種算法,從明確的人類指令中進行學(xué)習(xí),而不是通過一系列的例子。在圖像識別中,訓(xùn)練師可能會告訴算法,天空通常是藍色的,并且位于圖片的頂部。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練相比,他們的方法效果更好。Kobielus說:“如果不訓(xùn)練算法,你就不知道算法是否有效。”他還總結(jié)道,大量的訓(xùn)練都會在云或其他集中的環(huán)境中進行,而分散的“物聯(lián)網(wǎng)”設(shè)備(比如自動駕駛汽車)將會在現(xiàn)場做出決定。

人物訪談