物聯(lián)傳媒 旗下網站
登錄 注冊

數據變現難題,“七宗罪”待解

作者:本站收錄
來源:大數據周刊
日期:2017-07-31 08:56:00
摘要:而今天,幾乎所有行業(yè)的所有公司,都在產生這種極有價值的副產品:數據。我們可以通過數據了解一些截然不同的東西,但遺憾的是,很少有公司能真正利用數據創(chuàng)造價值。難點何在?究其原因,是人們在大數據處理和應用方面,常常會跌入一些錯誤的邏輯中去。

  從商業(yè)世界誕生的那一天起,人們就不斷意識到,運營過程中產生的副產品,往往會有其他人樂意花錢買下它,一個有利可圖的新業(yè)務產生了。

  有數不清這樣的例子:賣豆腐腦的攤主順便售賣豆?jié){;玉米磨坊主長期賣出的“麥片”是給牲畜吃的玉米粉和玉米油后的剩余料;石油公司定期賣出提煉過程的副產品氫氣……正如在“大數據”這個詞出現之前,很多時候,數據的出現只是伴隨科技進步而產生的免費副產品。就像醫(yī)院為了病人就診的便利,建設了掛號系統(tǒng),從而得到了海量的醫(yī)療信息,這就是技術進步所帶來的副產品——數據增量。

  而今天,幾乎所有行業(yè)的所有公司,都在產生這種極有價值的副產品:數據。我們可以通過數據了解一些截然不同的東西,但遺憾的是,很少有公司能真正利用數據創(chuàng)造價值。

  難點何在?究其原因,是人們在大數據處理和應用方面,常常會跌入一些錯誤的邏輯中去。

  貪婪:對數據無止境的收集

  大數據產業(yè)剛剛經歷了爆發(fā)的初期,很多公司將他們的數據當作傳世皇冠一樣捍衛(wèi),紛紛“跑馬圈地”,或憑借傳統(tǒng)優(yōu)勢搶占某一應用領域的“山頭”,或積極布局試圖壟斷某些數據資源的入口,產業(yè)秩序尚未建立完全。

  大數據產業(yè)可以說是一種“資源型產業(yè)”。據統(tǒng)計,2016年1月至2016年10月底,中國大數據行業(yè)有184家企業(yè)獲得投融資,占有的數據資源量是資本對大數據公司估值的最重要依據之一。行業(yè)內的大數據公司,紛紛將目光集中在了如何獲取數據資源方面。

  顯然,對數據源的重視,在前期數據池的擴充方面具有正面效應,但是,因此大量誕生的依托數據資源優(yōu)勢的企業(yè),也為大數據產業(yè)帶來了低附加值的壟斷經濟模式,使得更多依靠技術壁壘打江山的企業(yè)不得不面對缺少“原材料”失敗的可能。

  而對于那些主營業(yè)務并非數據源的公司來說,即使那些看起來可能對你的業(yè)務毫無關聯(lián)、沒有產出的數據,也很少有公司去考慮“賣掉”它,寧可閑置不用也不去售賣,從而轉換為有利可圖的新服務項目。

  售賣的關鍵在于識別那些不是競爭者的公司——在相關領域運營,但并不是正面競爭的邊際業(yè)務。如豐田就開創(chuàng)了一項新業(yè)務,就是利用它在日本賣出的車里安裝的GPS定位設備,捕捉車的速度和位置,再將其以每月2000美金的價格交通數據賣給市政規(guī)劃部門,幫助改善交通問題,并通過數據結果,整合自己公司的發(fā)貨渠道。

  歸根結底,數據資源打通難是因為行業(yè)缺乏國家層面的統(tǒng)籌規(guī)劃,缺乏在生產環(huán)節(jié)解決數據權屬等核心問題的規(guī)則和制度。如何才能以開放的視野打破數據孤島,實現數據變現?仍需要在數據資源層面形成統(tǒng)一的行業(yè)共識和行為規(guī)范,引導產業(yè)走向以資源、技術、應用綜合發(fā)展為導向的良性發(fā)展模式。

  麻木:非法數據交易猖獗

  以國有數據資源和公共數據資源為主、看得見的數據,像冰塊一樣凝結不動,而地下數據交易黑市規(guī)模坐大,針對用戶信息的非法收集、竊取、販賣和利用行為猖獗,甚至形成一條龍式的產業(yè)鏈形態(tài)。

  在國內,數據交易流通產業(yè)規(guī)模逼近百億產值。百度、騰訊、阿里、京東等互聯(lián)網巨頭紛紛切入數據交易和數據服務市場,啟動了百度API、騰訊云、阿里云、京東萬象等大型數據交易和數據服務平臺,已經匯集的數據供應商超過500 余家,數據交易流通超過每天百億次。北京、貴州、河北、上海、武漢等地方政府,建立了政府數據開放、數據資產管理、本地數據流通為目標的區(qū)域數據交易市場,而未納入公開市場的數據流通,更是體量巨大,整個數據流通產業(yè)如火如荼。

  隨著數據交易平臺的大量涌現和數據流通交易產業(yè)的變現模式為全社會所認知,在利益誘導和監(jiān)管缺失的情況下,大數據的流通交易面臨的問題也愈發(fā)凸顯:數據侵權、數據竊取、非法數據使用、非法數據買賣已成為行業(yè)亂象,并呈現失控態(tài)勢。大數據的流通交易中的這些問題不僅僅嚴重損害了國家安全、企業(yè)合法利益、個人隱私、數據價值挖掘等方面,更在實質上阻礙了大數據產業(yè)的整體發(fā)展。2015 年以來,電信詐騙、數據泄漏、非法倒賣案件頻發(fā),個人身份信息等用戶數據的泄露,使得違法人員能夠使用大數據實現精準詐騙;微博數據、各類論壇數據等被非法獲取導致用戶社交關系泄露;企業(yè)積累數據被二次倒賣致使經濟利益受損。

  2016年8月,山東考生徐玉玉因為隱私泄露導致被詐騙后身亡;同年12月,“京東用戶數據泄漏”事件,包括用戶名、密碼、郵箱、QQ號、電話號碼、身份證等多個維度、數千萬條數據被倒賣,引發(fā)社會對信息安全的緊張情緒劇增。

  如何對流通的數據構建監(jiān)管、追溯、標識體系,建立行業(yè)秩序和標準化行為模式,打擊非法數據流通,保護企業(yè)、個人利益,維護行業(yè)健康發(fā)展,已經迫在眉睫。

  盲從:用“巨量”掩蓋個性化

  在大數據時代,個人的信息更多的是以數據為載體來進行互動的。海量的數據在為研究和分析社會現象帶來便利的同時,實際上也掩蓋了許多具有個性特征的數據的意義,許多本身具有個性特征的數據已經變得無足輕重了。

  大數據簡化了人們對數據差異性的認知。大數據的復雜性不僅在于其數據樣本巨量,更在于其多源異構、多實體和多空間之間的交互動態(tài)性。當前,只有少數人掌握處理這種復雜的巨量化大數據的技術,這很容易導致“數據暴力”。

  所有數據說到底,都是關于個體的呈現。因此,其中所蘊含著各異的社會文化價值,是更加需要我們了解和掌握的內容。數據來源于社會又作用于社會。無論是可以數字化的數據還是不可數字化的數據,其比較、分析和歸納,其實反映的都是人在符號層面上的一種互動。

  如果脫離了人及其所在社會的價值本性,無限放大巨量大數據的效應及其影響力,而忽視人性的本質,就可能本末倒置,最終產生許多難以預期的后果。

  分歧:在“因果性”和“相關性”中走極端

  數據的本質,是快速讓大家知道發(fā)生了什么事,只有降低成本,把簡單數據簡單化或者復雜化分析,快速變成結果去變現,大數據公司才能活下去。

  在一場變革或者技術的初期,需要找到最簡單、甚至看起來很粗糙的方式發(fā)揮出它的效能。當然,這也還跟現在數據量、數據化和數據保存以及剖析工具等錯綜復雜的因素有關,利用這樣的相關性關系研究,把數據里面的金子挖出來,或者利用相關性,預防或促成某些結果的發(fā)生。我們需要一定的速度,應對信息社會“數據爆炸”和諸多涌現出來的“復雜性”很高的問題,然后才是對其過程和背后原由的探詢。

  對因果性的執(zhí)著,強調更多是個體甚至人類整體的記憶,或者經驗、規(guī)律性等條件,必須從“人”的態(tài)度才能理解的,因果是“自然的人化”。而做大數據的,最怕聽到去解釋“為什么”,因為大數據能做到最真實情況的還原,就已經很難了,數據噪音太大,現實市場狀況往往是混亂的,嘗試去找出項目成敗的因果關系,實際上是沒有必要的。大數據的作用是趨勢判斷,而不是找出因果。

  草率:數據共享陷阱難以跨越

  當前,國內大數據行業(yè)的應用市場呈現政府牽頭的明顯趨勢,各級政府部門、公安、交通、鐵路、金融等各行業(yè)龍頭機構對數據開放、共享、應用的日益重視,逐漸形成了中國特色的大數據應用市場。

  眾所周知,由于政府各部門各自主導的信息系統(tǒng)設計上,先天開放共享的條件就不足,加上部門管理體制原因,信息孤島、數據壁壘現象普遍。然而,大數據、信息化項目普遍存在涉及部門多、推進難度大、“一把手工程”現象,同時項目周期長、投資規(guī)模大、直接經濟效益不顯著,使得政府部門更傾向于追求短期效果而非長期利益,使得大數據項目建設如火如荼,核心政府數據資源的匯聚卻沒有真正實現。

  此外,在有些政府企業(yè)PPP(Public-Private Partnership)合作模式中,由于沒有約定合理的數據資產歸屬權和政府資本退出機制,導致政府重要數據資源過早變現或廉價變現,國有資產流失到社會,公共數據資源沒有經過高技術、高附加值的處理而野蠻開放。

  政府及行業(yè)客戶對大數據需求不斷增長,但數據資源的封閉與過度開發(fā)現象并存,一方面使得部分機構陷入大數據項目沒有真正有效利用數據的“數據共享陷阱”;另一方面,為了籌措項目資金,政府高融資、高負債、高擔?,F象嚴重,一旦項目實際應用效果不佳,容易誘發(fā)政府債務危機等問題。

  主觀:數據人才缺失嚴重

  國家十三五規(guī)劃綱要中明確提出:“實施國家大數據戰(zhàn)略,推進數據資源開放共享”,在這樣的契機下,大數據領域必將迎來建設高峰和投資良機。而推動大數據發(fā)展不僅依靠國家戰(zhàn)略與相關政策的支持,更需要大數據相關人才的支撐。而當前制約大數據發(fā)展的瓶頸之一,也在于大數據人才的極度緊缺。

  教育部分別于2016年2月和9月公布新增大數據本科和??茖I(yè),國內高校紛紛成立大數據研究機構或大數據學院。然而,僅僅依靠體制內是遠遠難以滿足我國大數據產業(yè)對人才需求的。首先,體制內培養(yǎng)人才尚屬起步和探索階段,人才培養(yǎng)需要3-4年的周期,體制內向產業(yè)界規(guī)模性輸送大數據人才大約在2019年到2020年;其次,體制內的招生受到名額限制,現有體制下的招生名額遠遠低于市場需求;最后,正如北京大數據研究院院長鄂維南院士所提到的,國內大數據學科的發(fā)展依然比較落后。“這種落后是多方面的,不僅是觀念上的落后,還包括培養(yǎng)體系上的落后。舉個例子,大數據分析涉及到的最重要的兩塊是統(tǒng)計和算法。而要讓做統(tǒng)計的老師重視算法,讓做算法的老師關注數據,這需要時間和努力。”

  可以說,大數據的人才培養(yǎng)是全程實踐性的,需要以數據為核心、以問題為導向開始實踐性教學,這也意味著必須在大數據人才培養(yǎng)上進行創(chuàng)新和改革,加強體制外大數據人才的培養(yǎng),把人才教育、科研創(chuàng)新和市場化、產業(yè)化結合在一起,否則培養(yǎng)的人才可能會和市場需求脫節(jié)。

  客觀:數據價值不易標準化

  2015到2016年,不少地方政府主導成立了數據交易所,一些商業(yè)化的數據交易平臺也上線運營,但目前基于數據的全新商業(yè)模式依然還處在探索的初級階段,數據的商業(yè)化仍面臨諸多挑戰(zhàn),如應用場景和價值不易標準化,從而引發(fā)數據定價及資產評估難的問題。

  數據與工業(yè)時代的商品有截然不同的屬性,工業(yè)時代的商品是實體物品為主,基于一定成本的原料生產后,基于工廠相對標準化的大規(guī)模生產模式生產出來,其商品經歷了上百年的發(fā)展之后,已經形成了大家都認同的標準化定價模式,比如基于物權的定價模式,是由成本加上品牌定價決定。

  而目前的數據應用水平和程度有限,數據標準化程度很低,無法按照傳統(tǒng)的商品銷售模式進行銷售。數據的權屬問題還是個大難題,傳統(tǒng)物權、知識產權等都存在不適用的部分,同時數據產生的邊界成本基本為零,因此,目前從數據加工的成本和基于數據加工衍生出的服務出發(fā),總體規(guī)模和盈利模式都遠不成熟。

人物訪談