RFID世界網 > 新聞中心 > 物聯(lián)網新聞 > 正文

數據變現難題，“七宗罪”待解

作者：本站收錄

來源：大數據周刊

日期：2017-07-31 08:56:00

摘要：而今天，幾乎所有行業(yè)的所有公司，都在產生這種極有價值的副產品：數據。我們可以通過數據了解一些截然不同的東西，但遺憾的是，很少有公司能真正利用數據創(chuàng)造價值。難點何在?究其原因，是人們在大數據處理和應用方面，常常會跌入一些錯誤的邏輯中去。

關鍵詞：大數據數據處理與分析物聯(lián)網

　　從商業(yè)世界誕生的那一天起，人們就不斷意識到，運營過程中產生的副產品，往往會有其他人樂意花錢買下它，一個有利可圖的新業(yè)務產生了。

　　有數不清這樣的例子：賣豆腐腦的攤主順便售賣豆?jié){;玉米磨坊主長期賣出的“麥片”是給牲畜吃的玉米粉和玉米油后的剩余料;石油公司定期賣出提煉過程的副產品氫氣……正如在“大數據”這個詞出現之前，很多時候，數據的出現只是伴隨科技進步而產生的免費副產品。就像醫(yī)院為了病人就診的便利，建設了掛號系統(tǒng)，從而得到了海量的醫(yī)療信息，這就是技術進步所帶來的副產品——數據增量。

　　而今天，幾乎所有行業(yè)的所有公司，都在產生這種極有價值的副產品：數據。我們可以通過數據了解一些截然不同的東西，但遺憾的是，很少有公司能真正利用數據創(chuàng)造價值。

　　難點何在?究其原因，是人們在大數據處理和應用方面，常常會跌入一些錯誤的邏輯中去。

　　貪婪：對數據無止境的收集

　　大數據產業(yè)剛剛經歷了爆發(fā)的初期，很多公司將他們的數據當作傳世皇冠一樣捍衛(wèi)，紛紛“跑馬圈地”，或憑借傳統(tǒng)優(yōu)勢搶占某一應用領域的“山頭”，或積極布局試圖壟斷某些數據資源的入口，產業(yè)秩序尚未建立完全。

　　大數據產業(yè)可以說是一種“資源型產業(yè)”。據統(tǒng)計，2016年1月至2016年10月底，中國大數據行業(yè)有184家企業(yè)獲得投融資，占有的數據資源量是資本對大數據公司估值的最重要依據之一。行業(yè)內的大數據公司，紛紛將目光集中在了如何獲取數據資源方面。

　　顯然，對數據源的重視，在前期數據池的擴充方面具有正面效應，但是，因此大量誕生的依托數據資源優(yōu)勢的企業(yè)，也為大數據產業(yè)帶來了低附加值的壟斷經濟模式，使得更多依靠技術壁壘打江山的企業(yè)不得不面對缺少“原材料”失敗的可能。

　　而對于那些主營業(yè)務并非數據源的公司來說，即使那些看起來可能對你的業(yè)務毫無關聯(lián)、沒有產出的數據，也很少有公司去考慮“賣掉”它，寧可閑置不用也不去售賣，從而轉換為有利可圖的新服務項目。

　　售賣的關鍵在于識別那些不是競爭者的公司——在相關領域運營，但并不是正面競爭的邊際業(yè)務。如豐田就開創(chuàng)了一項新業(yè)務，就是利用它在日本賣出的車里安裝的GPS定位設備，捕捉車的速度和位置，再將其以每月2000美金的價格交通數據賣給市政規(guī)劃部門，幫助改善交通問題，并通過數據結果，整合自己公司的發(fā)貨渠道。

　　歸根結底，數據資源打通難是因為行業(yè)缺乏國家層面的統(tǒng)籌規(guī)劃，缺乏在生產環(huán)節(jié)解決數據權屬等核心問題的規(guī)則和制度。如何才能以開放的視野打破數據孤島，實現數據變現?仍需要在數據資源層面形成統(tǒng)一的行業(yè)共識和行為規(guī)范，引導產業(yè)走向以資源、技術、應用綜合發(fā)展為導向的良性發(fā)展模式。

　　麻木：非法數據交易猖獗

　　以國有數據資源和公共數據資源為主、看得見的數據，像冰塊一樣凝結不動，而地下數據交易黑市規(guī)模坐大，針對用戶信息的非法收集、竊取、販賣和利用行為猖獗，甚至形成一條龍式的產業(yè)鏈形態(tài)。

　　在國內，數據交易流通產業(yè)規(guī)模逼近百億產值。百度、騰訊、阿里、京東等互聯(lián)網巨頭紛紛切入數據交易和數據服務市場，啟動了百度API、騰訊云、阿里云、京東萬象等大型數據交易和數據服務平臺，已經匯集的數據供應商超過500 余家，數據交易流通超過每天百億次。北京、貴州、河北、上海、武漢等地方政府，建立了政府數據開放、數據資產管理、本地數據流通為目標的區(qū)域數據交易市場，而未納入公開市場的數據流通，更是體量巨大，整個數據流通產業(yè)如火如荼。

　　隨著數據交易平臺的大量涌現和數據流通交易產業(yè)的變現模式為全社會所認知，在利益誘導和監(jiān)管缺失的情況下，大數據的流通交易面臨的問題也愈發(fā)凸顯：數據侵權、數據竊取、非法數據使用、非法數據買賣已成為行業(yè)亂象，并呈現失控態(tài)勢。大數據的流通交易中的這些問題不僅僅嚴重損害了國家安全、企業(yè)合法利益、個人隱私、數據價值挖掘等方面，更在實質上阻礙了大數據產業(yè)的整體發(fā)展。2015 年以來，電信詐騙、數據泄漏、非法倒賣案件頻發(fā)，個人身份信息等用戶數據的泄露，使得違法人員能夠使用大數據實現精準詐騙;微博數據、各類論壇數據等被非法獲取導致用戶社交關系泄露;企業(yè)積累數據被二次倒賣致使經濟利益受損。

　　2016年8月，山東考生徐玉玉因為隱私泄露導致被詐騙后身亡;同年12月，“京東用戶數據泄漏”事件，包括用戶名、密碼、郵箱、QQ號、電話號碼、身份證等多個維度、數千萬條數據被倒賣，引發(fā)社會對信息安全的緊張情緒劇增。

　　如何對流通的數據構建監(jiān)管、追溯、標識體系，建立行業(yè)秩序和標準化行為模式，打擊非法數據流通，保護企業(yè)、個人利益，維護行業(yè)健康發(fā)展，已經迫在眉睫。

　　盲從：用“巨量”掩蓋個性化

　　在大數據時代，個人的信息更多的是以數據為載體來進行互動的。海量的數據在為研究和分析社會現象帶來便利的同時，實際上也掩蓋了許多具有個性特征的數據的意義，許多本身具有個性特征的數據已經變得無足輕重了。

　　大數據簡化了人們對數據差異性的認知。大數據的復雜性不僅在于其數據樣本巨量，更在于其多源異構、多實體和多空間之間的交互動態(tài)性。當前，只有少數人掌握處理這種復雜的巨量化大數據的技術，這很容易導致“數據暴力”。

　　所有數據說到底，都是關于個體的呈現。因此，其中所蘊含著各異的社會文化價值，是更加需要我們了解和掌握的內容。數據來源于社會又作用于社會。無論是可以數字化的數據還是不可數字化的數據，其比較、分析和歸納，其實反映的都是人在符號層面上的一種互動。

　　如果脫離了人及其所在社會的價值本性，無限放大巨量大數據的效應及其影響力，而忽視人性的本質，就可能本末倒置，最終產生許多難以預期的后果。

　　分歧：在“因果性”和“相關性”中走極端

　　數據的本質，是快速讓大家知道發(fā)生了什么事，只有降低成本，把簡單數據簡單化或者復雜化分析，快速變成結果去變現，大數據公司才能活下去。

　　在一場變革或者技術的初期，需要找到最簡單、甚至看起來很粗糙的方式發(fā)揮出它的效能。當然，這也還跟現在數據量、數據化和數據保存以及剖析工具等錯綜復雜的因素有關，利用這樣的相關性關系研究，把數據里面的金子挖出來，或者利用相關性，預防或促成某些結果的發(fā)生。我們需要一定的速度，應對信息社會“數據爆炸”和諸多涌現出來的“復雜性”很高的問題，然后才是對其過程和背后原由的探詢。

　　對因果性的執(zhí)著，強調更多是個體甚至人類整體的記憶，或者經驗、規(guī)律性等條件，必須從“人”的態(tài)度才能理解的，因果是“自然的人化”。而做大數據的，最怕聽到去解釋“為什么”，因為大數據能做到最真實情況的還原，就已經很難了，數據噪音太大，現實市場狀況往往是混亂的，嘗試去找出項目成敗的因果關系，實際上是沒有必要的。大數據的作用是趨勢判斷，而不是找出因果。

　　草率：數據共享陷阱難以跨越

　　當前，國內大數據行業(yè)的應用市場呈現政府牽頭的明顯趨勢，各級政府部門、公安、交通、鐵路、金融等各行業(yè)龍頭機構對數據開放、共享、應用的日益重視，逐漸形成了中國特色的大數據應用市場。

　　眾所周知，由于政府各部門各自主導的信息系統(tǒng)設計上，先天開放共享的條件就不足，加上部門管理體制原因，信息孤島、數據壁壘現象普遍。然而，大數據、信息化項目普遍存在涉及部門多、推進難度大、“一把手工程”現象，同時項目周期長、投資規(guī)模大、直接經濟效益不顯著，使得政府部門更傾向于追求短期效果而非長期利益，使得大數據項目建設如火如荼，核心政府數據資源的匯聚卻沒有真正實現。

　　此外，在有些政府企業(yè)PPP(Public-Private Partnership)合作模式中，由于沒有約定合理的數據資產歸屬權和政府資本退出機制，導致政府重要數據資源過早變現或廉價變現，國有資產流失到社會，公共數據資源沒有經過高技術、高附加值的處理而野蠻開放。

　　政府及行業(yè)客戶對大數據需求不斷增長，但數據資源的封閉與過度開發(fā)現象并存，一方面使得部分機構陷入大數據項目沒有真正有效利用數據的“數據共享陷阱”;另一方面，為了籌措項目資金，政府高融資、高負債、高擔?，F象嚴重，一旦項目實際應用效果不佳，容易誘發(fā)政府債務危機等問題。

　　主觀：數據人才缺失嚴重

　　國家十三五規(guī)劃綱要中明確提出：“實施國家大數據戰(zhàn)略，推進數據資源開放共享”，在這樣的契機下，大數據領域必將迎來建設高峰和投資良機。而推動大數據發(fā)展不僅依靠國家戰(zhàn)略與相關政策的支持，更需要大數據相關人才的支撐。而當前制約大數據發(fā)展的瓶頸之一，也在于大數據人才的極度緊缺。

　　教育部分別于2016年2月和9月公布新增大數據本科和?？茖I(yè)，國內高校紛紛成立大數據研究機構或大數據學院。然而，僅僅依靠體制內是遠遠難以滿足我國大數據產業(yè)對人才需求的。首先，體制內培養(yǎng)人才尚屬起步和探索階段，人才培養(yǎng)需要3-4年的周期，體制內向產業(yè)界規(guī)模性輸送大數據人才大約在2019年到2020年;其次，體制內的招生受到名額限制，現有體制下的招生名額遠遠低于市場需求;最后，正如北京大數據研究院院長鄂維南院士所提到的，國內大數據學科的發(fā)展依然比較落后。“這種落后是多方面的，不僅是觀念上的落后，還包括培養(yǎng)體系上的落后。舉個例子，大數據分析涉及到的最重要的兩塊是統(tǒng)計和算法。而要讓做統(tǒng)計的老師重視算法，讓做算法的老師關注數據，這需要時間和努力。”

　　可以說，大數據的人才培養(yǎng)是全程實踐性的，需要以數據為核心、以問題為導向開始實踐性教學，這也意味著必須在大數據人才培養(yǎng)上進行創(chuàng)新和改革，加強體制外大數據人才的培養(yǎng)，把人才教育、科研創(chuàng)新和市場化、產業(yè)化結合在一起，否則培養(yǎng)的人才可能會和市場需求脫節(jié)。

　　客觀：數據價值不易標準化

　　2015到2016年，不少地方政府主導成立了數據交易所，一些商業(yè)化的數據交易平臺也上線運營，但目前基于數據的全新商業(yè)模式依然還處在探索的初級階段，數據的商業(yè)化仍面臨諸多挑戰(zhàn)，如應用場景和價值不易標準化，從而引發(fā)數據定價及資產評估難的問題。

　　數據與工業(yè)時代的商品有截然不同的屬性，工業(yè)時代的商品是實體物品為主，基于一定成本的原料生產后，基于工廠相對標準化的大規(guī)模生產模式生產出來，其商品經歷了上百年的發(fā)展之后，已經形成了大家都認同的標準化定價模式，比如基于物權的定價模式，是由成本加上品牌定價決定。

　　而目前的數據應用水平和程度有限，數據標準化程度很低，無法按照傳統(tǒng)的商品銷售模式進行銷售。數據的權屬問題還是個大難題，傳統(tǒng)物權、知識產權等都存在不適用的部分，同時數據產生的邊界成本基本為零，因此，目前從數據加工的成本和基于數據加工衍生出的服務出發(fā)，總體規(guī)模和盈利模式都遠不成熟。

數據變現難題，“七宗罪”待解

數據變現難題，“七宗罪”待解