發布時間:2019-9-22 分類: 電商動態
要查看大數據,最好查看大數據背后的技術,業務和社交方面。從發展成熟的角度來看,技術維度走得最遠,業務維度發展但不全面和成熟,社會維度發展最差。因此,盡管我已經討論了大數據很長一段時間,但除了產生大數據本身的領域(如搜索)之外,其他領域還沒有從大數據中獲得明顯的好處。大多數時候人們仍然認為這里必須有金子,但他們需要更多的耐心。本文試圖挖掘大數據本身的特征,并對未來趨勢做出一些預測。
大數據上的深度和廣度
如果大數據與海量數據相匹配,那么這是一個非常模糊的概念,相當于成為信息的同義詞。顯然,很難回答什么信息可以做的問題。
此時,為了提前思考,通常需要先進行分類。如果時間空間是最基本的視角,首先要區分的是大數據的深度和廣度。從時間的角度來看,大數據是一個完整的歷史。從空間角度來看,大數據是全球活動的痕跡。前者可以看作是一種深度,后者可以看作是一種廣度,不同的場景對深度和廣度有不同的側重。
對于一些垂直行業,如醫療保健,大數據的深度更為重要。畢竟可以在數據上找到歷史記錄,人們可以更好地了解和優化相應的行業。
對于社會而言,在許多情況下,廣度更為重要。在某個場景中我們只有一個刻度和半爪,但是當這個信息足夠且范圍足夠寬時,可以描述相對及時和完整的圖像。經常被引用的谷歌預測傳染病的例子依賴于這種廣度。
這決定了大數據的應用趨勢。在深度重要的地方,公司等組織需要成為主體。困難在于如何跨越數據所有權的界限。對于醫院而言,將所有治療病例數字化和共享是有益的,但如果只有一家醫院這樣做,則可能對醫院的隱私更不利。
在廣度很重要的領域,盡管公司可以從搜索這些領域中受益,但真正受益于大數據的機構實際上是政府。數據越廣泛,它描述的身體就越大,如果它是整個社會,它顯然應該是社會的主要負責人。這是一個常識性問題。就像在看醫生時為別人吃藥一樣。在某些情況下,CCTV將在春節期間播放百度的流程圖。這個問題也可以從側面解釋這個問題——這種移動地圖有助于可以制作地圖的公司,遠離政府。幫助大。
簡而言之,數據的要求在深度和廣度上都有所不同。前者需要更詳細和更高質量的數據源,而后者需要更少,但兩者在應用時都將面臨支付和返回。不相等。大數據傾向于描述整體,有能力收集或處理大數據的個人通常是個人,而個人的回報并不容易反映在整體改進中。
因此,大數據開發的瓶頸不是技術,而是建立它背后的分銷關系。這種關系不合理,數據將保持在島級,每個組織都有自己的東西,并將其命名為“大數據”。為了理順這種關系,我們必須回到一個非常經典的問題,即可以建立“公共土地”。
數據公地的設想
大數據有點像普通的土地。經濟學中最著名的一個論點是公地的悲劇。《美國經濟史》一個非常容易理解的例子中的常見悲劇是什么:
……這些經濟推理命題有助于解釋集體所有權和產出(一半或固定份額)的共享如何導致“搭便車”問題。為了說明這一點,考慮10名分享土地所有權并共同生產100蒲式耳玉米的工人,每人平均消費10蒲式耳玉米。假設一個工人開始懶惰并將他的勞動力減半,導致產量減少5蒲式耳。由于輸出共享系統的安排,懶人的消費與其他工人的消費相同,現在是9.5蒲式耳。雖然他的努力下降了50%,但他的消費僅下降了5%。一個懶惰的人是一個在別人身上工作的自由騎手……
這背后有一個非常深刻的人類問題。即使我們可以共同努力創造更多財富,個人也可以從中分享更多財富,但群體中明顯的個人傾向是減少工作但分享更多。事實上,這與囚犯的困境有關。
在現實世界中,沒有辦法徹底解決這個問題。它只能依賴于每個人基本認可的特定分配順序。例如,以前的血統現在是一個自然的選擇,但現在基于比特的數字財富有可能解決這個問題。
基于位的數據與真實數據之間的最大區別在于,數據不是“當你接受它時,我沒有任何東西”,并且硬件的價格正在快速下降。開源使數據訪問工具基本免費。這些是疊加的,以使數據變得普通。
這里有趣的問題是,如果每個人都更關心我得到的東西是否變大,那么數據公共土地形成的可能性就更大,因為如果有數據公共土地,那么每個人(企業)必須有更多的收益,但如果你更關心我是否比你更重要,那么數據公共土地的建設會有很多障礙,因為公共土地實際上是讓相關人員站在競爭的起點。
大數據的問題是數據使用中的技術問題,但它實際上是數據源中的社會經濟問題,后者更難,因此大數據應用的開發不依賴于技術的發展,但取決于社會經濟的變化速度。在一個有限的領域,如搜索,電子商務,云計算,技術已經得到充分發展,現在誰支付誰的利益的問題是將小數據轉化為大數據的過程中最重要的問題。
大數據的路往那里走?
數據的內在發展是數據的價值越全面,這也是一種網絡效應。這種內在動機導致在宏觀視圖中數據所有權的發展只有兩個趨勢:
一個是像移動方面一樣,每個人都有自己的私人數據源,然后你開始生死競爭,最后一個幸存下來,這也可以實現數據統一的最終目標;
另一種是開始聯合競爭并建立上述數據公共土地。
如上所述,行業數據和整個社會的數據性質差異很大,因此應分別討論。
對于行業數據,除非有非常特殊的人,否則競爭者之間的坦誠合作是不可能的。最簡單的方法是引入第三方。例如,每個運營商都掌握著幾乎所有網民的行為數據,但很難將數據整合在一起,為運營商公開誠實地合作創造一定的價值。此時,如果涉及第三方,則可以制定福利分配計劃。
如果能夠實現這一點,唯一的關鍵點是相應的業務模型是否可以超過數據處理的成本。必須強調的一點是,大數據的價值密度非常稀少。很多東西都很有價值,但不一定值得做。視頻網站無法賺錢的關鍵原因是帶寬和存儲成本相對較高。商業模式不適合大數據,而且情況可能比視頻網站更糟糕。采礦成本也低于采礦收入,采礦業也很有價值。
上述問題在行業數據中可能不會太大。一般來說,行業數據的價值密度會更大,而且由于它相對垂直,總量是有限的。因此,大數據產業的應用相對容易發展。
但對于社交數據,在許多情況下這是一個問題。我們都知道樣本的全面性比數據量更有價值,但如果它是確保樣本全面性的唯一方法,那就意味著讓所有數據做一件事就必須有意義。
社交數據有兩個應用方向。一個是公司可以處理谷歌,另一個是社交數據。很難屬于公司的活動數據,如智能城市相關人員。后者需要上面提到的數據共同點來支持。
從數據的角度來看,現在有兩種形式的數據存儲:一種是像谷歌這樣的公司在整個社會的一個橫截面上擁有所有數據,這應該是一個特例,數據僅限于公共信息;它是與人類行為有關的各種數據,例如與電子商務相關的購物,與社交網絡和IM中的人相關的,與O2O企業相關的離線服務,與鐵路相關的12306等。谷歌擁有所有數據,但它沒有人類行為,因此谷歌相當于擁有整個社會的橫截面數據,而所有其他公司只擁有垂直領域的數據。
如果依靠企業做這種數據統一的嘗試,前者將有20億投資做O2O級,因為這將完成數據,后者會有一個想要社交的電子商務,社交我想做電子商務這樣的事情。類似的故事可能發生在終端上。所有這些行為的最終目標是讓公司完成所有這些,但這是不可能的。這不僅僅是一個經濟原因。并且數據無法打開,那么您只能對碎片數據執行自以為是的大數據。
因此,這是關于是否可以建立數據公共土地的問題。如果你想建立一個數據公共土地,至少你必須解決誰將要做的問題。開源給予的啟示非常重要:
首先,這不是一個盈利組織;
其次,這必須得到許多公司的支持。
由于數據與隱私相關,因此與開源相比,必須有更清晰的數據使用規則定義。
小結
在有一種解決所有數據和使用權的實用方法之前,大數據的應用應該是部分的。由于其深層應用涉及社會許多部分的協調,因此這個過程可能非常漫長。有趣的是,大數據的出現直接推動了機器智能的發展,機器智能可以比大數據本身更快地影響影響。
作者訂閱號:zuomoshi(琢磨事)