從搜寻數據,看“黑天鵝”可能帶來什麽新機會

電影《末日重啟》中有這樣一句台詞:“你有沒有想過,世界上還存在一個鏡像世界,那裏的一切都和你的生活一樣,就像我們熟知的平行時空那樣。”

在這樣一個特殊的時間點,或許已經有不少人開始思索這個問題,如果我們可以從“鏡像世界”看到自己,如果我們可以在兩個多月前叫停那些吃“野味”的人群,社會就不會停擺,我們的生活也不會被外力打亂。

然而現實世界中可能並不缺少這樣的“平行時空”。

兩個多禮拜前,華南農業大學公布了最新的研究成果,穿山甲正是新型冠狀病毒的潛在中間宿主。但在更早前的一個禮拜,發布的搜寻大數據報告顯示,穿山甲雄踞過去十年中“野味搜寻”的第一位,類如“野味的做法”和“野味館”的百度搜寻大數據同樣呈現出較為明顯的季節性波動,這說明即使經曆非典之後,依然有人對吃野味這件事情有獨鍾。

從中不難梳理出潛在的因果關係:搜寻作為用戶主動獲取信息的方式,所產生的搜寻大數據直觀地暴露了民眾對於“野味”的熱情,隱藏在這些數據背後的用戶行為,正是為疫情爆發而種下的“因“。

拋卻疫情這般沉重的話題,保留一些“私心”將目光看向商業世界,看到的卻是企業家、者們的“訴苦”,諸如“現金流隻能維持三個月”“給員工發不出工資”之類的聲音比比皆是,而非嚐試從現實世界的“鏡像”裏尋找活下去的答案,思索“黑天鵝”可能帶來的新機會。

本文想要討論的正是這樣一個話題。

“搜寻直接連接大腦”

“搜寻直接連接大腦”,穀歌聯合創始人謝爾蓋·布林提出的概念被不少人解讀,甚至有人猜測穀歌一開始就想打造連接人與世界的“腦機”。

或許無須這般深奧的猜測,穀歌不止一次對外宣稱:“搜寻的最終目標是理解人的意思”,沒準這就是謝爾蓋·布林的題中之意。厘清了搜寻引擎的價值,也就不難理解搜寻數據由少變多,再到大數據的現實意義。

首先,穀歌和百度的主頁大概是世界中最簡單的UI,有人給出的解釋是“偶然性”的產物,搜寻引擎誕生的時間還是撥號上網的年代,為了保證網頁加載的速度,以及節省服務的流量成本,最簡單的選擇無疑是最好的選擇。

暫且不去論證此類說法的正確性,簡單到極致的搜寻框恰恰是破解“搜寻直接連接大腦”的關鍵所在。當用戶麵對這樣的搜寻框時,看不到太多的幹擾因素,由此養成的習慣就是:在搜寻框裏輸出自己想要答案的關鍵詞,一種最原始也最純粹的“主動尋找信息”的場景。何況人們並不缺少雅虎這樣包括搜寻框的門戶或導航網站,為用戶提供了這樣或那樣的選擇,最終卻和PC時代一起走向了衰落。

其次,人們的每一次請求,搜寻引擎都知道人們在尋找什麽,正如人們的所有行為都會在互聯網上留下痕跡,而搜寻引擎占領了捕捉和分析這一行為的最佳路徑,針對這些用戶行為的抓取、存儲和分析,甚至可以揣摩用戶搜寻之前的動機來洞察新的趨勢,指引下一階段的走向。

即便到了移動互聯網時代,超級APP逐漸崛起,數據孤島逐漸形成,“投喂”模式的內容分發已經成為新潮流,可搜寻仍然是最高頻的用戶行為之一。穀歌在全球範圍內的月活用戶超過了10億人次,國內每天也有10 億人次通過百度搜寻了解疫情,同時移動互聯網又進一步擴展了搜寻引擎的能力邊界,除了搜寻的關鍵詞,還有搜寻的地點、設備、方式,數據不僅在增“大”,也在變“深”。

之所以用如此長的篇幅來闡述搜寻的意義,無非是想要回答這樣一個問題:記憶和聯想是大腦最重要的兩種思維方式,記憶是互聯網的優勢所在,聯想的路徑是什麽?這也就引出了搜寻大數據的價值,即洞察、預測、研判……

畢竟搜寻作為網民的“意圖數據庫”,當然可以根據某一專題搜寻大數據的的漲跌,預測下一步的市場走勢。

“像上帝一樣俯視”

搜寻大數據的“一戰成名”,還要從穀歌的GFT說起。

2008年穀歌推出了一個名為Google Flu Trends的應用,翻譯成中文就是“穀歌流感趨勢”,通過匯總分析用戶的搜寻數據,對全球的流感疫情進行估測。2009年美國H1N1流感爆發的幾周前,穀歌的工程師們在《Nature》上發表了一篇論文,預測了H1N1在美國的傳播,並且具體到了特定的地區,事後證明與美國疾病控製和預防中心(CDC)的官方數據相關性高達97%,時間上卻提前了整整兩周。

隻是穀歌的GFT也有“玩砸”的時候。

2014年有研究人員在《Science》上發表文章指責GFT的糟糕表現,文章的標題相當直接——“穀歌流感的寓言:大數據分析的陷阱”。原因在於,2011年8月到2013年8月之間的108周裏,GFT有100周的流感發病率預測高過CDC,2012年到2013年的預測發病率已是CDC報告值的2倍多。

不過這並不是唱衰搜寻大數據的理由。

打這樣一個比方:在一個交通流量密集的十字路口,實時記錄行駛過的車輛和發生的交通事故,如果上禮拜一的車流量是1萬輛,不難在下個禮拜一記錄到大致相同的數字;可如果上禮拜一發生了兩起交通事故,很難說下個禮拜一定會發生交通事故,因為交通事故是不確定性事件。

簡而言之,搜寻大數據在不確定性、隨機性事件中的預測可能會出現不小的偏差,但對確定性、趨勢性的事件,幾乎可以用“研判”一詞來形容。

直接的例子就是有人用Google趨勢多次成功預測了比特幣的價格走勢,畢竟加密貨幣的價格變化直接取決於外界的關注度,當用戶搜寻比特幣正麵關鍵詞的標準差增加時,預示著比特幣的價格將有所上升,而負麵關鍵詞的標準差增加時,往往會在一段時間後出現價格下降的情況。

國內也不乏這樣的例子。

比如線上教育的百度搜寻大數據在今年春節後不久就開始猛漲,這比線上教育概念股的瘋漲足足提前了兩個禮拜左右。可以給出的合理解釋是:1月23日武漢封城的消息曝出後,一些家長就開始焦慮孩子開學的問題,線上教育相關關鍵詞的搜寻量開始迅速增長。

此外,疫情的消息傳出後,新型冠狀病毒肺炎症狀之一“咽喉痛”的關鍵詞搜寻開始呈現出上升趨勢,折射了人們對於自身情況的擔憂,可能會引發焦慮情緒和心理健康問題。對於內容生產者和平台方,及時辟謠並加大權威信息、科普信息的權重,可以說是防疫過程中必要的一個環節......

假如人們可以在黑天鵝出現之前,對市場的走向做出準確的洞察,或許可以像上帝一樣俯視亂象中的危與機,而非無奈的“訴苦”。

不應被忽略的金礦

關於大數據價值的“警示”,幾乎成了老調常談的話題。

早在1980年,著名未來學家阿爾文·托夫勒就在《第三次浪潮》中,將“大數據”描繪為“第三次浪潮的華彩樂章”。

2012年,IBM CEO羅睿蘭的觀點更為直接:“大數據不亞於一種新的自然資源。數據在我們當今時代的角色就像是蒸汽、電磁和化石燃料對之前時代的角色一樣。它有潛力推動更高一層的社會進步和繁榮。”

也正是在2012年,美國、歐洲、日本、韓國等先後啟動了政府帶頭的大數據研究與開發計劃,國內也在當年的“十二五”規劃中明確提出要支持海量數據存儲、處理技術的研發和產業化。

隻是大數據在國內的用戶基礎似乎還很貧瘠:微信每年都會放出一份大數據報告,告訴我們什麽是最受歡迎的年度表情;支付寶每年都會公布一份年度賬單,用數據詮釋過去一年中花了多少錢,花在了什麽地方;至於百度搜寻大數據的應用,可能是不少營銷人的必備工具,更廣闊的B端市場對其的關注度還有不小的增長空間。

比如手機廠商已經習慣於從搜寻大數據中追蹤輿情,然後根據用戶的喜好製定相應的市場營銷計劃,卻沒有耐心從億萬用戶的搜寻大數據中挖掘產品痛點在哪裏,反而喜歡從幾千人規模的調研數據裏找答案。

再比如提到經典的數據應用案例時,很多人想到的還是沃爾瑪“啤酒與尿布”,也折射了當下零售商的窘境:執著於在自家的倉庫數據中找到可能的商品關聯,如果進一步分析搜寻啤酒的用戶背後的動機是什麽、還會搜寻哪些商品,是否會製造更多的可能?

另一個現實而迫切的問題是,疫情期間每天有超過10億人次在用百度搜寻獲取信息,沉澱了海量的用戶數據,這些用戶們出於什麽樣的需求,基於什麽樣的訴求?幸運的是,已經有不少人嚐試從野味、口罩等數據中給出了一些洞察,可這些疫情期間的搜寻數據如何優化社會治理體係,如何預防下一次疫情的出現,還需要進一步下功夫挖掘。

就像疫情期間同時發生的生鮮搶購和農產品滯銷,對這些數據進一步挖掘整理,是否可以對供應鏈的調整給出科學的指導;不同地區的醫學關鍵詞搜寻情況和當地的醫療體係進行關聯分析,或許可以以遠程診療的形式彌補醫療資源分配不均衡的問題;以及不同地區“口罩”、“消毒水”等防疫用品的搜寻情況,大致可以洞察出當地的需求強弱,引導政府調整醫療物資的分配......

至少對站在產業轉折點上的中小企業而言,在現金流遠不能和巨頭匹敵的局限下,搜寻大數據這座金礦可能是拉平差距的唯一籌碼,誰能掌握挖掘大數據的“黑魔法”,無疑將在競爭中多一些勝算。

寫在最後

“鏡像世界”並不是科幻電影的專屬,而是耶魯大學計算機科學家David Gelernter在1991年提出的概念。

彼時給“鏡像世界”下的定義是:鏡像世界是將一些巨大的結構性的運動的真實生活,像鏡像圖景一樣嵌入到電腦中,通過它你能看到和理解這個世界的全貌。長達30年時間的科技演進,現實世界正在1:1映射變成數字社會,特別是在物聯網的推進下,整個世界都在“可讀化”,“鏡像世界”已然從概念成了現實。

其中搜寻大數據正是“鏡像世界”的組成部分之一,或許我們還不能從人類的尺度觀察世界,但從商業的尺度來洞察潛在的機會點,並不缺少一定的可行性。正如那句有些雞湯性質但不失哲理的話:當你改變了看世界的方式,你就改變了你所看到的世界。

作者:Alter 來源:品途商業評論

頂: 2踩: 1

來源:盧鬆鬆博客



相關說明:

1、VIP會員無限製任意下載,免積分。立即前往開通>>

2、下載積分可通過日常 簽到綁定郵箱 以及 積分兌換 等途徑獲得!

3、本站資源大多存儲在雲盤,如出現鏈接失效請評論反饋,如有密碼,均為:www.ipipn.com。

4、所有站內資源僅供學習交流使用。未經原版權作者許可,禁止用於任何商業環境,否則後果自負。為尊重作者版權,請購買正版作品。

5、站內資源來源於網絡公開發表文件或網友分享,如侵犯您的權益,請聯係管理員處理。

6、本站提供的源碼、模板、軟件工具等其他資源,都不包含技術服務,請大家諒解!

7、源碼、模板等資源會隨著技術、壞境的升級而存在部分問題,還請慎重選擇。

PS.源碼均收集自網絡,如有侵犯閣下權益,請發信件至: admin@ipipn.com .


源站網 » 從搜寻數據,看“黑天鵝”可能帶來什麽新機會

發表評論

讚助本站發展 維持服務器消耗

全站源碼免費下載 立刻讚助