回顧早期的爭論 現(xiàn)在搞大數(shù)據(jù)(后端數(shù)據(jù))的朋友,和早些年搞數(shù)據(jù)倉庫的沒啥本質(zhì)區(qū)別,因為都是人為需要把各系統(tǒng)的數(shù)據(jù)集中化,現(xiàn)在增加個非結(jié)構(gòu)化數(shù)據(jù),于是就叫大數(shù)據(jù),而以前就叫數(shù)據(jù)倉庫。 在10多年前,數(shù)據(jù)倉庫界一直有個爭論,到底是TOP-DOWN好還是Bottom-UP好,一邊說,我先把企業(yè)所有數(shù)據(jù)都集成,數(shù)據(jù)基礎(chǔ)做扎實了,然后分析就可以源源不斷產(chǎn)出了。而另一邊認(rèn)為,我們得先建數(shù)據(jù)集市,把業(yè)務(wù)主題搞扎實,讓數(shù)據(jù)先有產(chǎn)出,然后再多個主題后再進行數(shù)據(jù)梳理整合。 前者的詬病是大半年都不會有啥“數(shù)據(jù)變現(xiàn)”的產(chǎn)出,問產(chǎn)出,就一直在說,系統(tǒng)搭建中,XX系統(tǒng)搭好了,XX 業(yè)務(wù)數(shù)據(jù)集成了,等等。后者的詬病是,數(shù)據(jù)是有產(chǎn)出了,但是不同主題間的數(shù)據(jù)會有管理問題、每個主題需要不斷添加新的數(shù)據(jù)源,開發(fā)、數(shù)據(jù)冗余都是個問題。 這是數(shù)據(jù)倉庫界爭論10多年的話題,直到近兩年大數(shù)據(jù)興起,大家就都沒興趣討論了。在很多企業(yè),大家都采用數(shù)據(jù)團隊組織基礎(chǔ)數(shù)據(jù),做傳統(tǒng)數(shù)據(jù)倉庫前者的事情,再組織一個商業(yè)數(shù)據(jù)分析團隊,做后者的事情。只不過大家都很少提數(shù)據(jù)倉庫、BI這些老概念,不知道認(rèn)為過時了,還是新一代數(shù)據(jù)人都不知道這些歷史。其實本質(zhì)是一樣的,IBM等企業(yè)10年前就是2 個團隊在做,前后者的優(yōu)勢兼得。 商業(yè)數(shù)據(jù)分析的傳統(tǒng) 在商業(yè)數(shù)據(jù)分析方面,我也是近4、5年才真正切入,之前都是做傳統(tǒng)的數(shù)據(jù)倉庫和BI。不過我經(jīng)常欣賞幾十年前的小數(shù)據(jù)商業(yè)分析的成功案例,試想小數(shù)據(jù)時代商業(yè)分析如此成功,大數(shù)據(jù)時代炒得那么熱,卻炒來炒去,就那么幾個案例,有意思么? 我這里還是介紹那2個經(jīng)典小數(shù)據(jù)時代的案例: 1。早期超市為了優(yōu)化超市設(shè)計,采用人工觀察,到后來的視頻觀察,來解析用戶行為,他們解析用戶行為的時候,發(fā)現(xiàn)了幾個方面的業(yè)務(wù)改進Idea,超出了預(yù)期的想法。當(dāng)看到人們眼光主要放在眼睛上下30度范圍,于是陳列的時候,總是把利潤最高的放這2排,利潤低,性價比高的分別放上面和最下面;當(dāng)發(fā)現(xiàn)人們通過買面包順便買紅酒,而不是買紅酒順便買面包,于是他們改變兩種商品的組合和區(qū)域順序;當(dāng)發(fā)現(xiàn)免費品嘗某水果,可以帶動新鮮水果以及高利潤的純果汁的時候,超市又改變了策略。 2。有個商場,糾結(jié)于傳統(tǒng)方案是現(xiàn)代方案,于是兩個方案同時上,一個是用咨詢團隊,一個是監(jiān)控方案,數(shù)人數(shù)看人流。結(jié)果咨詢團隊的方案勝,原因是咨詢團隊雖然是小數(shù)據(jù),但是他們的抽樣數(shù)據(jù)都是按照經(jīng)驗選擇恰當(dāng)?shù)臉颖,其次小?shù)據(jù)的信息非常全面,包括人的性別、年齡、身份背景、收入水平(經(jīng)驗判斷)、去哪個區(qū)域,買東西走到哪一步了(咨詢、試穿、有沒討價還價),這些數(shù)據(jù)監(jiān)控都沒法得出,所以監(jiān)控數(shù)據(jù)全面,但無法給出任何實質(zhì)價值意義的建議,都是些空話。 大數(shù)據(jù)商業(yè)分析應(yīng)該TO-DWON還是Botton-Up? 一種思路是需要足夠大、全面的數(shù)據(jù),沒有解決不了的分析,一上來把所有可能的維度、數(shù)據(jù)分布、趨勢都嘗試一遍,認(rèn)為沒有規(guī)律也能看出規(guī)律了;一種是看問題,需要解決什么問題,就做什么分析,缺什么數(shù)據(jù)再從大數(shù)據(jù)中去取。 有人問,如果采用第二種方案,那么大數(shù)據(jù)價值何在,那么多數(shù)據(jù)都沒利用起來?我想問,如果你想挖前面一座金山,你是挖一部分,然后淘一部分出來賣,還是把金山都挖完,然后一點點淘出來賣呢?當(dāng)然你選擇第一種,但你選擇這個,你不會說浪費了整個金山,因為你知道你需一點點變現(xiàn)后才會有動力挖后面的。但為啥那么多搞大數(shù)據(jù)的人不是這個思路呢? 看到這里,可能大家認(rèn)為我偏向第二種方案,其實不全是,我一直認(rèn)為任何方案都有其優(yōu)勢,中庸取其精華最好。第二種方案的死穴是,如果你問題沒搞得透徹明白,那么分析的都是無用功,都是在錯誤的軌道上轉(zhuǎn)圈。 什么是大數(shù)據(jù)時代好的分析方案? 我們來看第一個超市案例,他通過一個簡單的、人工判斷過的“用戶行為”數(shù)據(jù)解決了這么多各種業(yè)務(wù)難題(陳列、布局、商品搭配、促銷等),是因為他們發(fā)現(xiàn)一個問題,然后去解決的思路么?不是,而是充分以“商業(yè)”為中心,以“迎合用戶需求,滿足商業(yè)利益最大化”這一個最大分析目的,發(fā)現(xiàn)了用戶行為,原來對這么多商業(yè)布局都有改進的地方,可以同時滿足用戶的購物需求,也滿足商業(yè)利益最大化的需求,于是產(chǎn)生了后來的一系列超市零售改進。 再看大數(shù)據(jù)的案例,某人收到小孩用品推薦,他很生氣投訴,結(jié)果沒多久就寫感謝信,說他女兒真的懷孕了,感謝云云。其實從這個案例中,除非給人驚奇外,有多大“商業(yè)價值”?如果純從數(shù)據(jù)商業(yè)價值來說,這個分析推薦的作用,比起超市零售通過用戶行為的變革,簡直不值得一提,為啥還廣為流傳? 因為大數(shù)據(jù)時代,還找不出像樣的案例,于是就拿驚奇的案例來吸引大眾注意吧。 反過來說,并非大數(shù)據(jù)無用,或者說大數(shù)據(jù)不是遠不夠大(要知道比超市人工觀察的數(shù)據(jù)大多了),而是大數(shù)據(jù)分析和應(yīng)用的人們思維并未完全打開,我相信做推薦的朋友沒多少熟悉供應(yīng)鏈的,也沒多少熟悉商品定價和生命周期管理的,所以他們的大數(shù)據(jù)只是應(yīng)用在推薦。
[大數(shù)據(jù)時代的商業(yè)分析]