海量資料的深厚感動
蕭瑞麟|政治大學科技管理與智慧財產研究所教授
沒有脈絡的大數據,資料其實只是廢料
大數據的大迷思
只要資料量夠大,數字自己就會說話?這似乎又是企業一窩蜂的追隨流行趨勢的迷思。大數據(Big Data),或稱海量資料,成為今年最夯的技術名詞。近年來,企業紛紛成立大數據研究中心,或巨量資料學院。好像有了如海一般多的資料,銀行就可以分析出顧客行為,投其所好創新產品;國會選舉就可精準預測誰會當選;錄影帶店就能知道如何依照個人喜好推薦影片;商場就可以知道要將啤酒與尿布放在一起賣(按:美國零售業發現,來買啤酒的男性顧客也會順便買尿布);而警察就可以預測犯罪來源。大數據其實就是一套資料探勘系統,以特定的程序去爬梳資料,找出資料之間的關連性。在資訊管理領域,資料探勘已經是老掉牙的工具,可是改個名字後卻紅了起來。這是怎麼一回事?
說穿了,就是懶。企業希望最快找出客戶,然後業績一飛沖天。研發人員希望找到一項工具,一用見效。冷靜一想就知道,這怎麼可能!這樣的求快心理,使得企業盲目的採用「工具」,希望即刻「藥到病除」。海量資料分析的確是有其優點,我們先來看由《大數據》這本暢銷書所舉的兩個例子。
案例一:日本一家汽車座椅公司在座位中放入偵測器,可以收集車主各種坐姿,若是加以比對,便可以檢測駕駛座是否異常,判定車子是否遭到偷竊。案例二:由推特上的大數據分析,可以預測某個電影推出後的票房。這很類似目前視頻網公司號稱用大數據就可以預測觀眾收視行為,因而挑劇的準確率就會大為提升。
這樣的資料固然巨量,但推理卻可能過於工具性。若是車主習慣改變會如何?不同型態的車主習慣真的會一樣嗎?若是推特上對電影的喜好只是網路上的應酬話,怎麼辦?當過度依賴海量資料,而卻不重視深厚的「行為脈絡」時,資料可能會變成廢料。《大賣場裡的人類學家》一書便點出,運用大數據時,必須結合「厚數據」(thick data)才能見效。分析厚數據其實就是釐清問題的脈絡。我們來看兩個例子。
脈絡一:顧客原來不在台灣
一家電子商務公司專賣面膜等化妝品,員工約30人。這樣的公司市面上少說也有百家,而且同質性高。2007年,這家賣面膜公司營運不佳,虧損約達新台幣六百萬元。問這位經營者有多少會員,不清楚。問他們客戶都是從哪裡來的,也不知道。問他們都是如何行銷面膜,說是透過網路促銷活動、團購網頁、網誌代言、客戶資料庫行銷都做了,就是沒效果。
一位新上任總經理由四千多筆客戶資料中歸納出兩項脈絡。第一,彙整購物單指出,八成以上的顧客來自海外,一查之下名字很多是兩個中文字,地址都是在美國;一查方知是海外華僑與中國留學生。美國美妝商品大多很貴,貨物稅又高。愛漂亮的留學生比較相信臺灣出貨的產品,所以會找臺灣網站團購。而且,透過網購可以省掉當地貨物稅。這位總經理發現,客戶最關心的問題其實不是團購或促銷,而是運費。這道理不難懂,許多女生想要買一些私人物品,本不想和別人一起團購。但是數量不夠多,運費就高。所以,這位總經理就推出運費券,這其實航空公司里程數積點的道理一樣。網路購買點數累積越多,運費券就送愈多,而刺激更多團購行動。
第二,這位總經理派產品企劃部門每天瀏覽美容討論網站,看看女性都在談什麼,分析面膜的討論。他們發現,許多女生不喜歡「一條龍」的產品搭配方式,例如以面膜搭配晨霜或晚霜來賣。但是,這些女生喜歡試用不同的面膜品牌,還常常在網站上對各牌面膜品頭論足一番。所以,產品企劃部門就將20種品牌的面膜,從貴的到便宜的,一起配搭成特賣商品。之後,產品企劃盯著各家討論網站,客戶抱怨缺什麼商品,就推出那項產品。還有,不管那是什麼產品,都加上面膜一起賣(例如,性感內衣加上面膜)。結果,業績就起來了;四年間營業額由虧損轉為新台幣一億四千萬元,登記會員達十八萬人,常購會員一萬多人。這位總經理釐清脈絡後,沒去做促銷活動、團購網頁、網誌代言以及客戶資料庫行銷。這些事情耗錢又費力。針對客戶的痛點,該公司推出運費券與面膜搭配特賣。這項創新不難,只要在分析數據時,同時也看見脈絡。
脈絡二:成功關鍵原來是黃金點
台灣大車隊初期創業時需要招募約六千位計程車司機成為會員。分析數據後發現,計程車司機集中於加油站、建國橋下、濱江休息站等。於是,公司針對這些地點去招募司機。不知為何,這樣去招募司機時,招來的司機來得快,也去得快。當時用的是新加坡康福集團使用的衛星派遣系統,功能已經優化過,應該沒問題。用衛星派遣比無線電派遣範圍廣,速度又快,按理應該是備受歡迎才是,但並沒有。如果分析行為脈絡會發現,加油站等地的司機大多是交易型的,只要每月派遣數一不夠,就離開,而且常常壞事傳千里。如果分析每位計程車司機所獲得的電腦派遣數,會發現有蠻大的落差。聽說一位林司機每月接到的派遣數將近300~350通(很滿意),而多數司機大約只有90到100通(常抱怨而離開車隊)。為什麼有這麼懸殊的差距?採訪林司機,可以發現高派遣數的脈絡。
問:為什麼你每個月能夠接到這麼多派遣?
答:因為我很努力,永不懈怠,所以才會這麼成功。(這樣的回答有點令人傻眼,因為這完全是個人的偏見)
問:能不能分享你有什麼獨家的做法?
答:這套衛星系統非常好用,我走到哪兒就接到哪兒,這就是我的秘訣。(這根本不是秘訣,他可能自己都不知道自己為什麼會這麼厲害)
問:請問你手上為什麼一直提著這個黑色的公事包?(我注意到他很謹慎地隨身帶著這個物件)
答:因為公事包裡面有「黃金點」,我做生意都必須靠它。
問:什麼是「黃金點」?
答:就是客人上車的時間跟地點,我都會做紀錄,而且我們也組成一個讀書會,一共有八個人。我們每個禮拜五聚會,當然不是去唸書啦。他們會把記錄下來的資料交給我。我用Excel匯整這些資料,按照每二十分鐘為一個單位,整理這些「黃金點」,印成手冊,分為早上與晚上。然後,我再根據不同的地區,是大安區、信義區、文山區來分類。不管我們走到哪裡,都可以馬上拿出手冊,找到最近的「黃金點」,只要在那邊等,很快派遣就會進來。
就這樣,脈絡出現了。找出「黃金點」,也就了解這一類高效率司機的工作秘訣。原來,司機最關心的是每月能收到多少通派遣。一位司機每月收到60~90通派遣,就會覺得不划算(一天平均才收到1~3通)。然而,一位司機若是每月收到200~250通派遣,就會覺得超划算,還會推薦司機進台灣大車隊。那問題就來了,為何有的隊員只收到60通,有的卻可以收到300通?
採訪的「厚資料」指出,這些300通司機會用心記錄乘客上車的時間與地點,然後按照時間與空間排序,也就是先排序上車時間,再排序上車地點,然後分區整理。司機稱這些紀錄為「黃金點」(看到熱點,覺得遍地都是黃金,故名之)。
這樣一來,當司機於某一區放下乘客時,便可以先找出該地區,對應當時區段,再找出最接近的地點去等客人。這樣一下子就等到客人,等候時也可以安心的做點運動,休息一下,不會像以前一樣,等待時心中充滿不確定感。相對地,其他計程車司機在城市裡亂跑,隨機的尋找乘客,所到之處也不一定是黃金點,自然就耗時費力,成效又不彰。了解這些行為脈絡,就能知道大數據該怎麼運用。
沒有留言:
張貼留言