不管是針對即時定價或是即時預測顧客購物喜好,都需要大量的消費者資料數據當作基礎,那麼梅西百貨究竟收集了哪些使用者的數據呢?根據 Macy’s.com 的「WHAR WE COLLECT & SHARE」一節描述,梅西百貨會蒐集的使用者資料分為下面幾種,包括使用者主動提供的資訊(Information you provide)、透過科技蒐集的資訊(Technology-Enabled Collection Services)以及交易資訊(Transaction Information)。
梅西百貨的巨量數據分析,收集了哪些個人資料?
使用者主動提供的資訊包括,顧客在線上或實體商店時,創造個人設定檔、登記、下訂單或參與各種活動時提供的資料,舉例來說會包括姓名、地址(帳單與郵寄地址)、郵遞區號、電子郵件帳號、電話號碼、手機號碼、信用卡號碼、生日與安全問題等資料,都是屬於使用者主動提供的資訊。
利用科技蒐集的資訊包括,當使用者連上梅西百貨網站、使用他們的行動裝置 App、在線上商店購買使用它們的Wi-Fi 服務、iBeacon 服務時,所有會自動紀錄的資料,像是 Cookie 、瀏覽資料、連網裝置資訊、所在地點資訊等等。
交易資訊則包含了,使用者曾經購買了哪些商品,購買的時間與日期,這次交易是在線上或線下進行的。
梅西百貨的大數據處理與分析解決方案:Hadoop
為什麼梅西百貨需要 Hadoop?隨著使用者能透過各種裝置,以各種方式,不論是線上的行動裝置、電腦或實體店面,以及需要分析的接觸點(touch point)越來越多,自 2010 年以來,能夠分析的數據已經增加數百倍,因此亟需要能夠進行大數據處理與分析的解決方案。
巨量資料具有幾個特徵,首先是資料量龐大,就算是單一公司的資料,都可能單日就上看 TB或 PB,再來就是資料產生的速度快,同時也需要極快的處理速度才能運算,另外就是資料具備多樣性,包括傳統的資料庫系統無法處理的半結構化與非結構化資料等,而梅西百貨從 2010 年開始,就引入 Hadoop 雲端處理平台進行巨量資料分析,梅西百貨的行銷分析與客戶管理系統總監(Director, Marketing Analytic and CRM Systems at Macy's)- Seetha Chakrapany 認為,採用 Hadoop 雲端處理平台是因為傳統的資料處理架構與資料處理解決方案不夠彈性,也不夠敏捷以處理大量且多樣的資料,處理歷史資料需要花費很高的成本,計算能力有限制,擴充成本高,也不能處理非結構化的資料。
為什麼要採用 Hadoop 來做智慧商業(BI)呢?首先可以用 Hadoop 單一檔案架構處理各種使用情境,而且 Hadoop 平台整合了資料,處理與工具的整個生態鍊,並可以集分析、實驗、分析結果產出於單一平台,例如你有一個想法,可以直接在Hadoop 平台上分析巨量數據是否能驗證你的想法,並且套用在商業決定上以及測量效果等,最後相較於傳統的資料庫解決方案,Hadoop 整體的建置成本也較低,擴充越多的伺服器就可以取得相對越多的效能,增加的成本與增加的效能是等比例增加的。
Seetha Chakrapany 也認為 Hadoop 就操作面上帶來的優勢就包括,第一是可以在 BI 的測試/實驗循環,一直到產出的流程間快速進行,第二平台上的資料品質、管理與安全性也有保障,,第三是具備可接受的穩定度與穩健性水準,且能符合各種服務水準協議,最後是具備多等級的自動化能力,只需要一些些的人為介入即可。
如果我們看梅西百貨的巨量數據分析架構藍圖, 包括顧客本身、訂單、產品、網站點擊、行銷資料以及其它外部資料都是巨量數據分析的資料來源,並且在 Hadoop 上進行資料儲存、管理、處理、保全,處理過程也因應不同的用途而適用各種工具,例如用EPIPHANY做行銷活動管理/最佳化,用 SAS、R 語言做資料分析,用 Kxen 、Kiji、H2O.ai、Mahout、Salford System 做進階分析/模組化,用 Tableai、AtScale 做資料視覺化/資料探勘,最後包括行銷人員、商業人員、產品管理人員、分析師、資料科學家,以及其它部門都能從中得到想要的資訊。
顧客隱私與經濟效益 巨量數據分析的兩難或雙贏
就如同在巨量數據分析架構藍圖看到的,巨量數據分析首要的就是能有各式各樣、各種類的數據,然而輿論經常對於梅西百貨收集顧客資料有微詞,擔心這些顧客資料會被濫用,但是梅西百貨認為,顧客資料收集以及提供更完美的購物體驗是一體兩面的事,因為如果梅西百貨不收集大量資料,並做巨量數據分析,如何得知顧客究竟喜歡哪些商品,如何在下次光臨線上購物網站或線下實體商店時,提供顧客最想要的商品呢?梅西百貨認為它們是以一種負責任的態度在進行顧客的資料收集與分析使用,對顧客來說,它們可以提供顧客最想要的商品或者商品的廣告,對梅西百貨來說,自然也能提高商品銷售量,對顧客以及對梅西百貨兩者都是雙贏的。
有些人認為大數據會侵犯到個人隱私,你覺得這樣收集用戶資訊合理嗎?
1 則回應