大數據的關鍵思考  車品覺 書摘  

作者: 車品覺    (香港人 西方教育 阿里巴巴數據技術產品副總裁)

 

自序:遍地大數據的未來黃金十年

 

產品(服務)數據化 - 使數據在產品中體現 

Google無人車 - 數據指引行為 (數據的品質 穩定性 計算速度 成熟)

找出有用的關聯數據,將數據用於生產環節,進而改善流程

 

產品經理的關鍵問題:(用數據的思維模式)

 

我們該做什麼

1. 遇到什麼問題?(改變誰的體驗)

2. 這是誰的問題?(以誰為中心來設計產品)

3. 是否能解決?(能否了解需求,是否有核心競爭力去解決)

4. 問題要現在解決嗎?(時機重要還是性能重要)

5. 如果現在得解決,可支撐的數據在哪?(數據是否是解決問題的核心)

我們該怎麼做

1. 用戶目前的困難?

2. 現有的數據可否解決?

3. 假設數據都可被獲取,哪些需要?

4. 獲取數據的成本與風險?

5. 數據解決方案?

6. 如果方案可行,如何獲取與累積數據?

 

前言 忘記大數據

 

用數據找機會:過去有問題才找數據,未來是用數據找機會 (養數據 用數據還原真實)

有質的數據量:數據的質比量重要 有效的數據才有用

決勝未來的商業利器:數據化的公司需要文化培養  混、通、曬   存、管、用

鍛鍊數據力和思考力:"假設數據是可獲取的"思維重新思考周遭的一切 =>定位問題的能力,以數據改善盲點

 

數據十戒

1 好的問題 答案就在裡面

2 在實踐中提煉數據

3 讓Data變成Technology

4 讓數據跟著人走

5 缺乏數據品質,數據就是浮雲

6 以"假設數據可獲取"思考問題

7 大數據安全,不是監管

8 利用數據拿到更有用的數據

9 建立數據的數據,才有進步

10 讓人做擅長的事情,機器作擅長的事情

 

第一部 從數據化營運到營運數據

 

01 只會談大數據不會做 (問題就是答案)

 

數據化營運(先用數據):2005年淘寶有第一個數據分析師,數據化營運就是用數據解決問題

營運數據(後養數據) :2011年阿里巴巴開始有計劃的收集數據,並以此創新,創造更優質的新數據

資訊要對稱,視野要溝通:蒐集數據的人 - 設計數據模型的人 - 使用數據模型的人 (不同的角色對於數據價值有不同見解)

 

問題就是答案:目前遇到的三大問題 未來三個月要解決什麼 過去一個月做對了什麼做錯了什麼?

先問問題 再收集數據 具備商業理解+好的思維方法

 

先學會問對問題(好的問題引發好的答案)大數據思考 三分想法 七分實踐 

 

02 還原使用者真實需求 (CEO關心哪些數據)

 

思考數據價值的三個面相:

1. Identify用戶身分:碎片化的個人

2.數據的Value:企業-資源分配最佳化 顧客-體驗提昇 (不同角度對數據有不同看法 需整合全盤考量)

3.收集數據的Situation:碎片化數據如何還原用戶情境?數據的價值來自情境,情境透漏客戶的需求,數據的本質就是還原,確認數據身分是第一步。

 

用數據解碼需求:更深化的數據連結,使海量數據經過提煉,更真實的還原事實

 

CEO關心哪些數據:數據分析師要把分析與當下作結合,先了解問題的內涵。

 

03 活數據才是大數據(別再作碰巧遊戲)

 

死數據:存在卻無法分析使用的數據,無法產生價值的數據。

從解決問題出發:分析 -> 推薦 -> 回饋 -> 再推薦

 

活數據收集:外部的關連性數據也可拿為己用,增加自己數據的精準度 *克強指數:耗電量、鐵路貨運量、銀行貸款發放量 觀察經濟發展

活看數據指標:要考慮用戶情境靈活應用數據,不要侷限自己的數據框架,要看出當前數據的侷限性。

用情境驗證:動態觀察數據才能準確反應使用者的需求 靜態數據是死的

 

別再作碰巧遊戲:數據分析師必須有商業敏感度

 

在電子商務中,行為數據 商業模式 之間的邏輯關係組成了儀表板,儀表板應該對好壞現象都要有敏銳反應

 

 

前端行為數據:訪問量、瀏覽量、點擊率、站內搜尋

後端商業數據:交易量、投資報酬率、顧客終身價值(LTV, Lifetme Value)

前後端需對應,決策不能碰巧,需看路(監控數據、解析數據)

 

04 大數據的顛覆者 行動數據 (樣本的偏見)

 

消費者的行為,需用多螢思維去解讀(使用網路的多情境) => 推薦演算法多螢化

 

擁有用戶體系的網站:用用戶ID+Cookie關連性識別用戶行為

 

行動數據蒐集的原理:(在沒有用戶體系的情況無法與電腦用戶行為連結)

1. WAP (Wireless Application Protocol) 過去

2. APP (Mobile Application) 現在 (將使用者行為記錄下來,適時傳給網站)

    APP是基於手機代碼識別用戶,還有系統問題IOS or Android,軟體版本問題,手機品牌問題,都會影響數據的一致性、完整性

 

電腦數據---使用者體系(透過用戶帳號作連結)--行動數據 

 

行動數據的分析是新興領域,無線不能以獨立模型看待,而是橫向的穿插於各種垂直的主題模型中

 

樣本的偏見:樣本的採樣方法影響調查結果,不盡然客觀,有偏見的樣本也有其價值,例如博客來的員工卻推薦其他書城

 

大數據是全量數據去分析,而非抽樣獲得。

 

05 什麼才是核心數據 (用傻瓜的視角觀察)

 

不同的情境決定不同的數據價值 數據分析師必須要以不同面相檢視數據,分類、估值

數據分類的四大面相(分類有助於認知與管理)

1 不可再生數據(原始數據) => 可再生數據

2 按儲存層次:基礎層(原始 需備份) 中間層(加工數據) 應用層

3 按業務歸屬 可分為不同數據主體 ex 交易類 會員類 日誌類

4 隱私數據  非隱私數據

數據的五大價值

1 識別與串連價值     帳號、Cookie、手機號碼、生日 *能識別身分與關係的數據最重要

2 描述價值:分析數據的框架,有邏輯的展示數據,從複雜的數據抽取核心 *描述性的數據通常經過初步加工完成某種目的展示

3 時間價值:數據的時間價值是大數據運用最直接的體現,歸納出用戶的偏好

4 預測價值:1. 商品推薦 2.經營狀況預測指導策略方針

5 產出數據的價值:店鋪評分系統Detail Seller Rating , DSR

 

用傻瓜的視角觀察:眼光放遠 讓問題在清晰的思路下去執行 多幫助人

 

06 從用數據到養數據 (遠離 或 選擇)

 

收集數據時應想像未來如何用。

用數據(數據化營運)->養數據(營運數據) 開發數據應用可小而美(目標具體)

 

把數據放進框架,數據框架是商業分析師的靈魂,可從框架中找尋問題關鍵與答案,不同的問題有不同的框架

 

如何用框架決策:

1 確定問題 從解決問題的角度收集數據

2 整理好收集到的數據 放入一框架(幫助決策者作決定,用框架清楚的表現數據與決策的關係)

3 看框架與決策的關係(若數據框架無法幫助決策,返回上一步)

4 根據決策行動,檢視行動是否達到目的。問題出在 數據 框架 決策 還是數據缺乏?

問題是什麼 框架如何搭建 決策是什麼? 從小角度切入

 

被動-收集數據

主動-養數據(1.網站沒有,需要使用者主動提供的數據 2.公司可接觸到,卻沒去收集記錄的數據) =>基於深入業務理解的更高層商業決策

 

遠離或選擇: 或 是一種二元思考的陷阱 例如:促銷最後一天=買 or 不買   要遠離或的慣性思考

 

07 負面數據的力量 (為什麼數據會騙人)

 

數據盲點:

A. 物理盲點 沒有收集到應該收集到的數據 沒有精確得到數據 => 數據收集策略需檢討  電腦網頁比行動APP來的好修改

B. 邏輯盲點 數據存在但沒有去發掘重視 (異常數據、人工造假)

 

用小偷思維觀察數據:當失敗代價與風險越高,人類天生有動物般的敏感。(避免風險的能力)

正面能量:如何達到終點 負面能量:如何避免失敗 (看到應該看到的數據)

大數據時代:可被記錄與調用的數據越來越多。(網路與行動網路是媒介)

假設常是誤判的源頭,錯誤的經驗讓人不斷犯錯。(錯誤經驗形成的盲點) =>環境會改變、趨勢會變動 正確的判斷要看趨勢

即存:如何管理從未見過多又廣的數據

即管即用:如何利用數據產生更大的價值

 

情態(人):喜、怒、哀、樂、愛、惡、欲 體內為情 體外為態

常態(人):弱、狂、嘩、周旋、慵懶、媚  平常的性格

時態(人):當下表現出的樣子

區分人的謊言:判斷常態與時態的差異

數據的常態與時態是什麼?為何數據會騙人?

 

數據化營運 實踐過程中的問題:

堵:資訊量大 難以捕捉有效資訊

獨:資訊分散在不同部門 缺少整合

慢:業務異動的處理往往是由上而下推動

漏:關鍵分析成果取得成效,但未實現沈澱後的結果

 

第二部 阿里巴巴的大數據秘密

 

08 大數據實踐 (先開槍 後瞄準)

 

數據化營運(假定數據是穩定的  常是由 計劃性 由上而下 管理者->員工) -> 營運數據(假定數據是可獲取且不穩定 常是由下而上 經由 錯誤與實驗 非管理層能憑空想像) -> 數據化營運 *大數據時代的核心特質:用數據找機會

 

 

結構化數據:財務數據 (企業對數據營運分析需要假設很多穩定因素)

半結構化數據:

非結構化數據:音訊   (數據指導營運的技術難度提高)

 

營運數據才叫大數據

data get data   ex: A/B test 有意識的用數據拿數據

 

先開槍:從海量數據中盲選

後瞄準:盲選出有價值的數據

先開槍,後瞄準,對於創業公司是正確作法,從短期目標出發,在不斷觀察中發現問題,尋找有價值的數據,做出決策、解決問題,更容易獲得成功。

 

09 數據化營運三訣竅 混 通 曬 (思考 要學會關窗口)

數據化營運 -> 從 人 作起

 

數據分析師要具有 商業意識(敏感度) 才能利用數據驅動公司實現經營目標

(數據部 要跟 業務部 "" 在一起 才能培養商業敏感度)

公司內部對於 數據標準 需要打、一致:

帶著業務問題觀察數據或帶著數據觀察業務,兼具兩者的敏感就是做到""

 

的兩種場景:

1. 商業模式 --(產生關係 Smart Data Set 數據中間層 可反應商業變化) -- 數據 *基於商業理解產生的通

2. 跨部門數據的交叉比對 (不要 堵 不要 散 建立數據關連 數據的營運要連通不同部門)

 

建立數據框架 解答問題

業務需要比較才能判斷好壞

評價業務水準:

1.  流量x轉換率x客單價 = 成交額

2.  加入購物車的商品數x商品單價x經驗轉換率x經驗成交額佔比=大促銷成交額

參照組:1. 這次促銷帳幅比較平常促銷漲幅 2.這次促銷帳幅比較上次同等規模漲幅 3.這次促銷漲幅比較上其促銷漲幅

 

數據表達:1.表達精準的數據用表 2.表現變化趨勢用圖

 

收集數據的人要知道怎麼用

用數據的人要知道數據怎麼來

數據分析師要讓數據的獲取、使用、分享、協同、組合上要做到簡單便捷,這是的內容

透過數據發現問題、解決問題、發現機會、驅動決策,達到人人會用數據,人人都是數據分析師。

 

10 營運數據三絕招 存 管 用 (用化骨綿掌解決本質問題)

11 未來商業的利器 (忽略趨勢 過去的價值一文不值)

延伸閱讀:

淺談大數據或海量資料(An introduction to Big Data)1

淺談大數據或海量資料(An introduction to Big Data)2

淺談大數據或海量資料(An introduction to Big Data)3

大數據的關鍵思考  車品覺 書摘

, , ,

asemia623 發表在 痞客邦 PIXNET 留言(0) 人氣()