1. <rt id="zqleh"><optgroup id="zqleh"></optgroup></rt>
          <cite id="zqleh"><noscript id="zqleh"></noscript></cite>

          <tt id="zqleh"><noscript id="zqleh"></noscript></tt>
          首頁 > 大數據 > 正文

          京東出品!寫給大家看的數據分析思路(一)

          2020-03-02 16:59:20  來源:優設

          摘要:數據分析主要分為 6 大步驟:構建 X 問題 – 提出假設 & 選擇指標 – 數據采集與整理 – 數據分析 – 數據呈現 – 提出后續建議。下文將圍繞這 6 步詳細講解每一步具體是如何做的。
          關鍵詞: 京東 數據分析
            美國前郵政部長,美國百貨商店之父,約翰·華納梅克(John Wanamaker)感嘆到:「我在廣告上的投資有一半是無用的,但是問題是我不知道是哪一半」。這種類似的感嘆現在也經常發生在我們身邊。
           
          \
           
            小 A 同學:在項目結束后,拿到了項目數據,看看自己的方案是否有帶來數據上的增長,但面對一堆 Excel 表里一堆密密麻麻的數字,卻不知從何下手……
           
            小 B 同學:拿到了自己花大精力投入的項目數據,滿懷期待地想來驗證自己在項目中推動落地的好幾個方案,還把項目過往數據也找來進行對比,一頓操作之后,看到整體數據上漲了,但因為影響因素特別多,具體是哪些方案產生了作用卻無從知曉……
           
            我們更常遇到的情況是不知道該如何去運用數據,讓數據帶來實際上的作用。本文將圍繞實際的數據分析步驟,更細化地來講講具體是如何進行下去的。
           
            數據分析6步曲
           
            數據分析主要分為 6 大步驟:構建 X 問題 – 提出假設 & 選擇指標 – 數據采集與整理 – 數據分析 – 數據呈現 – 提出后續建議。下文將圍繞這 6 步詳細講解每一步具體是如何做的。
           
            1. 構建X問題
           
            從本質上來說,數據分析的最終目的在于解決問題。帶著不同的出發點得到的數據結果可能會很不一樣。所以,一切分析的開始必須要先識別要解決的重要問題是什么,以及這個問題為什么是最重要的。這兩個問題將引導我們進入構建問題的過程,也就是明確數據分析的目的。
           
            從哪入手
           
            有預判類的分析,可以從已有的策略方案出發,尋找相應定量衡量方法。例如,嘗試通過強化某促銷 A 頁面利益點等相關信息,從而促進用戶購買,此案例則可以直接預設 X 問題為:「強化利益信息是否可以提升轉化率」。
           
            而無預判類(發現問題或機會)的分析,構建問題的起點往往是業務角度的商業目標,通過指標拆解、經驗判斷、橫向對比、邏輯推導等方式來尋找有效的實現方式。例如,某電商促銷頁面 B 的核心目標是「提升 GMV(銷售額)」,而 GMV=流量×轉化率×客單價,就可以圍繞提升轉化率、客單價等指標出發去尋找解決方案。
           
            判斷是否重要
           
            有預判類的問題,可以直接尋找指標評估驗證結果可靠與否即可。
           
            無預判類(發現問題或機會)的則可以通過評估該問題解決后,能夠對最重要的商業目標帶來的增益會有多大。例如,上述提升 GMV 的案例中,通過橫向對比相同類頁面的數據,發現此頁面的轉化率為 1.8%,明顯低于同類頁面 4.7% 的轉化率,而流量和客單價與同類頁面基本持平,故判斷轉化率極有可能是「提升 GMV(銷售額)」的關鍵點,所以可定義「提升轉化率的關鍵因素是什么」為此頁面數據分析的重要問題。
           
            定義X問題
           
            可以根據不同的類型用一個問句來表達,如何/哪種/是否/原因是什么等。根據經驗,細化之后的常見問題有以下幾類,每類都可以用一個 X 問題來描述。
           
          • 實驗驗證類,已經有了假設和方案,待驗證效果,如 A\B\C 三種策略,哪種效果更有利于提升轉化率或策略 A 是否有助于提升轉化率;
          • 尋找原因類,看到了某現象,希望尋找背后的原因,如導致跳失率急劇上升的原因是什么;
          • 結果呈現類,不帶預判的呈現事實,如通過數據呈現項目 D 的轉化與售賣情況;
          • 預測類,通過尋找事物發生的規律,來預測接下來可能發生的事件,如一年之中用戶購買美妝用品是否存在時間上的購買規律,美妝類目運營可依據此規律來制定年度活動計劃。
           
            注意
           
            問題的范圍不可過于寬泛。往往要得出一個可靠且明確的結論,會需要收集數據并將數據應用到一個可檢驗的假設身上。如果問題太寬泛,數據收集就會變得非常困難。舉個反例:「項目 D 的數據效果是否有變好」,這個例子中,「是否有變好」可能的方向有拉新效果是否有變好/銷售是否有變好/跳失情況有變好等非常多種方向,每個方向都做探索將使你本次分析駛入無邊大海迷失方向。但也不要過早地限制問題范圍,剛開始時,可以開放性地思考問題,在腦中形成一些可供選擇的方向。例如,「可能帶來 D 項目的銷售變好的可能情況是 1、2、3,通過初步數據來看 3 的可能性會更高一些」,然后就可以往 3 的方向深入分析下去了。
           
            2. 提出假設,選擇指標
           
            在上一步中,我們已經明確了 X 問題,即數據分析的目標。接下來,我們將圍繞 X 問題,提出該問題的結論假設,并建立模型(選擇衡量指標)來驗證假設是否成立。
           
            提出假設
           
            針對有預設的問題,假設可以直接來源于問題,如方案 A 有助于提升轉化率。對于沒有實現預設的問題,則需要我們圍繞問題進行窮舉可能的假設,如頁面 E 的跳失率急劇下降,可能原因有:
           
          • 流量來源的用戶質量變差了;
          • 流量入口放錯了信息,導致用戶進入后預期不符;
          • 首屏商品選品問題;
          • 首屏信息設計用戶無法理解/無吸引力;
          • 頁面加載出現問題等。
          • 根據假設,選擇衡量指標
           
            不同類型的假設,衡量方式會不一樣,有些假設可能還需要定性調研配合來驗證。在電商定量數據范圍來看,可以參考以下思路:
           
          • 關于流量的假設,可選取流量相關的指標如瀏覽 UV/PV、各渠道流量來源 UV/PV;
          • 關于銷售類的假設,可選取訂單相關的指標,如引入訂單金額、引入訂單數量、轉化率、UV 價值;
          • 關于用戶行為的假設,可以選取頁面操作相關的指標,如點擊 UV/PV、頁面點擊率、曝光點擊率、人均點擊次數、瀏覽深度等;
          • 關于用戶人群的假設,可以選取用戶畫像數據,如性別、年齡、城市線級、新老用戶等,且可同時結合頁面操作數據進行細化人群行為分析。
           
            3. 數據采集與整理
           
            數據源分為定量數據和定性數據,定性數據更偏用研方法,本文將注重講定量數據的采集與整理。
           
            數據采集
           
            各平臺的原始數據正在進入指數級爆炸的階段,僅從電商平臺來看,各類數據指標都非常的多而復雜。在采集之前的一個階段,必不可少的是與數據產品或開發人員明確:數據指標的計算規則以及需要的數據指標列表(包括對應的時間段、平臺端),防止等到要提數的時候結果發現沒有數據或者數據計算方式不合理。
           
            數據整理
           
            數據整理的第一步是數據清洗,原始的數據表往往含有不少臟數據,如測試數據、異常值、空缺等等,直接用來計算分析可能會導致數據結論有偏差或無法計算。數據清洗就是要將原始數據表處理成可方便計算分析的干凈整潔的數據表。主要包括:
           
          • 刪除重復數據,可通過 Excel 的 COUNTIF 函數或者篩選排序來進行操作;
          • 檢查數據格式,原始數據里可能會有特殊格式如 N/A、####、性別為數值等情況,可根據實際情況判斷如何處理;
          • 檢查異常數據,可以著重關注極小值和極大值,小數點,負數等,明顯不符合實際情況的,可以排查原因,選擇刪除或重新提取數據;
          • 處理缺失數據,這個最常見的情況,一般情況可接受的標準是缺失值在 10% 以下,超過就需要酌情看是否有辦法重新提取了;
          • 檢查數據邏輯錯誤,可以抽樣選取數據進行計算檢查,如計算頁面點擊率=點擊 UV/頁面瀏覽 UV,假如算出頁面點擊率大于100%,就可能是有數據異常了,需要重新排查指標統計方式是否正確等。
           
            數據加工計算
           
            數據整理好之后,可以進行初始的數據加工了。因為原始數據可能并不符合我們的分析需求,比如,我們想看的是某模塊的數據,但原始數據是拆成每一個點擊位的數據,我們就需要把每個點擊位的數據進行求和等操作,轉化成模塊數據。還有一些常見的情況是利用標準的行業計算公式,將某幾個指標進行數理計算得到另一個指標,如訂單 UV 價值=GMV/頁面 UV、訂單轉化率=引入訂單數/頁面 UV、人均點擊次數=點擊 PV/點擊 UV等,通過這一步的操作,我們將能初步看到要驗證假設需要的一些基本指標的數據了。
           
            4. 數據分析
           
            數據整理完之后就到了真正的重頭戲——數據分析了,也是含金量最高的一步。做數據分析有一個非常基礎但又極其重要的思路,那就是對比,基本上 90% 以上的分析都離不開對比。沿著假設及衡量指標的思路,我們有了一個假設「X 策略可以提升 A 頁面轉化率」,且定義了此假設的衡量指標為「頁面轉化率」,當我們拿到頁面轉化率指標后,轉化率需要達到多少才算好呢?是否是因為 X 策略帶來的提升,還是可能是時間規律上的自然上漲?這時就可以通過對比來分析了。
           
          • 縱比:在時間維度上,對比頁面 A 在使用 X 策略后,頁面轉化率是否提升了?
          • 橫比:選取同時期的同類頁面-頁面 B,橫向對比老頁面 A、新頁面 A、B 三個頁面的轉化率對比情況。
          • 與經驗值對比:可以拉取更長的時間段,看 A 頁面的轉化率變化規律,看使用 X 策略是否高于時間規律上的預期值;可以選取更多同類頁面,選取同時期的轉化率對比,看 A 的轉化率處于哪個位置?與業務目標對比:假如大的業務目標其實是 GMV 為 2000w,在頁面瀏覽 UV 和 UV 價值穩定的情況下,計算目標轉化率=目標 GMV/頁面瀏覽 UV/UV 價值,然后對比目標轉化和目前轉化的差距。
          • 與業務目標對比:假如大的業務目標其實是 GMV 為 2000w,在頁面瀏覽 UV 和 UV 價值穩定的情況下,計算目標轉化率=目標 GMV/頁面瀏覽 UV/UV 價值,然后對比目標轉化和目前轉化的差距。
           
            各個角度的對比都能幫助你更清晰地理解目前指標的情況,然后就可以據此繼續做下一步計劃了。

          第三十屆CIO班招生
          法國布雷斯特商學院碩士班招生
          北達軟EXIN網絡空間與IT安全基礎認證培訓
          北達軟EXIN DevOps Professional認證培訓
          責編:baiyl
          亚洲香蕉视频在线播放-伊人大杳蕉青青视频-国产亚洲视频中文字幕