指標體系:指標的設(shè)計方法!附pdf

01 為什么要設(shè)計指標?



因為我們知道的太少。

不僅是Jon Snow,“我們真的知道的,比我們認為自己知道的,知道的少?!笔且粋€對于大多數(shù)人而言都普遍存在的現(xiàn)象。
251509bk-1.jpg

牽強附會加張 圖



而設(shè)計指標的目的就在于:讓我們了解更多。



具體而言,通過指標數(shù)值,可以在可接受的成本下,傳遞足夠多的信息。



設(shè)想一下:
中年危機老賈去醫(yī)院體檢,咨詢身體狀況如何;醫(yī)生說:“還行。有點問題。問題不大?!倍皇歉嬖V他血壓如何、體脂如何、血糖如何。
法外狂徒小藝被查酒駕,交警質(zhì)問他喝了多少;小藝說:“沒醉。喝了一點。喝的不多?!苯痪瘏s沒有一個血液酒精含量的指標,去判斷他是否醉駕,應該作何處罰。
霸道總裁阿餅例行月會詢問業(yè)績,負責銷售的副總說:“很棒。業(yè)績很好,賣了不少。”只字不提銷售總額、人均產(chǎn)能、業(yè)績趨勢。


“唉~”
倘若沒有指標這個工具,我們能獲得的信息,就會變得是非常有限的;或是獲取信息的成本變得極高。為了更好的使用這個工具,我們首先要了解“指標”的定義是什么。





02 什么是指標?



讓我們簡單的回憶一下:我們?nèi)粘W畛=佑|到的指標,像身高、體重、溫度、GDP。
它們的共性是什么?
——共性在于它們的載體都是數(shù)值。例如,身高180,體重154,溫度26,GDP14.7萬億。
它們的差別是什么?
 ——差別在于它們的含義各不相同。比方說,身高180(cm)和體重180(斤)的含義是截然不同的。
所以,指標是一個被定義的數(shù)值,用來對事實進行量化抽象。這個抽象過程可以是一次的,也可以是多次:
當一個事實比較簡單的時候,例如某個物品的輕重,我們用通過質(zhì)量這一個指標就可以衡量清楚。
但當一個事實更復雜一些的時候,例如一個人的胖瘦,也許僅僅是用質(zhì)量(體重)就不足以說明這個事實。這個時候我們可能會用BMI、體脂率等經(jīng)過了兩次抽象的指標。
當這個事實變得更加復雜,例如一個國家的經(jīng)濟狀況,我們會用GDP,這個一個進行了很多層復雜抽象、涉及到大量數(shù)據(jù)[1]的指標。甚至是僅僅一個指標也完全不足以描述出這個事實的重要特征;這時候就要設(shè)計一整套的指標體系,來量化這個復雜的事實。
251509bk-2.jpg

事實、數(shù)據(jù)、指標之間的關(guān)系



綜上所述,一個應該至少包含4個要素:
名稱:指標名稱要清晰明確,避免歧義,降低溝通成本。
責任人:責任人要保證指標可維護、可運營。
含義:指標含義要描述的是“被量化的事實”;例如——這個指標是在什么場景下?為了什么目的?刻畫了什么事實?
口徑:指標口徑要保證我們能及時地、準確地取到所需的“數(shù)值”;例如——這個指標是如何計算的?所需的數(shù)據(jù)從哪獲?。揩@取的時效如何?
當然僅僅知道什么是指標是遠遠不夠的,還要知道怎么去生成一個指標。
03 如何設(shè)計一個指標?



1、指標設(shè)計的過程與分類

結(jié)合統(tǒng)計與數(shù)據(jù)治理視角,我們可以將指標的設(shè)計過程分為三個步驟:抽象、加工、限定。
251509bk-3.jpg

指標的生成過程



數(shù)據(jù)經(jīng)過初步抽象,形成原子指標,即絕對數(shù)指標。例如:保費、客戶數(shù)、用戶量。



原子指標經(jīng)過三種加工方式,形成衍生指標。例如:升學率、平均客單價、滬深300。這3種加工方式分別為:進行對比、計算統(tǒng)計量、指數(shù)設(shè)計(結(jié)合對比和統(tǒng)計計算)。



當我們對原子指標和衍生指標,進行維度限定的時候,就形成了派生指標。

251509bk-4.jpg

指標類型

這里對原子指標、相對指標以及統(tǒng)計量指標的使用做一個簡單的介紹:



原子指標記錄事實:根據(jù)指標的定義,指標是一個被定義的數(shù)值,用來對事實進行量化抽象。這個量化過程的起點是傳感器、數(shù)字化等;然后是日志、記錄、標簽等;進入指標匯總層面的第一步就是原子指標。我們通過原子指標來記錄事實,例如訪問的次數(shù)、出行的距離、消費的金額等等。所以當我們需要記錄一些基本事實的時候,我們設(shè)計一個原子指標來量化它們。



相對指標用于評價:我們通過原子指標,記錄下了一堆的事實。緊接著,我們要做的就是對這些事實進行評價。常說“沒有比較就沒有傷害?!睘槭裁礇]有傷害呢?因為沒有比較,就很難做評價,進而我們也不知道自己是好是壞。所以當我們需要評價一些事實的時候,我們設(shè)計一個相對指標來量化它們。



當我們要評價一件事對整體的影響的時候,我們可以用比例相對數(shù);例如:市場占有率。
當我們要評價同一個事物在不同維度下的差異程度的時候,我們可以用比較相對數(shù);例如:TGI、男女比例。
當我們要評價兩個不同事物之間的關(guān)聯(lián)的時候,我們可以用強度相對數(shù);例如:投訴發(fā)起強度、退款發(fā)起強度。
當我們要評價計劃的完成情況的時候,我們可以用完成相對數(shù),例如:銷售額完成進度。


統(tǒng)計數(shù)指標提煉信息:有時候,我們會有非常多的記錄或指標。它們蘊含著非常多的信息,但是價值的密度卻很有限。這個時候就可用通過一些統(tǒng)計的方式,提煉其中的信息價值。例如我們有數(shù)以千萬記的用戶的月均消費金額,這時候可以通過統(tǒng)計分位置的方式對我們客戶整體的消費能力做一個刻畫。

2、指標的尺度特性

不同的指標,還會具有不同的尺度特性。根據(jù)可比程度的不同,我們可以將指標劃分為4個測量尺度:定比尺度、定距離尺度、定序尺度和名義尺度。

                       名義尺度   定序尺度   定距尺度   定比尺度

類別區(qū)別               √             √              √             √

次序區(qū)別                              √              √             √

距離區(qū)別                                              √             √

比例區(qū)別                                                             √



指標尺度的特性是我們必須要了解清楚的,因為低尺度的指標不能使用高尺度的數(shù)據(jù)運算進行處理。這里舉2個反例說明以下,如果沒有弄清楚指標的尺度特性會導致什么問題:

定距尺度不能直接做乘除:
例如溫度就是一個典型定距尺度,“20度有10度的2倍那么熱,是一個非常令人困惑的表述?!?br>定比尺度具有絕對起點“0點”;而定距尺度沒有絕對起點,定距尺度的“0點”是人工計算出來的。換言之,定比尺度的指標,本身和零點的差是有意義的。但,定距尺度,之間的差才是有意義的。這就導致了,定比尺度可以直接和自然數(shù)做乘除法,但定距尺度不可以。
定序尺度不能直接做加減:
滿意度評分就是一個典型的定序尺度。如果消費者給A酒店的評分是5分,B酒店的評分是3分,C酒店的評分是1分。很可能這并不意味著,A比B酒店好的程度與B酒店比A酒店好的程度相等。實際情況可能是 ,大多數(shù)的酒店都在4分左右,而5分是非常棒的;1、2、3分的酒店都乏善可陳,甚至體驗很差。
因為定距尺度之間的距離是精確定義了的,而定序尺度沒有。所以定序尺度只能比較大小,而不能夠進行直接的加減。
雖然很多場景下,我們都會用平均滿意度來衡量客戶的滿意情況。但我們會發(fā)現(xiàn)這樣的使用方法,存在一些問題,例如說沒有區(qū)分度等。這些問題中,有一部分就是由于“定序尺度”的特性帶來的。
3、指標的時間特征
在指標設(shè)計的過程中,時間是一個非常重要的因素。由于多個事實的發(fā)生時間之間的異步性,以及事實發(fā)生時間與指標計算時間之間的異步性,導致不同的時間統(tǒng)計口徑會對指標產(chǎn)生重大的影響。

多個事實發(fā)生時間之間的異步性:

一個件事通常在一件事發(fā)生后一段時間,才會發(fā)生,或者才會被觀測到。例如訂單退款必須在下單支付之后才能發(fā)生;退房必須在入住酒店之后才能發(fā)生,且存在著一定的時間差。

事實發(fā)生與指標計算之間的異步性:

一個事實發(fā)生與這個事實被計算(為指標)之間通常存在著時間差。
例如,一個消費者1分鐘內(nèi)在APP上(生產(chǎn)環(huán)境下)下了20筆訂單。但可能在1個小時后,才能在后臺數(shù)據(jù)庫中查詢到這20筆增量的訂單記錄。這種情況的發(fā)生可能是由于任務(wù)調(diào)度的設(shè)置導致的,也可能是由于技術(shù)能力的限制導致的。

再舉個例子,應該幾個月前,知乎在創(chuàng)作中心中統(tǒng)計的閱讀量還是日頻刷新的。現(xiàn)在也僅僅做到了小時刷新。

這樣的刷新頻次可能在“創(chuàng)作中心”的業(yè)務(wù)場景下是可接受的,但在很多其他的業(yè)務(wù)場景下(例如短視頻推薦),是不可接受的。為了解決以上業(yè)務(wù)場景的問題,我們就需要采取流計算的技術(shù),來提高數(shù)據(jù)生產(chǎn)的時效性。

事實間的“異步性”和事實與計算間的“異步性”,會影響指標反饋信息的“及時性”與對事實抽象的“準確性”。

總的來說,我們希望指標在保證一定準確性的前提下,越及時越好。為了達成這個目標,我們需要慎重的考慮兩個時間特征:“T+n”和“時間切片 v.s. 關(guān)聯(lián)綁定”

251509bk-5.jpg
“T+n”與“時間切片統(tǒng)計”、“關(guān)聯(lián)綁定統(tǒng)計”的示意說明

"T+n":
T+n中的n應該設(shè)置為什么更為合適,是1天、3天還是5天;1小時、2小時還是5分鐘。

舉個例子,保險公司要衡量保單的品質(zhì),即有沒有賣給消費者他們所需要的產(chǎn)品。那么用什么指標來衡量更為合適呢?

大家可能會想到“退保率”。但是退保率該如何計算呢?嚴格來說,一筆保單在其合同約定的期限內(nèi)的任意一天都是可以退保的。所以,從完全準確的角度出發(fā),如果某個保險產(chǎn)品的合同期為20年,那么應該統(tǒng)計20年零1天前所有保單的退款率,即T+20y。

但是,這顯然是不現(xiàn)實的。因為“及時性”太差了,完全不可運營。

因此,我們要設(shè)計一個更恰當?shù)臅r間特征n。假設(shè),現(xiàn)在我們知道保險的猶豫期大約是10~15天,也許在平衡“及時性”與“準確性”之后,退款率的設(shè)計就會是“T+15d”計算。

“時間切片 v.s. 關(guān)聯(lián)綁定”:

我們在計算相對指標的時候,應該以什么樣的方式進行對比?舉個例子,運營常用的流程分析,AAARR(獲取、激活、留存、收益、傳播)。

通常使用這套方法去做運營分析,就要計算激活率、留存率、消費轉(zhuǎn)化率等等一系列的指標。如果我們要計算這類指標就存在一個選擇,是使用時間切片的方式去計算激活率嗎?即:今日的激活率 = 今天獲取的用戶量 / 今天激活的用戶量。

但是思考一下:今天激活的用戶中,有沒有昨天獲取的用戶呢?有沒有前天獲取的用戶呢?有沒有去年獲取的用戶呢?顯然是有的。

而我們在使用切片數(shù)據(jù)時,就可能導致一個現(xiàn)象,今天的激活率高,可能僅僅是因為今天獲取的用戶數(shù)少,而今天激活的用戶都是之前積累下來的。也就是說,有可能轉(zhuǎn)化率高,是件壞事。

那么,是不是為了準確性,就用關(guān)聯(lián)綁定的方式去設(shè)計指標呢?即,計算激活率的時候,應該圈定某天獲取的那些用戶,看這些用戶中有多少激活了。

例如,今天計算“T+7d ”前獲取的用戶中的激活率是多少。如果采取這樣的方式,我們就回到了問題1:“n”應該如何選擇。

綜上所述,當我們遇到一個量化的問題,就從上述的指標類型中選取一種設(shè)計方法,完成指標的設(shè)計工作。接下來我們要做的,就是去衡量這個設(shè)計的好壞。

04 什么樣的指標算一個好的指標?

我們可以從4個維度去評價一個指標的優(yōu)劣:

1. 有效性:這個指標能不反映我們量化的事實?

例如,我們想要去衡量某個APP的用戶量有多少,應該用DAU,還是MAU?不同類型的APP可能有不同的選擇,對于外賣而言,每天的DAU可能都非常關(guān)鍵。而對于一個旅行類的APP而言,因為類目本身消費頻次的不同,可能MAU才是一個更能真實反映用戶數(shù)量的指標。

2. 可信性:反映事實的指標是不是穩(wěn)定的?
例如,人力部門設(shè)計了一套題庫去衡量應聘者的數(shù)據(jù)能力,希望通過測試題的分數(shù),去做出是否招聘某位同學的決定。那么對于同一個面試的同學而言,第一次參加數(shù)據(jù)能力測試,和第二次參加數(shù)據(jù)能力測試的分數(shù)應該是相近的。

3. 敏感性:事實的變化,能否被指標敏感的捕捉到,并反映出來?
例如,對于酒店住宿預訂而言,到酒店前臺卻沒有空房可以入住,是一種非常糟糕的用戶體驗。但也是一個非常低頻發(fā)生的情況。那么是否應該用“到店無房發(fā)生率”來追蹤這個問題就是一個值得思考的問題。同理,對于輿情監(jiān)控,是應該用絕對數(shù)指標來監(jiān)控,還是比例指標來監(jiān)控更好呢?

4. 可運營:這個指標能否被用于日常的運營,及時的幫助我們謀求改善?

例如,越來越多的公司因為對客戶忠誠度的重視,開始用NPS(客戶凈推薦值)來衡量客戶的感受。但是如果僅僅有這個主觀指標,當NPS降低了10%的時候,公司應該如何去提升用戶的忠誠度呢?


最后:小結(jié)一下

使用指標的原因:指標可以幫助我們低成本的獲取更多信息。
指標的定義:指標是一個被定義的數(shù)值,用來對事實進行量化抽象。
指標設(shè)計的4個要素:名稱、責任人、含義、口徑。
指標設(shè)計的3個過程:通過抽象、加工、限定,我們可以將數(shù)據(jù)轉(zhuǎn)化為原子指標、衍生指標和派生指標。衍生指標是原子指標經(jīng)過運算的結(jié)果,派生指標是原子指標和衍生指標經(jīng)過維度限定的結(jié)果。
衡量指標設(shè)計好壞的4個標準:有效性、可信性、敏感性、是否可運營。



作者:薛秋艷


歡迎關(guān)注微信公眾號 :大數(shù)據(jù)球球