指標(biāo)體系:指標(biāo)的設(shè)計(jì)方法!附pdf
01 為什么要設(shè)計(jì)指標(biāo)?
因?yàn)槲覀冎赖奶佟?br>
不僅是Jon Snow,“我們真的知道的,比我們認(rèn)為自己知道的,知道的少?!笔且粋€(gè)對(duì)于大多數(shù)人而言都普遍存在的現(xiàn)象。
牽強(qiáng)附會(huì)加張 圖
而設(shè)計(jì)指標(biāo)的目的就在于:讓我們了解更多。
具體而言,通過指標(biāo)數(shù)值,可以在可接受的成本下,傳遞足夠多的信息。
設(shè)想一下:
中年危機(jī)老賈去醫(yī)院體檢,咨詢身體狀況如何;醫(yī)生說:“還行。有點(diǎn)問題。問題不大。”而不是告訴他血壓如何、體脂如何、血糖如何。
法外狂徒小藝被查酒駕,交警質(zhì)問他喝了多少;小藝說:“沒醉。喝了一點(diǎn)。喝的不多?!苯痪瘏s沒有一個(gè)血液酒精含量的指標(biāo),去判斷他是否醉駕,應(yīng)該作何處罰。
霸道總裁阿餅例行月會(huì)詢問業(yè)績,負(fù)責(zé)銷售的副總說:“很棒。業(yè)績很好,賣了不少?!敝蛔植惶徜N售總額、人均產(chǎn)能、業(yè)績趨勢(shì)。
“唉~”
倘若沒有指標(biāo)這個(gè)工具,我們能獲得的信息,就會(huì)變得是非常有限的;或是獲取信息的成本變得極高。為了更好的使用這個(gè)工具,我們首先要了解“指標(biāo)”的定義是什么。
02 什么是指標(biāo)?
讓我們簡(jiǎn)單的回憶一下:我們?nèi)粘W畛=佑|到的指標(biāo),像身高、體重、溫度、GDP。
它們的共性是什么?
——共性在于它們的載體都是數(shù)值。例如,身高180,體重154,溫度26,GDP14.7萬億。
它們的差別是什么?
——差別在于它們的含義各不相同。比方說,身高180(cm)和體重180(斤)的含義是截然不同的。
所以,指標(biāo)是一個(gè)被定義的數(shù)值,用來對(duì)事實(shí)進(jìn)行量化抽象。這個(gè)抽象過程可以是一次的,也可以是多次:
當(dāng)一個(gè)事實(shí)比較簡(jiǎn)單的時(shí)候,例如某個(gè)物品的輕重,我們用通過質(zhì)量這一個(gè)指標(biāo)就可以衡量清楚。
但當(dāng)一個(gè)事實(shí)更復(fù)雜一些的時(shí)候,例如一個(gè)人的胖瘦,也許僅僅是用質(zhì)量(體重)就不足以說明這個(gè)事實(shí)。這個(gè)時(shí)候我們可能會(huì)用BMI、體脂率等經(jīng)過了兩次抽象的指標(biāo)。
當(dāng)這個(gè)事實(shí)變得更加復(fù)雜,例如一個(gè)國家的經(jīng)濟(jì)狀況,我們會(huì)用GDP,這個(gè)一個(gè)進(jìn)行了很多層復(fù)雜抽象、涉及到大量數(shù)據(jù)[1]的指標(biāo)。甚至是僅僅一個(gè)指標(biāo)也完全不足以描述出這個(gè)事實(shí)的重要特征;這時(shí)候就要設(shè)計(jì)一整套的指標(biāo)體系,來量化這個(gè)復(fù)雜的事實(shí)。
事實(shí)、數(shù)據(jù)、指標(biāo)之間的關(guān)系
綜上所述,一個(gè)應(yīng)該至少包含4個(gè)要素:
名稱:指標(biāo)名稱要清晰明確,避免歧義,降低溝通成本。
責(zé)任人:責(zé)任人要保證指標(biāo)可維護(hù)、可運(yùn)營。
含義:指標(biāo)含義要描述的是“被量化的事實(shí)”;例如——這個(gè)指標(biāo)是在什么場(chǎng)景下?為了什么目的?刻畫了什么事實(shí)?
口徑:指標(biāo)口徑要保證我們能及時(shí)地、準(zhǔn)確地取到所需的“數(shù)值”;例如——這個(gè)指標(biāo)是如何計(jì)算的?所需的數(shù)據(jù)從哪獲取?獲取的時(shí)效如何?
當(dāng)然僅僅知道什么是指標(biāo)是遠(yuǎn)遠(yuǎn)不夠的,還要知道怎么去生成一個(gè)指標(biāo)。
03 如何設(shè)計(jì)一個(gè)指標(biāo)?
1、指標(biāo)設(shè)計(jì)的過程與分類
結(jié)合統(tǒng)計(jì)與數(shù)據(jù)治理視角,我們可以將指標(biāo)的設(shè)計(jì)過程分為三個(gè)步驟:抽象、加工、限定。
指標(biāo)的生成過程
數(shù)據(jù)經(jīng)過初步抽象,形成原子指標(biāo),即絕對(duì)數(shù)指標(biāo)。例如:保費(fèi)、客戶數(shù)、用戶量。
原子指標(biāo)經(jīng)過三種加工方式,形成衍生指標(biāo)。例如:升學(xué)率、平均客單價(jià)、滬深300。這3種加工方式分別為:進(jìn)行對(duì)比、計(jì)算統(tǒng)計(jì)量、指數(shù)設(shè)計(jì)(結(jié)合對(duì)比和統(tǒng)計(jì)計(jì)算)。
當(dāng)我們對(duì)原子指標(biāo)和衍生指標(biāo),進(jìn)行維度限定的時(shí)候,就形成了派生指標(biāo)。
指標(biāo)類型
這里對(duì)原子指標(biāo)、相對(duì)指標(biāo)以及統(tǒng)計(jì)量指標(biāo)的使用做一個(gè)簡(jiǎn)單的介紹:
原子指標(biāo)記錄事實(shí):根據(jù)指標(biāo)的定義,指標(biāo)是一個(gè)被定義的數(shù)值,用來對(duì)事實(shí)進(jìn)行量化抽象。這個(gè)量化過程的起點(diǎn)是傳感器、數(shù)字化等;然后是日志、記錄、標(biāo)簽等;進(jìn)入指標(biāo)匯總層面的第一步就是原子指標(biāo)。我們通過原子指標(biāo)來記錄事實(shí),例如訪問的次數(shù)、出行的距離、消費(fèi)的金額等等。所以當(dāng)我們需要記錄一些基本事實(shí)的時(shí)候,我們?cè)O(shè)計(jì)一個(gè)原子指標(biāo)來量化它們。
相對(duì)指標(biāo)用于評(píng)價(jià):我們通過原子指標(biāo),記錄下了一堆的事實(shí)。緊接著,我們要做的就是對(duì)這些事實(shí)進(jìn)行評(píng)價(jià)。常說“沒有比較就沒有傷害。”為什么沒有傷害呢?因?yàn)闆]有比較,就很難做評(píng)價(jià),進(jìn)而我們也不知道自己是好是壞。所以當(dāng)我們需要評(píng)價(jià)一些事實(shí)的時(shí)候,我們?cè)O(shè)計(jì)一個(gè)相對(duì)指標(biāo)來量化它們。
當(dāng)我們要評(píng)價(jià)一件事對(duì)整體的影響的時(shí)候,我們可以用比例相對(duì)數(shù);例如:市場(chǎng)占有率。
當(dāng)我們要評(píng)價(jià)同一個(gè)事物在不同維度下的差異程度的時(shí)候,我們可以用比較相對(duì)數(shù);例如:TGI、男女比例。
當(dāng)我們要評(píng)價(jià)兩個(gè)不同事物之間的關(guān)聯(lián)的時(shí)候,我們可以用強(qiáng)度相對(duì)數(shù);例如:投訴發(fā)起強(qiáng)度、退款發(fā)起強(qiáng)度。
當(dāng)我們要評(píng)價(jià)計(jì)劃的完成情況的時(shí)候,我們可以用完成相對(duì)數(shù),例如:銷售額完成進(jìn)度。
統(tǒng)計(jì)數(shù)指標(biāo)提煉信息:有時(shí)候,我們會(huì)有非常多的記錄或指標(biāo)。它們蘊(yùn)含著非常多的信息,但是價(jià)值的密度卻很有限。這個(gè)時(shí)候就可用通過一些統(tǒng)計(jì)的方式,提煉其中的信息價(jià)值。例如我們有數(shù)以千萬記的用戶的月均消費(fèi)金額,這時(shí)候可以通過統(tǒng)計(jì)分位置的方式對(duì)我們客戶整體的消費(fèi)能力做一個(gè)刻畫。
2、指標(biāo)的尺度特性
不同的指標(biāo),還會(huì)具有不同的尺度特性。根據(jù)可比程度的不同,我們可以將指標(biāo)劃分為4個(gè)測(cè)量尺度:定比尺度、定距離尺度、定序尺度和名義尺度。
名義尺度 定序尺度 定距尺度 定比尺度
類別區(qū)別 √ √ √ √
次序區(qū)別 √ √ √
距離區(qū)別 √ √
比例區(qū)別 √
指標(biāo)尺度的特性是我們必須要了解清楚的,因?yàn)榈统叨鹊闹笜?biāo)不能使用高尺度的數(shù)據(jù)運(yùn)算進(jìn)行處理。這里舉2個(gè)反例說明以下,如果沒有弄清楚指標(biāo)的尺度特性會(huì)導(dǎo)致什么問題:
定距尺度不能直接做乘除:
例如溫度就是一個(gè)典型定距尺度,“20度有10度的2倍那么熱,是一個(gè)非常令人困惑的表述?!?br>定比尺度具有絕對(duì)起點(diǎn)“0點(diǎn)”;而定距尺度沒有絕對(duì)起點(diǎn),定距尺度的“0點(diǎn)”是人工計(jì)算出來的。換言之,定比尺度的指標(biāo),本身和零點(diǎn)的差是有意義的。但,定距尺度,之間的差才是有意義的。這就導(dǎo)致了,定比尺度可以直接和自然數(shù)做乘除法,但定距尺度不可以。
定序尺度不能直接做加減:
滿意度評(píng)分就是一個(gè)典型的定序尺度。如果消費(fèi)者給A酒店的評(píng)分是5分,B酒店的評(píng)分是3分,C酒店的評(píng)分是1分。很可能這并不意味著,A比B酒店好的程度與B酒店比A酒店好的程度相等。實(shí)際情況可能是 ,大多數(shù)的酒店都在4分左右,而5分是非常棒的;1、2、3分的酒店都乏善可陳,甚至體驗(yàn)很差。
因?yàn)槎ň喑叨戎g的距離是精確定義了的,而定序尺度沒有。所以定序尺度只能比較大小,而不能夠進(jìn)行直接的加減。
雖然很多場(chǎng)景下,我們都會(huì)用平均滿意度來衡量客戶的滿意情況。但我們會(huì)發(fā)現(xiàn)這樣的使用方法,存在一些問題,例如說沒有區(qū)分度等。這些問題中,有一部分就是由于“定序尺度”的特性帶來的。
3、指標(biāo)的時(shí)間特征
在指標(biāo)設(shè)計(jì)的過程中,時(shí)間是一個(gè)非常重要的因素。由于多個(gè)事實(shí)的發(fā)生時(shí)間之間的異步性,以及事實(shí)發(fā)生時(shí)間與指標(biāo)計(jì)算時(shí)間之間的異步性,導(dǎo)致不同的時(shí)間統(tǒng)計(jì)口徑會(huì)對(duì)指標(biāo)產(chǎn)生重大的影響。
多個(gè)事實(shí)發(fā)生時(shí)間之間的異步性:
一個(gè)件事通常在一件事發(fā)生后一段時(shí)間,才會(huì)發(fā)生,或者才會(huì)被觀測(cè)到。例如訂單退款必須在下單支付之后才能發(fā)生;退房必須在入住酒店之后才能發(fā)生,且存在著一定的時(shí)間差。
事實(shí)發(fā)生與指標(biāo)計(jì)算之間的異步性:
一個(gè)事實(shí)發(fā)生與這個(gè)事實(shí)被計(jì)算(為指標(biāo))之間通常存在著時(shí)間差。
例如,一個(gè)消費(fèi)者1分鐘內(nèi)在APP上(生產(chǎn)環(huán)境下)下了20筆訂單。但可能在1個(gè)小時(shí)后,才能在后臺(tái)數(shù)據(jù)庫中查詢到這20筆增量的訂單記錄。這種情況的發(fā)生可能是由于任務(wù)調(diào)度的設(shè)置導(dǎo)致的,也可能是由于技術(shù)能力的限制導(dǎo)致的。
再舉個(gè)例子,應(yīng)該幾個(gè)月前,知乎在創(chuàng)作中心中統(tǒng)計(jì)的閱讀量還是日頻刷新的?,F(xiàn)在也僅僅做到了小時(shí)刷新。
這樣的刷新頻次可能在“創(chuàng)作中心”的業(yè)務(wù)場(chǎng)景下是可接受的,但在很多其他的業(yè)務(wù)場(chǎng)景下(例如短視頻推薦),是不可接受的。為了解決以上業(yè)務(wù)場(chǎng)景的問題,我們就需要采取流計(jì)算的技術(shù),來提高數(shù)據(jù)生產(chǎn)的時(shí)效性。
事實(shí)間的“異步性”和事實(shí)與計(jì)算間的“異步性”,會(huì)影響指標(biāo)反饋信息的“及時(shí)性”與對(duì)事實(shí)抽象的“準(zhǔn)確性”。
總的來說,我們希望指標(biāo)在保證一定準(zhǔn)確性的前提下,越及時(shí)越好。為了達(dá)成這個(gè)目標(biāo),我們需要慎重的考慮兩個(gè)時(shí)間特征:“T+n”和“時(shí)間切片 v.s. 關(guān)聯(lián)綁定”
“T+n”與“時(shí)間切片統(tǒng)計(jì)”、“關(guān)聯(lián)綁定統(tǒng)計(jì)”的示意說明
"T+n":
T+n中的n應(yīng)該設(shè)置為什么更為合適,是1天、3天還是5天;1小時(shí)、2小時(shí)還是5分鐘。
舉個(gè)例子,保險(xiǎn)公司要衡量保單的品質(zhì),即有沒有賣給消費(fèi)者他們所需要的產(chǎn)品。那么用什么指標(biāo)來衡量更為合適呢?
大家可能會(huì)想到“退保率”。但是退保率該如何計(jì)算呢?嚴(yán)格來說,一筆保單在其合同約定的期限內(nèi)的任意一天都是可以退保的。所以,從完全準(zhǔn)確的角度出發(fā),如果某個(gè)保險(xiǎn)產(chǎn)品的合同期為20年,那么應(yīng)該統(tǒng)計(jì)20年零1天前所有保單的退款率,即T+20y。
但是,這顯然是不現(xiàn)實(shí)的。因?yàn)椤凹皶r(shí)性”太差了,完全不可運(yùn)營。
因此,我們要設(shè)計(jì)一個(gè)更恰當(dāng)?shù)臅r(shí)間特征n。假設(shè),現(xiàn)在我們知道保險(xiǎn)的猶豫期大約是10~15天,也許在平衡“及時(shí)性”與“準(zhǔn)確性”之后,退款率的設(shè)計(jì)就會(huì)是“T+15d”計(jì)算。
“時(shí)間切片 v.s. 關(guān)聯(lián)綁定”:
我們?cè)谟?jì)算相對(duì)指標(biāo)的時(shí)候,應(yīng)該以什么樣的方式進(jìn)行對(duì)比?舉個(gè)例子,運(yùn)營常用的流程分析,AAARR(獲取、激活、留存、收益、傳播)。
通常使用這套方法去做運(yùn)營分析,就要計(jì)算激活率、留存率、消費(fèi)轉(zhuǎn)化率等等一系列的指標(biāo)。如果我們要計(jì)算這類指標(biāo)就存在一個(gè)選擇,是使用時(shí)間切片的方式去計(jì)算激活率嗎?即:今日的激活率 = 今天獲取的用戶量 / 今天激活的用戶量。
但是思考一下:今天激活的用戶中,有沒有昨天獲取的用戶呢?有沒有前天獲取的用戶呢?有沒有去年獲取的用戶呢?顯然是有的。
而我們?cè)谑褂们衅瑪?shù)據(jù)時(shí),就可能導(dǎo)致一個(gè)現(xiàn)象,今天的激活率高,可能僅僅是因?yàn)榻裉飓@取的用戶數(shù)少,而今天激活的用戶都是之前積累下來的。也就是說,有可能轉(zhuǎn)化率高,是件壞事。
那么,是不是為了準(zhǔn)確性,就用關(guān)聯(lián)綁定的方式去設(shè)計(jì)指標(biāo)呢?即,計(jì)算激活率的時(shí)候,應(yīng)該圈定某天獲取的那些用戶,看這些用戶中有多少激活了。
例如,今天計(jì)算“T+7d ”前獲取的用戶中的激活率是多少。如果采取這樣的方式,我們就回到了問題1:“n”應(yīng)該如何選擇。
綜上所述,當(dāng)我們遇到一個(gè)量化的問題,就從上述的指標(biāo)類型中選取一種設(shè)計(jì)方法,完成指標(biāo)的設(shè)計(jì)工作。接下來我們要做的,就是去衡量這個(gè)設(shè)計(jì)的好壞。
04 什么樣的指標(biāo)算一個(gè)好的指標(biāo)?
我們可以從4個(gè)維度去評(píng)價(jià)一個(gè)指標(biāo)的優(yōu)劣:
1. 有效性:這個(gè)指標(biāo)能不反映我們量化的事實(shí)?
例如,我們想要去衡量某個(gè)APP的用戶量有多少,應(yīng)該用DAU,還是MAU?不同類型的APP可能有不同的選擇,對(duì)于外賣而言,每天的DAU可能都非常關(guān)鍵。而對(duì)于一個(gè)旅行類的APP而言,因?yàn)轭惸勘旧硐M(fèi)頻次的不同,可能MAU才是一個(gè)更能真實(shí)反映用戶數(shù)量的指標(biāo)。
2. 可信性:反映事實(shí)的指標(biāo)是不是穩(wěn)定的?
例如,人力部門設(shè)計(jì)了一套題庫去衡量應(yīng)聘者的數(shù)據(jù)能力,希望通過測(cè)試題的分?jǐn)?shù),去做出是否招聘某位同學(xué)的決定。那么對(duì)于同一個(gè)面試的同學(xué)而言,第一次參加數(shù)據(jù)能力測(cè)試,和第二次參加數(shù)據(jù)能力測(cè)試的分?jǐn)?shù)應(yīng)該是相近的。
3. 敏感性:事實(shí)的變化,能否被指標(biāo)敏感的捕捉到,并反映出來?
例如,對(duì)于酒店住宿預(yù)訂而言,到酒店前臺(tái)卻沒有空房可以入住,是一種非常糟糕的用戶體驗(yàn)。但也是一個(gè)非常低頻發(fā)生的情況。那么是否應(yīng)該用“到店無房發(fā)生率”來追蹤這個(gè)問題就是一個(gè)值得思考的問題。同理,對(duì)于輿情監(jiān)控,是應(yīng)該用絕對(duì)數(shù)指標(biāo)來監(jiān)控,還是比例指標(biāo)來監(jiān)控更好呢?
4. 可運(yùn)營:這個(gè)指標(biāo)能否被用于日常的運(yùn)營,及時(shí)的幫助我們謀求改善?
例如,越來越多的公司因?yàn)閷?duì)客戶忠誠度的重視,開始用NPS(客戶凈推薦值)來衡量客戶的感受。但是如果僅僅有這個(gè)主觀指標(biāo),當(dāng)NPS降低了10%的時(shí)候,公司應(yīng)該如何去提升用戶的忠誠度呢?
最后:小結(jié)一下
使用指標(biāo)的原因:指標(biāo)可以幫助我們低成本的獲取更多信息。
指標(biāo)的定義:指標(biāo)是一個(gè)被定義的數(shù)值,用來對(duì)事實(shí)進(jìn)行量化抽象。
指標(biāo)設(shè)計(jì)的4個(gè)要素:名稱、責(zé)任人、含義、口徑。
指標(biāo)設(shè)計(jì)的3個(gè)過程:通過抽象、加工、限定,我們可以將數(shù)據(jù)轉(zhuǎn)化為原子指標(biāo)、衍生指標(biāo)和派生指標(biāo)。衍生指標(biāo)是原子指標(biāo)經(jīng)過運(yùn)算的結(jié)果,派生指標(biāo)是原子指標(biāo)和衍生指標(biāo)經(jīng)過維度限定的結(jié)果。
衡量指標(biāo)設(shè)計(jì)好壞的4個(gè)標(biāo)準(zhǔn):有效性、可信性、敏感性、是否可運(yùn)營。
作者:薛秋艷
歡迎關(guān)注微信公眾號(hào) :大數(shù)據(jù)球球