數據質量:重拾數據信心的最佳方式
已發表: 2022-09-29企業收集數據以獲得基於證據的見解。 然而,75% 的關鍵決策者不信任他們的數據。 更重要的是,幾乎一半的員工仍然根據直覺做出決定。
但如果公司希望數據對收入和業務增長產生積極影響,則需要建立數據質量流程。 這些流程將使員工和決策者更有信心,並使他們在做出業務決策時能夠依靠數據。
關鍵要點
- 通過在收集點進行清理來提高數據質量。 這消除了清理數據的需要。
- 質量數據有七個主要維度:準確性、完整性、一致性、有效性、唯一性、完整性和及時性。
- 提高數據質量的四個過程是數據剖析、數據治理、數據清洗和數據標準化。 這些可以手動完成,但這樣做會打開人為錯誤的窗口。 像 Improvado 這樣的工具可以自動化並簡化這些過程。
- 除了使用質量維度來衡量數據質量之外,還可以將生產力和參與度指標添加到組合中,以實現全面的數據質量衡量過程。
- 數據質量有助於使營銷和銷售流程透明化並改善跨職能協作。
什麼是數據質量?
數據是新的石油。 就像未經提煉就沒有價值的石油一樣,數據在變得可用之前是毫無價值的。 不幸的是,數據很脆弱,很容易被污染。
數據質量確保不會發生這種情況。 這是評估數據、確保數據準確無誤並顯示您和您的企業感興趣的見解的正確圖像的過程。
什麼定義了數據質量?
有超過 60 個數據質量維度。 但是,在實踐中,大多數數據團隊都關心七個。
1. 準確性
這個數據質量維度是指數據的準確性和正確性。 準確性的目標是生成反映實際情況的無差錯數據。
這通常被認為是質量數據最重要的維度。
2. 完整性
當數據包括其預期目的所需的所有信息時,它被認為是完整的。 完整性可能因收集數據的目的而異。
例如,假設您收集數據的目標是將潛在客戶轉化為銷售。 如果營銷團隊只收集姓名和電子郵件——但銷售團隊需要電話號碼來進行演示電話——那麼你擁有的數據被認為是不完整的。
3. 一致性
跨不同數據庫的數據需要保持一致,以防止數據錯誤。
如果您的電子郵件營銷軟件記錄了客戶電子郵件地址的更改,則此更改也應反映在客戶關係管理 (CRM) 軟件中。 不這樣做可能會導致計費通知出現問題。
4. 有效期
數據有效性是指業務定義的數據值的一致性。
例如,一家歐洲企業可能會使用 dd-mm-yyyy 格式(2022 年 9 月 12 日)來格式化日期。 但是如果有人添加了一個使用 mm-dd-yyyy 格式(2022 年 9 月 12 日)書寫的條目,那麼這個數據就不再有效。
5. 獨特性
唯一性意味著在任何數據集中都沒有數據重複或重疊。
假設一個潛在客戶以 JH Watson 的身份註冊了一個鉛磁鐵。 如果他們在購買您的軟件時將自己的名字寫為 John H. Watson,則應將其作為一個人輸入到您的數據庫中。
6. 誠信
這個維度是指數據在整個生命週期中的保存,因為它在組織中的不同系統和部門中移動。 這也意味著有適當的流程來防止數據篡改。
7. 時效性
數據的及時性意味著數據在需要時隨時可用。
例如,應在會計師需要時準備好年度財務報表。 如果不是,則不符合數據時效維度的要求。
質量數據的好處
質量數據對組織的流程及其作為企業的整體價值具有積極影響。
當質量數據流程到位並傳達給決策者時,數據會得到更多使用,並最終成為業務決策和創新的基礎。
它提高了業務盈利能力和收入,因為決策者可以更快地獲得洞察力。 它還提高了業務績效,因為人們不會浪費時間來糾正和協調數據。
數據質量對銷售、營銷和客戶管理團隊的重要性
數據質量促進不同部門及其數據之間的一致性,同時防止任何錯誤或不一致。
這使得跨部門協作更容易。 所有銷售和營銷工作都是透明的,每個人都可以宏觀和微觀地了解客戶及其整個生命週期的旅程。
當數據處理不到位時可能發生的最壞情況是什麼?
我們聽說過很多企業因為糟糕的數據而陷入困境。
例如,三星承認,當一名員工因數據安全措施不善而犯錯時,三星損失了 1050 億美元。 由於會計錯誤,優步多年來一直少付司機。 美國郵政服務在處理無法投遞的電子郵件上花費了大約 15 億美元。
我們聽到的許多關於營銷和銷售團隊因不良數據而發生事故的故事怎麼樣? 一些常見的包括:
- 營銷團隊正在發送標籤錯誤的電子郵件——至少破壞了品牌信任。
- PPC 團隊瞄準了錯誤的細分市場——最終成本非常高。
- 銷售團隊撥打了不正確或不存在的電話號碼,影響了他們的效率。
- 由於重複輸入,客戶服務團隊向客戶開出了兩次賬單,這導致客戶很生氣。
所有這些都清楚地表明,糟糕的數據會給企業帶來多大的麻煩。
這就是為什麼質量數據必須成為任何使用數據作為業務決策和活動基石的企業的優先事項。 質量數據將讓他們準確了解他們所做的事情、可能發生的事情以及他們可以做些什麼來增加收入。
如何衡量數據質量
目前,還沒有衡量數據質量的既定標準。 組織必須制定他們的指導方針,並建立關於數據管理和治理的基線和期望。
通常,數據質量維度用作度量。 根據行業或數據集的目的,每個指標都被分配了一個權重和重要性級別。 例如,金融行業更重視有效性,而製藥行業則優先考慮準確性。
Mikkel Dengse 建議超越衡量數據質量的範圍,並將生產力和參與度指標添加到組合中。
生產力衡量花費在數據管理上的時間的效率,而參與度則確保在最終用戶需要時可以使用數據報告。
如何提高數據質量
首先,每個與數據打交道的人都需要對數據質量負全部責任。 這包括數據創建者(創建數據的人)和數據用戶(使用數據的人)。
數據用戶應該清楚地傳達他們需要什麼類型的數據,以便數據創建者可以專注於提供滿足這些需求的數據。
一旦清楚這一點,您就可以繼續提高數據質量。
但你從哪兒開始呢?
為了提高數據質量,您應該從根本上開始,只允許高質量的數據進入您的數據庫。 這減少了(如果不是消除的話)對數據質量檢查的需求。
但這引出了一個問題:您已經擁有的數據呢? 你怎麼清洗它?
這裡有四個數據改進流程,用於糾正當前數據的任何質量問題。
數據分析
數據剖析是提高數據質量的第一步。 這是審查和檢查數據以解決任何錯誤、缺失信息或冗餘的過程。
當手動完成時,該過程可能既耗時又成本高,更不用說容易出現人為錯誤。 但是,數據集成工具可以加快和提高流程的準確性。
數據治理
在處理公司數據時,必須為組織中的人員分配特定角色。
這就是數據治理的作用——組織和管理數據的過程,以便規則清楚地說明誰可以訪問它、他們可以採取什麼行動以及他們可以使用什麼方法。 這最大限度地減少了人為錯誤,同時為人們提供了足夠的訪問權限來完成他們的工作。
數據清理
不再服務於業務目標的數據需要通過數據清理來刪除,否則會污染您的數據。 此過程會刪除冗餘、不准確和不完整的數據。
數據標準化
數據可以來自許多不同的來源。 例如,對於營銷和銷售團隊,數據可能來自您的電子郵件軟件、Google Analytics、CRM 工具以及 Facebook 和 Google Ads 等廣告平台。
通過數據標準化,您可以對齊從這些不同地方收集的所有數據並防止數據不一致。 這使得部門間的協作和洞察力共享更加順暢和快捷。
標準化數據的一種簡單方法是使用 Improvado 等自動化工具,該工具從 300 多個營銷和銷售來源中提取數據。
到你了
我們生活在一個數據驅動的世界。 擁有高質量數據並知道如何處理數據的企業享有許多好處。 他們是那些可以更快地擴展並將所有競爭對手拋在後面的人。
如果您仍然沒有適當的數據質量管理 - 現在是投資數據質量的最佳時機。