数据质量:重拾数据信心的最佳方式
已发表: 2022-09-29企业收集数据以获得基于证据的见解。 然而,75% 的关键决策者不信任他们的数据。 更重要的是,几乎一半的员工仍然根据直觉做出决定。
但如果公司希望数据对收入和业务增长产生积极影响,则需要建立数据质量流程。 这些流程将使员工和决策者更有信心,并使他们在做出业务决策时能够依靠数据。
关键要点
- 通过在收集点进行清理来提高数据质量。 这消除了清理数据的需要。
- 质量数据有七个主要维度:准确性、完整性、一致性、有效性、唯一性、完整性和及时性。
- 提高数据质量的四个过程是数据剖析、数据治理、数据清洗和数据标准化。 这些可以手动完成,但这样做会打开人为错误的窗口。 像 Improvado 这样的工具可以自动化并简化这些过程。
- 除了使用质量维度来衡量数据质量之外,还可以将生产力和参与度指标添加到组合中,以实现全面的数据质量衡量过程。
- 数据质量有助于使营销和销售流程透明化并改善跨职能协作。
什么是数据质量?
数据是新的石油。 就像未经提炼就没有价值的石油一样,数据在变得可用之前是毫无价值的。 不幸的是,数据很脆弱,很容易被污染。
数据质量确保不会发生这种情况。 这是评估数据、确保数据准确无误并显示您和您的企业感兴趣的见解的正确图像的过程。
什么定义了数据质量?
有超过 60 个数据质量维度。 但是,在实践中,大多数数据团队都关心七个。
1. 准确性
这个数据质量维度是指数据的准确性和正确性。 准确性的目标是生成反映实际情况的无差错数据。
这通常被认为是质量数据最重要的维度。
2. 完整性
当数据包括其预期目的所需的所有信息时,它被认为是完整的。 完整性可能因收集数据的目的而异。
例如,假设您收集数据的目标是将潜在客户转化为销售。 如果营销团队只收集姓名和电子邮件——但销售团队需要电话号码来进行演示电话——那么你拥有的数据被认为是不完整的。
3. 一致性
跨不同数据库的数据需要保持一致,以防止数据错误。
如果您的电子邮件营销软件记录了客户电子邮件地址的更改,则此更改也应反映在客户关系管理 (CRM) 软件中。 不这样做可能会导致计费通知出现问题。
4. 有效期
数据有效性是指业务定义的数据值的一致性。
例如,一家欧洲企业可能会使用 dd-mm-yyyy 格式(2022 年 9 月 12 日)来格式化日期。 但是如果有人添加了一个使用 mm-dd-yyyy 格式(2022 年 9 月 12 日)书写的条目,那么这个数据就不再有效。
5. 独特性
唯一性意味着在任何数据集中都没有数据重复或重叠。
假设一个潜在客户以 JH Watson 的身份注册了一个铅磁铁。 如果他们在购买您的软件时将自己的名字写为 John H. Watson,则应将其作为一个人输入到您的数据库中。
6. 诚信
这个维度是指数据在整个生命周期中的保存,因为它在组织中的不同系统和部门中移动。 这也意味着有适当的流程来防止数据篡改。
7. 时效性
数据的及时性意味着数据在需要时随时可用。
例如,应在会计师需要时准备好年度财务报表。 如果不是,则不符合数据时效维度的要求。
质量数据的好处
质量数据对组织的流程及其作为企业的整体价值具有积极影响。
当质量数据流程到位并传达给决策者时,数据会得到更多使用,并最终成为业务决策和创新的基础。
它提高了业务盈利能力和收入,因为决策者可以更快地获得洞察力。 它还提高了业务绩效,因为人们不会浪费时间来纠正和协调数据。
数据质量对销售、营销和客户管理团队的重要性
数据质量促进不同部门及其数据之间的一致性,同时防止任何错误或不一致。
这使得跨部门协作更容易。 所有销售和营销工作都是透明的,每个人都可以宏观和微观地了解客户及其整个生命周期的旅程。
当数据处理不到位时可能发生的最坏情况是什么?
我们听说过很多企业因为糟糕的数据而陷入困境。
例如,三星承认,当一名员工因数据安全措施不善而犯错时,三星损失了 1050 亿美元。 由于会计错误,优步多年来一直少付司机。 美国邮政服务在处理无法投递的电子邮件上花费了大约 15 亿美元。
我们听到的许多关于营销和销售团队因不良数据而发生事故的故事怎么样? 一些常见的包括:
- 营销团队正在发送标签错误的电子邮件——至少破坏了品牌信任。
- PPC 团队瞄准了错误的细分市场——最终成本非常高。
- 销售团队拨打了不正确或不存在的电话号码,影响了他们的效率。
- 由于重复输入,客户服务团队向客户开出了两次账单,这导致客户很生气。
所有这些都清楚地表明,糟糕的数据会给企业带来多大的麻烦。
这就是为什么质量数据必须成为任何使用数据作为业务决策和活动基石的企业的优先事项。 质量数据将让他们准确了解他们所做的事情、可能发生的事情以及他们可以做些什么来增加收入。
如何衡量数据质量
目前,还没有衡量数据质量的既定标准。 组织必须制定他们的指导方针,并建立关于数据管理和治理的基线和期望。
通常,数据质量维度用作度量。 根据行业或数据集的目的,每个指标都被分配了一个权重和重要性级别。 例如,金融行业更重视有效性,而制药行业则优先考虑准确性。
Mikkel Dengse 建议超越衡量数据质量的范围,并将生产力和参与度指标添加到组合中。
生产力衡量花费在数据管理上的时间的效率,而参与度则确保在最终用户需要时可以使用数据报告。
如何提高数据质量
首先,每个与数据打交道的人都需要对数据质量负全部责任。 这包括数据创建者(创建数据的人)和数据用户(使用数据的人)。
数据用户应该清楚地传达他们需要什么类型的数据,以便数据创建者可以专注于提供满足这些需求的数据。
一旦清楚这一点,您就可以继续提高数据质量。
但你从哪儿开始呢?
为了提高数据质量,您应该从根本上开始,只允许高质量的数据进入您的数据库。 这减少了(如果不是消除的话)对数据质量检查的需求。
但这引出了一个问题:您已经拥有的数据呢? 你怎么清洗它?
这里有四个数据改进流程,用于纠正当前数据的任何质量问题。
数据分析
数据剖析是提高数据质量的第一步。 这是审查和检查数据以解决任何错误、缺失信息或冗余的过程。
当手动完成时,该过程可能既耗时又成本高,更不用说容易出现人为错误。 但是,数据集成工具可以加快和提高流程的准确性。
数据治理
在处理公司数据时,必须为组织中的人员分配特定角色。
这就是数据治理的作用——组织和管理数据的过程,以便规则清楚地说明谁可以访问它、他们可以采取什么行动以及他们可以使用什么方法。 这最大限度地减少了人为错误,同时为人们提供了足够的访问权限来完成他们的工作。
数据清理
不再服务于业务目标的数据需要通过数据清理来删除,否则会污染您的数据。 此过程会删除冗余、不准确和不完整的数据。
数据标准化
数据可以来自许多不同的来源。 例如,对于营销和销售团队,数据可能来自您的电子邮件软件、Google Analytics、CRM 工具以及 Facebook 和 Google Ads 等广告平台。
通过数据标准化,您可以对齐从这些不同地方收集的所有数据并防止数据不一致。 这使得部门间的协作和洞察力共享更加顺畅和快捷。
标准化数据的一种简单方法是使用 Improvado 等自动化工具,该工具从 300 多个营销和销售来源中提取数据。
到你了
我们生活在一个数据驱动的世界。 拥有高质量数据并知道如何处理数据的企业享有许多好处。 他们是那些可以更快地扩展并将所有竞争对手抛在后面的人。
如果您仍然没有适当的数据质量管理 - 现在是投资数据质量的最佳时机。