发布网友 发布时间:2022-04-23 22:34
共1个回答
热心网友 时间:2023-09-17 20:51
数据清理是在数据源中分析数据质量的过程,在其中手动批准/拒绝系统的建议并将对数据进行更改。 Data Quality Services (DQS) 中的数据清理包括计算机辅助的过程和交互式过程,前者分析数据与知识库中知识的符合程度,后者允许数据专员查看和修改计算机辅助过程的结果,确保数据清理符合自己的要求。
数据专员还可以在 Integration Services 包装过程中执行数据清理。 在这种情况下,数据专员将通过 Integration Services 中的 DQS 清理组件使用现有的知识库来自动执行数据清理。 有关详细信息,请参阅DQS 清除转换。
DQS 中的数据清理功能具有以下优点:
标识数据源(Excel 文件或 SQL Server 数据库)中不完整或不正确的数据,然后进行更正或就无效数据向您报警。
提供一个包括两个步骤的过程来清理数据:计算机辅助和交互式过程。 计算机辅助过程使用 DQS 知识库中的知识自动处理数据,并提出替换/更正建议。 第二步交互式过程允许数据专员批准、拒绝或修改 DQS 在计算机辅助的清理过程中建议的更改内容。
使用域值、域规则和引用数据标准化和充实客户数据。 例如,通过将“St.”更改为“Street”将字词用法标准化,通过将“1 Microsoft way Redmond 98006”更改为“1 Microsoft Way, Redmond, WA 98006”填充缺少的元素来充实数据。
向用户提供简单直观、类似向导的一致界面,以便浏览数据和查找大量数据中的错误。