如何对评论进行数据清洗

发布网友 发布时间:2022-04-23 22:34

我来回答

1个回答

热心网友 时间:2023-09-15 13:58

数据在以前并没有被认为是一种资源,而是被认为成一种使用资源的事物。现在观念中,数据已被广泛认为是一种资源,是我们可以利用并从中获得价值和知识的一种资源。将数据资源进行分析挖掘,从而使我们做出适时的、节约成本、高质量的决定和结论。

整理清洗数据的目的就是从以上大量的、结构复杂、杂乱无章、难以理解的数据中抽取并推导出对解决问题有价值、有意义的数据和数据结构。清洗后、保存下来真正有价值、有条理的数据,为后面做数据分析减少分析障碍。

如何去整理分析数据,其中一个很重要的工作就是数据清洗。数据清洗是指对“脏”数据进行对应方式的处理,脏在这里意味着数据的质量不够好,会掩盖数据的价值,更会对其后的数据分析带来不同程度的影响。有调查称,一个相关项目的进展,80%的时间都可能会花费在这个工作上面。因为清洗必然意味着要对数据有一定的理解,而这个工作是自动化或者说计算机所解决不了的难题,只能靠人脑对数据进行重新审查和校验,找到问题所在,并通过一些方法去对对应的数据源进行重新整理。

而清洗方式步骤还是需要放到具体的业务需求中。数据清洗永远不是存在的,它还和很多相关的领域一起并行,例如数据安全性、稳定性和成本。不同的情况下,需要考虑不同的数据清洗方式或者工具。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com