发布网友 发布时间:2022-04-24 06:16
共2个回答
热心网友 时间:2023-10-08 17:46
阻碍大数据发挥价值的第一大挑战就是兼容性和融合性。大数据的一个主要特点是其来源多样。然而,如果数据形式不相同,或难以整合,则其来源的多样性将使公司难以削减开支,也无法为客户创造价值。例如,在我们和一个合作项目中,该公司拥有丰富的数据,记录客户的交易量和忠诚度,以及专门的在线浏览行为数据,但是鲜少交叉检索这两类数据来判断某种浏览行为即为交易达成的前兆。面对这种挑战,公司创建了“数据湖”来容纳大量非结构性数据。但是,这些公司能够加以利用的数据目前都显得杂乱无章,只不过是一些以文本,也就是说,当这些数据只是普通的二进制数字时,要将它们井然有序地存储起来非常困难。要将来源不同的它们整合起来更是难上加难。
热心网友 时间:2023-10-08 17:47
曾担任中山医和中科院数据分析师,主要工作是帮实验室和研究所人搭建数学模型平台。对于不同项目,数据分析角度不同。比如RNA和DNA序列分析,即使都被称作为二代测序,但是分析方法有本质区别。因此,需要熟练掌握算法编程,医学背景和两者交叉。实际上在大多数企业里,所谓的数据是一大堆放在电脑文件夹中的Word 和Excel文件,分布在不同系统中的封闭的数据库文件。这种情况下如同没有数据,你分析这些文件夹,不如重新发起填报一次。源头规范数据收集在传统行业里是重中之重,占全部分析时间的90%,传统行业只需拿出你1%的分析技能就能秒杀同行,差别不在于分析,而在于你能否搞定那源头的90%。