从数据分析来看「为什么多一事不如少一事」

互联网 2023-03-19 20:35:19

今天给大家普及一下从数据分析来看「为什么多一事不如少一事」相关知识,最近很多在问从数据分析来看「为什么多一事不如少一事」,希望能帮助到您。

编辑导语:在进行数据分析前,需要耗费不少的时间在数据的清洗过程中。那么,有什么方法可以提高数据清洗的效率?作者通过总结自己的工作经历,分享了在数据分析之前你需要了解的7件事情,希望对你有所启发。

写在前面

在进行数据分析之前,常常需要耗费大量的心力在对数据的清洗过程,比如,需要针对缺失数据、重复数据或错误数据等等进行预处理。还有很多小伙伴,在没想好想要获取哪些数据来验证何种假设的情况下,就贸然开展采集工作。这些都是在进入数据分析环节前,非常重要但很容易被忽略的问题。

如前美国首席数据科学家 DJ Patil 所说:“不过分的说:任何数据项目中 80% 的工作都在采集清理数据。”

为了更好的避免这类问题的出现,在开展数据分析之前,需要围绕在“问题的具体化描述”、“确立假设”中进行深入的剖析,这个时期的“慢即是快”。如果无法正确地定义问题、合理地拆解问题、抓住关键问题,后续的环节都是徒劳。

所以,正确的问题是指引你找到可靠解决的路标,而高质量的数据是数据分析的基石。我依据实际工作中的经历,梳理了数据分析前你要知道的 7 件事,希望对你有所启发。

以下,Enjoy~

通过本文,你可以了解:

5W1H 让问题具体化将商业思考拆解成可量化的数字从假设出发采集数据什么是第一、二、三方数据?哪些是可以直接利用的数据?结构化和非结构化数据有什么不同?你采集的是好数据吗?一、5W1H 让问题具体化,清晰需要采集什么数据

在所有的研究工作开始之前,厘清目标问题是什么,这是整个研究的核心。运用 5W1H (who -谁、when-时间、where-地点、what-什么事、why-为什么发生、how-如何发生),针对问题进行提问,有助于把问题具体化。