数据挖掘是深层次的数据分析,数据分析是浅层次的数据挖掘,数据挖掘更偏重于探索性数据分析,因为数据挖掘的重点是从数据中发现知识规律。
它们的具体区别如下:
(1)数据分析处理的数据量可能不大;而数据挖掘处理的数据量极大, 并且特别擅长处理大数据,尤其是几十万行、几百万行,甚至更多的数据。
(2)数据分析往往是从一个假设出发,需要自行建立方程或模型来与假设吻合;而数据挖掘不需要假设,可以自动建立方程,比如关联规则和聚类分析。
(3)数据分析往往处理数值型数据;而数据挖掘能够处理不同类型的数据,比如声音、文本等。
(4)数据分析主要侧重于通过观察数据来对历史数据进行统计学分析;而数据挖掘通过从数据中发现“知识规律”来对未来的某些可能性做出预测分析,其更注重分析数据间的内在联系。
(5)数据分析与数据挖掘的区别更多地体现在职业方向上。相对数据挖掘工程师,数据分析师与业务方的工作衔接更多,理解与梳理业务诉求、 明确业务目的和指导模型搭建是数据分析师的主要工作;而模型搭建与参数调优则是数据挖掘工程师的工作。