数据科学大致可以分为描述统计和预测分析两个板块。
描述统计总是在观察数据的动态变化,并询问发生了什么。最终,你拿到了原数据,并且从中做出来一些有用的东西。
预测分析,从这个领域出发,你就慢慢转向了机器学习算法领域。你将会查看类似于诈骗一类的东西,你会尝试去预测一笔转账是不是诈骗。或者,你会去尝试安全领域:存不存在恶意攻击?上述这些模式都是从数据中学习到的东西,而且是实时的,实时这一点就给计算增添了许多的复杂性。