首先需要学习的知识,也就是需要学习的书籍, 概率论、统计学、数据挖掘、sql等相关教材,基本上这些书名都有对应的书,所以这些是必须要学习的。理解数据库,如MySQL,PostgreSQL,CouchDB,MongoDB,Cassandra等。理解数据库并且能熟练使用它,将是一个基础能力。还要掌握数据整理、可视化和报表制作等。数据被结构化并存储在可以从一台计算机进行管理的数据库中。收集传统数据的一种方法是对人进行调查。要求他们以1到10的等级来评估他们对产品或体验的满意程度。
学一种数据库程序的应用,mysql的语法语句都要会写,至少能够用select自主从复杂数据库中查询数据,不要到时候什么都依靠数据库工程师;其次是一些基础的统计理论,统计方法,包括一些基本的分析方法对比分析、占比构成、趋势分析、5W2H、PEST、杜邦分析了等等。
现实世界的数据通常是不完整、含噪声、不一致的,对数据进行预处理,可提高数据质量,从而有助于提高其后数据挖掘的精度和性能。对于有些统计分析方法,例如多元线性回归、聚类分析、主成分分析等,Excel无法实现,通过SPSS可以轻松搞定。日常工作的话,大部分时间会用来做日常数据报表,以及满足运营、产品同学提的一堆数据需求,其他时间会做一些指标波动分析、写专题报告之类的。归纳,根据业务的形态对指标进行归纳,比如规模类、趋势类、盈利类、驱动类、核心类等等,类似聚类分析一样,给指标做出业务的画像。