数据分析师所需的技能包括但不限于:
硬技能:
数据分析的软件和统计学知识
工具:
查询语言:SQL,HIVE,Pig
脚本语言:Python,Matlab,shell
统计工具:R,SPSS,SAS,SPSS moderler
数据处理:Excel
编程语言:Java(scala)
软技能:
对数据的敏感程度,问题定义与发现,问题分析
数据量化能力
需要接触的构架与思想:
了解转化漏斗模型思维架构
市场主流量化工具Google Analytics、webtrends、Omniture、Double Click
机器学习算法有基本认识并能调用工具实现
完善用户拉新、激活、留存机制,从用户生命周期角度运营用户,维护用户活跃、激活沉默用户,针对不同用户类型设计有效激励机制,提升活跃度和留存率等;
计算广告
SQL性能调优
工作流程:完成可行性分析、进行数据采集、数据清洗、构建模型、性能调优、分析报告
数据分析流程:
1.数据导入 (导入本地或web的csv文)
2.数据变换
3.数据统计描述
4.探索性数据分析
5.验证性数据分析
数据分析步骤:
导入数据
数据准备、探索和清理
拟合统计模型-评估拟合结果-模型的交叉验证(循环)
在新数据上的评估模型预测
生成报告
利用Python进行数据分析:
需要掌握numpy,scipy,pandas等工具
统计
快速傅里叶变换
平滑和滤波
基线和峰值分析
数据分析是将收集的数据进行加工、整理和分析,使其转换为信息,通常的方法有:
老七种工具,即排列图、因果图、分层法、调查表、散步图、直方图、控制图;
新七种工具,即关联图、系统图、矩阵图、KJ法、计划评审技术、PDPC法、矩阵数据图;