数据分析师技术要求

数据分析师所需的技能包括但不限于:
硬技能:
数据分析的软件和统计学知识

工具:

查询语言:SQL,HIVE,Pig
脚本语言:Python,Matlab,shell
统计工具:R,SPSS,SAS,SPSS moderler
数据处理:Excel
编程语言:Java(scala)

软技能:

对数据的敏感程度,问题定义与发现,问题分析
数据量化能力

需要接触的构架与思想:

了解转化漏斗模型思维架构
市场主流量化工具Google Analytics、webtrends、Omniture、Double Click
机器学习算法有基本认识并能调用工具实现
完善用户拉新、激活、留存机制,从用户生命周期角度运营用户,维护用户活跃、激活沉默用户,针对不同用户类型设计有效激励机制,提升活跃度和留存率等; 
计算广告

SQL性能调优

工作流程:完成可行性分析、进行数据采集、数据清洗、构建模型、性能调优、分析报告

数据分析流程:

1.数据导入 (导入本地或web的csv文)
2.数据变换 
3.数据统计描述 
4.探索性数据分析
5.验证性数据分析

数据分析步骤:

导入数据
数据准备、探索和清理
拟合统计模型-评估拟合结果-模型的交叉验证(循环)
在新数据上的评估模型预测
生成报告

利用Python进行数据分析:

需要掌握numpy,scipy,pandas等工具
统计
快速傅里叶变换
平滑和滤波
基线和峰值分析

数据分析是将收集的数据进行加工、整理和分析,使其转换为信息,通常的方法有:
老七种工具,即排列图、因果图、分层法、调查表、散步图、直方图、控制图;
新七种工具,即关联图、系统图、矩阵图、KJ法、计划评审技术、PDPC法、矩阵数据图;