近期学习

近期学习:

Java 学习,基础,能看得懂代码
Python Scrapy
nutch
Linux的命令
hadoop的体系结构
学习hive
学习SQL进阶

SQL进阶:

order by 

group by

having 

join union

SQL内建函数

SQL函数

SQL调优(MySQL 数据查询的模型,数据存储的数据结构,查询的优化)

Linux的命令(进阶):
以下内容参考自:Linux的命令大全网

系统管理:
    系统安全
    进程和作业管理
    用户和工作组管理
    X-windows
    SELinux
    文件系统管理
    系统关机和重启

网络管理:
    网络应用
    高级网络
    网络测试
    网络安全
    网络配置
    网络服务器

软件|打印|开发|工具:
    常用工具命令
    软件包管理
    编程开发
    打印

文件目录管理:
    文件查找和比较
    文件内容查看
    文件处理
    文件编辑
    目录基本操作
    文件权限属性设置
    文件过滤分割与合并
    文件压缩与解压
    文件备份和恢复
    文件传输

硬件|监测|内核|shell
    Shell内建命令
    性能监测与优化
    硬件管理
    内核与模块管理
    磁盘管理

主要涉及:

归档操作
文件搜索
文本操作
SSH 登录
授权操作
用户管理
系统操作
文件下载

scrapy学习:

基础学习

进阶——中间件开发

数据分析报告:

统计局报告下载

近期空余时间研究:

1.网页文本提取研究:基于行快密度的算法 goose python的使用,python 开源库newspaper

2.自然语言处理

自己要去想一下,自己的研究方向:

自己目前接触到的内容有: