关于我 | 坚守本心

我来自湖北，本科毕业于湖北省内的一所省属高校，专业是信息管理与信息系统专业。

本科期间，在一老师的带领下，与小伙伴们一同完成了《基于位置服务的学生管理系统的设计与实现》论文的撰写，并开发出可用的模型。在此之后，还完成了老师交代的采集数据任务，通过自学Python，学习了Python的相关知识，并在2017年7月–2017年9月间凭借爬虫技能，拿到实习Offer，前往深圳实习。但后期由于自己原因，并且学校急迫让外出实习学生返校，只得提前结束实习任务。

用python写爬虫接触过的标准库和第三方库有:

数据抓取方面：requests、urllib2、selenium+webdriver、cookielib
数据解析方面：bs4、lxml、re
数据存储方面：pymysql、xlwt
提高数据抓取效率的库有：multiprocessing、gevent

接触过的运行平台有:

1 2	windows、linux下的爬虫运行 Android 客户端下网络抓包分析

接触的抓包工具有:

1	windows平台下的浏览器的自带工具、fiddler4和wireshark

抓取过的平台包括:

1	微博移动版、豆瓣电影、阿里巴巴商友圈、投资界网站数据

利用爬虫做的小工具有:

1	网盘资源搜索与过滤:搜索几个网盘资源网站，对资源进行分析判断，判断是否失效，最后汇总几个网站的搜索资源

自己目前的学习和研究方向是推荐系统和数据分析方向。本科毕业论文拟做一个基于豆瓣评分数据的电影推荐系统，自己也在自学数据分析和挖掘方向的知识。

近期在阅读的书有：

《Python Cookbook》中文版第三版
机器学习实战
数据挖掘：概念与技术
推荐系统（蒋凡译）
推荐系统实战

近期在看的资料有：

1
2
3

W2V
情感分析的应用
surprise推荐库

近期在做：

调用百度云的自然语言处理接口，获取评论的情感分析(已完成)
itemCF(已实现)：利用抓取的数据构建同现矩阵，计算给定用户的推荐项目
评价的情感分析在推荐上的应用：复现相关论文
NLP的分词、词性标注、情感分析

自己也在数据分析与挖掘竞赛平台Kaggle上玩过。但是没有深入探索，未来这也是一种消遣方式。

更多信息，自己将在后面更新。

请联系我：

QQ: 838357249

E-mail: 838357249@qq.com

Github:https://github.com/Jackence