关于我

我来自湖北,本科毕业于湖北省内的一所省属高校,专业是信息管理与信息系统专业。

本科期间,在一老师的带领下,与小伙伴们一同完成了《基于位置服务的学生管理系统的设计与实现》论文的撰写,并开发出可用的模型。在此之后,还完成了老师交代的采集数据任务,通过自学Python,学习了Python的相关知识,并在2017年7月–2017年9月间凭借爬虫技能,拿到实习Offer,前往深圳实习。但后期由于自己原因,并且学校急迫让外出实习学生返校,只得提前结束实习任务。

用python写爬虫接触过的标准库和第三方库有:

1
2
3
4
数据抓取方面:requests、urllib2、selenium+webdriver、cookielib
数据解析方面:bs4、lxml、re
数据存储方面:pymysql、xlwt
提高数据抓取效率的库有:multiprocessing、gevent

接触过的运行平台有:

1
2
windows、linux下的爬虫运行
Android 客户端下网络抓包分析

接触的抓包工具有:

1
windows平台下的浏览器的自带工具、fiddler4和wireshark

抓取过的平台包括:

1
微博移动版、豆瓣电影、阿里巴巴商友圈、投资界网站数据

利用爬虫做的小工具有:

1
网盘资源搜索与过滤:搜索几个网盘资源网站,对资源进行分析判断,判断是否失效,最后汇总几个网站的搜索资源

自己目前的学习和研究方向是推荐系统和数据分析方向。本科毕业论文拟做一个基于豆瓣评分数据的电影推荐系统,自己也在自学数据分析和挖掘方向的知识。

近期在阅读的书有:

1
2
3
4
5
《Python Cookbook》中文版第三版
机器学习实战
数据挖掘:概念与技术
推荐系统(蒋凡译)
推荐系统实战

近期在看的资料有:

1
2
3
W2V
情感分析的应用
surprise推荐库

近期在做:

1
2
3
4
调用百度云的自然语言处理接口,获取评论的情感分析(已完成)
itemCF(已实现):利用抓取的数据构建同现矩阵,计算给定用户的推荐项目
评价的情感分析在推荐上的应用:复现相关论文
NLP的分词、词性标注、情感分析

自己也在数据分析与挖掘竞赛平台Kaggle上玩过。但是没有深入探索,未来这也是一种消遣方式。

更多信息,自己将在后面更新。

请联系我:

QQ: 838357249

E-mail: 838357249@qq.com

Github:https://github.com/Jackence