surprise框架之使用预测算法(翻译) 发表于 2018-01-16 | 更新于: 2018-02-13 | 分类于 翻译草稿 字数统计: | 阅读时长 ≈ surprise框架提供了一堆内建的算法。所有算法都来自AlgoBase基类,其中实现了一些关键方法(例如预测,拟合和测试)。 可用预测算法的列表和详细信息可以在prediction_algorithms包文档中找到。 每个算法都是surprise的全局命名空间的一部分,所以你仅仅只需从surpri ... 阅读全文 »
surprise框架之起步(翻译) 发表于 2018-01-16 | 更新于: 2018-02-13 | 分类于 翻译草稿 字数统计: | 阅读时长 ≈ 基本使用自动进行交叉验证surprise 有一系列的内建的算法和数据集供用户来进行尝试。在最简单的形式中,它的模型仅需几行代码就可以运行一次交叉验证的流程:代码如下: 12345678910111213from surprise import SVDfrom surprise import Data ... 阅读全文 »
关于农村秸秆燃烧地想法 发表于 2018-01-14 | 更新于: 2018-02-13 | 分类于 生活 字数统计: | 阅读时长 ≈ 昨天晚上遭遇了一场持久的农村燃烧秸秆的浓烟,昨天晚上估计燃烧了一晚上。 昨天先是把窗户打开,想着浓烟尽快散去,但是发现似乎浓烟一直都在,然后就等着,把窗户关上了。之后再把窗户打开通风,发现浓烟还在…… 直至今早,房间里似乎依然还是有浓烟的味道,感觉很是不爽。 早上起来感觉鼻腔疼痛,喉咙不舒服,有些 ... 阅读全文 »
《如何有效整理信息》读书笔记 发表于 2018-01-13 | 更新于: 2018-02-13 | 分类于 生活 字数统计: | 阅读时长 ≈ 在日常生活中,我经常发现需要手中有一个笔记本,来记录自己的感悟和发现,也需要整理自己的生活。 自己用过的的工具有印象笔记、有道云笔记、OneNote、wuderlist等工具,但是发现似乎都没有手写笔记本来得高效。 作者推荐使用笔记本时要使用三个原则: 一元化,即所有想记录地一切都记录其中 时序化 ... 阅读全文 »
KMP算法概览 发表于 2018-01-12 | 更新于: 2018-02-13 | 分类于 学习 字数统计: | 阅读时长 ≈ 在用匹配字符串(A)对目标字符串(B)进行匹配的过程中,会出现多次遍历的情况,当A越长,要进行匹配的次数越多,且一旦匹配失效,其时间成本在急剧上升。在这里,结合其他前辈的经验,理解一下大名鼎鼎的KMP算法的思路吧。 解决思路: 在进行匹配之前,需要计算匹配字符串的部分匹配值。 1.查找目 ... 阅读全文 »
动手写爬虫概览 发表于 2018-01-12 | 更新于: 2018-01-12 | 分类于 学习 字数统计: | 阅读时长 ≈ 编写的爬虫代码的主要涉及的过程: 获取网页数据–提取数据–数据的清洗和处理–数据存储。 以下是编写爬虫程序所需要安装的库。在这里,默认大家在安装Python之时已经安装好pip这个工具。 1.获取网页数据阶段,可能会用到的库:requests,urllib2 进入控制台界面: pip install ... 阅读全文 »
《釜山行影评》 发表于 2018-01-12 | 更新于: 2018-02-13 | 分类于 生活 字数统计: | 阅读时长 ≈ 电影很好看,故事发生在韩国,以丧尸感染人类为背景。 故事开头是发生在白天,一司机在收费站经历消毒之后,回家路上因为要接电话分神,开车撞死了一头鹿,下车之后,但是司机就检查了一下,然后开车走了。之后,等司机离开,死去的鹿,抽搐了两下就站立起来。 男主(一基金公司的经理)的公司似乎是做了什么不可告人的项 ... 阅读全文 »
计算机网络初探——HTTP协议 发表于 2018-01-12 | 更新于: 2018-02-13 | 分类于 学习 字数统计: | 阅读时长 ≈ HTTP协议构建于TCP/IP协议之上,默认端口号是80。 HTTP协议是无连接无状态的。 HTTP协议是以ASCII码传输,建立在TCP/IP协议上的规范。 HTTP报文(请求和响应) 请求报文 报文分为三部分:状态行、请求头、消息主体。 HTTP定义了四种客户端与服务器端交互的方法: GET/P ... 阅读全文 »
数据分析之探索性分析 发表于 2018-01-12 | 更新于: 2018-02-13 | 分类于 学习 字数统计: | 阅读时长 ≈ 探索性数据分析是指对已有数据通过作图、制表、计算特征量等手段探索数据的结构和规律的一种数据分析方法。特别是当我们队这些数据中的信息没有足够的经验,不知道该用何种传统统计方法进行分析是,探索性数据分析就会非常有效。课程内容主要包括描述性统计分析、多维数据的可视化、降维技术、数据模型的可视化。 描述统计 ... 阅读全文 »
聚类分析的学习概览 发表于 2018-01-12 | 更新于: 2018-01-12 | 分类于 学习 字数统计: | 阅读时长 ≈ 聚类学习是一种无监督学习,是可以根据数据集中的自相似进行自动分类。 聚类的结果希望达成类内大相似,类间不相似的分类效果。 聚类分析的方法有很多,列举下:基于划分的聚类、基于层次的聚类、基于密度的聚类、基于网格的聚类和基于模型的聚类等几种。 其中,基于层次聚类的聚类方法有:凝聚法和分裂法。 凝聚法是自 ... 阅读全文 »