聚类分析之K-means算法 发表于 2018-01-12 | 更新于: 2018-02-13 | 分类于 学习 字数统计: | 阅读时长 ≈ 聚类分析是根据数据之间的自相似自动分类的。 分类的结果是,类内大相似,类间不相似或小相似。 聚类的分类方法有: 1.划分 2.层次 3.基于密度 4.基于网络 5.基于模型 划分聚类:K-Means算法将数据集划分为K个簇,每隔簇内部的样本都相似。主要步骤: 1.确定K个簇。 2.计算距 ... 阅读全文 »
《推荐系统》读书笔记——协同过滤推荐 发表于 2018-01-12 | 更新于: 2018-02-13 | 分类于 读书 字数统计: | 阅读时长 ≈ 在应用协同过滤推荐技术时,除了用户评分数据,我们不需要额外的物品数据。 这样的好处是避免了付出很大的代价向系统提供详细而且实时更新的物品描述信息,但是这种仅基于纯粹的协同过滤的算法却无法根据物品的特性和用户的特殊偏好来客观选择推荐物品的。 本章中,将物品的特征描述为“内容”。因为后面章节部分介绍的大 ... 阅读全文 »
决策树算法——概述 发表于 2018-01-12 | 更新于: 2018-02-13 | 分类于 学习 字数统计: | 阅读时长 ≈ 决策树是一种基本的分类和回归方法。 决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程,可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。主要优点是模型具有可读性、分类速度快。 学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型。预测 ... 阅读全文 »
《推荐系统》(蒋凡译)读书笔记——概览 发表于 2018-01-12 | 更新于: 2018-02-13 | 分类于 读书 字数统计: | 阅读时长 ≈ 第一章 引言书中首先以在线书店为例,讲述了书店向特定用户推荐相关书籍的推荐系统,引申出推荐系统的类别——个性化推荐与热门推荐。在线书店是个性化推荐系统。每一个人由于其兴趣爱好不同,在系统中会看到不同的列表。当然也会有畅销书的推荐,而畅销书的推荐,显示的是当前用户群体,大众的关注热点,表示 ... 阅读全文 »
《推荐系统》读书笔记——协同过滤推荐 发表于 2018-01-12 | 更新于: 2018-02-13 | 分类于 读书 字数统计: | 阅读时长 ≈ 协同过滤推荐的主要思想:利用已有用户群过去的行为或意见预测当前用户最可能喜欢哪些东西或对哪些东西感兴趣。 此类的系统在在线零售系统中成为对用户需求个性化定制内容的工具。 纯粹的协同过滤方法的输入数据只有给定的用户—物品评分矩阵,输出数据一般有以下几种类型: 1. 表示当前用户对物品喜欢或者不喜欢程度 ... 阅读全文 »
《推荐系统》读书笔记——基于知识的推荐 发表于 2018-01-12 | 更新于: 2018-02-13 | 分类于 读书 字数统计: | 阅读时长 ≈ CF系统需要用户的评分数据作为知识源,向用户推荐商品,而不需要输入并维护其他的附加信息。 基于内容的推荐系统主要应用的知识源包括类别和体裁信息,还有从文档中提取的关键词。这两种方法的优势在于能以相对较小的代价获取并维护这些知识。 但是日常生活中,纯粹的CF系统会由于评分数据很少而效果不好,而且时间因 ... 阅读全文 »
基础数据结构 发表于 2018-01-12 | 更新于: 2018-02-13 | 分类于 学习 字数统计: | 阅读时长 ≈ 链表链表是一种由节点(Node)组成的线性数据集合,每个节点通过指针指向下一个节点。它是一种由节点组成,并能用于表示序列的数据结构。 单链表:每个节点仅指向下一个节点,最后一个节点指向空(null)。 双链表:每个节点有两个指针p,n 。 p指向前一个节点,n指向下一个节点;最后一个节点指向空。 ... 阅读全文 »
Web挖掘概述 发表于 2018-01-11 | 更新于: 2018-02-13 | 分类于 学习 字数统计: | 阅读时长 ≈ 自Web2.0时代开始,网站提供的功能不在仅仅是页面信息的展示了。更多的是与用户的交互,而在与用户的交互的过程中,又会产生很多的数据。 因此,一些公司就针对Web的数据进行了数据挖掘和分析。 针对Web2.0时代的网站数据分析,主要有:内容挖掘,结构挖掘和日志挖掘三种挖掘方向。 其中,内容挖掘,包括 ... 阅读全文 »
数据挖掘十大算法 发表于 2018-01-11 | 更新于: 2018-02-13 | 分类于 学习 字数统计: | 阅读时长 ≈ 2006年,在香港举办的IEEE数据挖掘国际会议上,与会专家遴选出十个最具影响力的数据挖掘算法。包括C4.5,K-means,SVM,Apriori,EM,PageRank,AdaBoost,KNN,Navie Bayes和CART算法。 其中,C4.5,SVM, KNN, Navie Bayes, ... 阅读全文 »
科学上网 发表于 2018-01-11 | 更新于: 2018-02-13 | 分类于 生活 字数统计: | 阅读时长 ≈ 经过实际使用的体验,国内的搜索引擎–百度和搜狗的搜索体验不佳。因此,尝试使用国外的google搜索,经过试用,体验效果比较良好。 以下内容参考自:http://coderschool.cn/1853.html科学上网-轻松访问Google(持续更新-解决Google打不开)————————————— ... 阅读全文 »