《智能Web算法(中文版)》pdf格式下载电子书免费下载

《智能Web算法(中文版)》pdf格式下载电子书免费下载: https://u253469.ctfile.com/fs/253469-302448502

内容简介

《智能Web算法》涵盖了五类重要的智能算法:搜索、推荐、聚类、分类和分类器组合,并结合具体的案例讨论了它们在Web 应用中的角色及要注意的问题。除了第1 章的概要性介绍以及第7 章对所有技术的整合应用外,第2~6 章以代码示例的形式分别对这五类算法进行了介绍。

《智能Web算法》面向的是广大普通读者,特别是对算法感兴趣的工程师与学生,所以对于读者的知识背景并没有过多的要求。《智能Web算法》中的例子和思想应用广泛,所以对于希望从业务角度更好地理解有关技术的技术经理、产品经理和管理层来说,本书也有一定的价值。

作者简介

Haralambos (Babis) Marmanis 博士是一个把机器学习技术应用于工业界的先行者,也是供应管理的世界级专家。Dmitry Babenko曾经为银行、保险、供应链管理与商务智能公司设计过应用与基础架构。

目录

前言 .............. XV
致谢 ............. XIX
关于本书 ...... XXI
1 什么是智能Web......................................... 1
1.1 智能Web 应用实例 ............................................ 3
1.2 智能应用的基本要素 ......................................... 4
1.3 什么应用会受益于智能 ..................................... 5
1.3.1 社交网络 . 6
1.3.2 Mashup .... 7
1.3.3 门户网站 . 8
1.3.4 维基 ......... 9
1.3.5 文件分享网站 ......................................... 9
1.3.6 网络游戏 ............................................... 11
1.4 如何构建智能应用 ........................................... 11
1.4.1 检查功能和数据 ................................... 12
1.4.2 获取更多的数据 ................................... 12
1.5 机器学习、数据挖掘及其他 ........................... 16
1.6 智能应用中八个常见的误区 ........................... 17
1.6.1 误区1:数据是可靠的 ........................ 18
1.6.2 误区2:计算能马上完成 .................... 19
1.6.3 误区3:不用考虑数据规模 ................ 19
1.6.4 误区4:不考虑解决方案的可扩展性 19
1.6.5 误区5:随处使用同样的方法 ............ 19
1.6.6 误区6:总是能知道计算时间 ............ 20
1.6.7 误区7:复杂的模型更好 .................... 20
1.6.8 误区8:存在无偏见的模型 ................ 20
1.7 小结 ................... 20
1.8 参考资料 ........... 21
2 搜索.......... 22
2.1 用Lucene 实现搜索 ......................................... 23
2.1.1 理解Lucene 代码 ................................. 24
2.1.2 搜索的基本步骤 ................................... 31
2.2 为什么搜索不仅仅是索引 ............................... 33
2.3 用链接分析改进搜索结果 ............................... 35
2.3.1 PageRank 简介 ...................................... 35
2.3.2 计算PageRank 向量 ............................. 37
2.3.3 alpha:网页间跳转的影响 .................. 38
2.3.4 理解幂方法 ........................................... 40
2.3.5 结合索引分值和PageRank 分值 ......... 45
2.4 根据用户点击改进搜索结果 ........................... 47
2.4.1 用户点击初探 ....................................... 48
2.4.2 朴素贝叶斯分类器的使用 ................... 50
2.4.3 整合Lucene 索引、PageRank 和用户点击 ........................................ 54
2.5 Word、PDF 等无链接文档的排序 .................. 58
2.5.1 DocRank 算法简介 ............................... 58
2.5.2 DocRank 的原理 ................................... 60
2.6 大规模实现的有关问题 ................................... 65
2.7 用户得到了想要的结果吗?精确度和查全率 ............................................... 67
2.8 总结 ................... 69
2.9 To Do ................. 70
2.10 参考资料 ......... 72
3 推荐系统 .. 73
3.1 一个在线音乐商店:基本概念 ....................... 74
3.1.1 距离与相似度的概念 ........................... 75
3.1.2 走近相似度的计算 ............................... 80
3.1.3 什么才是最好的相似度计算公式 ....... 83
3.2 推荐引擎是怎么工作的 ................................... 84
3.2.1 基于相似用户的推荐 ........................... 85
3.2.2 基于相似条目的推荐 ........................... 94
3.2.3 基于内容的推荐 ................................... 98
3.3 推荐朋友、文章与新闻报道 ......................... 104
3.3.1 MyDiggSpace.com 简介 ..................... 105
3.3.2 发现朋友 ............................................. 106
3.3.3 DiggDelphi 的内部工作机制 ............. 108
3.4 像Netflix.com 那样推荐电影 ........................ 114
3.4.1 电影数据集的介绍及推荐器 ............. 114
3.4.2 数据标准化与相关系数 ..................... 117
3.5 大规模的实现与评估 ..................................... 123
3.6 总结 ................. 124
3.7 To Do ............... 125
3.8 参考资料 ......... 127
4 聚类:事物的分组 .................................. 128
4.1 聚类的需求 ..... 129
4.1.1 网站中的用户组:案例研究 ............. 129
4.1.2 用SQL order by 子句分组 ................. 131
4.1.3 用数组排序分组 ................................. 132
4.2 聚类算法概述 . 135
4.2.1 基于分组结构的聚类算法分类 ......... 136
4.2.2 基于数据类型和结构的聚类算法分类 ............................................. 137
4.2.3 根据数据规模的聚类算法分类 ......... 137
4.3 基于链接的算法 ............................................. 138
4.3.1 树状图:基本的聚类数据结构 ......... 139
4.3.2 基于链接的算法概况 ......................... 141
4.3.3 单链接算法 ......................................... 142
4.3.4 平均链接算法 ..................................... 144
4.3.5 最小生成树算法 ................................. 147
4.4 k-means 算法 .. 149
4.4.1 初识k-means 算法 ............................. 150
4.4.2 k-means 的内部原理 .......................... 151
4.5 鲁棒的链接型聚类(ROCK) ...................... 153
4.5.1 ROCK 简介 ......................................... 154
4.5.2 为什么ROCK 这么强大 .................... 154
4.6 DBSCAN......... 159
4.6.1 基于密度的算法简介 ......................... 159
4.6.2 DBSCAN 的原理 ................................ 162
4.7 超大规模数据聚类 ......................................... 165
4.7.1 计算复杂性 ......................................... 166
4.7.2 高维度 . 167
4.8 总结 ................. 168
4.9 To Do ............... 169
4.10 参考资料 ....... 171

猜你喜欢

转载自blog.csdn.net/zhiyong499/article/details/81777193