《数学之美》读书笔记（六）（七）（八）（九） - 代码天地

《数学之美》读书笔记（六）（七）（八）（九）

其他 2019-02-06 15:00:54 阅读次数: 0

信息的度量和作用

信息熵

条件熵

互信息

相对熵

贾里尼克

布尔代数和搜索引擎

二进制的布尔代数

索引：搜索引擎为什么可以在如此短的时间内找如此巨量的内容？建立索引。

每个网站就像图书馆里的一本书，我们不可能在图书馆书架上一本一本找，而是要通过搜索卡片找到他的位置。

最简单的索引是用一个很长的二进制数表示一个关键字是否出现在一篇文献中；

有多少篇文献，就有多少位数，每一位对应一篇文献，1代表相应的文献有这个关键字，0代表没有。

同时包含两个关键字的时候，进行与运算就可以了。

网络爬虫和图论：

前面讲的是如何建立搜索引擎的索引，那如何下载互联网所有网页？

广度优先搜索：一层一层往外访问；

深度优先搜索：一条路走到底，再一个一个节点回来，一条路走到底，循环。

使用BFS还是DFS？

理论上讲，能在大致相同的时间里爬下整个静态互联网上的内容。但是工程上两个假设：不考虑时间因素，互联网静态不变，这都是无法做到的。这个问题因该被定义为如何在有限时间里最多地爬下最重要的网页。

如果爬虫非常小，只能下载非常有限的网页，那么应该下载的是所有网站的首页。如果爬虫在扩大些，应该趴下直接连接的网页。在这个前提下，BFS好。

握手成本

猜你喜欢

转载自blog.csdn.net/jr1261181988/article/details/54706098

《数学之美》读书笔记（六）（七）（八）（九）

《数学之美》读书笔记&思考

数学之美读书笔记(2)

数学之美读书笔记(1)

《数学之美》读书笔记

《数学之美》读书笔记（五）

《数学之美》读书笔记（四）

《数学之美》读书笔记

《数学之美》读书笔记（一）

读书笔记——数学之美

【读书笔记】数学之美2--信息指纹

【读书笔记】数学之美2--分类问题

《数学之美》读书笔记（十）（十一）

读书笔记--读数学之美有感

《数学之美》——第七、八章个人笔记

《架构之美》读书笔记

团队之美 -- 读书笔记

读书笔记 - 算法之美

读书笔记－《深度学习之美》

《系统之美》读书笔记

【读书笔记】数学之美2--从规则到统计

【读书笔记】数学之美2-搜索引擎

数学之美读书笔记第一章

第八周读书笔记 ——编程之美

读书笔记六

读书笔记(六)

《简约之美：软件设计之道》- 读书笔记

美赛读书笔记之亚太2017A

同济数学之矩阵及其运算----读书笔记

《数学之美》——第九章个人笔记

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)