我发起了一个 .Net 平台上的 开源项目 知识图谱 Babana Map 和 文本文件搜索引擎 Babana Search

起因 也是 前几天 有 网友 在 群 里发了   知识图谱   相关的文章,

还有 有 网友 问起   NLog -> LogStash -> Elastic Search  的 问题,

所以, 像 Elastic Search 这样的, 应该算是一个 文本文件搜索引擎,

我觉得 我们 写一个 文本文件搜索引擎 也没什么问题 。

文本文件搜索引擎  是  粗粒度的 、 松散的   数据存储检索  系统 。

数据 可以存放在 任意 的 文件 里, 文件 的 大小 是 任意的(可以存放任意数量的数据条目), 文件 的 数量 是 任意的, 文件 的 位置 是 任意的(可以是 不同的 文件夹 和 服务器) 。

文本文件搜索引擎 需要 的 技术 如下 :

1  文本分析(字符串分析),  可以参考 《SelectDataTable》  https://www.cnblogs.com/KSongKing/p/9455216.html    ,

2  大规模并行计算,  可以参考 《.Net Core 应用方向 图谱》  https://www.cnblogs.com/KSongKing/p/10209880.html    ,

3  数据存储 检索技术,  可以参考 《我发起了一个 .Net 平台上的 NewSql 数据库 BabanaDB》  https://www.cnblogs.com/KSongKing/p/10255420.html    ,

但是 文本文件搜索引擎 和 NewSql 数据库 是 有区别 的 。

传统的 关系数据库 和 NewSql 数据库 都是   紧密的 、 严格的 、 用于 实时交易 的 数据库 。

知识图谱 应该是 在 文本文件搜索引擎 上 发展出来的 一些 高级功能 。

猜你喜欢

转载自www.cnblogs.com/KSongKing/p/10293280.html