感受一下搜索引擎

    对于搜索引擎一直都神秘的,揭开这个神秘感我是这样开始的。

    开始了搜索引擎,到学校图书馆借回了大量的相关书,看第一本于天恩的《迅速搭建全文搜索平台----开源搜索引擎实战教程》。很多软件可用。呵呵,

    有一个这样的感觉,如果你要学习一门新的技术,刚开始的时候还是试用一下,去感受下。用就得需要一软件,这个会很快就掌握了。也能让人有初步的认识。

其实这个瞬间很奇妙,用一个类似于概论的书就可以。书内容包含与可以记录的内容:

用一个表来表示吧!

序号

类型

工具与作用

1

数据抓取

WebLech

WebSPHINX

J-Spider

2

数据解释

PDF解释

PDFBox

Xpd

JACOB组件

调用Widows内的程序来作用COM组件进行解释

Word

Textmining

Java2Word

JACOB

Excel

JDBC

POI

Java Excel API

XML

Dom

SAX

JDOM

DOM4J 

HTML

HTMLParser

 

3

建立索引和执行搜索

Hyper Estraier:支持英,日,韩。

 

    看完,用WebLech做了一个实验(设置config/Sprider.properties的文件,每个变量看那些英文的说明就OK),把学校的网页都收拾回我的计算机了,呵呵,这是一个多么快乐的一件事情呀。

    这本书就是一个绪论,对我来说,就只是学习到这些东西,不过,也很高兴了,毕竟还是第一次接触的。这个给了我很大启示性信息,为学习下去有了一个好的开始。

 

猜你喜欢

转载自happyprince.iteye.com/blog/1450258