〇,概述与索引

本文为solomon@javaeye原创,如有转载,注明出处(作者solomon与链接 http://zolomon.iteye.com).
本专题使用中文分词为ikanalyzer,感谢其作者为java中文事业做出的巨大贡献.
我的个人资料 http://www.google.com/profiles/solomon.royarr

本专题包括9个部分.
前3个部分在实施人员的使用层面,
第4部分提供更详细的nutch配置属性的讲解,
第5部分在开发人员的使用层面,
6到8部分在源码研究层面,
第9部分是在二次开发(zh本地化)之后linux实施与管理员如何使用nutch提供的命令与工具进行大型搜索引擎的部署.
由于笔者比较懒,又要上班,所以文章更新进度不会很快,
预计1~8部分在两个月内完成.
第9部分笔者也没接触过,没有预计时间,也可能会搁浅.

废话说了不少,下面进入正题:
首先介绍一些资源一些资源:
nutch 主页: http://lucene.apache.org/nutch/
nutch wiki: http://wiki.apache.org/nutch/
nutch入门教程: http://lucene.apache.org/nutch/tutorial.html
ikanalyzer的友人: http://linliangyi2007.iteye.com/
ikanalyzer: http://linliangyi2007.iteye.com/blog/41014
截止到笔者书写这篇的时候,nutch官方入门教程还没有更新仍然是0.7的内容.

下面各链接为9部分内容.
初稿只写了1~3部分,
阅读者可以根据这1~3步初步运行起nutch的搜索网站与爬虫.
这3部分仍未写全,所以这3步与后面6步都会不断增加,更新与补全.

1)准备工作,nutch 1.0 的下载与抽取 http://zolomon.iteye.com/blog/373079
2)nutch 1.0 web应用部署 http://zolomon.iteye.com/blog/373080
3)nutch 1.0 爬虫配置与运行 http://zolomon.iteye.com/blog/373084
4)nutch 1.0 网站与爬虫的属性配置文件研究 http://zolomon.iteye.com/blog/378871
5)使用nutch 1.0 api 进行定制开发
6)构建eclipse nutch 1.0 工程
7)nutch 1.0 源码研究
8)对nutch 1.0 进行二次开发,nutch 1.0 插件的编写
9)nutch 1.0 高级使用

抱歉读者最近没有及时更新.
前一段时间工作上比较忙,
最近由于个人原因于2009年8月无限期暂时停止更新.

猜你喜欢

转载自zolomon.iteye.com/blog/373088