学习xapian 一分钟安装教程


学习xapian 一分钟安装教程
2011年12月19日
   Xapian是什么?
  Xapian是基于GPL发布的搜索引擎开发库,它采用C++语言编写,通过其提供绑定程序包可以使Perl、Python、PHP、Java、Tck、C#、Ruby等语言方便地使用它。
  Xapian 还是一个具有高适应性的工具集,使开发人员能够方便地为他们的应用程序添加高级索引及搜索功能。它支持信息检索的概率模型及丰富的布尔查询操作。 Xapian的发布包通常由两部分组成:xapian-core及xapian-bindings,前者是核心主程序,后者是与其他语言进行绑定的程序 包。
  Xapian为程序开发者提供了丰富的API及文档进行程序的编制,而且还提供了许多编程实例及一个基于 Xapian的应用程序Omega,Omega由索引器及基于CGI的前端搜索组成,能够为HTML、PHP、PDF、PostScript、 OpenOffice/StarOffice、 RTF等多种格式的文档编制索引,通过使用Perl DBI模块甚至能为MySQL、PostgreSQL、SQLite、Sybase、MS SQL、LDAP、ODBC等关系数据库编制索引,并能以CSV或XML格式从前端导出搜索结果,程序开发者可以在此基础上进行扩展。
  Xapian工作方式简介Xapian说白了其实就是一个共享库,一般来说就是/usr/local/lib/libxapian.so Xapian 由C++编写。它通过一系列接口来提供对用户指定文件的搜索支持。通过Xapian来搜索文件分以下两步: 建立索引 进行查询
  如果用户希望搜索哪些文件,可以利用Xapian提供的API编程,用程序来为那些文 件建立索引,索引包含了搜索关键字和其对应文件的关联信息,当搜索进行时,从索引中找出搜索的关键字,再根据关联信息,即可找到相应文件。对于一个文 件,Xapian提供了手工指定关键字的功能,也提供了自动收集该文件中的关键字的功能,比如含"Hello world!"的网页,Xapian可以自动检索文件内容,并把Hello和world作为关键字。 索引是一个数据库,其实就是一个文件夹,此文件夹位置由用户指定,Xapian在建立索引时就把一系列数据库文件存储在里面。当查询进行时,用户需要指定要查询的数据库,然后指定查询关键字,Xapian根据关键字在数据库里找到关联文件,然后将其列出。
  Anchor(oneminute)
  一分钟安装教程
  去Xapian官方下载页面下载最新版的xapian-core源代码包
  解压:$ tar xfz xapian-core-version.tar.gz 编译,安装: $cd xapian-core-version $./configure $make $sudo make install 此时已经完成安装,检查安装情况,请运行 $ls /usr/local/include/ | grep xapian 正确结果应为 xapian
  xapian.h$ls /usr/local/lib/ | grep libxapian 正确结果大致是 libxapian.a
  libxapian.la
  libxapian.so
  libxapian.so.15
  libxapian.so.15.6.0后面的数字可能会由于版本号有所不同 如果有其他定制要求,请参考源代码包中的帮助文档
  多语言接口绑定安装
  Xapian社区提供了多种语言对Xapian共享库的调用接口,除C++外,现在支持的有Perl, Python, PHP, Java, Tcl, C#和Ruby。为了使用多语言接口,需要安装xapian-bindings软件包
  在Xapian官方下载页面下 载xapian-bindings软件包,然后解压,编译,安装。注意,安装时要指定你要安装的语言接口,方法是在configure的时候加选项 --with-language 。如果你的xapian-core安装在非标准位置,那么还需要指定其他选项。具体方法以及更多配置细节请参阅安装包中的INSTALL文件。这里我们假 定要安装python接口和java接口。
  $tar xfz xapian-bindings-version.tar.gz
  $cd xapian-bindings-version
  $./configure --with-python --with-java
  $make
  $sudo make install

猜你喜欢

转载自bos274km.iteye.com/blog/1357906