返回列表 发帖

配置测试搜索引擎Lucene开发环境

       哦,昨天看到有会员朋友问到搜索引擎方面的问题,就把我原来写的一遍简单的搜索Lucene配置方面文章放上来了!我原来买过一本《lucene+nutch搜索引擎开发》一书,由于时间关系,只看了前面几章,后面的一些内容还未看完!这本书对于初学搜索引擎方面的实战开发来说,个人感觉还算可以的!

搜索引擎Lucene 的配置 和简单实例测试

  今天星期六偶然有些空闲,阿堂写下了这篇lucene学习文章第一篇.lucene是什么东东?我就不必重点介绍了,网上有很多这方面的文章。Lucene的基本设计原理是索引检索,通过实现准备好的索引文件,提高用户检索时的响应速度。通过对文件和资料的全文索引,保证检索的快速响应.lucene提供的是搜索内核。任何文档只要转换成文本格式都可以被索引检索。处理的文档内容包括互联网上的web页面,各种本地文档(文本文件,word文档,html和pdf文件)或任何其它能够提取出文本信息的格式。Lucene能够为应用程序增加索引和搜索能力。
  下面,阿堂就直接说说lucene的配置环境及使用了
阿堂测试环境 tomcat6.0+jdk1.6+lucene3.2.jar+lucene-demos3.2.jar
一.配置好JDK和tomcat6.0的环境
jdk和tomcat环境比较简单,我这里就略了
(可以参考站长的《疯狂java讲义》一书中的详细介绍)
主要是在classpath中加入如上的两个jar包
(如下两个jar包可以在lucene官方网站下载得到,以自己下载时的jar包为准)
我的jar路径如下
E:\systemcondition\jdk16\lib\lucene-core.jar;E:\systemcondition\jdk16\lib\lucene-demos.jar

二.将lucene-3.0.2.jar包解压后,将其中的luceneweb.war直接拷贝到D:\tomcat60\webapps目录下



三.Luceneweb 下创建 docs 文件夹,并在文件夹里面加入文本或者HTML文


四.CMD 下 运行以下命令:
java org.apache.lucene.demo.IndexHTML -create -index "D:\tomcat60\webapps\luceneweb\index" "D:\tomcat60\webapps\luceneweb\docs"
该命令正常执行后,会在luncene项目目录下创建index文件夹,并生成索引文件






五.编辑luncene文件夹下的configuration.jsp文件
把String indexLocation="/opt/luncene/index"改成"D:\\tomcat60\\webapps\\luceneweb\\index"
所String appfooter名字改成"LooLoo Lucene Search Engine for 网络时空"

六.启动 tomcat6服务器输入http://localhost:8888/luceneweb/





我们输入lucene进行检索,就可以下下面的检索结果,这表明阿堂的全文搜索测试已经一切正常啦

                                                                                       


[ 本帖最后由 heyitang 于 2010-10-3 13:37 编辑 ]
a1.jpg
a2.jpg
a3.jpg
a4.jpg
a5.jpg
a6.jpg
a7.jpg
a8.jpg
a9.jpg
倚楼听风雨,笑看江湖路。。。

谢谢heyitang的帮助,请多指教!

TOP

谢谢你的分享,不错

TOP

返回列表