solr 的安装配置
Solr简介
Solr是采用Java开发,基于Lucene的全文检索服务器,同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。
Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-Service的API接口,用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引,也可以通过Http G Solret操作提出查找请求,并得到XML格式的返回结果。
Solr与Lucene的关系
Lucene是一套信息检索工具包,但是并不包含搜索引擎系统,它包含了索引结构、读写索引工具、相关性工具、排序等功能,因此在使用Lucene时仍需要关注搜索引擎系统,例如数据获取、解析、分词方面的东西。
solr是基于Lucene开发的,Solr主要是为了打造一款企业级的搜索引擎系统,因此它更接近于常用的搜索引擎系统(百度、搜狗),它是一个搜索引擎服务,通过各种API可以让我们的应用使用搜索服务,而不需要将搜索逻辑耦合在应用中。而且solr可以根据配置文件定义数据解析的方式,更像是一个搜索框架,它也支持主从、热换库操作,还添加了高亮、facet等搜索引擎常见的功能支持。
Nutch是一款开源的Java实现的搜索引擎,它提供了我们运行自己的搜索引擎所需的全部工具。包括全文检索和web爬虫。常用来使用Nutch做爬虫。
Solr的简单搭建运行
下载解压后的目录:
配置步骤:
1.解压solr-4.7.0.zip到你想到存放的路径,比如当前用户根目录/Users/liuxun/solr-4.7.0
2.cmd打开命令行窗口,进入/Users/liuxun/solr-4.7.0/example目录
3.执行命令:java -jar start.jar
4.通过第三步以后,系统会启动solr自带的jetty服务器,通过 http://localhost:8983/solr/便可访问solr。
此时,solr已成功启动
2.cmd打开命令行窗口,进入/Users/liuxun/solr-4.7.0/example目录
3.执行命令:java -jar start.jar
4.通过第三步以后,系统会启动solr自带的jetty服务器,通过 http://localhost:8983/solr/便可访问solr。
此时,solr已成功启动
操作界面说明:
等等还有查询 界面使用并不麻烦
命令测试管理索引
(一) 创建索引
此时solr已安装并启动,但是还没有索引,只有创建好索引,搜索才能有结果
1、命令进入/solr-4.6.0/example/exampledocs目录
2、执行命令:java -jar post.jar solr.xml monitor.xml,此时你已成功提交了2个solr文档
3、执行完第二步后,我们可以通过浏览器访问:http://localhost:8983/solr/collection1/select?q=solr&wt=xml
如果你想导入更多的文档,执行命令:java -jar post.jar *.xml
1、命令进入/solr-4.6.0/example/exampledocs目录
2、执行命令:java -jar post.jar solr.xml monitor.xml,此时你已成功提交了2个solr文档
3、执行完第二步后,我们可以通过浏览器访问:http://localhost:8983/solr/collection1/select?q=solr&wt=xml
如果你想导入更多的文档,执行命令:java -jar post.jar *.xml
(二)更新索引
当重复执行命令:java -jar post.jar *.xml后,发现搜索的结果没有出现重复的数据,原因:example目录下的schema.xml中指定了列id为uniqueKey(即:唯一),所以重复提交数据到索引库时,id相同的数据会替换原来document中的数据。
如果想要得到重复的数据,可以通过修改exampledocs目录下*.xml中id值的方式实现
如果想要得到重复的数据,可以通过修改exampledocs目录下*.xml中id值的方式实现
(三)删除索引
1、执行命 令:
java -Ddata=args -Dcommit=false -jar post.jar “<delete><id>SP2514N</id></delete>”,可以删除id为 SP2514N的document
2、执行第一步后,再去搜索发现搜索结果中还有id为SP2514N的数据,其实不是第一步没有删除成功,因为第一步的命令中-Dcommit=false,所以第一步的删除操作没有提交到索引(index)中。
3、在没有打开新的searcher之前,第一步删除数据会一直存在于搜索结果中,所以我们可以强制打开一个新的searcher,执行命令:java -jar post.jar -
java -Ddata=args -Dcommit=false -jar post.jar “<delete><id>SP2514N</id></delete>”,可以删除id为 SP2514N的document
2、执行第一步后,再去搜索发现搜索结果中还有id为SP2514N的数据,其实不是第一步没有删除成功,因为第一步的命令中-Dcommit=false,所以第一步的删除操作没有提交到索引(index)中。
3、在没有打开新的searcher之前,第一步删除数据会一直存在于搜索结果中,所以我们可以强制打开一个新的searcher,执行命令:java -jar post.jar -
(四)查询索引
solr通过http以get的方式进行搜索数据,如:http://localhost:8983/solr/collection1/select?q=solr&wt=xml
q:查询的关键词(此时查询的字段是solrconfig.xml中指定的默认查询字段<str name=”df”>text</str>)
fl:搜索结果返回的字段
sort:排序
wt:搜索结果返回格式
q=video&fl=name,id (return only name and id fields)
q=video&fl=name,id,score (return relevancy score as well)
q=video&fl=*,score (return all stored fields, as well as relevancy score)
q=video&sort=price desc&fl=name,id,price (add sort specification: sort by price descending)
q=video&wt=json (return response in JSON format)

q:查询的关键词(此时查询的字段是solrconfig.xml中指定的默认查询字段<str name=”df”>text</str>)
fl:搜索结果返回的字段
sort:排序
wt:搜索结果返回格式
q=video&fl=name,id (return only name and id fields)
q=video&fl=name,id,score (return relevancy score as well)
q=video&fl=*,score (return all stored fields, as well as relevancy score)
q=video&sort=price desc&fl=name,id,price (add sort specification: sort by price descending)
q=video&wt=json (return response in JSON format)
使用SolrJ与Solr服务器交互
我们要使用Solr服务,可以直接使用urlconnecion按照规则去调用Solr服务的接口,如果是web应用除了可以使用URLConnection在后台调用外还可以使用AJAX技术(XmlHttpRequest)调用,但是需要自己封装数据,解析数据,非常麻烦。
SolrJ提供了针对各种客户端的API,可以省去这些繁琐的步骤,面向API编程 直接与Solr服务器进行交互。
SolrJ的简介和使用:
solrj是solr的java客户端,用于访问solr索引库。
它提供了添加、删除、查询、优化等功能。
Jar 包位置
解压目录:
它是集成到solr压缩包里的,解压文件后,有个目录/dist/,里面就存放了solrj所用到的jar(/dist/solrj-lib/*.jar和/dist/*.jar),把这些所有的jar都添加到项目中的classpath就可以直接开发了。
它提供了添加、删除、查询、优化等功能。
Jar 包位置
解压目录:
它是集成到solr压缩包里的,解压文件后,有个目录/dist/,里面就存放了solrj所用到的jar(/dist/solrj-lib/*.jar和/dist/*.jar),把这些所有的jar都添加到项目中的classpath就可以直接开发了。
Demo示例如下(以上传GitHub https://github.com/LX1993728/SolrJ_java_Test)
Product.java
SolrDao.java (索引的增删改查)
SolrDaoTest
在solr图形界面搜索:
Solr安装插件与数据库表进行同步
修改solrconfig.xml,添加下面这段代码:
然后再solrconfig.xml文件统计的目录下新增上面声明的data-config.xml。内容如下:
然后再solrconfig.xml文件统计的目录下新增上面声明的data-config.xml。内容如下:
solr-dataimporthandler-4.7.0,solr-dataimporthandler-extras-4.7.0以及连接mysql
的jar 包)
因为需要连接数据库所以需要连接数据库的jar 包,以及操作索引库的jar 包,在collection 下面创建lib 目录将jar 包拷贝到lib 目录下 (
配置的目录如下

测试导入:
查询是否导入成功
转载:http://blog.****.net/u013087513/article/details/76034373?locationNum=3&fps=1点击打开链接