solr常见问题总结

1)搜索不到结果
schema.xml中默认搜索字段的配置:
<defaultSearchField>text</defaultSearchField>
q=flysnowxf这种不带字段的搜索,默认只搜索text字段。如果我要搜索name字段怎么样?使用
<copyField source="name" dest="text"/>
该语句意思是把name字段的值也复制到text字段中,这样就可以搜索了。否则必须显式指定
q=name:flysnowxf

2)bad request
客户端错误提示:
org.apache.solr.common.SolrException: Bad Request
Bad Request
request: http://localhost:8080/solr/update?wt=xml&version=2.2
服务端错误提示:
org.apache.solr.common.SolrException: ERROR:unknown field 'test'
原因是我add操作时,使用了
doc.addField("test", "bad request");
test字段在schema.xml中不存在,所以需要把test字段添加进去:
<field name="test" type="text" indexed="true" stored="true"/>

3)中文乱码
使用solr的admin查询或者solr客户端查询时,查询条件可能出现中文乱码,比如:
<lst name="params">

<str name="indent">on</str>

<str name="start">0</str>

<str name="q">???</str>

<str name="rows">10</str>

<str name="version">2.2</str>

</lst>
解决办法是在web服务器对get请求配置编码格式,tomcat的方式为:
<Connector port="8080" protocol="HTTP/1.1"
             
 connectionTimeout="20000"
              
redirectPort="8443" URIEncoding="UTF-8"/>

nutch1.5.1 + solr4.0.0集成
1、将nutch1.5.1的conf中的schema-solr4.xml拷贝到solr4的example/solr/collection1/conf中,改名为schema.xml

2、编辑schema.xml

(1)将version改成1.5,而非1.5.1

(2)增加<field name="cc" type="string" stored="true" indexed="true" multiValued="true"/>

(3)在conf目录下增加空文件stopwords_en.txt

猜你喜欢

转载自501565246-qq-com.iteye.com/blog/1855688