solr build索引遇到控制字符的错误

今天build solr 索引遇到如下错误:



 

发现提交的数据包含了控制字符,过滤就没有问题了。

m = u' \x11\u300b:  \u5bf9\u81ea\u5df1\u597d\u4e00\u70b9\u3001\u6bd4\u4ec0\u4e48\u90fd\u5f3a\uff01'
for x in m:
    a = ord(x)
    if a  in [17,18,19,20]:
        continue
    print x

猜你喜欢

转载自san-yun.iteye.com/blog/1929959