首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Solr错误#500 IOE

Solr错误#500 IOE
EN

Stack Overflow用户
提问于 2014-05-18 13:07:55
回答 1查看 1.7K关注 0票数 1

谁能告诉我是什么导致了这个问题?我试图在post.jar中发布一个xml文件;我在服务器日志下面复制

代码语言:javascript
复制
118208 [qtp760665089-18] ERROR org.apache.solr.servlet.SolrDispatchFilter  û nul
l:java.lang.RuntimeException: [was class java.io.CharConversionException] Invali
d UTF-8 middle byte 0x6c (at char #139212, byte #136949)
        at com.ctc.wstx.util.ExceptionUtil.throwRuntimeException(ExceptionUtil.j
ava:18)at com.ctc.wstx.sr.StreamScanner.throwLazyError(StreamScanner.java:731)
        at com.ctc.wstx.sr.BasicStreamReader.safeFinishToken(BasicStreamReader.j
ava:3657)at com.ctc.wstx.sr.BasicStreamReader.getText(BasicStreamReader.java:809)
at org.apache.solr.handler.loader.XMLLoader.readDoc(XMLLoader.java:397)
at org.apache.solr.handler.loader.XMLLoader.processUpdate(XMLLoader.java
:246)

[...]

Caused by: java.io.CharConversionException: Invalid UTF-8 middle byte 0x6c (at c
har #139212, byte #136949)
        at com.ctc.wstx.io.UTF8Reader.reportInvalidOther(UTF8Reader.java:313)
        at com.ctc.wstx.io.UTF8Reader.read(UTF8Reader.java:204)
        at com.ctc.wstx.io.ReaderSource.readInto(ReaderSource.java:84)
        at com.ctc.wstx.io.BranchingReaderSource.readInto(BranchingReaderSource.
java:57)...
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-05-19 15:50:54

您的文档中有一个或多个非法字符(例如非UTF-8):

http://www.coderanch.com/t/433718/XML/Invalid-UTF-middle-byte-error

我会仔细查看文档,并考虑只对UTF-8进行剥离/过滤。

前面的堆栈溢出回答在Perl和Java中有几个用于筛选出非UTF-8字符的代码片段:

How to remove bad characters that are not suitable for utf8 encoding in MySQL?

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23722242

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档