java在文件开头读取一个不存在的奇怪字符

发布于 2025-01-03 02:58:06 字数 447 浏览 2 评论 0原文

我的硬盘上有一个简单的 xml 文件。当我用记事本++打开它时，这就是我看到的：

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<content>
... more stuff here ...
</content>

但是当我使用FileInputStream读取它时，我得到：

?<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<content>...

我正在使用JAXB来解析xml，它抛出一个异常“序言中不允许的内容” “因为那个”？符号。

这个额外的“？”是什么？符号？为什么它在那里？我该如何摆脱它？

原文

I have a simple xml file on my hard drive.
When I open it with notepad++ this is what I see:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<content>
... more stuff here ...
</content>

But when I read it using a FileInputStream I get:

?<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<content>...

I'm using JAXB to parse xml's and it throws an exception of "content not allowed in prolog" because of that "?" sign.

What is this extra "?" sign? why is it there and how do I get rid of it?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

メ斷腸人バ 2025-01-10 02:58:06

这个额外的字符是一个字节顺序标记，一个特殊的 Unicode 字符代码，它让 XML 解析器知道什么文件中字节的字节顺序（小端或大端）是。

通常，您的 XML 解析器应该能够理解这一点。（如果没有，我会认为这是 XML 解析器中的错误）。

作为解决方法，请确保生成此 XML 的程序不包含 BOM。

回复收藏 0 原文

蓝眼睛不忧郁 2025-01-10 02:58:06

检查文件的编码，我见过类似的事情，在大多数编辑器中打开文件，看起来不错，结果发现它是用 UTF-8 编码的，没有 BOM（或者，我不记得了我的头）。 Notepad++ 应该可以在两者之间切换。

回复收藏 0 原文

浮世清欢 2025-01-10 02:58:06

您可以使用 Notepad++ 查看 View > 中显示的所有符号。显示符号>显示所有字符菜单。它会向您显示开头存在的额外字节。有可能是字节顺序标记。如果额外的字节确实是字节顺序标记，则此方法将无济于事。在这种情况下，您将需要下载十六进制编辑器，或者如果您安装了 Cygwin，请按照此响应最后一段中的步骤操作。一旦您可以看到十六进制代码的文件，请查找前两个字符。他们是否有 http://en.wikipedia.org/wiki/Byte_order_mark# 中提到的代码之一Representations_of_byte_order_marks_by_encoding

如果它们确实是字节顺序标记或者您无法确定错误原因，请尝试this：

从菜单中选择Encoding >使用UTF-8无BOM编码，然后保存文件。

（在 Linux 上，可以使用命令行工具来检查开头的内容。例如 xxd -g1 filename | head 或 od -t cx1 filename | head。）

回复收藏 0 原文

独闯女儿国 2025-01-10 02:58:06

您可能有一个换行符。删除那个。

选择查看>显示符号>在 Notepad++ 中显示所有字符 以查看发生了什么。

回复收藏 0 原文

青芜 2025-01-10 02:58:06

这不是 jaxb 问题，问题在于您用来读取 xml 的方式...尝试使用输入流

...
Unmarshaller u = jaxbContext.createUnmarshaller();
XmlDataObject xmlDataObject = (XmlDataObject) u.unmarshal(new FileInputStream("foo.xml"));
...

this is not a jaxb problem, the problem resides in the way you use to read the xml ... try using an inputstream

...
Unmarshaller u = jaxbContext.createUnmarshaller();
XmlDataObject xmlDataObject = (XmlDataObject) u.unmarshal(new FileInputStream("foo.xml"));
...

回复收藏 0 原文

空名 2025-01-10 02:58:06

除了 FileInputStream 之外，ByteArrayInputStream 也适用于我：

JAXB.unmarshal(new ByteArrayInputStream(string.getBytes("UTF-8")), Delivery.class);

=>不再出现解组错误。

Next to the FileInputStream a ByteArrayInputStream worked also with me:

JAXB.unmarshal(new ByteArrayInputStream(string.getBytes("UTF-8")), Delivery.class);

=> No unmarshaling error anymore.

回复收藏 0 原文

~没有更多了~

关于作者

萌面超妹

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

java在文件开头读取一个不存在的奇怪字符

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（6）

关于作者

相关话题

热门标签

推荐作者

alipaysp_snBf0MSZIv

梦断已成空

瞎闹

凯凯我们等你回来

寄意

似梦非梦

友情链接

java在文件开头读取一个不存在的奇怪字符

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（6）

关于作者

相关话题

热门标签

推荐作者

alipaysp_snBf0MSZIv

梦断已成空

瞎闹

凯凯我们等你回来

寄意

似梦非梦

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。