Java 中的 Unicode 感知 CSV 解析器

发布于 2024-08-16 03:22:51 字数 133 浏览 8 评论 0原文

我正在寻找 CSV（逗号分隔值）解析器的 Java 实现，并正确处理 Unicode 数据，例如带有中文文本的 UTF-8 CSV 文件。我想这样的解析器应该在迭代、比较等时在内部使用代码点相关的方法。 Apache 2 许可证或类似许可证效果最好。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

千纸鹤带着心事 2024-08-23 03:22:51

我不相信重新发明轮子。所以我不想编写自己的解析器并经历与其他人相同的头痛。

我个人喜欢 Ostermiller 的 CSV 解析器。如果有兴趣的话，他们还有一个 Maven 存储库。

您还可以查看 OpenCSV。 Stack Overflow 上已经存在一个关于解析 unicode 的问题。

回复收藏 0 原文

吝吻 2024-08-23 03:22:51

您是否尝试过Commons CSV？

回复收藏 0 原文

缘字诀 2024-08-23 03:22:51

自己写是很容易的。使用 FileInputStream 和使用 UTF-8 的 InputStreamReader 打开文件。将其包装在 BufferedReader 中，您可以使用 readLine() 对其进行迭代。将每一行作为字符串获取。使用正则表达式将其拆分为字段。

唯一棘手的部分是构造正则表达式，以便它们不会将引号内的逗号视为字段分隔符。

上面的方法效率有点低，但对于大多数应用程序来说足够快了。如果您有真正的性能要求，那么您将需要一些可以迭代字符的东西。几年前我写了一个使用运行正常的状态机的程序。

回复收藏 0 原文

~没有更多了~

关于作者

爱，才寂寞

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

Java 中的 Unicode 感知 CSV 解析器

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

苦中寻乐

lueluelue

嗼ふ静

王权女流氓

与花如笺

残酷

友情链接

Java 中的 Unicode 感知 CSV 解析器

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

苦中寻乐

lueluelue

嗼ふ静

王权女流氓

与花如笺

残酷

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。