将 jena TDB 查询结果写入 Parquet

发布于 2025-01-12 07:54:14 字数 296 浏览 5 评论 0原文

我不确定是否可以将 Apache-Jena tdbquery 的查询结果直接写入其他文件格式,例如柱状文件格式(例如 parquet 或 ORC)。

在这里,我如何将它与 CSV 一起使用,我希望它是其他文件格式之一。

./tdbquery --loc /location/.. --query $filename --results CSV> file.csv

值得注意的是,这个想法是我正在编写的文件有太多空值,对于 CSV,它占用的空间比我在机器上拥有的磁盘空间还要多。

I am not sure if it's possible to write the query results of Apache-Jena tdbquery directly into other file formats such as the columnar ones (e.g., parquet, or ORC).

Herein, how I use it with CSV, I want it to be one of the other file formats.

./tdbquery --loc /location/.. --query $filename --results CSV> file.csv

Notably, the idea is the file that I am writing has too many nulls, with CSV, it takes too much space more than the disk space I even have on the machine.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文