将 jena TDB 查询结果写入 Parquet
我不确定是否可以将 Apache-Jena tdbquery
的查询结果直接写入其他文件格式,例如柱状文件格式(例如 parquet 或 ORC)。
在这里,我如何将它与 CSV 一起使用,我希望它是其他文件格式之一。
./tdbquery --loc /location/.. --query $filename --results CSV> file.csv
值得注意的是,这个想法是我正在编写的文件有太多空值,对于 CSV,它占用的空间比我在机器上拥有的磁盘空间还要多。
I am not sure if it's possible to write the query results of Apache-Jena tdbquery
directly into other file formats such as the columnar ones (e.g., parquet, or ORC).
Herein, how I use it with CSV, I want it to be one of the other file formats.
./tdbquery --loc /location/.. --query $filename --results CSV> file.csv
Notably, the idea is the file that I am writing has too many nulls, with CSV, it takes too much space more than the disk space I even have on the machine.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论