当前位置：文江博客话题详情

在HDFS中存储普通的JSON将在MongoDB中使用

发布于 2025-01-18 22:17:05 字数 261 浏览 1 评论 0原文

我正在从不同的 API 获取 JSON 数据。我想将它们存储在 HDFS 中，然后在 MongoDB 中使用它们。

我是否需要将它们转换为 avro、序列文件、parquet 等，或者我可以简单地将它们存储为纯 JSON 并稍后将它们加载到数据库中？

我知道如果我将它们转换为另一种格式，它们将得到更好的分发和压缩，但是我如何才能将 avro 文件上传到 MongoDB？ MongoDB 仅接受 JSON。我应该采取另一个步骤从 avro 读取它们并将它们转换为 JSON 吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

半﹌身腐败 2025-01-25 22:17:05

您获取的数据有多大？如果每个文件小于128MB（或不带压缩），则实际上不应该在HDF中。

要回答这个问题，格式并不重要。您可以使用SparkSQL读取任何Hadoop格式（或JSON），以加载到Mongo（反之亦然）中。

或者，您可以将数据首先写入Kafka，然后使用Kafka Connect等过程同时写入HDFS和Mongo。

回复收藏 0 原文

~没有更多了~

关于作者

因为看清所以看轻

暂无简介

文章

674 人气

关注发私信

alipaysp_snBf0MSZIv

文章 0 评论 0

关注

梦断已成空

文章 0 评论 0

关注

瞎闹

文章 0 评论 0

关注

凯凯我们等你回来

文章 0 评论 0

关注

寄意

文章 0 评论 0

关注

似梦非梦

文章 0 评论 0

友情链接

文江博客

在HDFS中存储普通的JSON将在MongoDB中使用

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签