读取没有 schema 的 Json Kafka 消息
目前我们正在开发包含 Json 数据的实时数据源。
在阅读以下示例时 - https://sparkbyexamples.com/spark/spark-streaming-with-kafka/< /a>
看起来我们需要一个 kafka json 消息的模式。
有没有其他方法可以在没有模式的情况下处理数据?
Currently we are working on a real time data feeds having Json data.
While reading the examples from -
https://sparkbyexamples.com/spark/spark-streaming-with-kafka/
It looks like we need a schema for kafka json message.
Is there any other way to process data without schema ?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
运行zookeeper、Kafka服务器和其他所需的服务后尝试下面的代码。
只需更改基本配置,您就可以看到输出
try below code after running the zookeeper, Kafka server and other required service.
just change the basic configuration, you would be able to see the output
您可以使用 SparkSQL
get_json_object
函数从 JSON 字符串数据中解析数据,而无需定义任何其他架构。您可以简单地使用
cast
函数来反序列化二进制键/值,如示例所示You can use
get_json_object
SparkSQL function to parse data out of JSON string data without defining any additional schema.You can simply use
cast
function to deserialize the binary key/value, as the example shows