Kafka 开源流处理平台

发布于 2020-11-25 09:50:29 字数 3771 浏览 1409 评论 0

消息队列

含义：消息队列技术是分布式应用间交换信息的一种技术

通讯方式

点对点
多点广播
发布/订阅
集群

kafka 原理

作为一层中间中间存储介质，隔离生产者和消费者。 kafka producer 端写入多个 partition。partition 之间的数据是不相同的，同一个 partition 的数据是有序的。同一个组的 consumer 消费 partition 的时候，每个 consumer 根据一定的策略消费一个或者多个 partition，同一个 partition 只会被一个 consumer 消费，所以当 partition 不够用的时候，多余的 consumer 无法消费，为了保证性能，需要将 partition 的数量进行设置。

partition 可以配置多个备份，选取一个作为 leader 对外进行读写，协调信息在集群环境下由 zookeeper 保存。

名词解释

Broker：Kafka 集群包含一个或多个服务器，这种服务器被称为 broker
Topic：每条发布到 Kafka 集群的消息都有一个类别，这个类别被称为 Topic。（物理上不同 Topic 的消息分开存储，逻辑上一个 Topic 的消息虽然保存于一个或多个 broker 上，但用户只需指定消息的 Topic 即可生产或消费数据而不必关心数据存于何处）。
Partition：Partition 是物理上的概念，每个 Topic 包含一个或多个 Partition。
Producer：负责发布消息到 Kafka broker。
Consumer：消息消费者，向 Kafka broker 读取消息的客户端。
Consumer Group：每个 Consumer 属于一个特定的 Consumer Group（可为每个 Consumer 指定 group name，若不指定 group name 则属于默认的 group）。

交互流程

kafka可存储的信息格式信息是一个字节数组，程序员可以在这些字节数组中存储任何对象，支持的数据格式包括 String、JSON、Avro
信息模型消息模型可以分为两种，队列和发布-订阅式。队列的处理方式是一组消费者从服务器读取消息，一条消息只有其中的一个消费者来处理。在发布-订阅模型中，消息被广播给所有的消费者，接收到消息的消费者都可以处理此消息。Kafka为这两种模型提供了单一的消费者抽象模型：消费者组
同一个组内的消费者，是按照队列的方式来接收。不同组之间，是按照发布订阅方式来接收。

可靠性保证保序 topic配置了复制因子( replication facto)为N，那么可以允许N-1服务器当掉而不丢失任何已经增加的消息

配置方法

单机版 broker 配置文件

config/server.properties

启动 zookeeper

bin/zookeeper-server-start.sh config/zookeeper.properties

启动 kafka

bin/kafka-server-start.sh config/server.properties

集群版本

cp config/server.properties config/server-1.properties config/server-2.properties

分别启动这两个 kafka

bin/kafka-server-start.sh config/server-1.properties &

config/server-1.properties:
    broker.id=1
    port=9093
    log.dir=/tmp/kafka-logs-1
 
config/server-2.properties:
    broker.id=2
    port=9094
    log.dir=/tmp/kafka-logs-2

使用方法

list topic

bin/kafka-topics.sh --list --zookeeper 10.18.210.207:2181,10.18.210.208:2181,10.18.210.209:2181

create topic

bin/kafka-topics.sh --create --zookeeper 10.18.210.207:2181,10.18.210.208:2181,10.18.210.209:2181 --replication-factor 1 --partitions 1 --topic basp_basp
bin/kafka-topics.sh --describe --zookeeper 10.18.210.207:2181,10.18.210.208:2181,10.18.210.209:2181 --topic  ws_vod

producer

bin/kafka-console-producer.sh --broker-list 10.18.210.207:9092,10.18.210.208:9093,10.18.210.209:9094 --topic test_test

consumer

bin/kafka-console-consumer.sh  --zookeeper  10.18.210.207:2181,10.18.210.208:2181,10.18.210.209:2181  --topic test_topic [--from-beginning]

delete topic

stop kafka 集群要每天机器都要关闭

./bin/kafka-server-stop.sh ./config/server-1.properties

删除 zookeeper 中的 topic 记录

-# /usr/local/share/zookeeper/bin/zkCli.sh -server 10.18.210.207:2181,10.18.210.208:2181,10.18.210.209:2181 rm -rf /brokers/topics/*
或者
deleteall /brokers/topics/sometopic

删除 kafka 的日志项

cd /tmp/kafa-logs

rm -rf topics（topic对应的文件夹），注意是集群中多台机器

集群监控

kafka manager

技术选型

kafka与flume区别

Kafka 是一个通用型系统。你可以有许多的生产者和消费者分享多个主题。相反地，Flume 被设计成特定用途的工作，特定地向 HDFS 和 HBase 发送出去。

Flume 拥有许多配置的来源 (sources) 和存储池 (sinks)。然后，Kafka 拥有的是非常小的生产者和消费者环境体系，Kafka 社区并不是非常支持这样。

Flume 可以在拦截器里面实时处理数据。这个特性对于过滤数据非常有用。Kafka 需要一个外部系统帮助处理数据

无论是 Kafka 或是 Flume，两个系统都可以保证不丢失数据。

Flume 和 Kafka 可以一起工作的。如果你需要把流式数据从 Kafka 转移到 Hadoop，可以使用 Flume 代理 (agent)，将 kafka 当作一个来源 (source)，这样可以从 Kafka 读取数据到 Hadoop。

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据

关于作者

JSmiles

生命进入颠沛而奔忙的本质状态，并将以不断告别和相遇的陈旧方式继续下去。

文章

84965 人气

关注发私信

友情链接

文江博客

Kafka 开源流处理平台

消息队列

通讯方式

kafka 原理

名词解释

交互流程

配置方法

单机版 broker 配置文件

集群版本

使用方法

list topic

create topic

producer

consumer

delete topic

集群监控

技术选型

kafka与flume区别

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

你可能也喜欢

Howler.js 基于 Web Audio API 的音频处理插件

详解 MySQL 中的查询缓存 Query Cache 用法与性能

在 WordPress 中实现 HTML5 预加载

Jest 令人愉快的 JavaScript 测试框架

怎样下载蘑菇街商品主图的原图收藏

stickUp 基于 jQuery 的固定元素 JS 插件

天猫商品的手机详情页图片及视频批量保存的方法

米兰站商品主图和细节图采集实例教程

发布评论

关于作者

热门标签

推荐作者

动次打次papapa

我是有多爱你

原来分手还会想你

linces

霓裳挽歌倾城醉

玍銹的英雄夢

友情链接

Kafka 开源流处理平台

消息队列

通讯方式

kafka 原理

名词解释

交互流程

配置方法

单机版 broker 配置文件

集群版本

使用方法

list topic

create topic

producer

consumer

delete topic

集群监控

技术选型

kafka与flume区别

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

你可能也喜欢

发布评论

关于作者

热门标签

推荐作者

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。