Kafka

Alex2018-03-112023-10-28

简介

无论发布的消息是否被消费，kafka都会持久化一定时间（可配置）。
在每个消费者都持久化这个offset在日志中。通常消费者读消息时会使offset值线性的增长，但实际上其位置是由消费者控制，它可以按任意顺序来消费消息。比如复位到老的offset来重新处理。
每个分区代表一个并行单元。

message（消息）是通信的基本单位，每个producer可以向一个topic（主题）发布一些消息。如果consumer订阅了这个主题，那么新发布的消息就会广播给这些consumer。
message format：
- message length : 4 bytes (value: 1+4+n)
- “magic” value : 1 byte
- crc: 4 bytes
- payload : n bytes

一种更抽象的消费方式：消费组（consumer group）
该方式包含了传统的queue和发布订阅方式
- 首先消费者标记自己一个消费组名。消息将投递到每个消费组中的某一个消费者实例上。
- 如果所有的消费者实例都有相同的消费组，这样就像传统的queue方式。
- 如果所有的消费者实例都有不同的消费组，这样就像传统的发布订阅方式。
- 消费组就好比是个逻辑的订阅者，每个订阅者由许多消费者实例构成(用于扩展或容错)。
相对于传统的消息系统，kafka拥有更强壮的顺序保证。
由于topic采用了分区，可在多Consumer进程操作时保证顺序性和负载均衡。

生产者提交一批消息作为一个请求。消费者虽然利用api遍历消息是一个一个的，但背后也是一次请求获取一批数据，从而减少网络请求数量。
Kafka层采用无缓存设计，而是依赖于底层的文件系统页缓存。这有助于避免双重缓存，及即消息只缓存了一份在页缓存中。同时这在kafka重启后保持缓存warm也有额外的优势。因kafka根本不缓存消息在进程中，故gc开销也就很小
zero-copy：kafka为了减少字节拷贝，采用了大多数系统都会提供的sendfile系统调用
传输方式

Kafka代理是无状态的：意味着消费者必须维护已消费的状态信息。这些信息由消费者自己维护，代理完全不管。这种设计非常微妙，它本身包含了创新
- 从代理删除消息变得很棘手，因为代理并不知道消费者是否已经使用了该消息。Kafka创新性地解决了这个问题，它将一个简单的基于时间的SLA应用于保留策略。当消息在代理中超过一定时间后，将会被自动删除。
- 这种创新设计有很大的好处，消费者可以故意倒回到老的偏移量再次消费数据。这违反了队列的常见约定，但被证明是许多消费者的基本特征。

Kafka默认采用at least once的消息投递策略。即在消费者端的处理顺序是获得消息->处理消息->保存位置。这可能导致一旦客户端挂掉，新的客户端接管时处理前面客户端已处理过的消息。
at last once : 消息至少发送一次，如果消息未能接受成功，会出现重发的可能，保证消息不丢失
三种保证策略：
- At most once 消息可能会丢，但绝不会重复传输
- At least one 消息绝不会丢，但可能会重复传输
- Exactly once 每条消息肯定会被传输一次且仅传输一次

kafka将日志复制到指定多个服务器上。
复本的单元是partition。在正常情况下，每个分区有一个leader和0到多个follower。
leader处理对应分区上所有的读写请求。分区可以多于broker数，leader也是分布式的。
follower的日志和leader的日志是相同的，follower被动的复制leader。如果leader挂了，其中一个follower会自动变成新的leader.
ISR: kafka在zk动态维护了一个set(里面标示的所有副本，都是更上了learder的节奏)
ISR里副本需要删除的两个情况:
- 消息演示
- 数据落后太多

和其他分布式系统一样，节点“活着”定义在于我们能否处理一些失败情况。
kafka需要两个条件保证是“活着”
- 节点在zookeeper注册的session还在且可维护（基于zookeeper心跳机制）
- 如果是slave则能够紧随leader的更新不至于落得太远。
kafka采用in sync来代替“活着”
- 如果follower挂掉或卡住或落得很远，则leader会移除同步列表中的in sync。至于落了多远才叫远由replica.lag.max.messages配置，而表示复本“卡住”由replica.lag.time.max.ms配置
- replica.lag.max.messages 如果设为4，表明follower不能落后于leader超过3个消息，负责从ISR中删除
所谓一条消息是“提交”的，意味着所有in sync的复本也持久化到了他们的log中。这意味着消费者无需担心leader挂掉导致数据丢失。另一方面，生产者可以选择是否等待消息“提交”。
kafka动态的维护了一组in-sync(ISR)的复本，表示已追上了leader,只有处于该状态的成员组才是能被选择为leader。这些ISR组会在发生变化时被持久化到zookeeper中。通过ISR模型和f+1复本，可以让kafka的topic支持最多f个节点挂掉而不会导致提交的数据丢失。