Kafka安装配置和使用说明.docx

资源描述

Kafka安装配置和使用说明.docx

《Kafka安装配置和使用说明.docx》由会员分享，可在线阅读，更多相关《Kafka安装配置和使用说明.docx（40页珍藏版）》请在冰豆网上搜索。

Kafka安装配置和使用说明.docx

Kafka安装配置和使用说明

Kafka安装配置及使用说明

（铁树2018-08-08）

（Windows平台，5个分布式节点，修改消息大小，调用程序范例）

1安装配置

采用5台服务器作为集群节点，IP地址为：

XX.XX.0.12-XX.XX.0.16.

每台机器依次安装配置JDK、zookeeper、kafka，先安装完一台机器，然后拷贝到其他机器，再修改配置文件。

1.1JDK安装配置

JDK版本：

jdk1.7.0_51_x64解压版（jdk1.7.0_51_x64.rar）

解压到C盘kafka目录下，如图所示。

设置环境变量：

JAVA_HOME：

\kafka\jdk1.7.0_51_x64

PATH：

\kafka\jdk1.7.0_51_x64\bin

1.2zookeeper安装配置

1.2.1解压安装

zookeeper版本：

3.4.12（zookeeper-3.4.12.tar.gz）

解压到C盘kafka目录下，如图所示。

1.2.2创建zookeeper数据目录和日志目录

zkdata#存放快照

\kafka\zookeeper-3.4.12\zkdata

zkdatalog#存放日志

\kafka\zookeeper-3.4.12\zkdatalog

1.2.3修改配置文件

进入到“C:

\kafka\zookeeper-3.4.12”目录下的conf目录中，复制zoo_sample.cfg（官方提供的zookeeper的样板文件），重命名为zoo.cfg（官方指定的文件命名规则）。

默认内容：

修改后配置文件为：

#Thenumberofmillisecondsofeachtick

tickTime=2000

#Thenumberofticksthattheinitial

#synchronizationphasecantake

initLimit=10

#Thenumberofticksthatcanpassbetween

#sendingarequestandgettinganacknowledgement

syncLimit=5

#thedirectorywherethesnapshotisstored.

#donotuse/tmpforstorage,/tmphereisjust

#examplesakes.

dataDir=C:

/kafka/zookeeper-3.4.12/zkdata

dataLogDir=C:

/kafka/zookeeper-3.4.12/zkdatalog

#theportatwhichtheclientswillconnect

clientPort=12181

server.1=XX.XX.0.12:

12888:

13888

server.2=XX.XX.0.13:

12888:

13888

server.3=XX.XX.0.14:

12888:

13888

server.4=XX.XX.0.15:

12888:

13888

server.5=XX.XX.0.16:

12888:

13888

#themaximumnumberofclientconnections.

#increasethisifyouneedtohandlemoreclients

#maxClientCnxns=60

#Besuretoreadthemaintenancesectionofthe

#administratorguidebeforeturningonautopurge.

#http:

//zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance

#ThenumberofsnapshotstoretainindataDir

autopurge.snapRetainCount=100

#Purgetaskintervalinhours

#Setto"0"todisableautopurgefeature

autopurge.purgeInterval=24

配置文件解释：

#tickTime：

这个时间是作为Zookeeper服务器之间或客户端与服务器之间维持心跳的时间间隔，也就是每个tickTime时间就会发送一个心跳。

#initLimit：

这个配置项是用来配置Zookeeper接受客户端（这里所说的客户端不是用户连接Zookeeper服务器的客户端，而是Zookeeper服务器集群中连接到Leader的Follower服务器）初始化连接时最长能忍受多少个心跳时间间隔数。

当已经超过10个心跳的时间（也就是tickTime）长度后Zookeeper服务器还没有收到客户端的返回信息，那么表明这个客户端连接失败。

总的时间长度就是10*2000=20秒

#syncLimit：

这个配置项标识Leader与Follower之间发送消息，请求和应答时间长度，最长不能超过多少个tickTime的时间长度，总的时间长度就是5*2000=10秒

#dataDir：

快照日志的存储路径

#dataLogDir：

事物日志的存储路径，如果不配置这个那么事物日志会默认存储到dataDir制定的目录，这样会严重影响zk的性能，当zk吞吐量较大的时候，产生的事物日志、快照日志太多

#clientPort：

这个端口就是客户端连接Zookeeper服务器的端口，Zookeeper会监听这个端口，接受客户端的访问请求。

修改他的端口改大点

通过配置autopurge.snapRetainCount和autopurge.purgeInterval这两个参数能够实现定时清理了。

这两个参数都是在zoo.cfg中配置的：

autopurge.purgeInterval 这个参数指定了清理频率，单位是小时，需要填写一个1或更大的整数，默认是0，表示不开启自己清理功能。

autopurge.snapRetainCount 这个参数和上面的参数搭配使用，这个参数指定了需要保留的文件数目。

默认是保留3个。

1.2.4创建myid文件

在“C:

\kafka\zookeeper-3.4.12\zkdata”目录下，创建myid文件（无后缀名），内容为对应IP地址的主机号。

如server.1则内容为1。

1.3Kafka安装配置

1.3.1解压安装

kafka版本：

kafka1.1.1（kafka_2.11-1.1.1.tgz）

解压到C盘kafka目录下，如图所示。

1.3.2创建消息目录

kafkalogs：

\kafka\kafka_2.11-1.1.1\kafkalogs

1.3.3修改配置文件

打开C:

\kafka\kafka_2.11-1.1.1\config\server.properties

实际的修改项为：

broker.id=1

listeners=PLAINTEXT:

//:

19092

log.dirs=C:

/kafka/kafka_2.11-1.1.1/kafkalogs

#在log.retention.hours=168下面新增下面三项（消息大小最大1GB）

message.max.byte=1073741824

replica.fetch.max.bytes=1073741824

log.segment.bytes=1073741824

default.replication.factor=2

#设置zookeeper的连接端口

zookeeper.connect=XX.XX.0.12:

12181,XX.XX.0.13:

12181,XX.XX.0.14:

12181,XX.XX.0.15:

12181,XX.XX.0.16:

12181

配置说明：

broker.id=0#当前机器在集群中的唯一标识，和zookeeper的myid性质一样

port=19092#当前kafka对外提供服务的端口默认是9092

host.name=192.168.7.100#这个参数默认是关闭的，在0.8.1有个bug，DNS解析问题，失败率的问题。

work.threads=3#这个是borker进行网络处理的线程数

num.io.threads=8#这个是borker进行I/O处理的线程数

log.dirs=/opt/kafka/kafkalogs/#消息存放的目录，这个目录可以配置为“，”逗号分割的表达式，上面的num.io.threads要大于这个目录的个数这个目录，如果配置多个目录，新创建的topic他把消息持久化的地方是，当前以逗号分割的目录中，那个分区数最少就放那一个

socket.send.buffer.bytes=102400#发送缓冲区buffer大小，数据不是一下子就发送的，先回存储到缓冲区了到达一定的大小后在发送，能提高性能

socket.receive.buffer.bytes=102400#kafka接收缓冲区大小，当数据到达一定大小后在序列化到磁盘

socket.request.max.bytes=104857600#这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数，这个值不能超过java的堆栈大小

num.partitions=1#默认的分区数，一个topic默认1个分区数

log.retention.hours=168#默认消息的最大持久化时间，168小时，7天

message.max.byte=5242880#消息保存的最大值5M

default.replication.factor=2#kafka保存消息的副本数，如果一个副本失效了，另一个还可以继续提供服务

replica.fetch.max.bytes=5242880#取消息的最大字节数

log.segment.bytes=1073741824#这个参数是：

因为kafka的消息是以追加的形式落地到文件，当超过这个值的时候，kafka会新起一个文件

log.retention.check.interval.ms=300000#每隔300000毫秒去检查上面配置的log失效时间（log.retention.hours=168），到目录查看是否有过期的消息如果有，删除

log.cleaner.enable=false#是否启用log压缩，一般不用启用，启用的话可以提高性能

zookeeper.connect=192.168.7.100:

12181,192.168.7.101:

12181,192.168.7.107:

1218#设置zookeeper的连接端口

1.4其他节点配置

将安装以上配置好的目录c:

\kafka拷贝到其他节点的c盘目录，并修改如下配置。

1、JAVA环境变量：

JAVA_HOME：

\kafka\jdk1.7.0_51_x64

PATH：

\kafka\jdk1.7.0_51_x64\bin

2、zookeeper的myid

\kafka\zookeeper-3.4.12\zkdata\myid，修改为对应的数值

XX.XX.0.12：

XX.XX.0.13：

XX.XX.0.14：

XX.XX.0.15：

XX.XX.0.16：

3、kafka配置

\kafka\kafka_2.11-1.1.1\config\server.properties的

broker.id，修改为对应的数值

XX.XX.0.12：

XX.XX.0.13：

XX.XX.0.14：

XX.XX.0.15：

XX.XX.0.16：

1.5服务启动

1、启动zookeeper

\kafka\zookeeper-3.4.12\bin\zkServer.cmd

XX.XX.0.12-16，依次双击启动。

2、启动kafka

运行cmd，cdC:

\kafka\kafka_2.11-1.1.1目录，再执行命令：

【cdC:

\kafka\kafka_2.11-1.1.1】

\kafka\kafka_2.11-1.1.1>.\bin\windows\kafka-server-start.bat.\config\server.properties

1.6服务状态测试

1.6.1创建Topics

打开cmd进入C:

\kafka\kafka_2.11-1.1.1\bin\windows

\kafka\kafka_2.11-1.1.1\bin\windows>kafka-topics.bat--create--zookeeperlocalhost:

12181--replication-factor1--partitions1--topictest001

1.6.2打开一个Producer

打开cmd进入C:

\kafka\kafka_2.11-1.1.1\bin\windows

\kafka\kafka_2.11-1.1.1\bin\windows>kafka-console-producer.bat--broker-listlocalhost:

19092--topictest001

>等待输入消息内容。

1.6.3打开一个Consumer

打开cmd进入C:

\kafka\kafka_2.11-1.1.1\bin\windows

\kafka\kafka_2.11-1.1.1\bin\windows>kafka-console-consumer.bat--zookeeperlocalhost:

12181--topictest001

然后就可以在Producer控制台窗口输入消息了，很快Consumer窗口就会显示出Producer发送的消息。

1.6.4查看所有主题

\Users\Develop>C:

\kafka\kafka_2.11-1.1.1\bin\windows\kafka-topics.bat--list--zookeeperlocalhost:

12181

1.6.5查看Topic分区和副本

\Users\Develop>C:

\kafka\kafka_2.11-1.1.1\bin\windows\kafka-topics.bat--describe--zookeeperlocalhost:

12181

1.7消息大小调整

Kafka对于10KB大小的消息吞吐率最好，默认配置最大支持1MB的消息大小。

对于大消息的传输，需要修改kafka的server.properties、consumer、producer的相关配置。

server.properties修改：

打开C:

\kafka\kafka_2.11-1.1.1\config\server.properties

（按照最大1GB）

message.max.bytes=1073741824

replica.fetch.max.bytes=1073741824

log.segment.bytes=1073741824

consumer配置：

max.partition.fetch.bytes=1073741824

Producer配置：

max.request.size=1073741824

#33554432，默认32M

buffer.memory=1073741824

mon.errors.RecordTooLargeException:

Themessageis36428062byteswhenserializedwhichislargerthanthetotalmemorybufferyouhaveconfiguredwiththebuffer.memoryconfiguration.

附件太大可能会内存溢出，还会涉及超时参数配置等。

2JAVA程序示例

2.1Producer程序示例

2.1.1Properties文件配置

##producer

bootstrap.servers=XX.XX.0.12:

19092,XX.XX.0.13:

19092,XX.XX.0.14:

19092,XX.XX.0.15:

19092,XX.XX.0.16:

19092

producer.type=sync

request.required.acks=1

##consumer

mit=true

#latest,earliest,none

auto.offset.reset=earliest

建议公共参数（如服务地址）配置在properties文件里。

其他参数根据接口需要程序中配置。

//创建Producer

privateProducercreateProducer（）{

Propertiesprops=newProperties（）;

Stringpath=ProducerDemo.class.getResource（"/"）.getFile（）.toString（）+"kafka.properties";

try{

FileInputStreamfis=newFileInputStream（newFile（path））;

props.load（fis）;

props.put（"key.serializer","mon.serialization.IntegerSerializer"）;

props.put（"value.serializer","mon.serialization.StringSerializer"）;

fis.close（）;

}catch（Exceptione）{

e.printStackTrace（）;

}

returnnewKafkaProducer（props）;

}

2.1.2Properties配置详解

#0:

producer不会等待broker发送ack

#1:

当leader接收到消息后发送ack

#all（-1）:

当所有的follower都同步消息成功后发送ack

request.required.acks=0

2.1.3主题+VALUE

importjava.io.File;

importjava.io.FileInputStream;

importjava.util.Properties;

importorg.apache.kafka.clients.producer.KafkaProducer;

importorg.apache.kafka.clients.producer.Producer;

importorg.apache.kafka.clients.producer.ProducerRecord;

publicclassTopicValue{

//创建Producer

privateProducercreateProducer（）{

Propertiesprops=newProperties（）;

Stringpath=ProducerDemo.class.getResource（"/"）.getFile（）.toString（）

+"kafka.properties";

try{

FileInputStreamfis=newFileInputStream（newFile（path））;

props.load（fis）;

props.put（"key.serializer","mon.serialization.StringSerializer"）;

props.put（"value.serializer","mon.serialization.StringSerializer"）;

fis.close（）;

}catch（Exceptione）{

e.printStackTrace（）;

}

returnnewKafkaProducer（props）;

}

publicstaticvoidmain（String[]args）{

//消息主题

StringtopicName="test001";

TopicValuetopicValueProducer=newTopicValue（）;

Producerproducer=topicValueProducer.createProducer（）;

producer.send（newProducerRecord（topicName,"消息:

TopicValue"））;

producer.flush（）;

producer.close（）;

System.out.println（"Messagesendsuccessfully"）;

}

2.1.4主题+KEY+VALUE

2.1.4.1

packagekjsp.kafka.producer;

importjava.io.File;

importjava.io.FileInputStream;

importjava.util.Properties;

importorg.apache.kafka.clients.producer.KafkaProducer;

importorg.apache.kafka.clients.producer.Producer;

importorg.apache.kafka.clients.producer.ProducerRecord;

publicclassTopicIntegerString{

//创建Producer

privateProducercreateProducer（）{

Propertiesprops=newProperties（）;

Stringpath=ProducerDemo.class.getResource（"/"）.getFile（）.toString（）

+"kafka.properties";

try

展开阅读全文