Kafka安装配置和使用说明.docx
《Kafka安装配置和使用说明.docx》由会员分享,可在线阅读,更多相关《Kafka安装配置和使用说明.docx(40页珍藏版)》请在冰豆网上搜索。
Kafka安装配置和使用说明
Kafka安装配置及使用说明
(铁树2018-08-08)
(Windows平台,5个分布式节点,修改消息大小,调用程序范例)
1安装配置
采用5台服务器作为集群节点,IP地址为:
XX.XX.0.12-XX.XX.0.16.
每台机器依次安装配置JDK、zookeeper、kafka,先安装完一台机器,然后拷贝到其他机器,再修改配置文件。
1.1JDK安装配置
JDK版本:
jdk1.7.0_51_x64解压版(jdk1.7.0_51_x64.rar)
解压到C盘kafka目录下,如图所示。
设置环境变量:
JAVA_HOME:
C:
\kafka\jdk1.7.0_51_x64
PATH:
C:
\kafka\jdk1.7.0_51_x64\bin
1.2zookeeper安装配置
1.2.1解压安装
zookeeper版本:
3.4.12(zookeeper-3.4.12.tar.gz)
解压到C盘kafka目录下,如图所示。
1.2.2创建zookeeper数据目录和日志目录
zkdata#存放快照
C:
\kafka\zookeeper-3.4.12\zkdata
zkdatalog#存放日志
C:
\kafka\zookeeper-3.4.12\zkdatalog
1.2.3修改配置文件
进入到“C:
\kafka\zookeeper-3.4.12”目录下的conf目录中,复制zoo_sample.cfg(官方提供的zookeeper的样板文件),重命名为zoo.cfg(官方指定的文件命名规则)。
默认内容:
修改后配置文件为:
#Thenumberofmillisecondsofeachtick
tickTime=2000
#Thenumberofticksthattheinitial
#synchronizationphasecantake
initLimit=10
#Thenumberofticksthatcanpassbetween
#sendingarequestandgettinganacknowledgement
syncLimit=5
#thedirectorywherethesnapshotisstored.
#donotuse/tmpforstorage,/tmphereisjust
#examplesakes.
dataDir=C:
/kafka/zookeeper-3.4.12/zkdata
dataLogDir=C:
/kafka/zookeeper-3.4.12/zkdatalog
#theportatwhichtheclientswillconnect
clientPort=12181
server.1=XX.XX.0.12:
12888:
13888
server.2=XX.XX.0.13:
12888:
13888
server.3=XX.XX.0.14:
12888:
13888
server.4=XX.XX.0.15:
12888:
13888
server.5=XX.XX.0.16:
12888:
13888
#themaximumnumberofclientconnections.
#increasethisifyouneedtohandlemoreclients
#maxClientCnxns=60
#
#Besuretoreadthemaintenancesectionofthe
#administratorguidebeforeturningonautopurge.
#
#http:
//zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
#
#ThenumberofsnapshotstoretainindataDir
autopurge.snapRetainCount=100
#Purgetaskintervalinhours
#Setto"0"todisableautopurgefeature
autopurge.purgeInterval=24
配置文件解释:
#tickTime:
这个时间是作为Zookeeper服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个tickTime时间就会发送一个心跳。
#initLimit:
这个配置项是用来配置Zookeeper接受客户端(这里所说的客户端不是用户连接Zookeeper服务器的客户端,而是Zookeeper服务器集群中连接到Leader的Follower服务器)初始化连接时最长能忍受多少个心跳时间间隔数。
当已经超过10个心跳的时间(也就是tickTime)长度后Zookeeper服务器还没有收到客户端的返回信息,那么表明这个客户端连接失败。
总的时间长度就是10*2000=20秒
#syncLimit:
这个配置项标识Leader与Follower之间发送消息,请求和应答时间长度,最长不能超过多少个tickTime的时间长度,总的时间长度就是5*2000=10秒
#dataDir:
快照日志的存储路径
#dataLogDir:
事物日志的存储路径,如果不配置这个那么事物日志会默认存储到dataDir制定的目录,这样会严重影响zk的性能,当zk吞吐量较大的时候,产生的事物日志、快照日志太多
#clientPort:
这个端口就是客户端连接Zookeeper服务器的端口,Zookeeper会监听这个端口,接受客户端的访问请求。
修改他的端口改大点
通过配置autopurge.snapRetainCount和autopurge.purgeInterval这两个参数能够实现定时清理了。
这两个参数都是在zoo.cfg中配置的:
autopurge.purgeInterval 这个参数指定了清理频率,单位是小时,需要填写一个1或更大的整数,默认是0,表示不开启自己清理功能。
autopurge.snapRetainCount 这个参数和上面的参数搭配使用,这个参数指定了需要保留的文件数目。
默认是保留3个。
1.2.4创建myid文件
在“C:
\kafka\zookeeper-3.4.12\zkdata”目录下,创建myid文件(无后缀名),内容为对应IP地址的主机号。
如server.1则内容为1。
1.3Kafka安装配置
1.3.1解压安装
kafka版本:
kafka1.1.1(kafka_2.11-1.1.1.tgz)
解压到C盘kafka目录下,如图所示。
1.3.2创建消息目录
kafkalogs:
C:
\kafka\kafka_2.11-1.1.1\kafkalogs
1.3.3修改配置文件
打开C:
\kafka\kafka_2.11-1.1.1\config\server.properties
实际的修改项为:
broker.id=1
listeners=PLAINTEXT:
//:
19092
log.dirs=C:
/kafka/kafka_2.11-1.1.1/kafkalogs
#在log.retention.hours=168下面新增下面三项(消息大小最大1GB)
message.max.byte=1073741824
replica.fetch.max.bytes=1073741824
log.segment.bytes=1073741824
default.replication.factor=2
#设置zookeeper的连接端口
zookeeper.connect=XX.XX.0.12:
12181,XX.XX.0.13:
12181,XX.XX.0.14:
12181,XX.XX.0.15:
12181,XX.XX.0.16:
12181
配置说明:
broker.id=0#当前机器在集群中的唯一标识,和zookeeper的myid性质一样
port=19092#当前kafka对外提供服务的端口默认是9092
host.name=192.168.7.100#这个参数默认是关闭的,在0.8.1有个bug,DNS解析问题,失败率的问题。
work.threads=3#这个是borker进行网络处理的线程数
num.io.threads=8#这个是borker进行I/O处理的线程数
log.dirs=/opt/kafka/kafkalogs/#消息存放的目录,这个目录可以配置为“,”逗号分割的表达式,上面的num.io.threads要大于这个目录的个数这个目录,如果配置多个目录,新创建的topic他把消息持久化的地方是,当前以逗号分割的目录中,那个分区数最少就放那一个
socket.send.buffer.bytes=102400#发送缓冲区buffer大小,数据不是一下子就发送的,先回存储到缓冲区了到达一定的大小后在发送,能提高性能
socket.receive.buffer.bytes=102400#kafka接收缓冲区大小,当数据到达一定大小后在序列化到磁盘
socket.request.max.bytes=104857600#这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数,这个值不能超过java的堆栈大小
num.partitions=1#默认的分区数,一个topic默认1个分区数
log.retention.hours=168#默认消息的最大持久化时间,168小时,7天
message.max.byte=5242880#消息保存的最大值5M
default.replication.factor=2#kafka保存消息的副本数,如果一个副本失效了,另一个还可以继续提供服务
replica.fetch.max.bytes=5242880#取消息的最大字节数
log.segment.bytes=1073741824#这个参数是:
因为kafka的消息是以追加的形式落地到文件,当超过这个值的时候,kafka会新起一个文件
log.retention.check.interval.ms=300000#每隔300000毫秒去检查上面配置的log失效时间(log.retention.hours=168),到目录查看是否有过期的消息如果有,删除
log.cleaner.enable=false#是否启用log压缩,一般不用启用,启用的话可以提高性能
zookeeper.connect=192.168.7.100:
12181,192.168.7.101:
12181,192.168.7.107:
1218#设置zookeeper的连接端口
1.4其他节点配置
将安装以上配置好的目录c:
\kafka拷贝到其他节点的c盘目录,并修改如下配置。
1、JAVA环境变量:
JAVA_HOME:
C:
\kafka\jdk1.7.0_51_x64
PATH:
C:
\kafka\jdk1.7.0_51_x64\bin
2、zookeeper的myid
C:
\kafka\zookeeper-3.4.12\zkdata\myid,修改为对应的数值
XX.XX.0.12:
1
XX.XX.0.13:
2
XX.XX.0.14:
3
XX.XX.0.15:
4
XX.XX.0.16:
5
3、kafka配置
C:
\kafka\kafka_2.11-1.1.1\config\server.properties的
broker.id,修改为对应的数值
XX.XX.0.12:
1
XX.XX.0.13:
2
XX.XX.0.14:
3
XX.XX.0.15:
4
XX.XX.0.16:
5
1.5服务启动
1、启动zookeeper
C:
\kafka\zookeeper-3.4.12\bin\zkServer.cmd
XX.XX.0.12-16,依次双击启动。
2、启动kafka
运行cmd,cdC:
\kafka\kafka_2.11-1.1.1目录,再执行命令:
【cdC:
\kafka\kafka_2.11-1.1.1】
C:
\kafka\kafka_2.11-1.1.1>.\bin\windows\kafka-server-start.bat.\config\server.properties
1.6服务状态测试
1.6.1创建Topics
打开cmd进入C:
\kafka\kafka_2.11-1.1.1\bin\windows
C:
\kafka\kafka_2.11-1.1.1\bin\windows>kafka-topics.bat--create--zookeeperlocalhost:
12181--replication-factor1--partitions1--topictest001
1.6.2打开一个Producer
打开cmd进入C:
\kafka\kafka_2.11-1.1.1\bin\windows
C:
\kafka\kafka_2.11-1.1.1\bin\windows>kafka-console-producer.bat--broker-listlocalhost:
19092--topictest001
>等待输入消息内容。
1.6.3打开一个Consumer
打开cmd进入C:
\kafka\kafka_2.11-1.1.1\bin\windows
C:
\kafka\kafka_2.11-1.1.1\bin\windows>kafka-console-consumer.bat--zookeeperlocalhost:
12181--topictest001
然后就可以在Producer控制台窗口输入消息了,很快Consumer窗口就会显示出Producer发送的消息。
1.6.4查看所有主题
C:
\Users\Develop>C:
\kafka\kafka_2.11-1.1.1\bin\windows\kafka-topics.bat--list--zookeeperlocalhost:
12181
1.6.5查看Topic分区和副本
C:
\Users\Develop>C:
\kafka\kafka_2.11-1.1.1\bin\windows\kafka-topics.bat--describe--zookeeperlocalhost:
12181
1.7消息大小调整
Kafka对于10KB大小的消息吞吐率最好,默认配置最大支持1MB的消息大小。
对于大消息的传输,需要修改kafka的server.properties、consumer、producer的相关配置。
server.properties修改:
打开C:
\kafka\kafka_2.11-1.1.1\config\server.properties
(按照最大1GB)
message.max.bytes=1073741824
replica.fetch.max.bytes=1073741824
log.segment.bytes=1073741824
consumer配置:
max.partition.fetch.bytes=1073741824
Producer配置:
max.request.size=1073741824
#33554432,默认32M
buffer.memory=1073741824
mon.errors.RecordTooLargeException:
Themessageis36428062byteswhenserializedwhichislargerthanthetotalmemorybufferyouhaveconfiguredwiththebuffer.memoryconfiguration.
附件太大可能会内存溢出,还会涉及超时参数配置等。
2JAVA程序示例
2.1Producer程序示例
2.1.1Properties文件配置
##producer
bootstrap.servers=XX.XX.0.12:
19092,XX.XX.0.13:
19092,XX.XX.0.14:
19092,XX.XX.0.15:
19092,XX.XX.0.16:
19092
producer.type=sync
request.required.acks=1
##consumer
mit=true
#latest,earliest,none
auto.offset.reset=earliest
建议公共参数(如服务地址)配置在properties文件里。
其他参数根据接口需要程序中配置。
//创建Producer
privateProducercreateProducer(){
Propertiesprops=newProperties();
Stringpath=ProducerDemo.class.getResource("/").getFile().toString()+"kafka.properties";
try{
FileInputStreamfis=newFileInputStream(newFile(path));
props.load(fis);
props.put("key.serializer","mon.serialization.IntegerSerializer");
props.put("value.serializer","mon.serialization.StringSerializer");
fis.close();
}catch(Exceptione){
e.printStackTrace();
}
returnnewKafkaProducer(props);
}
2.1.2Properties配置详解
#0:
producer不会等待broker发送ack
#1:
当leader接收到消息后发送ack
#all(-1):
当所有的follower都同步消息成功后发送ack
request.required.acks=0
2.1.3主题+VALUE
importjava.io.File;
importjava.io.FileInputStream;
importjava.util.Properties;
importorg.apache.kafka.clients.producer.KafkaProducer;
importorg.apache.kafka.clients.producer.Producer;
importorg.apache.kafka.clients.producer.ProducerRecord;
publicclassTopicValue{
//创建Producer
privateProducercreateProducer(){
Propertiesprops=newProperties();
Stringpath=ProducerDemo.class.getResource("/").getFile().toString()
+"kafka.properties";
try{
FileInputStreamfis=newFileInputStream(newFile(path));
props.load(fis);
props.put("key.serializer","mon.serialization.StringSerializer");
props.put("value.serializer","mon.serialization.StringSerializer");
fis.close();
}catch(Exceptione){
e.printStackTrace();
}
returnnewKafkaProducer(props);
}
publicstaticvoidmain(String[]args){
//消息主题
StringtopicName="test001";
TopicValuetopicValueProducer=newTopicValue();
Producerproducer=topicValueProducer.createProducer();
producer.send(newProducerRecord(topicName,"消息:
TopicValue"));
producer.flush();
producer.close();
System.out.println("Messagesendsuccessfully");
}
}
2.1.4主题+KEY+VALUE
2.1.4.1
packagekjsp.kafka.producer;
importjava.io.File;
importjava.io.FileInputStream;
importjava.util.Properties;
importorg.apache.kafka.clients.producer.KafkaProducer;
importorg.apache.kafka.clients.producer.Producer;
importorg.apache.kafka.clients.producer.ProducerRecord;
publicclassTopicIntegerString{
//创建Producer
privateProducercreateProducer(){
Propertiesprops=newProperties();
Stringpath=ProducerDemo.class.getResource("/").getFile().toString()
+"kafka.properties";
try