h264协议.docx
《h264协议.docx》由会员分享,可在线阅读,更多相关《h264协议.docx(7页珍藏版)》请在冰豆网上搜索。
![h264协议.docx](https://file1.bdocx.com/fileroot1/2022-11/25/6587bc2f-bad7-45d9-a765-0f0dfc3e5a06/6587bc2f-bad7-45d9-a765-0f0dfc3e5a061.gif)
h264协议
竭诚为您提供优质文档/双击可除
h264协议
篇一:
如何学习h.264协议
如何学习h.264协议
首先,我假定你已经具有如下基础:
1了解基本的视频知识,知道什么是ycbcr/yuV;
2知道基本的视频压缩原理;
如果这两条还不具备,那么,停一下,补一下课。
这方面的相关文章在网上一找一大把。
now,你为什么要学习h.264呢?
可能你是个在校学生,要写论文,拿着复杂的jm代码无从下手。
可能你是个开发人员要往已有的代码里添加一个码率控制算法,但是拿着前人开发的代码又感到一头雾水。
无论你具体做什么,对264协议有个比较深的理解还是有必要的。
那先准备好以下几样东西:
1h.264_mpeg-4part10whitepaper;
2h.264Visa和streameye;
这是两个码流分析软件,前者有免费版本,后者有个免费版,屏蔽了一些功能,但是对初学者,足够了。
3码流。
你可以随便去下两个,很多地方都可以下到的。
4matlab
你可能注意到,我提供的清单里没有h.264协议,没有jm代码,为什么?
因为这两样东西,太复杂,不合适初学者。
即使现在,我看到h.264协议原本都还觉得复杂,jm代码更是没有怎么看过。
这两样东西,不到做具体开发的时候没有必要去详细地研究。
那么,如何理解h.264协议呢。
容易,我们可以手工完成一个264码流的解码过程,相信我,你如果专心,最多花30小时,就能基本完成这个过程。
264协议,其实也使用了与以前的协议类似的方法,但在各个环节中,都加入了不少的改进而已。
下面先简要说明一下各个模块的要点。
1帧内预测。
这是个新概念,但其实就是使用相邻的块来预测当前块。
我们先只考虑4x4亮度块的例子。
使用h.264Visa打开一个码流文件。
从第一帧第一块开始(无疑,是个i块)。
然后一个小块一个小块地做预测。
需要注意的是,预测一个小块,就重建一个小块。
重建你只需要把预测值加上残差就可以了。
你可以使用matlab来帮你完成这个过程。
残差值,现在先直接使用就可以,不必残差是如何来的。
重建后的小块就可以作为进一步预测的参考块了。
注意,要使用pre-loopfilter的数据。
2帧间预测。
请先用264Visa和streameye打开码流,查看第一个p帧(通常是第2帧)。
树状的块结构层次。
你可以用streameye查看一下,能很容易地看到各个宏块的结构类型。
mv。
你可以在h.264Visa中查看一下,看看每个part的mv是多少,注意,因为运动矢量是以1/4像素为单位的,所以(4,8),实际代表偏移了(1,2)个像素。
然后可以根据mv到上一帧找一下参考块的位置,然后比较一下参考块和预测块,看看两者是否近似(非整点情况)或相同(整点情况,比如mv=(4,4))。
mv的预测。
找到当前块的a、b、c块,然后预测一下mv,再看实际的mv是多少。
自己根据mv,找到参考块。
再在matlab中写个插值程序,应该可以插出正确的值。
注意,做这个练习,应该在第一个p帧中来做,如果到第二个p帧中做,因为涉及多参考帧的问题,找参考帧会比较麻烦。
3变换量化。
264中变换量化已经合在一起了,白皮书上已经有详细说明。
可以自己用matlab来算一下白皮书上的题目,再在码流中找一个块,做下反量化反变换,最后看看结果,和h.264Visa的结果比一下。
4caVlc。
没什么可说的,理解一下ca,然后知道其实就是个改进了的Run-level编码就可以。
5deblocking
理解一下bs,理解一下阈值。
注意,当梯度小于阈值时才做加权,为什么?
在h.264Visa中比较一下pre-loopfilter和final的数据。
6码流结构和语法。
用streameye可以查看码流及其分析结果。
有了这两个码流分析工具,再结合白皮书,应该很快能掌握i块,p块的重建方法,并能熟悉码流结构。
jm代码太复杂,没必要在这个阶段看。
协议,更烦琐,不做完整开发的话也没必要看了。
可以看看市面上的相关的参考书。
篇二:
h264媒体和数据传输介绍
h264媒体简单说明
一、h264简介
h264分层结构由五层组成:
序列参数集(sps)
图像参数集(pps)
片(slice)
宏块、
子块
其中后面层应用前面层(或则说从属关系);其中序列的第一个帧叫做idR帧,用于清空参考帧队列,避免错误累积。
h264nalu包Rtp传输一般分为三种情况:
单一nalu模式,一般nalumtu
二、h264的文件存储和传输区别
h264的文件存储:
每一个nalu包前都会多一个000001or00000001的起始头,作为nalu包之间的分隔标识;并通过给非起始头的0000后插入0x03来避免标识冲突。
取数据后,起始头需要丢掉,0x03数据也需要去除。
依据不同帧的情况来实现不同打包,代码可参考nalu打包demo
h264的文件传输:
nalu包属于传输包的自然分割,不需要加起始头。
包格式一般是:
x串+h264nalu头+h264data比如Rtp传输,x串往往就是Rtp头(一般12字节)三、h264和mp4关系
是itu-t与iso/iec两个组织联合进行开发的视频编解码方案。
itu-t命名为h264
iso/iec命名为mpeg-4aVc是mpeg-4标准的第10部分其中标准h264格式的文件存储不是国际标准格式
相关传输协议简单说明(本次使用到)
一、Rtp/Rtcp、Rtsp、sip等
Rtp/Rtcp是传输层的传输和控制协议,是一个传输子层,运行在tcp/udp之上Rtsp/sip是更上一层的传输协议
sip运行在Rtp之上
Rtsp直接在tcp/udp上运行二、Rtp包头
音频和视频采用不同端口,初期先考虑仅h264视频
三、Rtcp
在Rtp会话期间,各参与者周期性地传送Rtcp包,包中含有已发送的数据包的数量、丢失的数据包的数量等统计资料。
分为五类:
200sR发送端报告主要考虑201RR接收端报告202sdes源点描述203bye结束传输204app特定应用
sR主要包括:
相应的Rtp流的ssRc(丢失率、累计丢包数、接收抖动、上次sR以来的延时等)、Rtp流中最新产生的Rtp分组时间戳和ntp、Rtp流包含的分组数、字节数。
详情参见附录三Rtcp包结构说明
Rtp发往对端udp的偶数端口n,Rtcp发往对端udp的奇数端口n+1
发送周期(限制Rtcp占Rtp会话量的一小部分,通常不超过5%),计算起来比较麻烦
暂时先简化试试:
每20个Rtp包发送一个RtcpsRandRR包?
小文件传输测试时,先不发Rtcp包,看能不能找到个demo来编程参考,这部分很繁杂
Rtcp执行下列四大功能:
主要是提供数据发布的质量反馈。
是作为Rtp传输协议的一部分,与其他传输协议的流和阻塞控制有关。
反馈对自适应编码控制直接起作用,但ip组播经验表明,从发送者收到反馈对诊断发送错误是致关重要的。
Rtcp带有称作规范名字(cname)的Rtp源持久传输层标识。
如发现冲突,或程序重新启动,既然ssRc标识可改变,接收者需要cname跟踪参加者。
接收者也需要cname与
相关Rtp连接中给定的几个数据流联系
前两种功能要求所有参加者发送Rtcp包,因此,为了Rtp扩展到大规模数量,速率必须受到控制。
让每个参加者给其它参加者发送控制包,就大独立观察参加者数量。
该数量用语计算包发送的速率。
第四个可选功能是传送最小连接控制信息,如参加者辨识。
最可能用在"松散控制"连接,那里参加者自由进入或离开,没有成员控制或参数协调,Rtcp充当通往所有参加者的方便通道,但不必支持应用的所有控制通讯要求。
在ip组播场合应用Rtp时,前3个功能是必须的,推荐用于所有情形。
Rtp应用设计人员必须避免使用仅在单播模式下工作的机制,那将导致无法扩展规模。
四、Rtsp
是一个多媒体播放控制协议,通过tcp传输
Rtsp分为请求消息和响应消息,常用方法如下:
a.option,得到服务器提供的可用方法
b.descRibe,得到服务器的会话描述信息(sdp)c.setup,提醒服务器建立会话,并确定传输模式d.play,发送播放请求
e.teaRdown,发起关闭请求
f.其他如get/set_paRameteR、pause、RediRect等
使用朗驰摄像头实现思科视频对接过程注意内容
一、思科视频数据要求
基于sip协议,使用Rtp传输协议Rtp包格式:
Rtp包头(一般12字节)+h264nalu头+h264naludata二、朗驰摄像头数据源输入:
可以有两种方式:
a模式,作为客户端通过Rtsp方式获得数据b模式,调用sdk获得数据两者都可以通过udp传输三、数据解析说明(目前无朗驰提供格式说明,以下数据仅通过抓包直接解析获得,不排除低概率
的特殊内容出现)a模式
x头(12字节)+h264nalu头+h264naludata
和Rtp头差别,x头中时间戳为0;抓包工具不识别,播放软件可忽略该数据。
需要进行Rtsp协议会话、udp解包(修改时间戳)、转发包、增加Rtcp消息
b模式,两种情况
udp头(8字节)+a模式(x串+起始码(00000001)+h264nalu头+h264data)
x串000001…一直到00000001之前结束(共28/26字节,如:
0000000161(28字节),00000001f000(26字节)),存在个别情况x串和0000000167之间又增加了一个朗驰说明数据(tcp数据通过udp传输了?
),鉴别方法,000001~00000001处理即可
udp头(8字节)+b模式(h264data,上一个起始码(00000001)内容的的后续数据)没有x串
需要解包(去除不需要内容)、重新打包、增加Rtp包头、增加Rtcp
相对而言,采用a模式更简明,与ptsp的会话参见下面的附录一和附录二
篇三:
Rtsp-Rtp实现h.264视频直播
Rtsp/Rtp
实现h.264视频直播
20xx年06月
文档修订控制记录
1、综述
目前在流媒体传输技术中使用最多的就是基于Rtsp/Rtp的流媒体传输。
Rtsp对应iso网络七层参考模型的应用层,和http有点类似,也是一种文本协议,主要是实现对流的控制。
有关Rtsp/Rtp以及Rtcp之间的关系可以参考下图:
通过上图可以看出三者之间的关系,Rtsp协议基于tcp完成Rtsp请求报文和响应报文的传输,Rtp协议基于udp协议完成流媒体数据的实时传输,Rtcp协议基于udp协议提
供客户端和服务器有关当前网络拥塞和以及实时流传输质量等信息。
在智能网络相机上也需要实现基于Rtsp/Rtp的h.264实时流的传输。
Rtcp暂时还未实现,这在流媒体技术中是比较高级的应用。
2、Rtsp方法
Rtsp协议文档的官方编号是RFc2336,有关该协议的相关规范,可以参考RFc2336文档,在此不再赘述。
结合调试经验,先把调试过程中用到的Rtsp协议的几个重要方法简单总结一下:
图2-1高清网络智能相机Rtsp协议截图
图2-1高清网络智能相机Rtsp协议
如图所示:
ip192.168.1.100是Rtsp客户端,在测试的过程中,使用的Vlc2.0.1播放
器作为Rtsp客户端,ip192.168.1.42是Rtsp服务器端,即网络智能相机。
整个过程中使用的Rtsp协议的方法主要有以下几个:
options、descRibe、setup、play以及teaRdown.
options方法:
用于得到服务器提供的可用方法;
首先,客户端发出Rtsp请求报文option.如图2-2所示:
Rtps服务器端收到此报文后,返回Reply报文作为回应,并在public字段中指明了Rtsp服务器可提供的方法种类:
如图2-3所示:
图2-2Rtsp请求报文:
options
通过public字段可看到,在我们使用的高清网络智能相机的Rtsp
服务器可支持的方
图2-3对option报文的回应报文
法有:
options、descRibe、setup、teaRdown、play、pause、get_paRameteR、set_paRameteR。
descRibe方法
接着客户端向服务器端发descRibe请求报文,用于得到uRi所指定的媒体描述信息,一般是sdp信息。
客户端通过accept头指定客户端可以接受的媒体述信息类型,如图2-4所示:
图2-4descRibe请求报文
服务器端收到descRibe请求报文后,给出回应报文,在回应报文中,给出了sdp信息,如图2-5所示
图2-5descRibe回应报文
仔细分析sdp信息,其中最关键的部分是以下几个字段:
mediadescription(m):
指出了我们将要传输的媒体是基于Rtp协议的类型为96的媒体;mediaattribute(a):
指明了我们使用的Rtp类型为96的媒体是h264,且h264采用率为90000;mediaattribute(a):
指明了h264profile-leve-id为64001F,即prorfile_id为100,level_id为3.1。
(注:
实际我们使用的h264的profile_id
为基本框架
66,leVel_id为40,即4.0,因为我们使用的是appRo提供的liVe555移植过来的,所以这些信息还没在源码中改,需要完善源码)