硕士开题报告2.docx
《硕士开题报告2.docx》由会员分享,可在线阅读,更多相关《硕士开题报告2.docx(8页珍藏版)》请在冰豆网上搜索。
硕士开题报告2
长春工业大学研究生
硕士学位论文开题报告
论文题目:
基于场景分析的目标检测技术研究
专业名称:
信号与信息处理
:
2009年9月
:
导师姓名:
填表时间:
2009年10月8日
长春工业大学研究生学院制
研究生硕士学位论文开题报告程序
1、学生和导师共同根据导师研究方向及实际条件准备开题报告。
2、开题报告工作时间一般为四周。
3、各院主管院长组织本单位所属各学科、专业论文开题报告答辩委员会,并且组织学生及导师进行开题报告答辩工作。
答辩委员会成员应由各院分学术委员会成员组成,答辩会议由各院分学术委员会主席主持。
答辩会议应坚持公开、公正、严肃、认真的原则。
4、各学科、专业论文开题报告答辩委员会成员在学生答辩后应采取表决方式,依据同意人数超过总人数三分之二的原则来决定该学生的开题报告是否合格,并由各院主管主任在开题报告的院意见栏内签署意见。
5、各院主管院长应在论文开题报告答辩会议前一周将答辩会议日程安排报研究生学院。
6、各院论文开题报告答辩结束后,二天内应汇总全部开题报告送研究生学院审批。
研究生学院在一周内将审批结果通知各单位,各单位应立即将审批结果告知导师及学生。
开题报告留研究生学院存档。
7、各学科、专业开题报告的答辩审核工作应在研究生学院的规定时间内完成。
对于因学生或导师的原因在规定时间内完不成开题报告,或开题报告选题不符合本学科、专业培养目标及开题报告答辩未予通过等情况,研究生学院可延长该生在校学习时间或提出更换导师的建议报校学术委员会审批。
A:
研究生论文选题的来源及意义
选题来源:
自拟课题
选题意义:
外界信息中大约80%是由眼睛被人所接收的,所以说视觉是人类最重要的感知方法。
正是因为视觉对人类的重要性,随着数字计算机的飞速发展,让计算机也具有视觉,能够处理视觉信息就成了一项非常诱人的研究课题。
这样就导致了计算机视觉这一学科的产生和发展。
在计算机视觉领域中,一个最根本的问题就是如何从底层原始视频数据得到高层的语义理解。
纵观当前国内外对智能视频监控的研究,当前的研究还主要集中在摄像机标定、多摄像机融合、运动物体的视觉分析等关键技术方面。
其中,运动物体的视觉分析是计算机视觉领域中一个最活跃的研究课题之一,其核心是利用计算机视觉技术从图像序列中检测、跟踪和识别运动物体(如人和车等)并对其行为进行理解与描述,它在虚拟现实、视频监控、感知接口等领域均有着广阔的应用前景。
运动物体的场景分析系统一般遵从下述的四个处理过程:
运动物体的检测与提取;运动物体的分类;目标物体的跟踪;目标物体的行为理解与描述。
运动物体的检测与提取以及目标物体的跟踪作为运动物体的视觉分析中的两项核心技术以及底层问题,它们是后续各种高级处理,如物体分类及行为识别、事件检测、行为分析、视频图像的压缩编码和语义索引等高层次的视频处理和应用理解的基础,也是视频监控技术自动化和实时应用的关键,同时,它们也是当前图像技术研究应用的热点和焦点。
目前,运动物体的检测与提取以及目标物体的跟踪在视频监控、人机交互、娱乐动画、多媒体、通讯以及军事等领域都有着极为广泛的应用背景。
由于运动目标分割、目标检测与跟踪是一个复杂而有待完善的问题,实际应用中对可靠性的要求很高,而且有些应用环境也非常复杂,这就使得对算法的实时性和可靠性的要求很高,基于此目标的检测与跟踪具有很强的理论研究值,同时也具有广泛的应用前景及巨大的潜在经济价值,已引起了许多科研机构及研究人员的浓厚兴趣。
目前,国内的智能视频监控算法大都是建立在运动目标分割与跟踪技术的基础上,对于目标(人体和车辆等)的检测识别非常少。
因此,对目标检测算法的研究是有重要意义的。
B:
论文选题在该领域国内、国外研究现状
国内:
为了促进我国视频监控的研究和发展,中国科学院自动化研究所的模式识别国家重点实验室于2002年在北京成功的举办了“第一届全国智能视频监控会议”。
2003年底又在北京举办了“第二届全国智能视频监控会议”。
自动化学报在2003年5月出版了一期动态场景的视频监控专刊。
全国许多大学和科研机构也都竞相展开对视频监控的研究。
中国科学院自动化研究所模式识别国家重点实验室谭铁牛研究员从20世纪90年代初就开始研究基于三维模型的智能视频监控系统,领导视频监控小组,针对系统中目标检测等关键性问题,进行了深入的研究和探讨,取得了一系列的研究成果。
由他和SteveJ.Maybank组织的IEEE视频监控专题讨论会连续三年分别在印度(1998)、美国(1999)和爱尔兰(2000)成功举办,收录了大量智能视频监控领域内的最新研究成果。
在这些会议及专业期刊中,运动目标检测与跟踪、行为理解等都是热点问题。
清华大学计算机系的谢树煌教授等人提出了一种对无规则行进队伍中的人员进行检测与人数统计的系统模型,该系统于1998年开始应用于毛泽东纪念堂,对每日进堂瞻仰的人数进行实时统计。
清华大学电子工程系的刘晓东博士等研发出一个运动目标自动检测和分类的智能监控系统,以解决户外复杂场景下的人体检测困难的问题,但是由于该算法过于复杂,很难应用于实时监控系统中。
上海交通大学图像处理与模式识别研究所的周小四等采用基于遗传算法的最佳嫡阈值法进行图像分割,运用基于缺省规则推理的方法对可疑区域进行分别处理,实现智能报警系统中的目标分割与识别,只是这种算法没有充分考虑到噪声对图像的干扰,因此在实际场景中应用时会遇到较大的困难。
国外:
由于智能视频监控拥有广泛的应用前景和巨大的经济价值,自上个世纪七十年代以来,世界各国的广大科研工作者在这个领域中投入了大量的精力来进行研究。
许多关于视频监控的大规模的研究项目己在美国、欧洲和日本等国家或地区展开,同时,它也成为许多国际学术会议关的重要主题。
1997年美国国防高级研究项目署(DARPA)启动了视觉监控重大项目VSAM(VisualSurveillanceAndMonitoring),该项目以卡内基梅隆大学为依托、麻省理工学院等高校参与,项目的目标是拟发展一种自动的视频解译技术,实现单人对复杂区域如战场或其他的一些重要场所内的人员行动的监视,该系统利用三帧时域差分法实现运动目标的检测,采用自适应模板匹配的方法实现对运动物体的跟踪。
Haritaoglu等人开发的是一个融合形状分析和跟踪的视频监控系统,它利用背景减除的方法实现了运动物体的检测,并通过创建人体外形模型来实现在有遮挡的户外环境中,对多个人体目标的跟踪。
如检测人是否携带物体等。
美国的ARDA机构(AdvancedResearch&DevelopmentActivity)在2003年秋开始主持一项高级研究计划VACE(VideoAnalysisContentExtraction),旨在通过物体检测、识别和跟踪,以达到检测、识别和理解物体行为的目的。
由EC(EuropeanCommission)资助的为阻止地铁站的肆意破坏行为的基于视频的监控项目(AVS—PV:
AdvancedVideo-basedSurveillancePreventionofVandalisminmetrostations),目的是对地铁站内人群进行监控,防止各种破坏行为。
英国雷丁大学(UniversityofReading)已开展了对车辆和行人的检测和跟踪及其交互作用识别的相关研究;IBM与Microsoft等公司也正将基于手势识别的人机交换接口应用于商业领域。
此外,当前一些国际权威期刊如IJCV(InternationalJournalofComputerVision)、IVC(ImageandVisionComputing)、CVIU(ComputerVisionandImageUnderstanding)等以及一些重要的学术会议ICCV、CVPR、ECCV、IWVS等都将智能监控中的运动目标检测和跟踪作为其主题内容之一,为该领域的研究人员提供了更多的交流机会。
C:
论文选题的理论依据、研究方法、研究内容、实施方案和拟解决的关键问题
一.理论依据
1.马尔科夫随机场理论。
2.背景建模理论。
3.图像分割理论与方法。
二.研究方法
将最近的L帧视频中的同像素点的亮度值,利用高斯内核非参数化地对该位置像素的概率密度进行估计。
如果当前帧像素特征值的估计值,小于预定义的门限,则认为它是前景像素。
三.研究内容
在像素点的五维特征向量上建立概率模型,包含了灰度特征信息和空间域上的特征信息,使得模型对于摄像机抖动等情况具有更强的容错;采用核函数的非参数估计来模拟动态场景中更为真实复杂的概率分布情况;运用马尔可夫随机场模型、graph-cut求解进行全局的目标分割,改善以往高斯混合模型中由于各个像素点独立判断造成的噪声点和目标内部的空洞点。
主要研究内容如图1所示。
图1研究内容图
四.实施方案
1.预处理:
对视频数据进行简单的空间或时间滤波,以消除摄像机噪声和雨雪等瞬时环境噪声,或者降低帧大小和帧率。
2.背景建模:
这是各种减背景算法的核心所在。
本文拟采用马尔科夫随机场模型,建立非参数背景模型。
3.前景检测:
如果当前帧像素特征值的估计值,小于预定义的门限,则认为该像素为组成前景运动目标的像素。
4.后处理:
去除不属于真实运动目标的参考像素,得到真正的前景运动目标。
五.拟解决的关键问题
1.分割阈值的确定,既可根据像素的亮度、颜色差异,也可根据像素的分布密度等进行阈值分割。
2.复杂背景下,背景模型的建立,及背景更新算法。
3.针对目标检测提出更有效的噪声处理算法。
D:
论文选题研究工作基础条件和可能出现的问题(实验设备、研究资料等)
一.实验设备
PC机服务器(奔腾4处理器,内存512);图像处理实验室。
二.软件环境
采用Windows操作系统,C或MATLAB语言开发环境。
三.参考资料
1.关于目标检测方面的论文及论著(30余篇);
2关于场景分析方面的论文及论著(30余篇);
3关于视频监控方面的论文及论著(30余篇)。
E.论文选题前期准备工作(调研工作及10篇以上主要参考文献)
[1]李旭超,朱善安.图像分割中的马尔可夫随机场方法综述.中国图象图形学报:
自然科学版,2007,30(5):
15—18.
[2]刘丽,匡纲要.图像纹理特征提取方法综述.中国图象图形学报,2009
[3]仲兴荣,黄贤武,刘家胜.基于马尔可夫随机场与活动轮廓的运动目标分割.计算机应用,2007.
[4]S.Li,MarkovRandomFieldModelinginComputerVision.SpringerVerlag,1995.
[5]周箴毅,胡福乔.基于背景建模的动态场景目标检测.计算机工程,2008,12.
[6]李智慧,黄凤岗,刘艳葆.基于马尔可夫随机场的运动分割研究.计算机工程与应用.2008,44(11).
[7]文志强,蔡自兴.一种最大后验概率条件下的运动目标检测方法.小型微型计算机系统,2008,5(5).
[8]郑玮,康戈文,陈武凡,刘强.一种无监督的遥感图像分割新算法研究.仪器仪表学报,2009,1.
[9]谢磊,李梅,高智勇,刘海华.一种基于小波变换的马尔可夫随机场的视频对象分割.计算机工程与应用,2008,44(19).
[10]YaserSheikhandMubarakShah,“BayesianModelingofDynamicScenesforObjectDetection,”IEEETrans.PatternAnalysisandMachineIntelligence,2005.
[11]李晓春,孙培懋,金国藩,刘上乾.复杂场景中动目标图象分割的一种快速算法.清华大学学报(自然科学版),1997,37(8):
19~21.
[12]黄贤武,朱莉,仲兴荣,等.一种新的基于时空马尔可夫随机场的运动目标分割技术[J].电子与信息学报,2006,28
(2):
367-371.
[13]代科学,李国辉,涂丹,袁见.监控视频运动目标检测减背景技术的研究现状和展望.中国图象图形学报,2006
[14]仲兴荣,黄贤武,王加俊,刘仁金.苏州大学电子信息学院.
[15]XiangPAN,Yi-junWU.GSM-MRFbasedclassificationapproachforreal-timemovingobjectdetection.JournalofZhejiangUniversitySCIENCEAISSN1673-565X(Print),2007
[16]张鹏.随机场在图像处理中应用的研究.华中科技大学,2005
F:
论文工作总体进度安排(文献阅读、方案设计与实现、
计算与实验、论文书写等)
1.2010年8月-2010年10月
查阅资料、进行调研、可行性研究,完成开题报告,并提交导师审查。
同时,根据初步确定的思路,搜集、整理有关文件资料。
在此期间分析研究国内外相关文献。
准备设备,进行前期的预研工作。
2.2010年11月-2011年3月
进行方案、算法设计,并对相关算法进行设计仿真。
做好基础性研究工作。
3.2011年4月-2011年10月
在导师指导下,调试、测算实验系统,观察、比较实验结果,得出实验结论,撰写论文初稿。
4.2011年11月-2012年3月
进一步充实和完善论文,准备论文答辩。
G:
学科、专业所在院意见
(部门公章)院长:
(签字)
年月日
H:
研究生学院意见
(部门公章)院长:
(签字)
年月日
论文开题报告答辩委员会成员名单
姓名
职称
本人签字
主席
院长
委员名单
答辩委员会意见
主席:
(签字)
年月日