人工智能结课报告Word格式文档下载.docx
《人工智能结课报告Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《人工智能结课报告Word格式文档下载.docx(8页珍藏版)》请在冰豆网上搜索。
机器视觉系统是指通过机器视觉产品(即图像摄取装置,分CMOS和CCD两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号;
图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。
机器视觉系统适合于人工作业的危险工作环境或人工视觉难以满足要求的场合,常用机器视觉来替代人工视觉;
同时在大批量工业生产过程中,用人工视觉检查产品质量效率低且精度不高,用机器视觉检测方法可以大大提高生产效率和生产的自动化程度。
而且机器视觉易于实现信息集成,是实现计算机集成制造的基础技术。
三.三个问题回答
1.应用价值:
为什么跟踪这个项目?
答:
我在上工程训练课上,见到了零件加工厂里的现代自动化生产过程,人们将机器视觉系统广泛地用于装配定位、产品质量检测、产品识别、产品尺寸测量等方面。
当时觉得非常惊奇,在上了人工智能课后对机器视觉有了一定的认识后,我就更感兴趣。
就对此进行了跟踪。
机器视觉系统具有效率、高柔性、高度自动化等特点。
在大批量工业生产过程中,如果用人工视觉检查产品质量,往往效率低且精度不高,用机器视觉检测可以大幅度提高检测效率和生产的自动化程度;
同时,在一些不适合人工作业的危险工作环境或工人视觉难以满足要求的场合中,也常用机器视觉来替代人工视觉,如核电站监控、晶圆缺陷检测;
而且,机器视觉易于实现信息集成,是实现计算机集成制造的基础技术之一。
正是由于机器视觉系统可以快速获取大量信息,而且易于自动处理及信息集成。
(1)非接触测量,对于观测者与被观测者都不会产生任何损伤,从而提高系统的可靠性。
(2)具有较宽的光谱响应范围,例如使用人眼看不见的红外测量,扩展了人眼的视觉范围。
(3)长时间稳定工作,人类难以长时间对同一对象进行观察,而机器视觉则可以长时间地作测量、分析和识别任务。
(4)机器视觉系统的应用领域越来越广泛。
在工业、农业、国防、交通、医疗、金融甚至体育、娱乐等等行业都获得了广泛的应用,可以说已经深入到我们的生活、生产和工作的方方面面。
在国外,机器视觉的应用普及主要体现在半导体及电子行业。
机器视觉系统还在质量检测的各个方面已经得到了广泛的应用,并且其产品在应用中占据着举足轻重的地位。
目前国内随着经济水平的提高,3D机器视觉也开始进入人们的视野。
目前3D机器视觉大多用于水果和蔬菜、木材、化妆品、烘焙食品、电子组件和医药产品的评级。
它可以提高合格产品的生产能力,在生产过程的早期就报废劣质产品,从而减少了浪费节约成本。
这种功能非常适合用于高度、形状、数量甚至色彩等产品属性的成像。
在行业应用方面,主要有制药、包装、电子、汽车制造、半导体、纺织、烟草、交通、物流等行业,用机器视觉技术取代人工,可以提供生产效率和产品质量。
例如在物流行业,可以使用机器视觉技术进行快递的分拣分类,不会出现目前大多快递公司人工进行分拣,减少物品的损坏率,可以提高分拣效率,减少人工劳动。
2.难点:
机器视觉解决问题有哪些难点
①不能适应各种工程应用情况
在实际应用中即使使用恒定的光源和高质量的镜头,但由于系统机械误差、特别是检测产品的多样化(形状、姿态、反光度、透明度、材质纹理等)导致实际图像千变万化,难以预测,也不可能建立理想模型去预估实际情况,因此需要视觉检测系统从图像采集、光源照明到检测算法都必须有很好的适应能力,即对各种情况的检测对象都必须保持稳定的检测结果。
图像采集硬件必须尽量采集到突出检测对象的图像,检测算法必须在图像存在各种失真、干扰、部分缺失、遮挡、重叠的情况下保持很好的稳定度,才能在实际当中真正可靠应用。
在稳定度、可靠性得到保障的情况下,系统才有实际应用意义,脱离稳定可靠,过多限制条件下的精度没有实际意义
②系统的易操作性能差
机器视觉系统的应用场合,大多是缺少高级技术人员,操作工的技术水平有限,不可能理解和调整复杂的系统参数以及复杂的检测算法原理。
很多视觉系统通过调整许多参数可以使系统对不同产品能够达到较好效果,但实际应用中,操作员没有能力去调整过多难以理解的参数,导致系统的功能大打折扣。
因此,系统设计必须简化,检测算法的设计必须将检测参数精简到几个可以很好理解的参数,同时又不影响整个检测算法的效果。
检测参数的调整最好配有可视化的辅助调整手段,提供调整建议。
同时图形化的编程和可以灵活组态修改检测算法的系统具有明显的优势。
在实际调试中,能够快速高效率地修改检测算法可以使系统更容易调整,或可调整。
实际应用中,有时可提供的调整和测试时间是非常有限的。
给予调试人员修改检测算法的信息往往也是有限的。
要精简检测参数,实际上必须找到检测的关键点和重要点。
③系统不容易维护
工程应用的系统必须考虑在长期运行当中的可维护性,即出现故障如何快速排除。
许多实际系统,大量采用模块化设计,分布式系统、嵌入式系统大量应用。
将功能集成模块化,许多维护工作就是模块的的组合和替换。
集成相机、CPU、检测软件、I/O的智能图像处理相机系统得到大量应用。
一个很小体积的模块就等于以往一个庞大的系统。
其稳定性、可靠性高,同时在实际工程安装、调试当中非常方便。
信号线都有标准接口、软件有各种组态软件和图形化的编程软件,检测算法有通用性,不需要专业图像处理专业知识就能理解和使用。
④系统的性价比
系统往往受系统性价比影响,不能采用过多昂贵的部件,性能较好的低廉的系统才能被实际接受。
优化组合各种部件,取长补短达到最佳的性价比是衡量一个系统的重要标志。
3.收获:
通过跟踪机器视觉,你学到了什么?
我了解到了机器视觉的组成及工作原理:
机器视觉系统处理的核心目标是“图像”,一目标物体的“图像”被单帧或多帧采集量化为数字化信息,反之可以说,用一些离散的数字化数值阵列就可以表示一目标物体的“图像”。
对于复杂的“图像”或需要进行更高精度的处理来说,采集量化的数字化信息则要求更大。
即处理精度与数字化信息量成正比。
一般来说,图像用多级亮度来表示并进行量化采集,即所谓灰度法。
以灰度来表示图像量化的每一个像元素特征。
基于灰度法的机器视系统框图由图1所示。
图1机器视觉系统组成框图
机器视觉系统包括:
光路系统、面阵摄像机(CCD)、量化存贮单元、模板库、专用高速处理单元、监视单元等大模块。
其中光路系统由程控光源、变焦伺服机构、自动光圈、光学镜片组等组成。
对于以灰度进行量化处理的机器视觉系统而言,图像亮度是一个尤为重要的参数,而决定这一重要参数的因素便是光路系统的质量。
一般来说机器视觉系统为了避免环境自然光线或灯光对其工作状态的影响,光路设计均采用自足光源,程控光源要求亮度大、亮度可调、均匀性好、稳定性高,以抑制外界环境各种光对图像质量产生较大影响而导致机器视觉系统故障或误判行为。
其次,光路系统设计需满足视场需求和图像分辨率要求。
它的设计质量决定了图像质量,决定了机器视觉系统的准确率。
工业生产中采用的机器视觉系统,灰度级差异较大,小到二值图像、大到256灰度级,以及特殊需求可更大。
采用的灰度级越大,数字化图像越逼真清晰,越接近原视图。
一般来说,人眼能分辨的灰度级约为50〜60级之问。
因此64级灰度足以提供必要的观察信息及辨认需求,这是许多机器视觉系统采用64级灰度级的原因。
但是,要使机器视觉系统具有很强的精密区别目标的能力,一般采用的灰度级为256级,但是由于要处理的信息量很大,要求处理单元有足够快的运算能力。
例如采用512X512阵列像元图像量化为二值图像,一帧图像信息量为262144Bit,而按256级灰度时,一帧图像信息量为2000000Bit。
因此,实用化的机器视觉系统除尽可能选用专用高速处理单元外,还应根据不同应用需要选取,在识别处理精度、处理时间长短、像元灰度级等因素之间进行综合平衡,以达到高效、实用的目的。
机器视觉系统常用的摄像机一般为固态CCD或线阵摄像机,面阵分辨率可为300-700线或更高,线阵分辨率则可多达4048像元以至更高。
根据需求进行取舍配置。
机器视觉系统的精度取决于摄像机视场和所包含的像元数量,视场越小,每个像元代表的距离也越小,识别精度也越高。
标准CCD像元阵列为768X576和512X512二种。
另外,为满足某些需要较大视场较小分辨率的要求,可设计多路CCD将视图分割为一个个较小视场,又可提高分辨率。
机器视觉系统的核心是专用高速图像处理单元,如何把存入存贮单元大量离散的数字化信息与模板库信息进行比较处理,并快速得出结论是处理单元软、硬件面对的问题。
运算信息量大,意味着处理结果的准确率高,但如果运算时问较长,机器视觉便失去其存在的意义。
这种信息量与运算速度之问的矛盾已成为世界各国微处理器研制生产厂商必须面对的课题。
目前,已有多种视觉专用硬件处理器芯片、DSP芯片等等不断涌现并被广泛应用于计算机、通讯、娱乐等产品之中,进行高速图像计算、数据压缩,解压缩、贮存与传输。
除去硬件因素,选用适当的算法,可以提高处理运行效率,减少存贮容量、提高运算速度及准确度。
图像处理算法软件及技巧也成为高效机器视觉系统需要精益求精、探索不止的目的和不可缺少的重要组成部分。
四、综述:
为了解决你感兴趣的问题,你查找了哪些资料?
为了了解机器视觉以及机器视觉系统的运用我查了很多资料,主要阅读参考的文章有《基于图像分析与处理的电能表示值读取系统》、《机器人视觉实验平台及其算法设计》。
下面是这两本书的大体介绍:
书名:
基于图像分析与处理的电能表示值读取系统
【关键词】:
电表图像采集图像识别DSPCPLD
【摘要】:
目前长寿命机械式电表、全电子式电表只有码盘显示用电数据,因其价格便宜、使用寿命长,得到了广泛应用,但需要依靠人工进行抄表和收费管理。
为实现抄表终端的信息化,本文提出了基于数字图像处理技术的自动抄表和自动识别读数的解决方案。
即设计抄表器,用其上的摄像头采集电表数字码盘的图像信息,自动对采集的表盘数据进行处理,识别出电表数字码盘的数字信息(电量值)以及用户的ID信息,并将信息存入抄表器中,实现抄表终端的信息化。
论文利用数字图像处理技术和嵌入式技术,设计了电能表示值读取系统。
采用CMOS图像传感器0V5017采集电能表示值图像,应用CPLD来设计图像数据采集接口,通过逻辑综合优化设计,实现了功能仿真和时序分析,减少了CPU端软件设计的复杂度,提高了数据采集速度,使得采集图像的清晰度有了很大的提高,为图像数据的有效识别打下基础。
设计了键盘和液晶显示器接口,实现了友好的人机界面。
本文根据普通电能表的表盘数字特征采用了基于Canny算子的分割处理算法,减小了数据运算量,提高了准确率;
在图像预处理环节,提出了基于增大亮度和对比度的平均阈值法,提高了二值化图像的清晰度和可处理度,为后续的图像处理奠定了基础;
采用了数字特征提取法,进行数字识别,即对每个数字提取横线、竖线、水平过线数、垂直过线数四个特征,并设立相应的特征表,既简化了数字识别算法,又提高了识别准确度。
基于图像分析与处理的电能表示值读取系统,把抄表工作从繁重的体力劳动中解放出来,实现自动抄表,是抄表系统的一种很好的替代与补充,将有很好的发展前景。
【作者】:
李建志
机器人视觉实验平台及其算法设计
双目立体视觉机器视觉特征匹配自由度视觉机构
双目体视具有广阔的应用前景,随着光学、电子学以及计算机技术的发展,不断进步,逐渐实用化,双目体视将被应用于生产、生活中的各个领域。
20世纪80年代初,Marr视觉计算理论的提出,使计算机视觉研究有了一个比较明确的体系,对计算机视觉的研究产生了有力的推动作用。
然而