一、名词解释。
视知觉:直方图均衡化:
拉普拉斯算子:
统计模式识别:人工智能:
无监督学习:
视感觉:直方图规定化:
马尔算子:人工神经网络:
有监督学习。
模糊聚类:参考:
1. 视知觉主要论述人们从客观世界接收到视觉刺激后如何反应以及反应所采用的方式,视知觉是在神经中枢进行的一组活动,它把视野中一些分散的刺激加以组织,构成具有一定形状的整体以认识世界。
2. 直方图均衡化的基本思想是把原始图的直方图变换为在整个灰度范围内均匀分布的形式,这样就增加了像素灰度值的动态范围,从而达到增强图像整体对比度的效果。
3. 模板的基本要求是对应中心像素的系数应是正的,而对应中心像素邻近像素的系数应是负的,且所有系数的总和应该是零。
4. 统计模式识别方法就是用给定的有限数量样本集,在已知研究对象统计模型或已知类判别函数条件下根据一定的准则通过学习算法把d维特征空间划分为c个区域,每一个区域与每一类别相对应。模式识别系统在进行工作时只要判断被识别的对象落入哪一个区域,就能确定出它所属的类别。
一个统计模式识别系统应包含预处理、特征抽取、分类器等部分。
5. 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。研究用计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。
6. 无监督式学习是人工智能网络的一种算法,目的是对原始资料进行分类,以了解资料内部结构。有别于监督学习网络,无监督学习网络在学习时并不知道其分类结果是否正确,亦即没有受到监督式增强(告诉它何种学习是正确的)。
其特点是仅对此种网络提供输入范例,而它会自动从这些范例中找出潜在类别规则。当学习完毕并经测试后,也可以将之应用到新的案例上。
7. 视感觉中主要研究的内容有:①光的物理特性;②光刺激视觉感受器官的程度;③光作用于视网膜后经视觉系统加工而产生的感觉。
8. 用户可指定规定化函数来得到特殊的增强功能,3个步骤:①对原始图的直方图进行灰度均衡化,②规定需要的直方图,并计算能使规定的直方图均衡化的变换,③将第1步得到的变换反转过来,即将原始直方图对应映射到规定的直方图。
9. 在每个分辨率上进行如下计算:①用一个2-d的高斯平滑模板与原图像卷积,②计算卷积后图像的拉普拉斯值,③检测拉普拉斯图像中的过零点作为边缘点。
10. 人工神经网络从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络;神经网络是一种运算模型,由大量的节点(或称神经元)相互联接构成;每个节点代表一种特定的输出函数,称为激励函数;每两个节点间的连接代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆;网络的输出按网络的连接方式,权重值和激励函数而不同;网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。
11. 有监督学习是指利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练实例,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。
监督学习算法是分析该训练数据,并产生一个推断的功能,可以映射出新实例。
12. 模糊聚类分析是指根据研究对象本身的属性来构造模糊矩阵,并在此基础上根据一定的隶属度来确定聚类关系,即用模糊数学的方法把样本之间的模糊关系定量的确定,从而客观且准确地进行聚类。聚类就是将数据集分成多个类或簇,使得各个类之间的数据差别尽可能大,类内之间的数据差别尽可能小,即“最小化类间相似性,最大化类内相似性”原则。
二、简答。1、计算机视觉的定义、研究方法、研究的目标是什么?它和图像处理、机器视觉、模式识别、人工智能、计算机图形学等相关学科有哪些联系或区别?
计算机视觉是指用计算机实现人类的视觉功能。就是用各种成像系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。
计算机视觉的研究方法目前主要有两种,①仿生学的方法:参照人类视觉系统的结构原理;②工程的方法:实现系统的功能。
计算机视觉的主要研究目标可归纳成两个:①建立计算机视觉系统来完成各种视觉任务;②加深对人脑视觉机理的掌握和理解。
相关学科:(1)图像理解:与计算机视觉有相同的目标;(2)机器视觉:
更关注通过视觉传感器获取环境的图像,构建具有视觉感知功能的系统以及实现检测和辨识物体的算法;(3)模式识别:图像就是模式的一种;(4)人工智能:视觉功能是人类智能的体现(1分);(5)计算机图形学:
计算机视觉的反/逆问题。
2、 实现图像分割有哪几类技术方法?各自的特点是什么?
图像分割方法可以分为两大类。一类是边界方法,这种方法假设图像分割结果的某个子区域在原来图像中一定会有边缘存在;一类是区域方法,这种方法假设图像分割结果的某个子区域一定会有相同的性质,而不同区域的像素则没有共同的性质。
根据上述分割操作策略的不同,图像分割主要可以分为以下四种技术:并行边界分割技术、串行边界分割技术、并行区域分割技术和串行区域分割技术。其特点可作如下归纳。
并行边界分割技术:不同图像灰度不同,在边界处通常都会有明显的边缘,利用此特征可以分割图像。串行边界分割技术:
并行边缘检测的方法,对图像的每一点上所做的处理不依赖于其他的点处理结果。串行边界分割在处理图像时不但利用了本身像素的信息,而且利用前面处理过像素的结果。对某个像素的处理,以及是否把它分类成边界点,和先前对其他点的处理得到的信息有关。
并行区域分割技术:采用并行的方法对目标区域进行检测实现图像分割的方法。区域分割是最直接的方法,因此这种分割方法可以直接得到感兴趣的目标区域。
串行区域分割技术:采用串行处理策略对目标区域直接检测实现分割的方法。特点:
整个处理过程可以分解为顺序的多个步骤依次进行。可分为:区域生长,分列合并。
3、 摄像机的标定程序和标定步骤?两级标定法的原则?
标定程序:令a = prt,a中的元素包括摄像机平移、旋转和投影参数。
获得m ≥ 6个具有已知世界坐标(xi, yi, zi)的空间点;
用摄像机拍摄这些点以得到图像平面坐标(xi, yi);
把这些坐标代入上两式以解出未知系数。
标定步骤:第1步:标定旋转矩阵r和平移矢量t;第2步:标定焦距λ;第3步:标定镜头径向失真系数k;第4步:标定不确定性图像尺度因子μ。
两级标定法的原则:先外部参数,即摄像机姿态参数(如摄像机的位置和方向或平移、扫视角和倾斜角);后内部参数,摄像机自身参数(如焦距、镜头径向失真、不确定性图像尺度因子);如果μ已知,标定时只需用一幅含有一组共面基准点的图像即可;如果μ未知,标定时需用一幅含有一组不共面基准点的图像。
4、 请详细描述marr视觉计算理论。
marr认为视觉是一个复杂的信息加工过程,要解决两个问题:一个是视觉信息的表达问题,另一个是视觉信息的加工问题。他从信息处理系统的角度出发,认为视觉信息加工有三个要素,即计算理论、算法实现、硬件实现。
一个任务要用计算机完成,它应该是可以被计算的;这就是可计算性问题,需要用计算理论来回答。
有了计算理论后,还必须要有算法实现,为此需要给加工所操作的实体选择一种合适的表达。
有了表达和算法,在物理上如何实现算法也是必不可少的;特别是随着对实时性要求的不断提高,专用的硬件实现问题常常被提出来。
三、分析与计算。
1、已知某含噪声的图像f如图所示,用中值滤波模板m对噪声点(已经标明)进行处理,求去噪结果。
2、给出一幅图像的四方向链码(原码)为1-0-1-0-3-3-2-2,取左下像素点的右上角点作为初始点,画出其轮廓。
3、一幅图像的象素灰度级为256、大小为1024×1024的图像的数据量多少mb?假设网络的平均传输速率为1mbit/s,需要多少秒才能传送完毕?每个像素可以用8比特表示。
图像的数据量是1024×1024×8/8=1 mb,需要1 mb /1mbit/s =8s才能传送完毕。
4、判断下列模板类型,包括平滑模板、锐化模板和边缘检测模板。
m1边缘检测模板、m2锐化模板、m3平滑模板。
5、一幅32×32,8个灰度级的数字图像,各灰度级所占像素个数见下表,对其进行直方图均衡化处理,求实际直方图、变换函数以及变换后的直方图(取两位小数)。
四、设计与应用。
1、设计一个基于计算机视觉的车辆自动识别收费系统,要求该系统可以对行驶中的车辆进行车型和车牌识别,在不停车的情况下实现车辆按型号不同分类收费的功能。列出系统的总体结构和主要组成模块,并阐述它们的功能和作用。
系统的拓扑图如图所示,车辆进入收费站时触发埋设在地下的地感线圈,产生触发信号,收费计算机控制嵌入式车牌识别模块进行图像抓拍,抓拍到的车辆车牌图像经**采集卡送到收费计算机,并由嵌入式车牌识别模块识别车牌,根据识别出的车牌在数据库中查找对应车型,若数据库已存在该车车型,系统通知软件自动打印发票;若该车型尚未被数据库确认,软件将提示收费员人工确认该车车型。再进行打印发票收费。车牌车型信息在同一管理中心下属各收费站共享。
2、按下图分析说明虹膜识别的过程,以及虹膜抓拍系统的软件流水线。
虹膜识别的过程依次是:捕获人脸的图像、检测眼睛图像、虹膜图像分割、虹膜图像增强与归一化、虹膜特征抽取、虹膜特征矢量编码、虹膜特征数据库匹配、输出识别结果。在整个过程中最重要的是虹膜的分割与特征提取。
计算机视觉 作业
视觉是各个应用领域,如制造业 检验 文档分析 医疗诊断,和军事等领域中各种智能 自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战 grand challenge 计算机视觉的挑战是要为计算机...
计算机视觉作业
1 什么是游程长度编码?答 图象分割 把图像划分成区域,使得每一个区域对应一个候选的目标,这种划分称为图象分割 1.图像分割最简形式 把灰度图 gray image 转换成二值图 简单阈值化方法,自动阈值化方法 模态方法 mode 迭代式阈值选择法,自适应阈值化方法,变量阈值化方法,双阈值方法。3 ...
计算机视觉理论学习总结
第一部分 深度学习。1 神经网络基础问题。1 backpropagation 后向传播是在求解损失函数l对参数w求导时候用到的方法,目的是通过链式法则对参数进行一层一层的求导。这里重点强调 要将参数进行随机初始化而不是全部置0,否则所有隐层的数值都会与输入相关,这称为对称失效。大致过程是 首先前向传...