模式识别作业

模式识别简介。

pattern recognition

诞生。狗的嗅觉的灵敏度非常高，大约是人的50至100倍。狗通过这项特异的功能来识别各种各样的东西，帮助人类完成一些鉴别工作。

不仅如此，识别也是人类的一项基本技能，人们无时无处的在进行“模式识别”，古人有一成语“察言观色”表达的正是这个意思。

模式识别是人类的一项基本智能，在日常生活中，人们经常在进行“模式识别”。随着20世纪40年代计算机的出现以及50年代人工智能的兴起，人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。计算机模式识别在20世纪60年代初迅速发展并成为一门新学科。

概念。简单来说，模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为“模式”。

随着计算机技术的发展，人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说，特别重要的是对光学信息（通过视觉器官来获得）和声学信息（通过听觉器官来获得）的识别。

这是模式识别的两个重要方面。市场上可见到的代表性产品有光学字符识别（optical character recognition, ocr）、语音识别系统。其计算机识别的显著特点是速度快，准确性高，效率高。

在将来完全可以取代人工录入。

模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析，以对事物或现象进行描述、辨认、分类和解释的过程，是信息科学和人工智能的重要组成部分。

研究。模式识别研究主要集中在两方面，一是研究生物体(包括人)是如何感知对象的，属于认识科学的范畴，二是在给定的任务下，如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容，后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力，已经取得了系统的研究成果。

应用计算机对一组事件或过程进行辨识和分类，所识别的事件或过程可以是文字、声音、图像等具体对象，也可以是状态、程度等抽象对象。这些对象与数字形式的信息相区别，称为模式信息。

模式识别所分类的类别数目由特定的识别问题决定。有时，开始时无法得知实际的类别数，需要识别系统反复观测被识别对象以后确定。

模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人工智能的学习机制；人工智能研究的景物理解、自然语言理解也包含模式识别问题。

又如模式识别中的预处理和特征抽取环节应用图像处理的技术；图像处理中的图像分析也应用模式识别的技术。

应用领域包括：计算机视觉、医学图像分析、光学文字识别、自然语言处理、语音识别、手写识别、生物特征识别、人脸识别、指纹识别、虹膜识别、文件分类、互联网搜索引擎、信用评分、测绘学、摄影测量与遥感学。

以“汉字识别”为例：

识别过程与人类的学习过程相似。首先将汉字图象进行处理，抽取主要表达特征并将特征与汉字的**存在计算机中。就像老师教我们“这个字叫什么、如何写”记在大脑中。

这一过程叫做“训练”。识别过程就是将输入的汉字图象经处理后与计算机中的所有字进行比较，找出最相近的字就是识别结果。这一过程叫做“匹配”。

还有一些比较典型的应用例子如：

去雾算法：由有雾的**处理成无雾的过程用的是一种基于暗影通道的去雾算法。

相机照出的相片=真实相片*透谢分布率+天空亮度。这里要做的就是根据公式求出真实相片，另外三个未知量是可以求出来的。

交叉验证方法：

用来验证分类器的性能一种统计分析方法，基本思想是把在某种意义下将原始数据进行分组，一部分做为训练集，另一部分做为验证集，首先用训练集对分类器进行训练，在利用验证集来测试训练得到的模型，以此来做为评价分类器的性能指标。

纹理：在自然图象中，纹理作为物体的一种重要外观特征，为视觉感知提供了无处不在的信息，它在计算机视觉、图形学、图像编码等领域都有着重要作用，例如，格式塔（gestalt）心理学，早期视觉理论和marr的原始简约图（primal sketch）都将纹理模式作为中心话题。

因此，对纹理的理解是视觉理解不可或缺的组成部分。过去的几年里，纹理分析和合成的相关研究工作在基础理论上与实际应用两个方面都取得了振奋人心的发展，研究者结合计算机视觉，图形学，现代统计物理，心理学和神经系统科学等领域的知识，提出了很多关于纹理理解的新方法。纹理的研究工作主要集中在两个领域：

滤波理论（filtering theory）和统计建模（statistical modeling）理论。滤波理论**于在神经生理学中被发现并被广泛接受的多通道滤波机制，该机制认为，人类视觉系统将视网膜图像分解为一组子带（sub-band）图像信号，而这些子带信号可以通过一组线性滤波器和图像卷积然后经过某些非线性操作计算得到。滤波理论在纹理方面的应用主要有 gabor 滤波器和小波（w**elet）塔等，它们在纹理分割和分类中有良好的性能。

统计建模理论认为，纹理图像是随机场上概率分布的采样，该理论涉及到时间序列模型（time series model），马尔可夫链（markov chain）模型和马尔可夫随机场（markov random field，mrf）模型等建模方法。基于统计的建模方法一般只需要用很少几个参数来描述纹理特征，因此能为纹理提供简练的表示，而且它能把纹理分析问题转化为一个明确的统计推理问题来处理。

计算机视觉研究中低层视觉的一个主要研究方向是图像分割。由于一个场景中，不同的物体之间有不同层度的交叠，使得最理想的分割结果也会出现物体的不同部分（可视部分）之间分割开来，而不可视部分则为其它物体所覆盖的情况，这就不利于完整地展现物体。因此，有必要利用由图像得到的相关信息，如原始简约图（primal sketch）、颜色一致性、方位一致性等，研究一套算法，把同一物体分在同一个层里面，然后再把它们相应的部分之间连接起来，组成完整的物体。

这就是2.1d sketch的主要研究任务。

2.1d sketch主要研究面物体，且不关心物体之间的深度信息，而只考虑它们之间的偏序关系（partial order）。

2.1d sketch的研究成果将会用于图像分割、图像编辑、艺术图像生成以及图像序列分析中。

机器学习：机器学习是人工智能的一个分支，它是关于让机器具有学习能力的一些算法。许多情况这种算法给一些数据和从这些数据属性的推出的信息对将来出现的新的数据做出**。

之所以可以这么做是因为大多数的非随机的数据包含一些模式，这些模式可以让机器去做泛化。

机器学习的相关概念扫盲：

监督式学习：训练数据中包含输入的向量集合并且有相应的目标值（labeled样例）

例如分类（classification）、关联规则、回归(regression)

非监督式学习：训练数据中不包含labeled样例。

例如聚类(cluster)、density estimation、visualization.

半监督式学习：组合了labled和unlabeled的example去生成一个函数或分类。

泛化（generalization）：通过训练数据训练之后能够识别新的数据。

特征提取(feature extraction): 为了降维去除不想关的特征，在数据预处理阶段把数据转化成容易处理的。

机器学习的局限性：

机器学习在大量的模式面前的泛化能力是不同的，如果一个模式不同于以前所看到的，那么这个算法很容易被误解。由于当前的数据量不够，不能涵盖各种将来的情况，所以机器学习的方法很容易出现过度泛化，从而出现不准确性。

adaboost人脸检测原理：

一种基于积分图、级联检测器和adaboost 算法的方法，方法框架可以分为以下三大部分：

第一部分，使用harr-like特征表示人脸，使用“ 积分图”实现特征数值的快速计算；

第二部分，使用adaboost算法挑选出一些最能代表人脸的矩形特征( 弱分类器)，按照加权投票的方式将弱分类器构造为一个强分类器；

第三部分，将训练得到的若干强分类器串联组成一个级联结构的层叠分类器，级联结构能有效地提高分类器的检测速度。

总结。自20世纪50年代以来，模式识别在人工智能兴起后不久就迅速发展成一门学科。它所研究的理论和方法在很多科学和技术领域得到广泛重视，推动了人工智能系统的发展，扩大了计算机应用的可能性。

经过多年的研究和发展，模式识别技术已广泛被应用于人工智能、计算机工程、机器学、神经生物学、医学、侦探学以及高能物理、考古学、地质勘探、宇航科学和**技术等许多重要领域，如语音识别、语音翻译、人脸识别、指纹识别、手写体字符的识别、工业故障检测、精确制导等。模式识别技术的快速发展和应用大大促进了国民经济建设和国防科技现代化建设。

模式识别作业

模式识别作业

模式识别作业

模式识别作业

其他用户还读了