本次作业的任务是进行**分类实验,实验数据集由20个类别共2000张**组成,其中1000张**用于训练,另1000张**用于测试(详情见附录a)。
1) 为训练**提取底层特征,用特征向量表示训练**; (找训练样本分类属性)
2) 利用训练**的特征向量和类别标注数据训练分类器; (利用属性进行分类标注)
3) 为测试**提取底层特征,用特征向量表示测试**; (找训练样本分类属性)
4) 使用训练好的分类器对测试**的特征向量进行**分类;利用模型进行分类**。
5) 对**分类的结果进行评测分类结果**。
【要求】在本次大作业中,至少要用到以下底层特征:
1) hsv颜色特征:将h通道量化到18个值,s通道量化到3个值,v通道量化到3个值,hsv三个通道共量化到18x3x3=162个值;
2) cie-lab颜色特征:将l通道量化到4个值,a通道量化到8个值,b通道量化到8个值,lab三个通道共量化到4x8x8=256个值;
3) 除hsv颜色特征和cie-lab颜色特征以外,自选一种颜色特征;
4) 除以上颜色特征之外,自选2种非颜色类的底层特征(比如说,纹理特征和形状特征)。
建议】除以上要求的底层特征之外,可以自己查阅资料,使用更多更好的底层特征。
建议】可以在对不同的底层特征进行融合的过程中,观察不同的底层特征之间的互补关系,并加以分析。
【要求】在本次大作业中,至少要用到以下分类器:
1) libsvm:svm是一种被广泛采用的分类方法,libsvm是一个应用非常普遍的开源的svm实现,当前的最新版本是2.85版本(**地址);
2) 除libsvm外,自选另外两种分类方法。
建议】除以上要求的分类器之外,可以自己查阅资料,使用更多更好的分类方法。
建议】可以在实验过程中,观察不同的分类方法的效果优劣,并加以分析。
为了便于进行**分类结果的评测和比较,在实验的过程中请将**分类结果输出为以下统一的格式:
1) 每一行由3个数字组成,分别是**(在整个**集中)的序号、**的真实(标注)类别、**分类程序的**类别;
2) 由于共有1000张**,该文件共有1000行。
**分类实验的评测指标平均准确率a是所有类别的准确率的平均值,即:
a=(a1+a2+…+a20)/ 20
其中ai是对类别i的测试**进行**分类的准确率,定义如下:
ai=ri / ni
其中ri是类别i的测试**中**分类正确的**的数目, ni是类别i的测试**的数目(对于本次作业的**集ni=50)。
【要求】图形界面:实现一个图形化的界面用来展示**分类结果。
建议】可以按照下图进行图形化演示界面的设计。其中a为**类别列表,b为当前选定类别的训练**列表,c为当前选定类别的测试**列表。
【建议】图形化演示界面的原则是越能清楚地反应**分类结果越好,越美观越好。并不一定要按照上面的结构进行设计。
要求】confusion matrix: 将**分类结果的confusion matrix以一张图的形式显示出来。confusion matrix是一个20x20的矩阵,其中的第(i,j)个元素,是测试**中第i类**被判断为第j类的概率。
confusion matrix中每一行中所有元素的和应为1。confusion matrix中对角线上的第(i,i)个元素是第i类**的分类准确率ai,对角线上所有元素的平均值就是**分类实验的平均准确率a。
建议】尽量将confusion matrix的图做的清楚,美观。例子:下面是一个6个类别的**分类实验的confusion matrix(出处)。
confusion matrix的数据:
本次作业至少需要提交以下内容:
助教将根据“程序说明”编译你提交的源**,并重新运行**分类程序,因此,你提交的源**应该能够在windows xp操作系统上正常编译和运行。由于资源限制,你的程序不应该使用超过2g的内存,总的运行时间不应该超过12小时。在绝大多数情况下,这个限制是非常宽松的。
如果出现**无法编译、占用内存过多、运行时间过长或运行出错、运行结果与作业文档中的结果不一致等情况,在正常评分的基础上将酌情减分。
本次大作业采用的实验**集含有20个类别共2000张**(每个类别各100张**(其中训练**50张,测试**50张),如下表所示。
数字图像处理大作业
1图像变换。1.1实验背景。在数字图像应用领域,图像需要进行分析 变换 压缩或者增强来提高图像的可处理性和视觉效果。其中,图像变换是将图像从空间域变换到频率域,变换的目的是根据图像在变换域的某些性质对其进行处理,而这些性质在空间域难以获取,通常在频率域才能获取,在变换域处理完后再反变换到空间域,恢复...
数字图像处理大作业
图像处理技术。大作业。院 系 物联网工程学院。专业 计算机科学与技术。班级 学号 姓名 摘要。图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。它是图像处理 模式识别和人工智能等多个领域中的重要课题,也是计算机视觉技术中首要的 重要的关键步骤。图像分割的应用非常广泛,几乎出现在有...
数字图像处理大作业
西安电子科技大学。数字图像处理。上机大作业。教师 教授。学院 通信工程学院。班级 专业 电子与通信工程。姓名 学号 f1与f2的幅度谱相同,因为f1与f2振幅的绝对值是相同的。f3的幅度谱与f2的幅度谱按顺时针旋转90度后相同。f4的幅度谱与f1的幅度谱按顺时针旋转90度后相同。f5的幅度谱是f1与...