机器学习笔记 导论必看

发布 2021-05-12 23:58:28 阅读 2381

第一章:导论。

1.1什么是机器学习,为什么需要机器学习。

大数据时代,要求机器能自动分析数据,能从已知的数据中学习一些隐藏的模式,来**未来的数据,或者执行一些决策。

机器学习大体分为两类:**或者有监督学习:这个方式需要有训练数据库,然后给定输入特征、属性或者协变量,给定输出的信息。

如果输出的是类别信息,则称这类问题叫分类问题,或者模式识别问题。如果输出的是连续值,则称这类问题为回归问题(regression)。

描述(descriptive)或者无监督学习:这类问题只有输入信息,而没有关于输入的任何结构、模式等信息。给定输入,需要挖掘其内在的一些模式,因此有时候叫知识挖掘(knowledge discovery)。

还有第三类学习方法,叫增强学习(reinforcement learning),这类方法是用较少,1.2有监督学习:

分类问题:给定带有标注的输入数据,训练学习一个**函数。然后,利用这个**函数多新的样本进行**或者标注,这个过程也就推广(generalization)。

利用概率模型,我们可以将这类问题描述为概率形成:

利用map estimate原则,即最大化后验概率来决策。

**问题:给定的输入,输出可能是连续值。比如**年龄、**温度等值。

1.3无监督学习。

无监督学习意在发掘数据的“有意思”的结构信息,在这类方法中,从概率的角度讲,我们要构建带参数的概率密度估计。

无监督学习主要有以下几类:聚类算法、降维算法(高维数据显示)、图的结构挖掘、矩阵填充(matrix completion)。

有监督学习通常的概率描述:

无监督学习通常的概率描述:

1.4机器学习中的重要概念。

1,有参数模型和无参数模型;2,维度灾难;3,线性回归;logistic回归;4,过拟合;5,模型选择;6,没有免费的午餐原理。

【没有免费的午餐原理】:我们在一个数据域上所做的假设,不一定在其他的数据域也同样工作的很好;实际上往往在其他域内性能很差。这个原理产生的结果是,我们开发出很多不同的模型,来覆盖现实世界中的不同的数据。

CAD学习笔记,初学CAD必看

cad学习笔记,初学cad必看。网上找到的一份cad学习笔记,每张图虽然没有讲详细绘图步骤,但将审图思路 绘图基本步骤和重点难点给列出来了,我觉得对初学者会有帮助,在此分享一下,前面几张图加上了我的注解。第一部分。1 1图 审图 本题主要是用相对坐标画图,各点的坐标都可以计算出来。绘图步骤 先建立两...

机器人导论作业

1.什么是齐次坐标?与直角坐标有何区别?所谓齐次坐标就是将一个原本是n维的向量用一个n 1维向量来表示。区别 二直角坐标 x,y 可表示为齐次坐标,即 hx,hy,h 由此可以看出,一个向量的齐次表示是不唯一的,齐次坐标的h取不同的值都表示的是同一个点,比如齐次坐标 8,4,2 4,2,1 表示的都...

机器人导论作业

学院 化工学院。班级 高分子151 姓名 郝昊昇。学号 151268 对于我们来说机器人并不陌生,因为有好多关于机器人的电影 动画片 漫画 等知名度很高,使得现在社会中不管是小孩就连不识字的老人都知道有那么一种神奇的东西,它能在人们无法适应的恶劣的环境下干活,他能做很多人们做不了的事,甚至有人发出这...