机械工程专业作业题

发布 2022-07-18 17:26:28 阅读 9807

1.四足步行中,为什么说“间歇式小跑步态具有容易控制的特。

点”?答:以占空比为0.

5的小跑步态为基准,取更大的占空比为0.5-1的步态,各脚的相对位相与小跑步态完全相同,来考虑只让占空比变化的步态。即为对角线上的两脚总是同时抬起同时落脚、其游脚时间对应的占空比将变短的步态。

如fig.2.38所示,两对脚间的位相差没有改变还是0.

5,小跑步态的2拍节奏变成了间歇式进行。所以,将其称为“间歇小跑步态”。该步态具有容易控制的优点。

2.小跑、蹓蹄、跳跃三种步态中,使机器人可达实用化程度的最。

适步态是哪种?并解释为什么?

答:小跑步态是机器人可达实用化程度的最适步态。因为小跑步态占空比为0.

5,占空比小的步态更适合于快速步行,而且当占空比小于0.75时,支撑脚相对于躯干的速度要比游脚速度大,步行速度取决于支撑脚以多快的速度向后蹬腿。3.

强化学习方法的特点、基本思想及其构成要素各是什么?

答:强化学习的最大特点是完全不需要关于环境与机器人自身的先验知识信息的学习方法。机器人一边感知当前环境的状态,一边行动。

根据状态和行动,环境迁移到新的状态,相应于新的状态的“奖惩”报酬信息返还给机器人。机器人根据“报酬”信息决定下一个行动。标准的强化学习,智能体作为学习系统,获取外部环境的当前状态信息s,对环境采取试探行为u,并获取环境反馈的对此动作的评价r

和新的环境状态。如果智能体的某动作u导致环境正的奖赏(立即报酬),那么智能体以后产生这个动作的趋势便会加强;反之,智能体产生这个动作的趋势将减弱。在学习系统的控制行为与环境反馈的状态及评价的反复的交互作用中,以学习的方式不断修改从状态到动作的映射策略,以达到优化系统性能目的。

强化学习的构成要素有:

1)策略:从环境感知到的状态到该状态下应该采取的行动映射。2)报酬函数:

它用来定义强化学习问题的目标。该函数把从环境感知到的状态映射成一个数值化的“报酬”值,该报酬表示了从该状态所得到的期望程度。

3)价值函数:与某一时刻(或状态)意义上反应行动结果好坏的报酬函数相对应,价值函数则指定了最终什么是好的。所谓状态的“价值”是智能体以该状态为基点过渡到所期望的将来的过程中,所蓄积的报酬的总量。

4)环境的模型:这是为模仿环境的举动而建立的。例如:

设状态和行动被给定,则该模型将**作为结果生成的下一个状态和下一个报酬。模型是为了在实际执行行动之前考虑将来可能的状况而决定动作的方法的意义上所进行的规划而使用的。4.

简要回答:阶层型进化算法中ep层的操作过程是什么?

答:阶层型进化算法的操作过程——in ep layer

1)initialization——ga层、ep层的个体群被生成。(2)ep-mutation(ep层的遗传操作器)—生成新的候补解个体。

3)ep-evaluation—对ep层的各个体的适应度进行评价。(4)ep-selection—下一代的ep层个体群被选择。

5)transfer-configuration—由ep层向ga层传送适应度好的个体。

由以上四个操作,ep层个体群得到进一步地进化,生成更好的中间姿势,如此进行下去。被生成的中间姿势通过该操作被转写给ga层,使ga层的个体发生变化。5.

解释双足步行、四足步行的稳定性?

答:双足步行稳定性是确保单腿支撑期的机器人足与地面完全接触,使得各个自由度直接可控,避免出现欠驱动的翻转情形。作用在机器人上的惯性力和重力的合力与地面反力平衡,把垂直方向上的地面反力的合力的作用点称为地面反力中心,与zmp一致。

四足步行稳定性是总能保证有3只脚支撑成为步行稳定性判定的指标。我们称其为“静态稳定性”。规划好的步行运动能够按照原样丝毫不乱地进行时,该运动规划就可以称之为具有动态稳定性。6.

四足步行步态的用途?

答:a.移动脚步的一种特定的方式或样板;

b.通过用不同的节奏抬脚向前行进的步法,如慢跑、快步走或行走;

c.步调,行进步伐的速度或方式。四足步行步态有:

动物爬行步态和小跑步态:爬行步态的占空比为0.75,2拍步行。

的小跑步态占空比为0.5,占空比小的步态更适合于快速步行,而且当占空比小于0.75时,支撑脚相对于躯干的速度要比游脚速度大,步行速度取决于支撑脚以多快的速度向后蹬腿。

波动步态:是爬行步态与小跑步态的融合,也将其称为扩展的小跑步态,在这个步态中,可以通过低速情况下加大占空比、高速情况下减小占空比来适应于速度变化。

间歇小跑步态:以占空比为0.5的小跑步态为基准,取更大的占空比为0.5-1的步态,各脚的相对位相与小跑步态完全相同,来考虑只让占空比变化的。该步态具有容易控制的优点。

机械工程专业作业二。

7.什么是前馈控制?前馈+反馈控制?后者的pd控制器构成?

答:前馈控制是将被控变量的一个或多个影响条件的信息转换成反馈回路外的附加作用的控制。指通过观察情况、收集整理信息、掌握规律、**趋势,正确预计未来可能出现的问题,提前采取措施,将可能发生的偏差消除在萌芽状态中,为避免在未来不同发展阶段可能出现的问题而事先采取的措施。

由通过几个点的spline函数表示连续的时间波形,再通过离散点可以操作连续函数的变化。然后,根据控制目的,为使预先决定的动作的评价函数变得更好不断地进行试行错误的学习。为此需要给出逐次搜索的修正算法和概率性搜索的修正算法。

目标是生成时间函数的波形作为控制输入。

前馈控制是一种**控制,通过对系统当前工作状态的了解,**出下一阶段系统的运行状况。只有前馈的情况下,当有外界扰动时,运动变化很大,很难把握住目标。因此,在前馈的同时还进行两个反馈控制,以尝试抑制外界扰动。

其一是对于目标轨迹追踪的反馈控制,另一个是臂的方向反馈控制。

控制基本动作行为的基本行为控制器,输出目标状态的子控制器,反馈控制器。8.

ga(遗传算法)的基本原理是什么?简述ga的基本操作。

答:模拟自然界生物繁衍规律的一种简单算法,目的是找到问题求解近似最优解,其基本原理为:

1)算法的每个成员的适应度根据适应度函数的评估函数来计算,适应度函数测量个体在给定任务领域的性能的好坏。

2)最好的个体被成比例地传播其适应度,而性能不好的个体将被削减或或全部消除。

3)通过个体之间为产生新的搜索点进行信息交换,整个群体将探索空间并收敛到一个最优解的领域。

遗传算法可心发现最优解,但不保证一定能发现。遗传算法的基本操作:

1)种群——某一类物种或者搜索空间范围内群体。为同一类物种或繁殖池中所有个体的集合。

2)个体——某一类物种或者搜索空间范围内群体中的一员,在算法中,为含有信息的独立位串,每一位都相当于“染色体”串上的一个“基因”。

3)复制操作——选择适应度最大的个体,然后部分或完全复制下来,并代替适应度差的个体,保持群体大小不变。这一操作加大了性能良好的个体与差的个体的比例。

4)交叉操作——两个个体交换其形式表达的部分信息。通过这一操作防止个体群收敛到适应度高的个体时发生信息丢失。该操作是根据交叉概率决定的。

5)突变操作——任意选择一个以上的位使之反转,此操作是根据突变概率决定的。

6)选择操作——选择新一代的个体群。由n个个体生成n个子体,由个体、子体合起来的2n个解候补个体按照适应度高的次序选择n个个体,作为下一代的n个个体组成的种群。9.

试以双足步行机器人为例概括说明基于ga及ep(演化算法)

的阶层型进化算法的进行步行样本生成的基本方法。答:在ga层中,可进行某一目的动作或动作样本的评价。

在ep层中,进行ga层动作样本的中间姿势的评价,生成更好的新的中间姿势。

ga、ep层的各模块相互作用,ep层的评价函数依赖于在ga层的当前获得最高评价的个体,如果在ga层当前的最优个体发生变化,则ep层的评价函数变化,ep层的进化形态发生变化。相反,在ga层,ep层的个体开始被转写给个体ga层的个体,由于被转写,ga层的个体发生变化。这样,各层一边相互依存,一边共同进化下去。

阶层型进化算法的操作过程——in ep layer

1)initialization——ga层、ep层的个体群被生成。(2)ep-mutation(ep层的遗传操作器)—生成新的候补解个体。(3)ep-evaluation—对ep层的各个体的适应度进行评价。

(4)ep-selection—下一代的ep层个体群被选择。

5)transfer-configuration—由ep层向ga层传送适应度好的个体。

6)ga-crossover—遗传算法中的“交叉”操作。(7)ga-mutation—遗传算法中的“突变”操作。

8)ga-selection—对ga层的每个个体进行适应度的评价,然后选择适应度高的个体生成下一代的ga层个体群。

9)change-ep-evaluation-function—改变评价函数。通过上述9项操作,ga层的个体群得到进化,最优的动作样本被生成。

阶层型进化算法中的操作器:1)ep-mutation operator2)ep-selection operator

3)transfer-configuration operator4)ga-crossover operator5)ga-mutation operator6)ga-selection operator

7)change-ep-evaluation-function operator

10.基于ga及ep(演化算法)的阶层型进化算法的进行步行样本生。

成的基本方法。

答:阶层型进化算法由被称为大范围内生成动作样本的ga层和评价生成中间层的ep层两大模块组成。两层相互影响、共同进化下去。可以生成适于各种环境的动作。

在ga层中,可进行某一目的动作或动作样本的评价。在ep层中,进行ga层动作样本的中间姿势的评价,生成更好的新的中间姿势。

ga、ep层的各模块相互作用,ep层的评价函数依赖于在ga层的当前获得最高评价的个体,如果在ga层当前的最优个体发生变化,则ep层的评价函数变化,ep层的进化形态发生变化。相反,在ga层,ep层的个体开始被转写给个体ga层的个体,由于被转写,ga层的个体发生变化。这样,各层一边相互依存,一边共同进化下去。

阶层型进化算法的操作过程——in ep layer

1)initialization——ga层、ep层的个体群被生成。(2)ep-mutation(ep层的遗传操作器)—生成新的候补解个体。(3)ep-evaluation—对ep层的各个体的适应度进行评价。

(4)ep-selection—下一代的ep层个体群被选择。

5)transfer-configuration—由ep层向ga层传送适应度好的个体。

6)ga-crossover—遗传算法中的“交叉”操作。(7)ga-mutation—遗传算法中的“突变”操作。

8)ga-selection—对ga层的每个个体进行适应度的评价,然。

后选择适应度高的个体生成下一代的ga层个体群。

9)change-ep-evaluation-function—改变评价函数。通过上述9项操作,ga层的个体群得到进化,最优的动作样本被生成。

11.前馈学习基本思想?

答:前馈学习的基本思想——作为机器人通过学习获得前馈动作的方法,用spline函数表示控制输入的时间波形,在动作行为的反复试行中通过评价函数让输入波形变化,进行“探索性的学习”。为进行高效地搜索,采用启发式(heuristics)方法的算法,进行逐次修正和高效搜索。

12.强化学习方法的基本思想?

答:强化学习通过让机器人从学习过程中能够获得发现性的动作、行为,以适应变化的环境并自主地做出对策和响应。标准的强化学习,智能体作为学习系统,获取外部环境的当前状态信息s,对环境采取试探行为u,并获取环境反馈的对此动作的评价r和新的环境状态。

如果智能体的某动作u导致环境正的奖赏(立即报酬),那么智能体以后产生这个动作的趋势便会加强;反之,智能体产生这个动作的趋势将减弱。在学习系统的控制行为与环境反馈的状态及评价的反复的交互作用中,以学习的方式不断修改从状态到动作的映射策略,以达到优化系统性能目的。

机械工程材料作业题

第一章作业。1 试述下列力学性能指标的定义 1 弹性模量 定义 材料在弹性变形阶段,其应力和应变成正比例关系 即符合胡克定律 其比例系数称为弹性模量。单位 达因每平方厘米。意义 弹性模量可视为衡量材料。2 比例极限 拉伸曲线中oe段,材料在不偏离应力与应变正比关系 胡克定律 条件下所能承受的最大应力...

机械工程材料作业题

第一章作业。1 试述下列力学性能指标的定义 1 弹性模量 2 比例极限 3 屈服点 4 屈服强度 5 抗拉强度 6 延伸率和断面收缩率 7 疲劳极限 8 断裂韧性 9 冲击韧性。2 画出退火低碳钢的拉伸图,并根据拉伸图说明金属拉伸时的变形和断裂过程。3 何谓金属材料疲劳?疲劳曲线有几种?4 试述各种...

机械工程测量作业题

第一次作业。1 一般计算机测量系统的基本组成包括哪些主要环节,每个环节的作用是什么?2 什么是信噪比snr?假如用某仪器测量某信号时的信噪比为60db,已知噪声为0.01v,则信号电压为多少?3 阐述测量装置的静态特性指标及其定义?4 线性定常系统有那些基本特性?说明线性系统的频率保持性在测量中的作...