考试课程名称:多元统计分析学时: 60 考试方式:闭卷(a)
考试内容:*答案请写在答题纸上,写在试题纸上无效。
一、下面是5个样品两两间的距离矩阵。
试用最长距离法作聚类并画出谱系图10分)
二、设有三个总体和,概率密度分别为,假定各总体的先验概率相等,误判损失如下:
现有一样本,使,按照贝叶斯判别准则,应将该样品判归哪个总体10分)
三、 简要回答下列问题:
1) 作多元线性回归分析时,自变量与因变量之间的影响关系一定是线性形式的吗?多元线性回归分析中的线性关系是指什么变量之间存**性关系?
2)如何考虑两个自变量对因变量的交叉作用?对于实际应用问题,如何设定回归方程的形式?
3)如何考察自变量之间是否存在多重共线性的问题?如果存在多重共线性,会有怎样的不良后果?如何在尽量不降低模型解释能力的前提下消除多重共线性问题?
4)如何诊断数据中的异常数据?是否只要存在异常数据,都会对回归方程的参数估计以及**效果造成较大的影响?为什么?
5)标准化的回归方程与非标准化回归方程有何不同?在怎样的情况下需要将变量标准化? (28)
四、简述系统聚类法、模糊聚类法的基本思想和步骤,在实际应用时,如何确定分类数。
目? (12分)
五、解释因子分析模型中,变量共同度与公因子方差贡献的统计意义。为什么有时候需要作因子旋转?有哪些估计因子得分的方法?因子得分的计算是不是通常意义下的参数估计?
(10分)综合题:(30分)
六、 无论是国家或是地区,综合实力的竞争归根到底是经济与科技实力的竞争。一个地区的科技实力水平以及发展状况决定它在将来总体格局中的地位。某省决定对其所辖的21个地区科技实力进行综合评价。
为此委托某科研小组对以下问题进行研究:
1) 确定适当的评价指标体系,采用科学的评价方法对21个地区科技实力进行综合评价;
2) 确定影响各个地区科技发展的因素,提出促进科技发展的对策建议;
3) 研究该省21个地区科技发展状况的差异性,了解各个地区科技发达程度。
假设你是该科研小组成员,你觉得在这个课题的研究过程中,可以应用哪些多元统计方法?请指出每种方法的应用具体设想。
(15分) 七、某校研究生院基于该校全体研究生的各方面信息,拟对以下问题进行调研:
1)了解研究生们本科阶段的成绩与研究生阶段学习成绩的关系;
2)了解相同院系或专业的研究生中,免试推荐研究生与通过国家研究生入学考试而录取的学生之间的研究生课程成绩是否有差异;如果存在差异,则要弄清楚原因;
3)了解不同专业、来自于不同地区或不同本科院校的研究生们在学习成绩,科研能力等方面的状况。
4)了解影响研究生能力和综合素质培养的主要因素,提出相应对策建议。
如果你是研究小组成员,你将采用怎样的多元统计方法研究以上问题?请指出每种方。
法的具体设想。
15分)
多元统计2023年试题
一 计算最优三分割。二 设有两个一元正态总体g1 和g2 分布分别为n 0,0.25 m 0,4 假定两个总体的先验概率相等,误判损失如下 c 2 1 10,c 1,2 40,现有一样本x0 1.5,1 采用距离判别法判断该样品的归属。2 采用贝叶斯判别准则确定样品的归属。三 简要回答下列问题。1 ...
多元统计作业
一 回归分析。1.某地区二化螟的第一代成虫发生量y与四个因素有关,这四个因素是 x1 冬季积雪期限 单位为周 x2 每年化雪日期 以2月1日为1 x3 二月份平均气温 x4 三月份平均气温 y 二化螟发生总量 头 试建立二化虫发生总量的回归方程,已知原始观测数据如表1。表12 实习要求 1.用回归分...
多元统计作业
1 据统计成都市连续74年的谷物产量 单位 千吨 如附录1.1 判断该序列的平稳性和纯随机性。2 选择适当模型拟合该序列的发展。3 利用拟合模型,成都市未来5年的谷物产量?2 某段时间记录某人的体重 单位 公斤 如附录2.1 判断该序列的平稳性和纯随机性。2 如果序列平稳且非白噪声,选择适当模型拟合...