1、 简述统计数据的两个**,及其相互关系。
从统计数据的观测登记方式和统计数据本身的属性看,统计数据存在着两种不同的**:一是专门组织的统计调查;二是科学试验、生产实验和交易活动的观测数据。
从使用者的角度看,统计数据存在两种不同的**。
一是直接的**,使用者所应用是由自己亲自观测登记获得的统计数据,属于第一手的统计数据,称为初级数据;
二是间接的**,使用者所应用是由他人观测登记获得的统计数据,属于第二手的统计数据,称为次级数据。
任何第二手统计数据都是**于他人观测登记所获得的第一手统计数据。归根到底,专门组织的统计调查,科学试验和生产实验的观测数据是统计数据的**所在,是第一性的,决定着统计数据的质量。
2、 简述普查、抽样调查的特点和联系。
普查:为了特定目的而专门组织的一次性或周期性的全面调查,调查在某一标准时间上的社会经济现象的总量。
普查具有以下特点:
1)普查是一种全面调查。
2)普查是一种一次性或周期性的调查。
3)普查是一种调查在某一标准时间上的社会经济现象总量的调查。
抽查:根据随机原则和具体的抽样技术的要求,从总体中抽取部分个体构成样本,并依据样本信息推断总体数量特征的非全面调查。
1)抽样调查是一种按照随机原则抽取样本的调查。
2)抽样调查是一种可以事先估计和控制抽样误差的调查。
3)抽样调查是一种非全面调查。
4)抽样调查是一种准确性高的调查。
5)抽样调查是一种具有广泛适用性的调查。
3、 统计调查方案设计的主要内容。
1.调查任务和目的
2.调查对象、调查单位和填报单位
3.调查项目和调查指标。
4.调查时间
5.调查方法
6.调查误差的控制方法
7.调查数据的汇总处理方法
8.调查表和调查问卷设计
9. 制定调查工作的组织实施计划
4、 问卷设计的主要内容。
a问卷结构问卷结构由问卷的开始,主体和结束三个部分组成。
b封闭性问题及备选答案。
c问题排列。
5、 数据的登记性误差和代表性误差。
1. 登记性误差。
登记性误差是指在调查过程中由于调查者和被调查者的人为原因形成的误差。例如,调查者的人为原因主要有总体界定错误、调查单位缺失、计量和测量误差、记录失误、抄录错误、汇总差错;被调查者的人为原因主要有有意识地提供虚假数据、无意识地提供有误数据。从理论上说登记性误差属于可以消除的误差。
2.代表性误差。
代表性误差是指利用样本数据推断总体参数时产生的误差。分为随机性误差和系统性误差。
1)随机性误差是由于随机性原因形成的代表性误差,它是服从于某一概率分布的随机变量。随机性误差是不可以消除的误差,只要利用样本数据推断总体参数,就必然存在着随机性误差。随机性误差的取值随着样本容量的增大而减小。
2)系统性误差是由于非随机性原因形成的代表性误差。主要原因有抽样框过于陈旧导致的抽样框偏误、非随机样本、无回答问题、辅助数据偏误等。系统性误差属于代表性误差,也是在利用样本数据推断总体参数时产生的误差,但是系统性误差不会随着样本容量的增大而减小,不能通过增大样本容量来实现对系统性误差的控制。
6、什么是统计数据质量的三点标准?
时效性,准确性、一致性。
1、 什么是数据的审核,具体有什么内容和方式?
数据审核是指在进行数据整理之前对原始数据的审查和核对。
内容。统计数据的时效性,准确性、一致性三个方面的标准就是数据审核的基本内容。
1)统计数据的时效性审核。检查是否在规定的统计调查时间内完成数据搜集,采集的数据是否为规定的调查时点上,或规定的调查时段内的数量特征。
2)统计数据的准确性审核。从数据的完整性、真实性和精确性角度进行审核。
3)统计数据的一致性审核。检查统计数据在时间和空间上的连续性和可比性。
方式:逻辑检查和技术检查。
2、 非数值型数据分组和数值型数据分组有那些差别?
非数值型数据的分组也称为分类。定类数据和定序数据都是对事物质的属性的描述,两者都是一种分类性质的数据,只在分类划分的无序和有序上存在差别。
反映事物自然属性的非数值型数据的分组一般比较简单,只要进行适当的细分或合并,以及选择恰当的分组标志即可。
反映事物社会经济属性的非数值型数据的分组一般比较复杂,往往是人们对事物数量特征进行深入地统计分析之后形成的一种质的划分,这种质的划分体现了人们认识活动对与事物由量变到质变的把握,一般采用国家标准、行业标准或者企业标准等标准化的形式确定下来,并借助统计报表和统计调查方案等方式加以明确,以此来规范和指导后续的统计活动。
数值型数据分组可以分为单变量分组和组距分组。
单变量分组是指每个分组只用一个变量值表示的分组形式,又称为单项分组。单变量分组一般在分组标志为离散变量,且变量的取值范围不是太大的情况下使用。
组距分组是指每个分组用一个数据取值区间表示的分组形式。组距分组适用于按连续变量分组或变量的取值范围较大的离散变量的场合。
3、 简述数值型数据分组的具体方式有那些?
4、 怎样确定等距分组中组距、组数和各组上限、下限?
5、 频数、频数分布的概念和意义。
频数(frequence)是落在某一特定分组中的数据个数。
频数分布(frequence distribution)是由各组的频数组成的一个数组。
频数与频数分布总是在具体的分组设置前提下的对总体数据分布特征的描述。
6、 组中值的意义和计算方法。
组距分组中处在各组取值范围中点位置上的数值。
代表性的数值,用来代表该组数据取值的一般水平。
7、 绝对数的概念、种类和计量单位。
绝对数是反映总体绝对规模和绝对水平的测度,是通过数据汇总直接得到的测度。
1.总值和频数。
2.时期数据和时点数据。
3.截面数据和时间序列数据。
计量单位:实物单位、货币单位及时间单位。
8、 统计表的构成和绘制要求。
构成。从形式上看,统计表由表头、行标题、列标题和数据4个主要部分内容组成。此外,在需要时做某些说明时,可以在表的上下端加上附注。
9、直方图、折线图的概念和绘制方法。
1、 应从哪几方面对数据分布特征进行度量,为什么?
数据分布特征的度量包括三个方面:
一是数据分布的集中趋势,反映总体中各个单位的数值水平向其聚集,或者集中的中心数值;
二是数据分布的离散趋势,反映总体中各个单位的数值水平偏离中心数值的综合程度;
三是数据分布的偏态和峰度,反映各个总体单位的数值水平的分布形态是对称或偏倚,平坦或尖耸的具体数值。
2、 度量数据分布集中趋势的测度主要有那些?
众数 频数最大的变量值,直观地反映了数据的集中趋势。众数是度量定类数据集中趋势的测度。
频数最大的数据的数值来反映集中趋势。
当数值型数据中含有极小值和极大值时,使用众数来度量数据的集中趋势,前提是数据的频数分布存在明显的集中态势。
中位数。有序数据正中间位置上的变量值,中位数用其特殊的位置属性直接地体现了集中趋势的中心数值特征。
均值。3、 均值的特征、计算方法、数学性质,及其在度量数据分布特征中的地位。
计算方法:一组数值型数据之和除以该组数据总数的商,即同一组数据的总值与其频数的商。
计算均值的数据需要具备数值型数据的属性,均值是一个数值型的集中趋势测度。通过计算均值的运算过程,首先将各个数据之间的数量差异抽象掉了,以一个抽象性的综合测度概括地反映事物的集中趋势。其次将不同总体的总量规模抽象掉了,表现出来的只是一个一般性的代表水平,有利于不同规模的同类总体在不同空间和时间上的广泛比较。
1. 简单均值。
2.加权均值运用各组频数作为权数对各组数值水平进行加权计算出来的均值。
1)单变量值分组加权均值。
2)采用组均值计算加权均值。
3)采用组中值计算加权均值。
3.权数与加权结构。
均值的数学性质:
1)各个变量值与其均值的离差和为零,即。
2)各个变量值与其均值平均数的离差平方和为最小,即。
当取均值作为集中趋势的测度时,各个数据的取值与集中趋势测度的离差平方和为最小值。均值的这一数学性质是度量离散程度,进行误差分析和最小二乘估计等统计方法的基础。
4、调和平均数。
简单调和平均数:倒数的平均数的倒数。
加权调和平均数:
5、几何平均数。
是指各项数据的连乘积开其项数次方的算术根。
4、 均值、调和平均数和几何平均数的比较。
对于同一组数据,仅从数值比较的角度,有均值大于等于几何平均数,几何平均数大于等于调和平均数。
5、 如何利用均值、众数和中位数的数值特征分析数据分布的偏态?
均值是唯一的数值型测度。均值一般采用算术平均方法计算的集中趋势测度,对极端数值的反应比较敏感,在数据的分布出现偏倚时,均值受到的影响最大。
众数和中位数都是位置型的集中趋势测度,其具体取值不受极端数值的影响。其中众数是对应于最大频数的数值,中位数是居于有序数据中间位置上的数值。
因此,若数据的分布是对称的,有均值、众数和中位数三个集中趋势测度的取值相等。
当数据分布呈左偏态时,一般有均值的取值最小,其次是中位数,众数的取值最大。 在频数分布图上,众数始终对应于峰顶,均值和中位数偏在峰顶的左边,均值又在中位数左边;
当数据分布呈右偏态时,一般有均值的取值最大,其次是中位数,众数的取值最小。在频数分布图上,众数还是处在对应于峰顶的位置,均值和中位数偏在峰顶的右边,并且均值偏在最右边。
6、 度量数据分布离散趋势的测度主要有那些?
异众比率(variation ratio)是非众数所在组的频数之和占总频数的比率。
异众比率数值越大,越趋近于1,说明众数所在组的频数占总频数的比率越低,众数的代表性越弱,反映数据的频数分布不存在显著集中的态势,无法借助众数来反映数据的集中趋势;异众比率数值越小,越趋近于0,说明众数所在组的频数占总频数的比率越高,众数作为集中趋势测度的代表性越强。
四分位差。取值范围。
取值范围的计算只使用了数值变量中的最大与最小两个数值,具有计算简洁,意义明确,易于理解的特点,但是没有充分利用数据的全部信息,是一个粗略的,简单的,尤其是容易受到极端数值影响的测度。
平均差。全部变量值与其均值的离差的绝对值的均值,也称为平均离差,用表示。
C考点汇总
第一部分整理 据说必考的!以下数字都是书上的页码 p53 注意 base p59实参和形参之间的四种按值传递!一定要掌握的!p110集合类,据说要写程序!自己看吧p125多catch语句的这段 要掌握啊!p129委托是个重点,委托 这个标题下面的几行阴影的字!p132事件,与委托的区别和联系!p13...
新增考点汇总
主观辩证法 客观辩证法。概念 客观辩证法是客观世界本身所固有的辨证运动规律。主观辩证法是人类认识和思维运动的辩证法,对客观辩证法的反映,是以概念 判断 推理等思维形式表现出来的思维发展的辩证法,可以概括地把主观辨证法称为概念辩证法。联系 区别 内容上都是客观的,但二者的表现形式不同。客观辩证法是通过...
会计考点汇总
1 会计科目汇总表。2 账户结构练习资料 南方公司2008年各账务有关资料如下 横向看。第一章 1 简述会计核算的对象。5 施工企业会计核算对象就是施工企业资金运动 货币资金形态 储备资金形态 生产资金形态 成品资金形态 货币资金形态 阶段 施工生产阶段 工程点交阶段 施工企业会计核算对象就是施工企...