绪论。统计学家劳先生在《统计与真理——怎样运用偶然性》中指出:在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都是统计学。
一、 统计学的概念、发展简史及主要内容。
1.统计学:是以概率论和数理统计为基础,对研究对象的数据进行搜集、整理和分析,揭示事物总体特征和规律的方**科学。
2.中医统计学:是以概率论和数理统计的原理和方法为基础,以中医理论与实践为主体,通过对数据的搜集、整理和分析,达到**中医理论与方法内在规律的目的。
3.统计学的发展趋势:
依赖数学。②与计算机技术结合。
与实质性学科、统计软件、现代信息相结合,所发挥的功效日益增强。
从描述事物现状、反映事物规律,向抽样推断、**未来变化方向发展。
4.统计学的主要内容。
研究设计:专业设计、统计学设计⑵统计学的基本概念、原理和思维方法。
统计描述:统计指标、统计图表⑷统计推断:参数估计、假设检验。
二、统计工作的基本步骤和特点。
1.统计工作的基本步骤。
1)统计学设计。
2)搜集资料:①常规保存的记录;②现场调查记录;③实验/试验记录;④医学文献/网络信息。
3)整理资料:①检查;②审核;③计算机检查;④分组。
4)分析资料。
2.统计学认识现象的特点。
1)数量性:(2)群体性:(3)具体性:(4)概率性:
三、统计学中常用的概念。
1.总体(population):是根据研究目的确定的同质观察单位的集合。
例①河北省18岁男性的身高和体重分布②某性红地2023年健康成年男细胞数。
河北省18岁身高在170-175cm男性的体重分布。
有限总体:指总体限定于特定的空间、时间范围内有限个观察单位。
无限总体:指没有空间和时间范围限制的总体。
2.样本(sample):从总体中随机抽取的有代表性的一部分观察单位的集合。
样本的可靠性:指总体确定后,样本中的每一个观察单位确属预先规定的同质总体。
样本的代表性:即样本能够充分反映总体的真实情况。
3.随机(random):即在抽样、分组、安排试验顺序时,让总体中每个受试者或观察单位都有同等的机会被抽中、被分配或被安排,而不受研究者的主观意愿驱使。
不能将随机理解为随便。
4.事件(event):指事物发生某种情况或在调查、观察和实验中获得的某种结果。
确定性事件是可预言在一定条件下必然发生的事件,发生的概率为1。
随机事件:指一定条件下可能发生也可能不发生的不确定性事件,发生的概率介于0~1之间。
模糊事件:事物本身的含义不确定的现象。
5.频率(frequency):对于随机事件a,在相同的条件下进行了n 次实验,事件a发生的次数为m,比值m/n 为频率,记为fn(a);
概率(probability):描述某随机事件a发生的可能性大小,统计符号为p, 0≤p≤1,记为p(a)。
当n→∝时,频率fn(a)→概率 p(a)。
小概率事件:表示某事件发生的可能性很小,在医学研究中,习惯上把p≤0.05或p≤0.01的事件称为小概率事件。
6.变异(variation):总体中各个体之间的差异性。
同质是相对的,研究对象只是在某一方面是性质相同的,同类的观察对象之间往往也存在着变异。变异是绝对的、客观存在的。
7.误差(error):指测量值与真值之差。
过失误差:也叫粗差。观测者粗心大意造成的误差。
系统误差:由于仪器未校准、试剂未标定、观测标准未统一等固定原因造成的误差。
测量误差:由事先难于预料的实验或观察条件的随机波动造成的误差。
抽样误差:由抽样引起的样本指标(统计量)与总体指标(参数)的差别。
8.统计量(statistical):是反映样本特征的统计指标。
统计符号为小写的英文字母。如样本均数、样本标准差s 、样本率p 等。
9.参数(parameter):是描述总体特征的统计指标。
统计符号为小写的希腊字母。如总体均数μ、总体标准差σ、总体率π等。
10.统计资料的类型。
根据研究目的,对研究对象的某些特征进行观测,将这些观测指标或项目称为变量。
变量的具体数值(变量值)构成了统计数据或统计资料。
统计资料分为两类:
1 值变量(numerical variable):亦称定量资料。是指对每个观察单位用计量方法测得某项。
数值大小所获得的资料。
特点为其变量值大多有度量衡单位,其具体取值通常是正实数(零、正整数和小数)。
如身高1.75m、体重68kg、血压9.6kpa、血糖6.8mmol/l。
分类变量(categorical variable):又称定性资料。指对每个观察单位按某一方面的特征、性质或等级分组计数而得到的资料。
特点是变量值表现为互不相容的属性或类别,无度量衡单位。
分类变量又可分为两类:
1 序分类变量:又称为名义资料。具体取值通常是具有某种属性或特征的个数。
特点是可在非数字中取值,各类之间具有性质上的差异。
可分为二分变量和多分变量。
二分变量是按互不相容的属性分成两类的资料。
多分变量是按某种属性或特征分成两类以上的资料。
2 序分类变量:亦称等级资料或半定量资料。具体取值也是具有某种属性或特征的个数,但不同取值之间有半定量的关系。
特点是其各类别间有等级、程度或量的差异,即可按数量的相对大小或程度的高低排出顺序。
四、学习中医统计学的目的。
1.顺应中医药学的发展趋势。2.强化中医科研的计划性和科学性。
3.拓宽研究思路。4.学会正确地运用统计方法和合理地解释统计结果。
五、学习中医统计学的注意事项。
1.理解和领会基本概念和原理,切忌死记硬背。2.不追究公式的**和推导,但要掌握其应用条件。3.重视分析问题和解决问题能力的培养。4.学会使用统计软件。
数值变量资料的统计描述。
统计描述——概念:即利用原始数据,选择适宜的统计指标及统计图表,简明准确地探察数据的分布类型和数量特征的基本统计方法。
目的:是根据样本中所包含的信息,客观、正确地推论出其总体规律。
第一节频数分布。
频数:相同观察值或观察结果出现的次数。
分布:指随着随机变量取值的变化,其相应的概率变化的规律性。
频数分布:观察值(变量值)按大小分组,各个组段内观察值个数(频数)的分布,是了解数据分布形态特征与规律的基础。
一、 频数分布的特征。
1.集中趋势:指一组变量值的集中倾向或中心位置。
2.离散趋势:即一组变量值的离散倾向。
二、频数分布的类型。
1.对称分布:指集中位置居中、左右两侧的2.非对称分布:亦称偏态分布,是集中位置。
频数分布基本对称的频数分布。偏倚、两侧频数的分布不对分为正态分布和非正态分布两称的频数分布,可分为正。
种类型。偏态和负偏态分布。
三、频数分布表/图的作用。
1.直观地揭示数据的分布类型和特征。
2.便于发现资料中某些远离群体的特大或特小的可疑值。
3.描述频数分布的集中趋势与离散趋势。
4.便于进一步计算统计指标。
四、频数表。
概念:频数分布表的简称。指观察值或某些类别及其相应的频数按一定顺序排列的**。
例题:随机抽取某地120例正常人,测得血清铜的含量(μmol/l)如下表,试编制频数表。
频数表的编制方法:
1.找极值:xmax=19.84,x min =9.23
2.求全距:r=xmax-x min ,r19.84-9.23=10.61
3.定组数:k=8~15。
4.求组距:i=r/k–1)(i为组距,k为组段数,r为全距)i=10.61/(11-1)=1.061≈1
5.确定各组段的上下限:
6.归纳计数:
某地120名正常成年人血清铜含量频数表。
组段频数f频率。
统计学复习
统计学。第1章统计与数据。1.统计学 是收集 处理 分析 解释数据并从数据中得结论出的科学。2.统计分析数据的方法分为两大类 描述统计 是研究数据收集 处理和描述的统计学方法。描述统计的内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合 概括与分析,得出所关心...
统计学作业
课程 生物统计学。学号 2010114010132 作业次数 p23 第二章试验资料的整理与特征数的计算。习题2.5 某地100例30 40岁健康男子血清总胆固醇 mol l 测定结果如下 试根据所给资料编制次数分布表。解 1.求全距。7.22 2.70 4.52 mol l 2 确定组数和组距 参...
统计学试卷
兰州商学院200x 200x学年第x学期期末考试。一 选择题 每小题1分,共10分 1 若销售量增加,销售额持平,则物价指数 a 不变 b 增长 c 降低 d 无法确定。2 从变量之间相关的方向看,可分为 a 完全相关和无相关 b 直线相关和曲线相关 c 单相关和复相关 d 正相关与负相关。3 要了...