常用医学统计方法

发布 2021-02-07 04:10:28 阅读 1005

统计学是以数学方法观察和比较事物的一门学科。

一、研究对象:存在的事物或现象

变异:性质相同)对象之间存在的差异。

变异导致的现象有,个体≠个体;个体≠部分;部分≠部分;部分≠全部。

上述四种不同如果是变异所致,则不同是表像,相同才是本质。

鉴于“变异”的存在,当欲判断事物与事物有无不同时,必需考虑排除因变异。

导致的“假性”不同。

二、基本概念。

1、总体:由确定的研究对象

2、样本:**于总体,对总体有的。

样本具备‘代表性’的条件:

a、遵循(化)原则:总体中个体被抽取的机会。

b、样本含量(观察对象数量)适宜。

3、抽样误差:

1)样本指标(均**于同一总体)之间的差别。

2)样本指标与总体指标(样本**于该总体)之差。

应用意义:抽样误差存在的原因是变异。

样本与样本之间存在的抽样误差,并非真正不同,而是“同质”。

4、概率:指事件发生的可能性,用符号“p”表示。

小概率事件:指p≤0.05( 5% )的事件。

小概率事件原理:在一次观察中小概率事件不会发生。

1、 某病房将同类患者按入院次序编号,偶数组给予传统护理方法,奇数组给予新护理方法,每组30人。以期观察和比较两种护理法的效果。评价用表示则:

(1)上述研究的“真正”对象,是若干还是全体糖尿病患者?

(2)研究之前,两组对象同质吗?平均数必须相等吗?

(3)在研究之中,两组对象同质吗?

(4)上述“同质”的观察角度分别是:同类病人;同类护理方法;同类效果。

2、(1)指出下列可能由导致的现象:

2)指出下列可能由导致的现象:

x :个体观察值,x :样本平均数,μ:总体平均数。

a、x1≠x2 b、x1≠x2 c、x ≠x d、x≠μ e、μ1≠μ2

三、统计资料种类:资料不同,统计分析方法亦不同。

1、计量资料:由数据组成,可以计算。

2、计数资料:由数据组成,可以计算。

3、等级资料:既有计量又有计数性质(了解)

四、统计工作的基本步骤:

1. 统计:确定研究对象、内容;控制误差。

随机:使样本对总体有代表性。

对照:平行对照(观察组、对照组);自身对照。

双盲:调查者不知被调查者属于何组,避免诱导误差。

被调查者不知自己属于何组,避免依从性误差。

齐同:观察组与对照组的对象,除了被观察因素不同,其他所有条件均应相同。

2、资料:3、资料:4、资料:

以统计指标描述样本资料(频数分析:均数、率等)

以大样本代表总体,评判归属(医学正常值范围) —应用在个体水平)

以样本指标估计总体情况 (总体指标可信限应用在总体水平)

判断样本与样本、样本与总体是否同质(假设检验)——应用在样本水平)

判断的事物之间是否有关系(相关与回归分析)

1、 表示计量资料的统计指标,是资料数值“大小”的代表,即。

2、常用平均数有三种:不同的资料选用不同的平均数。

一、算术平均数:用μ表示;用x表示。

1、应用条件:数据呈或近似正态的。

2、计算方法:掌握计算器运算方法。

直接法:略。

加权法:原理(与直接法相比较)

以组中值代替原始数据。

大样本资料可以用直接法计算均数吗?

直接法和加权法计算公式中,“x”的含义有何区别?

直接法与加权法计算均数,那一种结果更精确?

二、几何均数(g)

1、应用条件:呈的,如资料。

2、计算方法:将所有数据(x)取对数(lgx)→求“算术均数”→取反对数。

三、中位数(m)

1、概念:将一组数据按大小顺序排列,数据之,即为中位数。

2、应用条件:呈的计量资料。

3、计算方法:

1)直接法:排序及目测位居中间的数据之值。

2)频数表法:计算关键——以n/2,找出。

式中:l =中位数所在组段的

i =中位数所在组段的。

fm =中位数所在组段的

σfl =中位数所在组段的。

1、是表示正态分布计量资料的统计指标。

2、以δ表示,以s表示。

3、意义:反映观察值之间的程度,δ大表示数据分散,δ小表示数据集中。

4、计算:重点掌握“应用公式”和计算器运算:(1)直接法:(2)加权法:

5、应用:1)标准差反映了一个资料(内部)的变异程度。

2)在x±1.96s的范围内包含了95%的观察值,故常用x±1.96s计算医学正常值。

1、标准差是表示正态分布计量资料的统计指标。

a、集中趋势b、离散程度。

c、频数分布d、数据最大值与最小值之差。

3、偏态分布计量资料常用表示集中趋势。

a、m b、g c、x d、s

4、调查100名女大学生血清总蛋白含量(g/l),得:x = 73.82(g/l),s = 3.91(g/l)

用公式x±1.96s计算,理论上女大学生血清总蛋白95%正常值范围为多少?

所计算的正常值范围仅适用于100名女大学生吗?

如要适用于女大学生,研究样本必须符合什么条件?

要知道人类血清总蛋白含量的情况,假如不存在,研究的对象需要多少名?

对频数表用计算器计算x和s时,掌握正确输入方法。,

1、每一个正态分布均能转换为标准正态分布(亦称u分布)

x1 μ x2u1 0 u2

由于对于具体资料,μ与δ是常数。故每个x可得到一个u值,形成u分布。

如:x=μ时,u=0;x1与x2之间包含的面积(数据),与u1到u2之间的面积相同;

如果某x值位于x1与x2之间,则对应的u值必然位于u1到u2之间;

如果某x值大于x2(或小于x1),则对应的u值必然大于u2(或小于u1)。

2、标准正态分布下的面积常数:可查表,用于计算医学正常值范围。

如:±1.64——90%的面积,[,2.58——99%的面积。

将面积常数代入公式x= μuδ,即可换算出相同比例的正态分布之面积。

即u=[,之间包含着95%的u ,故[, 之间也包含95%的数据(x)。

抽样误差的概念?产生的原因?可以避免吗?怎样缩小抽样误差?

1、原理:1) x分布与标准误。

许多x可形成一个x分布,**与同一总体的许多x(n相同)也可形成x分布。

n不同时,x分布也不同。

与x分布相比,x分布的集中趋势x=μ,离散趋势用(δx)标准误表示。

标准误“理**式”为:δx=δ/n “应用公式”为: sx = s/ n

sx是δx的估计值,计算sx仅用某个样本数据即可,但其已超出了该样本。

标准误的意义:(掌握)

标准误是 是表示抽样误差大小的统计指标;sx越小,表示。

样本均数x对μ的代表性越好、越可靠。

同样95%的x分布在μ±1.96δx区间内(与95%观察值范围计算相类似)

2)t分布。

由于实际上不能获得δ,故以s替代,计算出sx 代替δx。可获得t值。

t分布与u分布一样也是标准分布,但n不同t分布不同。

与u值一样,t值也可由查表而得。通常只需查t0.05值。

x=μ±1.96δxx=μ±t 0.05sx (95%的x分布范围)

x1 μ x2t1 0 t2

即当图中t1与t2分别取值为±t0.05时,则μ± t 0.05sx之间包含了95%的样本均数(x)。

当n≥100时,t分布已接近u分布,为了少查表,上式可改为x=μ±1.96sx

% 总体均数可信区间是以x为中心,两侧均延伸“t0.05sx”长度形成的一个区间。

t0.05sxt0.05sx

x-t0.05sx x x+t0.05sx

2、总体均数可信区间的应用意义:调查在样本水平,应用在总体水平,如保险费的估计。

以统计指标进行事物与事物的,称为“统计检验”或“假设检验”

一、计量资料的假设检验。

1、 统计检验(假设检验)的前提:

所比较的两个x(或x与μ)能**于同一总体,即x1≠x2 属于抽样误差。

经计算t值,进行两个均数的比较,称为t检验。

当样本含量[, 时,t值已接近u值。此时可用u0.05(1.96)代替t0.05 进行判断。所进行的均数的比较,称“u检验”。

2、统计检验(假设检验)步骤 --四步。

1)假设、确定检验水平。

h0:(无效假设)即假设两个x所属总体相同,差别为抽样误差。表达为μ1=μ2

h1:(备择假设)即假设两个x所属总体不同,差别为本质差别。表达为μ1≠μ2

:(检验水平)通常取5%,表达为α= 0.05

2)计算统计量。

t=?(当样本含量n<100时) 或 u=?(当样本含量n≥100时)

3)确定概率值(p值)

医学研究常用统计方法选用手册

一 两组或多组计量资料的比较。1.两组资料。1.1大样本资料或服从正态分布的小样本资料。1.1.1若方差齐性,则作成组t检验。1.1.2若方差不齐,则作t检验或用成组的wilcoxon秩和检验。1.2小样本偏态分布资料,则用成组的wilcoxon秩和检验。2.多组资料。2.1若大样本资料或服从正态分...

医学生常用统计

计数资料与计量资料。医学统计资料按其性质一般分为计数资料与计量资料两类。不同类型的统计资料应采用不同的统计分析方法。计数资料是先将观察单位按某种属性或类别分成若干组,再清点各组观察单位个数所得到的资料。如临床某些检验结果用阳性或阴性反应表示,对一批某病患者检验完毕后,清点呈阳性或阴性反应的各有若干例...

医学常用英语

医务人员常用语 1 what can do for you?你有什么事?2 may i help you?我能帮你什么忙?8 please take a seat!please sit down!请坐下 4 wait a moment,please 请等一等 5 sorry to h e kept ...