医学统计学知识点总结

知识点

1. 统计学是应用概率论和数理统计的基本原理和方法，研究数据的搜集、整理、分析、表达和解释的一门学科。

2. 医学统计学是应用统计学的基本原理和方法，研究医学及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。

3. 统计软件包是对资料进行各种统计处理分析的一系列程序的组合。

4. 统计工作的基本步骤：研究设计、搜集资料、整理资料和分析资料。

5. 科研结果的好坏取决于研究设计的好坏，研究设计是统计工作中的基础和关键，决定着整个统计工作的成败。

6. 统计分析包括统计描述和统计推断。统计描述是对已知的样本（或总体）的分布情况或特征值进行分析表述；统计推断是根据已知的样本信息来推断未知的总体。

7. 医学原始资料的类型有：计量资料、计数资料、等级资料。

8. 计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。

9. 计数资料是把观察单位按某种属性（性质）或类别进行分组，清点各组观察单位数所得资料。

10. 等级资料是把观察单位按属性程度或等级顺序分组，清点各组观察单位数所得资料。各属性之间有程度的差别。等级资料的等级顺序不能任意颠倒。

11. 同质：是指所研究的观察对象具有某些相同的性质或特征。

12. 变异：是同质个体的某项指标之间的差异，即个体变异或个体差异性。

13. 总体是根据研究目的确定的同质研究对象的总体。样本是总体中具有代表性的一部分个体。

14. 抽样研究是通过从总体中随机抽取样本，对样本信息进行分析，从而推断总体的研究方法。抽样误差是由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异，其根源在于总体中的个体存在变异性，只要是抽样研究，就一定存在抽样误差，不能用样本的指标直接下结论。

15. 统计学的主要任务是进行统计推断，包括参数估计和假设检验。

16. 概率是某随机事件发生可能性大小（或机会大小）的数值度量。概率的取值为0≤P≤1。小概率事件是指P≤0.05的随机事件。

17. 频数表和频数分布图的用途：(1)揭示计量资料的分布类型。(2)揭示计量资料分布的重要特征—集中趋势与离散趋势。(3)便于发现特大或特小的可疑值。(4)作为陈述资料的形式。例数大时，可以频率估计概率。（5）便于资料的进一步统计分析。

18. 均数应用于计量资料的正态分布或近似正态分布资料。

19. 当资料呈正态分布时，均数位于分布的中心。

20. 每个观察值都加一个常数a，则均数为原均数加常数a；每个观察值都乘以一个常数b，则均数为原均数的b倍。

21. 几何均数应用于对数正态分布或近似正态分布资料，也可用于呈倍数关系的等比资料。在医院中主要用于抗原（体）滴度资料。

22. 计算几何均数的资料一般不能有观察值为0，也不能同时包含正负观察值。

23. 中位数可用于描述任何分布类型计量资料的集中趋势，但对于正态分布或近似正态分布的资料，中位数不利于进一步的统计分析，故对正态分布或近似正态分布资料应首选均数描述其集中趋势。

24. 中位数适用于描述偏态分布资料、一端或两端无确定数据的资料和分布不明资料的集中趋势。

25. 极差与四分位数间距可用于描述计量资料的离散程度，但都比较粗略，而四分位数间距

26. 较极差稳定，他们用于描述偏态分布资料。

27. 中位数M是一个特殊的百分位数，即第50百分位数P50,。百分位数是一种位置指标，样本的第X百分位数记为Px，它表示将全部观测值X1、X2，…，Xn由小到大依次排列后位于第X百分位置的数值。

28. 方差和标准差用于描述正态分布计量资料的离散程度。

29. 均数与标准差结合用于全面描述正态分布计量资料的集中趋势与离散趋势。

30. 变异系数描述的是相对离散程度，无度量衡单位。用于单位不同，或虽单位相同，但均数相差较大的资料间变异程度的比较。

31. 正态分布是横轴上方以均数处最高的单峰对称分布，以均数为中心，左右两侧对称。正态分布N（μ，σ²）中有两个参数：总体均数μ和总体标准差σ。μ是位置参数，σ是变异度参数。

32. 正态分布曲线下的面积是1，其分布有一定的规律，

±1.64s内的面积为90%，

±1.96s内的面积为95%，

±2.58s内的面积为99%。

33. 常用相对数有：率、构成比、相对比。

34. 率是说明某现象发生的频率或强度。某一分率的改变不影响其他分率变化。

35. 构成比是表示某事物内部各组成部分所占的比重或分布。某一部分构成比的改变将影响其他构成比的变化。

36. 相对比表示两个有关事物指标，用以说明一个指标是另一个指标的几倍或几分之几。两个指标可以是绝对比、相对数或平均数。

37. 应用相对数注意事项：(1)计算相对数时分母应该有足够数量即例数不能太小。(2)计算合计率或平均率时，不能把n个率相加后除以n，应该绝对数相加后再计算相对数。（3）正确区分构成比与率，分析时不能以构成比代替率。(4)相对数的比较应注意其可比性。对比组之间除了被研究的因素不同以外，其他相对数造成影响的因素应可能在构成比代替率。(5)样本率或样本构成比在比较时应做假设检验。

38. 常用的标准化方法有直接标准化法、间接标准化法和反推标准法，简称直接法、间接法和反推法。

39. 一般选择“标准”的方法有两种：（1）选择具有代表性的，较稳定的、数量较大的人群作为“标准”；（2）互相比较资料中任选一组数据作“标准”。

40. 标准化死亡比（SMR）是被标化组的实际死亡数与预期死亡数之比，若SMR＞1，表示被标化组死亡率高于标准组；若SMR＜1，表示被标化组死亡率低于标准组；

41. 计算标准化率的步骤：⑴根据资料所具备的条件选用直接法或间接法；⑵选定标准构成；⑶选择公式计算标准化率。

42. 应用标准化法的注意事项：(1)标准化法只适用于内部构成不同影响到总率比较的情况； (2)由于选择的标准不同，算出的标准化率也不同，但比较的结论一致；(3)标准化后的标准化率，已经不再反映当时当地的实际水平，它只表示相互比较的资料间的相对水平；(4)样本标准化率也存在抽样误差，也需要进行假设检验。

43. 发病率是计算一定期间内某人群中的新发病例数，而患病率是计算调查时点被调查人群中的现患病例数。

44. 在一定期间内某人可能发病一次以上而成为多个病例，所以发病率可能会大于100%;；而患病率不会出现大于100%的情况。

45. 发病率高的疾病称为多发病；患病率高的疾病称为常见病。患病率高，发病率也高的疾病称为常见多发病。

46. 统计表一般由标题、标目、线条、数字和备注等部分组成。统计表的编制应：⑴重点突出，简单明了，一张统计表至应包括一个中心内容；⑵主谓分明，层次清楚；⑶结构完整，有自明性。

47. 常用的统计图有条图、圆图、百分条图、直方图、线图、半对数线图、散点图、箱式图和统计地图等。

48. 单个构成比的描述，可选用圆图或百分条图；多个构成比的描述和比较，宜选用百分条图。

49. 普通线图适用于描述某项指标随某个连续型数值变量变化而变化的幅度（绝对变化趋势）；半对数线图适用于描述某项指标随某个连续型数值变量变化而变化的速度（相对变化趋势）。

50. 箱式图通常选用5个描述统计量来绘制，即最小值、下四分位数（P25）、中位数（M）、上四分位数（P75）、最大值；可用于描述某个连续型数值变量的分布特征，也可用于比较不同类别之间某个连续型数值变量分布特征的差异。

51. 均数抽样误差是抽样产生的由于个体差异所导致的样本均数与样本均数之间、样本均数与总体均数之间的差异。

52. 标准误是样本均数的标准差，是描述均数抽样误差大小的指标。增加样本含量可减小样本均数的标准误，从而降低抽样误差。

53. 参数估计是指用样本指标（统计量）来推断总体指标（参数）。估计方法有点估计和区间估计，区间估计是按预先给定的概率1－α，由样本指标确定的包含总体参数的一个范围。

54. 可信区间是指总体均数可能所在的范围。用于推断总体参数所在的范围。总体均数95%可信区间的意义为：总体均数在

±t0.05，νS

或

±1.96S

范围内的可能性为95%。

55. 在抽样研究中，由于有抽样误差存在，不能直接通过比较样本均数与样本均数之间、样本均数与总体均数之间的大小得出结论，要进行假设检验。

56. 假设检验的基本思想包括小概率思想和反证法思想。

57. 假设检验是先对总体作出某种假定（检验假设），然后根据样本信息来推断其是否成立的一类统计方法的总称。用于推断总体参数是否相等。

58. 假设检验的基本步骤：⑴建立检验假设，确定检验水准；⑵计算检验统计量；⑶确定P值，作出统计判断。

59. 单样本t检验的目的是推断样本均数所代表的总体均数与已知总体均数是否相同，它要求样本取自正态总体。

60. 配对设计包括：⑴两个受试对象按某特征相同或相近配成对子，分别给予不同的处理；⑵同一受试对象给予不同处理或处理前后比较。它可以降低抽样误差，提高统计效率。

61. 配对t检验适用于配对设计的计量资料的比较，且要求差值服从正态分布。

62. 完全随机设计可以将一批同质受试对象随机分配到各组，也可以是随机抽取几组不同的受试对象，观察其实验效应。

63. 完全随机设计两样本均数比较的t检验是推断计量资料的两个总体均数之间有无差别的假设检验方法，要求样本来自正态总体，且两总体方差相等（方差齐）。

64. 方差齐性检验的适用条件是两样本均来自正态分布的总体，方差齐性检验中的检验统计量F服从F分布，有两个自由度，分子的自由度（较大方差）和分母的自由度（较小方差）。F值越大，P值越小。

65. 两个样本均数比较，方差不齐时刻选择：⑴近似t′检验；⑵通过一定的变量变换以达到方差齐；⑶选用非参数统计，如秩和检验等。

66. Z检验适用于大样本资料的假设检验。

67. 第Ⅰ类错误：检验假设H0本来是成立的，经过检验后被拒绝了，即“弃真”。其发生的的概率为α，为已知。

68. 第Ⅱ类错误：检验假设H0本来是不成立的，经过检验后被接受了，即“存伪”。其发生的概率为β，属未知数。

69. 假设检验的注意事项：⑴要有严密的研究设计；⑵选用的假设检验方法应符合应用条件；⑶有统计学意义不等于有实际意义；⑷结论不能绝对化；⑸正确理解P值与差别有无统计意义；⑹平衡Ⅰ类错误和Ⅱ类错误。

70. 方差分析是一种以分析数据的变异为基础，以F值为检验统计量的计量资料的假设检验方法，主要用于推断计量资料单因素k水平（k≧3）或多因素不同水平总体均数间的差异性，其前提条件为资料服从正态分布，各组方差齐。

71. 随机区组设计资料的总变异被分解为3个部分，即处理组间变异、区组间变异和误差。区组变异和误差两部分相当于单因素方差分析的组内变异。

72. 两两比较的方法很多，常用q检验、LSD—t检验等；q检验适用于探索性研究，对每两个样本均数都进行检验；LSD—t检验适用于事先有明确假设的证实性研究。

73. 常用数据变换的方法有对数变换、平方根变换、平方根反正弦变换、倒数变换。

74. X2检验是一种以Χ²分布为基础，以Χ²值为检验统计量的计数资料的假设检验方法。

75. X2值反映实际频数（A）和理论频数（T）的符合程度。

76. X2检验的主要用途：⑴推断两个或两个以上总体率（或构成比）之间有无差别；⑵两变量间有无相关关系；⑶检验频数分布的拟合优度。

77. 四格表X2检验的注意事项：(1)当n≥40，T≥5时，用四格表x2检验的基本公式或专用公式计算X2 值；(2)当n≥40，1≤T<5时，需要用校正公式计算X2 值； (3)当n<40或T<l时，不宜计算X2 值，需采用四格表确切概率法直接计算概率。

78. 行×列表资料X2检验的注意事项：(1) 行×列表X2检验允许有1／5的基本格子的理论频数小于5大于1，但不能有理论频数小于1。⑵如果有1／5以上格子的理论频数小于5大于1，或有一个格子的理论频数小于1，可采用以下处理方法：①增加样本含量：可以增大理论频数；②将理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并；③删去理论频数太小的格子所对应的行或例。

79. 依次增减四格表中某个格子（一般选用行合计与列合计均为最小的那个格子）的数据，可列出周边合计不变条件下各种组合的四格表（一般可列出最小周边合计数加1个四格表）。

80. 非参数检验是一类不依赖于总体分布类型的检验，即在应用中可以不考虑被研究对象为何种分布以及分布是否已知，检验假设中没有包括总体参数的一类统计方法。

81. 秩和检验的适用范围：⑴未加精确测量的资料（包括等级资料）；⑵偏态分布且无法转化为正态分布的资料；⑶分布不清的资料。

82. 配对资料的秩和检验用于配对设计计量资料差值的比较和单一样本与总体中位数的比较。

83. 直线相关是分析服从正态分布的两个随机变量x和y有无线性相关关系的一种统计分析方法。

84. 相关系数是描述两个变量间线性相关关系的密切程度与方向的统计指标。相关系数的符号表示两变量的线性相关的方向。其特点为：⑴相关系数r没有单位；⑵取值范围在﹣1和1之间；⑶r为正表示正相关，r为1表示完全正相关；r值为负表示负相关，r为﹣1表示完全负相关；⑷r绝对值越接近1，表示两个变量间相关关系密切程度越高；越接近0，则相关关系越不密切。

85. 相关分析的前提条件：两个随机变量；散点图呈线性相关；服从双变量正态分布。

86. 在有相关关系时，根据r值判断两变量相关的密切程度：⑴｜r｜≥0.7，两变量有高度相关关系；⑵0.7＞｜r｜≥0.4，两变量有中度相关关系；⑶｜r｜＜0.4，两变量有低度相关关系。

87. 直线回归分析的前提条件：⑴线性：两个变量间存在线性关系；⑵独立性：任意两个观察值互相独立；⑶正态性：应变量y是服从正态分布的随机变量；⑷方差齐：给定x后，应变量y的方差相等。

88. 等级相关应用范围：⑴不服从双变量正态分布或偏态分布；⑵总体分布类型未知；⑶原始数据是等级变量。

89. 对同一资料，相关系数t检验与回归系数t 检验效果相同。

90. 决定系数r²决定回归效果的好坏，r²越接近1，回归的效果越好。

91. 直线回归方程：y＝a＋bx其中a为回归直线在Y轴上的截距：⑴a＞0表示直线与纵轴的交点在原点的上方；⑵a＜0则交点在原点的下方；⑶a=0则回归直线通过原点；b为回归系数，即直线的斜率：⑴b＞0表示直线从左下方走向右上方，即 y随 x的增大而增大；⑵b＜0表示直线从左上方走向右下方，即 y随 x的增大而减小；⑶b=0表示直线与 x轴平行，即x与 y无直线关系；⑷b的统计学意义是x每增（减）一个单位，y平均改变b个单位。

92. 实验设计的特点：⑴研究者能人为设置处理因素；⑵受试对象接受何种处理因素或水平是由随机分配而定的。

93. 医学实验设计包括处理因素或研究因素，受试对象和实验效应三个基本要素。

94. 常用对照的形式为空白对照、安慰剂对照、实验对照、标准对照、自身对照、相互对照及历史对照等。

95. 随机化包括随机抽样和随机分组，随机抽样指保证总体中的每一个个体都有同等的机会被抽出来作为样本；随机分组指保证样本中的每一个个体都有同等的机会被分配到实验组或对照组。

96. 实验设计的基本原则：对照、随机、重复、均衡。

97. 重复是指研究样本要有一定的数量，即在保证研究结果具有一定可靠性的条件下，确定最少的样本例数。

98. 均衡原则又称齐同对比原则，指实验组和对照组或各实验组之间，除了处理因素以外，其他一切条件应尽可能相同或一致。

99. 完全随机设计又称随机对照试验，属于单因素研究设计。

100. 样本含量估计需要确定四个基本因素：α、1－β、σ、δ。α、δ与样本含量成反比，σ（或s）、1－β与样本含量成正比。

101. 剂量反应是实验物质引起实验动物总体中产生某种反应的剂量。

医学统计学知识点总结

猜你喜欢