Zusammenfassung der Wissenspunkte zur medizinischen Statistik

Wissenspunkte

1. Statistik ist eine Disziplin, die die Grundprinzipien und Methoden der Wahrscheinlichkeitstheorie und der mathematischen Statistik anwendet, um die Sammlung, Organisation, Analyse, den Ausdruck und die Interpretation von Daten zu untersuchen.

2. Medizinische Statistik ist eine Disziplin, die die Grundprinzipien und Methoden der Statistik anwendet, um die Sammlung, Anordnung, Analyse, den Ausdruck und die Interpretation von Daten und Informationen in der Medizin und verwandten Bereichen zu untersuchen Felder. Betreff.

3. Das Statistiksoftwarepaket ist eine Kombination aus einer Reihe von Programmen, die verschiedene statistische Verarbeitungen und Analysen von Daten durchführen.

4. Die grundlegenden Schritte der statistischen Arbeit: Forschungsdesign, Daten sammeln, Daten organisieren und Daten analysieren.

5. Die Qualität wissenschaftlicher Forschungsergebnisse hängt von der Qualität des Forschungsdesigns ab. Forschungsdesign ist Grundlage und Schlüssel statistischer Arbeit und entscheidet über Erfolg oder Misserfolg des Ganzen statistische Arbeit.

6. Statistische Analyse umfasst statistische Beschreibung und statistische Schlussfolgerung. Bei der statistischen Beschreibung handelt es sich um die Analyse und Darstellung der Verteilung oder des charakteristischen Werts einer bekannten Stichprobe (oder Population); bei der statistischen Inferenz geht es darum, auf der Grundlage bekannter Stichprobeninformationen auf eine unbekannte Population zu schließen.

7. Zu den Arten medizinischer Originaldaten gehören: Messdaten, Zähldaten und Notendaten.

8. Messdaten sind Daten, die durch Messung eines bestimmten Indikators jeder Beobachtungseinheit mit quantitativen Methoden gewonnen werden.

9. Zähldaten sind Daten, die durch Gruppieren von Beobachtungseinheiten nach bestimmten Attributen (Eigenschaften) oder Kategorien und Zählen der Anzahl der Beobachtungseinheiten in jeder Gruppe gewonnen werden.

10. Notendaten sind Daten, die durch Gruppieren von Beobachtungseinheiten nach Attributgrad oder Rangfolge und Zählen der Anzahl der Beobachtungseinheiten in jeder Gruppe erhalten werden. Es gibt Unterschiede zwischen den einzelnen Attributen. Die Notenreihenfolge der Notenangaben kann nicht beliebig umgekehrt werden.

11. Homogenität: bedeutet, dass die beobachteten untersuchten Objekte bestimmte gleiche Eigenschaften oder Merkmale aufweisen.

12. Variation: Dies ist der Unterschied zwischen bestimmten Indikatoren homogener Individuen, d. h. individuelle Variation oder individueller Unterschied.

13. Die Grundgesamtheit ist die Grundgesamtheit homogener Forschungsobjekte, die entsprechend dem Forschungszweck bestimmt wird. Eine Stichprobe ist ein repräsentativer Teil der Bevölkerung.

14. Stichprobenforschung ist eine Forschungsmethode, die zufällige Stichproben aus der Bevölkerung zieht und die Stichprobeninformationen analysiert, um Rückschlüsse auf die Bevölkerung zu ziehen. Der Stichprobenfehler ist der Unterschied zwischen Stichprobenindikatoren und Gesamtindikatoren sowie zwischen Stichprobenindikatoren und Stichprobenindikatoren, die durch Zufallsstichproben verursacht werden. Seine Wurzel liegt in den Unterschieden in der Population. Es besteht individuelle Variabilität. Solange es sich also um eine Stichprobenstudie handelt, müssen Stichprobenfehler vorliegen und Schlussfolgerungen können nicht direkt anhand von Stichprobenindikatoren gezogen werden.

15. Die Hauptaufgabe der Statistik besteht darin, statistische Schlussfolgerungen durchzuführen, einschließlich Parameterschätzungen und Hypothesentests.

16. Wahrscheinlichkeit ist ein numerisches Maß für die Wahrscheinlichkeit (oder Chance) des Eintretens eines zufälligen Ereignisses. Der Wahrscheinlichkeitswert ist 0≤P≤1. Ein Ereignis mit geringer Wahrscheinlichkeit bezieht sich auf ein Zufallsereignis mit P≤0,05.

17. Der Zweck von Häufigkeitstabellen und Häufigkeitsverteilungsdiagrammen: (1) Offenlegung des Verteilungstyps von Messdaten. (2) Zeigen Sie die wichtigen Merkmale der Messdatenverteilung auf – zentrale Tendenz und diskreter Trend. (3) Es ist leicht, extrem große oder extrem kleine verdächtige Werte zu finden. (4) Als Form der Präsentation von Informationen. Wenn die Anzahl der Beispiele groß ist, kann die Wahrscheinlichkeit häufig geschätzt werden. (5) Erleichtern Sie die weitere statistische Analyse von Daten.

18. Der Mittelwert wird auf Normalverteilungs- oder annähernd Normalverteilungsdaten von Messdaten angewendet.

19. Bei normalverteilten Daten liegt der Mittelwert im Zentrum der Verteilung.

20. Wenn zu jedem Beobachtungswert eine Konstante a addiert wird, ist der Mittelwert der ursprüngliche Mittelwert plus die Konstante a. Wenn jeder Beobachtungswert mit einer Konstanten b multipliziert wird, beträgt der Mittelwert das b-fache des ursprünglichen Mittelwerts.

21. Das geometrische Mittel wird auf Lognormalverteilungs- oder annähernd normale Verteilungsdaten angewendet und kann auch auf geometrische Daten mit einer Mehrfachbeziehung angewendet werden. Es wird hauptsächlich für Antigen-(Körper-)Titerdaten in Krankenhäusern verwendet.

22. Die zur Berechnung des geometrischen Mittels verwendeten Daten dürfen im Allgemeinen weder einen Beobachtungswert von 0 haben noch dürfen sie sowohl positive als auch negative Beobachtungswerte enthalten.

23. Der Median kann verwendet werden, um die zentrale Tendenz von Messdaten jeder Verteilungsart zu beschreiben. Für Daten mit Normalverteilung oder annähernd normaler Verteilung ist der Median jedoch für eine weitere statistische Analyse nicht förderlich. Daher für Normalverteilung oder annähernd normale Verteilung Verteilung ist der Median für die weitere statistische Analyse nicht förderlich. Der Mittelwert sollte bevorzugt werden, um die zentrale Tendenz der Daten zu beschreiben.

24. Der Median eignet sich zur Beschreibung der zentralen Tendenz von Daten mit verzerrter Verteilung, Daten ohne eindeutige Daten an einem oder beiden Enden und Daten mit unbekannter Verteilung.

25. Bereich und Interquartilbereich können verwendet werden, um den Grad der Streuung von Messdaten zu beschreiben, sie sind jedoch sowohl grob als auch Interquartilbereich

26. Sie sind stabiler als Bereiche und werden zur Beschreibung verzerrter Verteilungsdaten verwendet.

27. Der Median M ist ein spezielles Perzentil, also das 50. Perzentil P50. Perzentil ist ein Positionsindikator. Das X-Perzentil der Probe wird als Px aufgezeichnet. Es stellt den Wert dar, der sich an der X-Perzentilposition befindet, nachdem alle beobachteten Werte X1, X2, ..., Xn von klein nach groß angeordnet wurden. .

28. Varianz und Standardabweichung werden verwendet, um den Grad der Streuung normalverteilter Messdaten zu beschreiben.

29. Die Kombination aus Mittelwert und Standardabweichung wird verwendet, um die zentrale Tendenz und den Streuungstrend normalverteilter Messdaten umfassend zu beschreiben.

30. Der Variationskoeffizient beschreibt den relativen Grad der Streuung und hat keine Maßeinheit. Es wird verwendet, um den Grad der Variation zwischen Daten mit unterschiedlichen Einheiten zu vergleichen, oder auch wenn die Einheiten gleich sind, die Mittelwerte sehr unterschiedlich sind.

31. Die Normalverteilung ist eine unimodale symmetrische Verteilung mit dem höchsten Mittelwert über der horizontalen Achse, mit dem Mittelwert als Mittelpunkt und Symmetrie auf der linken und rechten Seite. In der Normalverteilung N (μ, σ²) gibt es zwei Parameter: den Populationsmittelwert μ und die Populationsstandardabweichung σ. μ ist der Positionsparameter und σ ist der Variabilitätsparameter.

32. Die Fläche unter der Normalverteilungskurve beträgt 1 und ihre Verteilung unterliegt bestimmten Regeln,

Der Bereich innerhalb von ±1,64 s beträgt 90 %,

Der Bereich innerhalb von ±1,96 s beträgt 95 %,

Der Bereich innerhalb von ±2,58 s beträgt 99 %.

33. Zu den häufig verwendeten relativen Zahlen gehören: Rate, Zusammensetzungsverhältnis und relatives Verhältnis.

34. Rate bezieht sich auf die Häufigkeit oder Intensität eines Phänomens. Eine Änderung in einem Bruch hat keinen Einfluss auf Änderungen in anderen Brüchen.

35. Das Zusammensetzungsverhältnis bezieht sich auf den Anteil oder die Verteilung jeder Komponente in etwas. Änderungen im Zusammensetzungsverhältnis eines Teils wirken sich auf Änderungen in anderen Zusammensetzungsverhältnissen aus.

36. Der relative Vergleich stellt zwei Indikatoren für verwandte Dinge dar und wird verwendet, um zu erklären, wie viele Male oder Bruchteile eines Indikators der andere Indikator ist. Zwei Indikatoren können absolute Verhältnisse, relative Zahlen oder Durchschnittswerte sein.

37. Vorsichtsmaßnahmen bei der Anwendung relativer Zahlen: (1) Bei der Berechnung relativer Zahlen sollte eine ausreichende Anzahl von Nennern vorhanden sein, d. h. die Anzahl der Beispiele sollte nicht zu groß sein klein. (2) Bei der Berechnung des Gesamtsatzes oder Durchschnittssatzes können Sie nicht n Sätze addieren und durch n dividieren. Sie sollten die absoluten Zahlen addieren, bevor Sie die relative Zahl berechnen. (3) Unterscheiden Sie richtig zwischen Zusammensetzungsverhältnis und Rate. Verwenden Sie während der Analyse nicht das Zusammensetzungsverhältnis anstelle der Rate. (4) Beim Vergleich relativer Zahlen ist auf deren Vergleichbarkeit zu achten. Zusätzlich zu den Unterschieden in den untersuchten Faktoren zwischen den Vergleichsgruppen dürften andere Faktoren, die die relative Zahl beeinflussen, wahrscheinlich die Verhältnisersatzrate bestimmen. (5) Hypothesentests sollten durchgeführt werden, wenn Stichprobenraten oder Stichprobenzusammensetzungsverhältnisse verglichen werden.

38. Zu den häufig verwendeten Standardisierungsmethoden gehören die direkte Standardisierungsmethode, die indirekte Standardisierungsmethode und die inverse Standardisierungsmethode, die als direkte Methode, indirekte Methode und inverse Methode bezeichnet werden.

39. Es gibt im Allgemeinen zwei Methoden zur Auswahl von „Standards“: (1) Wählen Sie eine repräsentative, stabile und große Gruppe von Menschen als „Standard“ aus; (2) Wählen Sie einen Datensatz aus den gegenseitigen Vergleichsdaten als „Standard“ aus.

40. Die standardisierte Todesrate (SMR) ist das Verhältnis der tatsächlichen Anzahl der Todesfälle zur erwarteten Anzahl der Todesfälle in der standardisierten Gruppe. Wenn SMR>1, bedeutet dies die Sterblichkeitsrate der standardisierten Gruppe ist höher als die der Standardgruppe; wenn SMR <1, bedeutet dies, dass die Sterblichkeitsrate der standardisierten Gruppe niedriger ist als die der Standardgruppe;

41. Schritte zur Berechnung der standardisierten Rate: ⑴ Wählen Sie die direkte oder indirekte Methode entsprechend den Bedingungen der Daten; ⑵ Wählen Sie die Standardzusammensetzung; ⑶ Wählen Sie die Formel aus Berechnen Sie den standardisierten Satz.

42. Hinweise zur Anwendung der Standardisierungsmethode: (1) Die Standardisierungsmethode ist nur anwendbar, wenn sich unterschiedliche interne Zusammensetzungen auf den Vergleich der Gesamtsätze auswirken. (2) Aufgrund der unterschiedlichen Auswahl von Standards sind auch die berechneten standardisierten Sätze unterschiedlich, jedoch der Vergleich Die Schlussfolgerungen sind konsistent; (3) Die standardisierte Rate nach der Standardisierung spiegelt nicht mehr das tatsächliche lokale Niveau zu diesem Zeitpunkt wider. Sie stellt nur das relative Niveau zwischen den verglichenen Daten dar; (4) Die standardisierte Stichprobenrate weist auch Stichprobenfehler auf und erfordert Hypothesentests.

43. Mit der Inzidenzrate wird die Anzahl neuer Fälle in einer bestimmten Bevölkerung innerhalb eines bestimmten Zeitraums berechnet, während mit der Prävalenzrate die Anzahl bestehender Fälle in der befragten Bevölkerung zum Zeitpunkt der Untersuchung berechnet wird.

44. Innerhalb eines bestimmten Zeitraums kann es vorkommen, dass jemand mehr als einmal erkrankt und mehrfach erkrankt, sodass die Inzidenzrate über 100 % liegen kann; die Prävalenzrate wird jedoch nicht über 100 % liegen.

45. Krankheiten mit einer hohen Inzidenz werden als häufig auftretende Krankheiten bezeichnet; Krankheiten mit einer hohen Prävalenz werden als häufige Krankheiten bezeichnet. Krankheiten mit hoher Prävalenz und hoher Inzidenz werden als häufige und häufig auftretende Krankheiten bezeichnet.

46. ​​Statistische Tabellen bestehen im Allgemeinen aus Titeln, Überschriften, Zeilen, Zahlen und Anmerkungen. Die Erstellung statistischer Tabellen sollte: ⑴ zielgerichtet, einfach und klar sein und eine statistische Tabelle sollte mindestens einen zentralen Inhalt enthalten; ⑵ klares Subjekt und Prädikat mit klaren Ebenen; ⑶ vollständige Struktur und selbsterklärend.

47. Zu den häufig verwendeten statistischen Diagrammen gehören Balkendiagramme, Kreisdiagramme, Prozentbalkendiagramme, Histogramme, Liniendiagramme, halblogarithmische Liniendiagramme, Streudiagramme und Boxdiagramme. Diagramme und statistische Karten usw.

48. Für die Beschreibung eines einzelnen Zusammensetzungsverhältnisses kann ein Kreisdiagramm oder ein prozentuales Balkendiagramm verwendet werden; für die Beschreibung und den Vergleich mehrerer Zusammensetzungsverhältnisse sollte ein prozentuales Balkendiagramm verwendet werden.

49. Gewöhnliche Liniendiagramme eignen sich zur Beschreibung der Änderungsamplitude (absoluter Änderungstrend) eines Indikators als kontinuierliche numerische Variablenänderungen; halblogarithmische Liniendiagramme eignen sich zur Beschreibung der Änderungen eines Indikators als kontinuierliche numerische Variablenänderungen. Geschwindigkeit ( relativer Änderungstrend).

50. Boxplots verwenden normalerweise fünf deskriptive Statistiken zum Zeichnen, nämlich Minimalwert, unteres Quartil (P25), Median (M), oberes Quartil (P75), Maximalwert ; kann verwendet werden, um die Verteilungseigenschaften einer kontinuierlichen numerischen Variablen zu beschreiben, und kann auch verwendet werden, um die Verteilungseigenschaften einer kontinuierlichen numerischen Variablen zwischen verschiedenen Kategorien zu vergleichen. Unterschied.

51. Der mittlere Stichprobenfehler ist die Differenz zwischen dem Stichprobenmittelwert und dem Stichprobenmittelwert sowie zwischen dem Stichprobenmittelwert und dem Populationsmittelwert, die durch individuelle Unterschiede bei der Stichprobenziehung verursacht wird. Differenz.

52. Der Standardfehler ist die Standardabweichung des Stichprobenmittelwerts und ein Indikator, der die Größe des mittleren Stichprobenfehlers beschreibt. Eine Vergrößerung der Stichprobengröße verringert den Standardfehler des Stichprobenmittelwerts und damit den Stichprobenfehler.

53. Parameterschätzung bezieht sich auf die Verwendung von Stichprobenindikatoren (Statistiken), um Gesamtindikatoren (Parameter) abzuleiten. Zu den Schätzmethoden gehören die Punktschätzung und die Intervallschätzung. Die Intervallschätzung ist ein Bereich, der die durch den Stichprobenindex bestimmten Populationsparameter gemäß der vorgegebenen Wahrscheinlichkeit 1-α enthält.

54. Das Konfidenzintervall bezieht sich auf den Bereich, in dem der Bevölkerungsmittelwert liegen kann. Wird verwendet, um den Bereich der Gesamtparameter abzuleiten. Die Bedeutung des 95 %-Konfidenzintervalls des Grundgesamtheitsmittelwerts ist: Der Grundgesamtheitsmittelwert liegt innerhalb

±t0,05,νS

oder

±1,96S

Die Wahrscheinlichkeit, innerhalb des Bereichs zu liegen, beträgt 95 %.

55. In der Stichprobenforschung können aufgrund des Vorhandenseins von Stichprobenfehlern keine Schlussfolgerungen direkt durch den Vergleich des Stichprobenmittelwerts mit dem Stichprobenmittelwert oder zwischen dem Stichprobenmittelwert und dem Populationsmittelwert gezogen werden. Hypothesentests sind erforderlich.

56. Zu den Grundideen des Hypothesentests gehören die Idee der kleinen Wahrscheinlichkeit und die Idee des Beweises durch Widerspruch.

57. Hypothesentest ist ein allgemeiner Begriff für eine Art statistischer Methode, die zunächst eine bestimmte Annahme über die Population trifft (Testhypothese) und dann daraus ableitet, ob sie wahr ist auf Beispielinformationen. Wird verwendet, um abzuleiten, ob die Populationsparameter gleich sind.

58. Die grundlegenden Schritte des Hypothesentests: ⑴ Stellen Sie die Testhypothese auf und bestimmen Sie das Testniveau; ⑵ Berechnen Sie die Teststatistik; ⑶ Bestimmen Sie den P-Wert und treffen Sie statistische Urteile.

59. Der Zweck des t-Tests bei einer Stichprobe besteht darin, abzuleiten, ob der durch den Stichprobenmittelwert dargestellte Populationsmittelwert mit dem bekannten Populationsmittelwert übereinstimmt. Er erfordert, dass die Stichprobe einer normalen Population entnommen wird.

60. Das gepaarte Design umfasst: ⑴ Zwei Probanden werden nach gleichen oder ähnlichen Merkmalen gepaart und erhalten jeweils unterschiedliche Behandlungen; ⑵ Derselbe Proband erhält unterschiedliche Behandlungen oder wird vor und nach der Behandlung verglichen. Es kann Stichprobenfehler reduzieren und die statistische Effizienz verbessern.

61. Der gepaarte t-Test eignet sich zum Vergleich von Messdaten in einem gepaarten Design, und die Differenz muss einer Normalverteilung entsprechen.

62. Ein vollständig randomisiertes Design kann jeder Gruppe zufällig eine Gruppe homogener Probanden zuordnen oder mehrere Gruppen unterschiedlicher Probanden zufällig auswählen, um die experimentellen Effekte zu beobachten.

63. Der t-Test zum Vergleich der Mittelwerte zweier Stichproben in einem völlig zufälligen Design ist eine Methode zum Testen von Hypothesen, um abzuleiten, ob es einen Unterschied zwischen den Mittelwerten zweier Grundgesamtheiten in Messdaten gibt. Er erfordert, dass die Stichproben aus normalen Grundgesamtheiten stammen und die Varianzen der beiden Grundgesamtheiten sind gleich (homogene Varianzen).

64. Die anwendbare Bedingung für den Varianzhomogenitätstest ist, dass beide Proben aus einer normalverteilten Grundgesamtheit stammen. Die Testgröße F im Varianzhomogenitätstest folgt der F-Verteilung und weist zwei Freiheitsgrade auf, den Freiheitsgrad des Moleküls (größere Varianz) und Freiheitsgrade im Nenner (kleinere Varianz). Je größer der F-Wert, desto kleiner der P-Wert.

65. Vergleichen Sie die Mittelwerte zweier Stichproben und wählen Sie, wenn die Varianzen ungleichmäßig sind: ⑴ Näherungs-t′-Test; ⑵ Erzielen Sie gleichmäßige Varianzen durch bestimmte Variablentransformationen; ⑶ Wählen Sie nichtparametrisch aus Statistiken wie Rangsummentest usw.

66. Der Z-Test eignet sich zum Hypothesentest großer Stichprobendaten.

67. Fehler vom Typ I: Die Testhypothese H0 wurde ursprünglich aufgestellt, aber nach dem Testen verworfen, d. h. „die Wahrheit aufgegeben“. Die Wahrscheinlichkeit seines Auftretens ist α, was bekannt ist.

68. Fehler vom Typ II: Die Testhypothese H0 war ursprünglich nicht wahr, wurde aber nach dem Testen akzeptiert, d. h. „unter Wahrung der Falschheit“. Die Eintrittswahrscheinlichkeit beträgt β, was unbekannt ist.

69. Vorsichtsmaßnahmen für das Testen von Hypothesen: ⑴ Es muss ein strenges Forschungsdesign vorhanden sein; ⑵ Die ausgewählte Methode zum Testen von Hypothesen sollte die Anwendungsbedingungen erfüllen; ⑶ Statistische Signifikanz bedeutet nicht, dass dies der Fall ist ist praktisch Bedeutung; ⑷ Die Schlussfolgerung kann nicht absolut sein; ⑸ Verstehen Sie den P-Wert richtig und ob der Unterschied statistisch signifikant ist; ⑹ Ausgleichen Sie Fehler vom Typ I und Fehler vom Typ II.

70. Die Varianzanalyse ist eine Hypothesentestmethode zum Messen von Daten, die auf der Analyse der Datenvariation und der Verwendung des F-Werts als Teststatistik basiert. Sie wird hauptsächlich verwendet, um das k-Niveau eines einzelnen Faktors (k ≥ 3) oder verschiedener Ebenen abzuleiten mehrerer Faktoren in den Messdaten. Voraussetzung für die Differenz zwischen den Grundgesamtheitsmittelwerten ist, dass die Daten einer Normalverteilung folgen und die Varianzen jeder Gruppe gleich sind.

71. Die Gesamtvariation der Zufallsblockentwurfsdaten wird in drei Teile zerlegt, nämlich Verarbeitung zwischen Gruppenvariation, Zwischenblockvariation und Fehler. Die beiden Teile Blockvariation und Fehler entsprechen der gruppeninternen Variation der einseitigen Varianzanalyse.

72. Es gibt viele Methoden für den paarweisen Vergleich, wie z. B. den Q-Test, den LSD-t-Test usw.; der q-Test eignet sich für explorative Forschung, und der Mittelwert von jeweils zwei Stichproben wird getestet; der LSD-t-Test eignet sich zur Bestätigung von Klare Hypothesen im Voraus. Sexualforschung.

73. Zu den häufig verwendeten Datentransformationsmethoden gehören die logarithmische Transformation, die Quadratwurzeltransformation, die Quadratwurzel-Arcsinus-Transformation und die reziproke Transformation.

74. Der X2-Test ist eine Hypothesentestmethode, die auf der Χ²-Verteilung basiert und den Χ²-Wert als Teststatistik für Zähldaten verwendet.

75. Der X2-Wert spiegelt den Grad der Übereinstimmung zwischen der tatsächlichen Frequenz (A) und der theoretischen Frequenz (T) wider.

76. Die Hauptverwendungen der

77. Vorsichtsmaßnahmen für den Vier-Zellen-Tabellen-X2-Test: (1) Wenn n ≥ 40, T ≥ 5, verwenden Sie die Grundformel oder spezielle Formel für den Vier-Zellen-Test Tabelle x2-Test Berechnen Sie den X2-Wert. (2) Wenn n≥40, 1≤T<5, muss die Korrekturformel verwendet werden, um den X2-Wert zu berechnen. (3) Wenn n<40 oder T<l, ist dies nicht der Fall geeignet, um die Wahrscheinlichkeit zu berechnen. Die exakte Wahrscheinlichkeitsmethode berechnet die Wahrscheinlichkeit direkt.

78. Hinweise zum Zeilen-×-Listen-Daten-X2-Test: (1) Der Zeilen-×-Listen-X2-Test ermöglicht, dass 1/5 der Grundgitter eine theoretische Häufigkeit von weniger als hat 5 und größer als 1. Es kann jedoch keine theoretische Häufigkeit kleiner als 1 geben. ⑵ Wenn die theoretische Häufigkeit von mehr als 1/5 der Gitter kleiner als 5 und größer als 1 ist oder die theoretische Häufigkeit eines Gitters kleiner als 1 ist, können die folgenden Verarbeitungsmethoden verwendet werden: ① Erhöhen Sie den Probeninhalt: Sie kann die theoretische Häufigkeit erhöhen; ② Machen Sie die theoretische Häufigkeit zu klein. Führen Sie Zeilen oder Spalten mit tatsächlichen Häufigkeiten in benachbarten Zeilen oder Spalten mit ähnlichen Eigenschaften zusammen; ③ Löschen Sie Zeilen oder Beispiele, die Zellen entsprechen, deren theoretische Häufigkeit zu klein ist.

79. Durch sequenzielles Erhöhen und Verringern der Daten eines bestimmten Rasters in der Tabelle mit vier Rastern (normalerweise wird das Raster mit der kleinsten Zeilen- und Spaltensumme ausgewählt) können verschiedene Kombinationen von vier Rastern unter aufgelistet werden Bedingung, dass die umgebende Gesamtzahl unverändert bleibt. Tabelle (kann im Allgemeinen die minimale Gesamtzahl der Umgebungen plus 1 Tabelle mit vier Zellen auflisten).

80. Der nichtparametrische Test ist ein Testtyp, der nicht von der Art der Gesamtverteilung abhängt. Das heißt, in der Anwendung muss die Verteilung nicht berücksichtigt werden des untersuchten Objekts und ob die Verteilung bekannt ist. Eine Art statistischer Methode, die beim Testen von Hypothesen keine Populationsparameter berücksichtigt.

81. Der Anwendungsbereich des Rangsummentests: ⑴ Daten ohne genaue Messung (einschließlich abgestufter Daten); ⑵ Daten mit schiefer Verteilung, die nicht in eine Normalverteilung umgewandelt werden können ; ⑶Unklar verteilte Daten.

82. Der Rangsummentest gepaarter Daten wird verwendet, um die Unterschiede in den Messdaten in einem gepaarten Design zu vergleichen und eine einzelne Stichprobe mit dem Gesamtmedian zu vergleichen.

83. Lineare Korrelation ist eine statistische Analysemethode, die die lineare Korrelation zwischen zwei Zufallsvariablen x und y analysiert, die der Normalverteilung gehorchen.

84. Der Korrelationskoeffizient ist ein statistischer Index, der die Nähe und Richtung der linearen Korrelation zwischen zwei Variablen beschreibt. Das Vorzeichen des Korrelationskoeffizienten gibt die Richtung der linearen Korrelation zwischen zwei Variablen an. Seine Eigenschaften sind: ⑴ Der Korrelationskoeffizient r hat keine Einheit; ⑵ Der Wertebereich liegt zwischen -1 und 1; ⑶ Ein positiver r-Wert zeigt eine positive Korrelation an, und ein r-Wert von 1 zeigt eine vollständig positive Korrelation an; ein negativer r-Wert zeigt eine negative Korrelation an, und r ist -1. Zeigt eine vollständige negative Korrelation an. (4) Je näher der Absolutwert von r an 1 liegt, desto näher ist die Korrelation zwischen den beiden Variablen. Je näher an 0, desto weniger eng ist die Korrelation Ist.

85. Voraussetzungen für die Korrelationsanalyse: zwei Zufallsvariablen; das Streudiagramm ist linear verknüpft; und es folgt der bivariaten Normalverteilung.

86. Wenn eine Korrelation besteht, beurteilen Sie die Nähe der Korrelation zwischen den beiden Variablen anhand des r-Werts: ⑴|r|≥0,7, die beiden Variablen sind hoch korreliert; ⑵0,7 >|r|≥0,4, die beiden Variablen weisen eine mäßige Korrelation auf; ⑶|r|<0,4, die beiden Variablen weisen eine geringe Korrelation auf.

87. Voraussetzungen für die lineare Regressionsanalyse: ⑴ Linearität: Es besteht eine lineare Beziehung zwischen zwei Variablen; ⑵ Unabhängigkeit: Zwei beliebige beobachtete Werte sind unabhängig voneinander; ⑶ Normalität: Die abhängige Variable y ist eine Zufallsvariable, die der Normalverteilung folgt; ⑷Gleiche Varianzen: Nachdem x gegeben ist, sind die Varianzen der abhängigen Variablen y gleich.

88. Notenbezogener Anwendungsbereich: ⑴ Folgt weder der bivariaten Normalverteilung noch der Schiefverteilung; ⑵ Der Gesamtverteilungstyp ist unbekannt; ⑶ Die Originaldaten sind eine Notenvariable.

89. Für dieselben Daten haben der Korrelationskoeffizienten-t-Test und der Regressionskoeffizienten-t-Test die gleiche Wirkung.

90. Das Bestimmtheitsmaß r² bestimmt die Qualität des Regressionseffekts. Je näher r² bei 1 liegt, desto besser ist der Regressionseffekt.

91. Lineare Regressionsgleichung: y=a+bx wobei a der Schnittpunkt der Regressionsgeraden auf der Y-Achse ist: ⑴a>0 bedeutet, dass der Schnittpunkt der geraden Linie und der vertikalen Achse über dem Ursprung liegt; ⑵a<0 bedeutet, dass der Schnittpunkt unterhalb des Ursprungs liegt; ⑶a=0 Dann verläuft die gerade Linie der Regression durch den Ursprung; b ist der Regressionskoeffizient, dh die Steigung der geraden Linie: ⑴b>0 bedeutet, dass die gerade Linie von unten verläuft von links nach rechts oben, d Die gerade Linie verläuft parallel zur x-Achse, d. h. es besteht keine geradlinige Beziehung zwischen den Einheiten.

92. Merkmale des Versuchsdesigns: ⑴Der Forscher kann die Behandlungsfaktoren künstlich festlegen; ⑵Welche Behandlungsfaktoren oder -niveaus die Probanden erhalten, wird durch zufällige Zuteilung bestimmt.

93. Medizinisches Versuchsdesign umfasst drei Grundelemente: Behandlungsfaktoren oder Forschungsfaktoren, Themen und experimentelle Effekte.

94. Üblicherweise verwendete Kontrollformen sind Blindkontrolle, Placebokontrolle, experimentelle Kontrolle, Standardkontrolle, Selbstkontrolle, Kreuzkontrolle und historische Kontrolle.

95. Die Randomisierung umfasst Zufallsstichproben und Zufallsgruppierungen.Zufallsstichproben bedeuten, sicherzustellen, dass jedes Individuum in der Bevölkerung die gleiche Chance hat, als Stichprobe ausgewählt zu werden; < a i=2> Zufällige Gruppierung bedeutet, sicherzustellen, dass jedes Individuum in der Stichprobe die gleiche Chance hat, der Experimentalgruppe oder der Kontrollgruppe zugeordnet zu werden.

96. Grundprinzipien des experimentellen Designs: Kontrolle, Randomisierung, Wiederholung und Balance.

97. Replikation bedeutet, dass die Forschungsprobe eine bestimmte Anzahl haben muss, das heißt, die Mindestanzahl der Proben muss unter der Bedingung bestimmt werden, dass die Forschungsergebnisse eine haben gewisses Maß an Zuverlässigkeit.

98. Das Prinzip des Gleichgewichts, auch als Prinzip der Homogenität und des Kontrasts bekannt, bezieht sich auf das Prinzip zwischen der Versuchsgruppe und der Kontrollgruppe oder zwischen jeder Versuchsgruppe, außer Die Behandlungsfaktoren, alle anderen Bedingungen sollten möglichst identisch bzw. konsistent sein.

99. Das vollständig randomisierte Design, auch bekannt als randomisierte kontrollierte Studie, ist ein einfaktorielles Forschungsdesign.

100. Die Schätzung der Stichprobengröße erfordert die Bestimmung von vier Grundfaktoren: α, 1-β, σ und δ. α und δ sind umgekehrt proportional zum Probeninhalt und σ (oder s) und 1-β sind direkt proportional zum Probengehalt.

101. Dosis-Wirkung ist die Dosis einer Versuchssubstanz, die in der Population der Versuchstiere eine bestimmte Reaktion hervorruft.

Guess you like

Origin blog.csdn.net/qq_67692062/article/details/134864195