Statistik, die Wissenschaft vom Sammeln, Analysieren, Darstellen und Interpretieren von Daten. Der Bedarf der Regierung an Volkszählungsdaten sowie an Informationen über eine Vielzahl von Wirtschaftstätigkeiten lieferte einen Großteil der frühen Impulse für den Bereich der Statistik. Gegenwärtig hat die Notwendigkeit, die großen Datenmengen, die in vielen Anwendungsbereichen verfügbar sind, in nützliche Informationen umzuwandeln, sowohl theoretische als auch praktische Entwicklungen in der Statistik angeregt.
Daten sind Fakten und Zahlen, die gesammelt, analysiert und zur Präsentation und Interpretation zusammengefasst werden. Daten können entweder als quantitativ oder qualitativ klassifiziert werden. Quantitative Daten messen entweder die Menge oder die Anzahl von etwas, während qualitative Daten Bezeichnungen oder Namen für Kategorien ähnlicher Elemente liefern. Nehmen wir zum Beispiel an, dass eine bestimmte Studie an Merkmalen wie Alter, Geschlecht, Familienstand und Jahreseinkommen für eine Stichprobe von 100 Personen interessiert ist. Diese Merkmale würden als die Variablen der Studie bezeichnet, und die Datenwerte für jede der Variablen würden mit jeder Person verknüpft werden. So würden die Datenwerte 28, männlich, alleinstehend und 30.000 $ für einen 28-jährigen alleinstehenden Mann mit einem Jahreseinkommen von 30.000 $ aufgezeichnet werden. Bei 100 Personen und 4 Variablen würde der Datensatz 100 × 4 = 400 Elemente enthalten. In diesem Beispiel sind das Alter und das Jahreseinkommen quantitative Variablen; die entsprechenden Datenwerte geben an, wie viele Jahre und wie viel Geld die einzelnen Personen haben. Geschlecht und Familienstand sind qualitative Variablen. Die Bezeichnungen „männlich“ und „weiblich“ liefern die qualitativen Daten für das Geschlecht, und die Bezeichnungen „ledig“, „verheiratet“, „geschieden“ und „verwitwet“ geben den Familienstand an.
Methoden der Stichprobenerhebung werden verwendet, um Daten aus Beobachtungsstudien zu sammeln, und Methoden der Versuchsplanung werden verwendet, um Daten aus experimentellen Studien zu sammeln. Der Bereich der deskriptiven Statistik befasst sich in erster Linie mit Methoden zur Darstellung und Interpretation von Daten anhand von Diagrammen, Tabellen und numerischen Zusammenfassungen. Wann immer Statistiker Daten aus einer Stichprobe – d. h. einer Teilmenge der Grundgesamtheit – verwenden, um Aussagen über die Grundgesamtheit zu treffen, führen sie statistische Schlussfolgerungen durch. Schätzungen und Hypothesentests sind Verfahren, mit denen statistische Schlussfolgerungen gezogen werden. In Bereichen wie dem Gesundheitswesen, der Biologie, der Chemie, der Physik, der Pädagogik, dem Ingenieurwesen, der Wirtschaft und der Ökonomie werden statistische Schlussfolgerungen ausgiebig genutzt.
Die Methoden der Wahrscheinlichkeitsrechnung wurden ursprünglich für die Analyse von Glücksspielen entwickelt. Die Wahrscheinlichkeit spielt eine Schlüsselrolle bei statistischen Schlussfolgerungen; sie wird verwendet, um die Qualität und Präzision der Schlussfolgerungen zu messen. In diesem Artikel werden viele der Methoden der statistischen Schlussfolgerung beschrieben. Einige dieser Methoden werden in erster Linie für Studien mit nur einer Variablen verwendet, während andere, wie die Regressions- und Korrelationsanalyse, verwendet werden, um Rückschlüsse auf Beziehungen zwischen zwei oder mehr Variablen zu ziehen.