Statystyka, nauka o zbieraniu, analizowaniu, prezentowaniu i interpretowaniu danych. Rządowe zapotrzebowanie na dane ze spisów powszechnych, jak również informacje o różnych rodzajach działalności gospodarczej, dostarczyły wiele z wczesnych impulsów dla dziedziny statystyki. Obecnie potrzeba przekształcenia dużych ilości danych dostępnych w wielu stosowanych dziedzinach w użyteczne informacje stymulowała zarówno teoretyczny, jak i praktyczny rozwój statystyki.
Dane to fakty i liczby, które są zbierane, analizowane i podsumowywane w celu prezentacji i interpretacji. Dane mogą być klasyfikowane jako ilościowe lub jakościowe. Dane ilościowe mierzą albo ile lub jak wiele czegoś, a dane jakościowe dostarczają etykiet, lub nazw, dla kategorii podobnych przedmiotów. Na przykład, załóżmy, że dane badanie dotyczy takich cech jak wiek, płeć, stan cywilny i roczny dochód dla próby 100 osób. Cechy te byłyby nazywane zmiennymi badania, a wartości danych dla każdej ze zmiennych byłyby powiązane z każdą osobą. Tak więc wartości danych 28, mężczyzna, samotny i 30 000 USD byłyby zapisane dla 28-letniego samotnego mężczyzny o rocznym dochodzie 30 000 USD. Przy 100 osobach i 4 zmiennych, zbiór danych miałby 100 × 4 = 400 pozycji. W tym przykładzie wiek i roczny dochód są zmiennymi ilościowymi; odpowiadające im wartości danych wskazują, ile lat i ile pieniędzy ma każda osoba. Płeć i stan cywilny są zmiennymi jakościowymi. Etykiety mężczyzna i kobieta dostarczają danych jakościowych dla płci, a etykiety samotny, żonaty, rozwiedziony i owdowiały wskazują stan cywilny.
Metody ankiety próbnej są używane do zbierania danych z badań obserwacyjnych, a metody projektu eksperymentalnego są używane do zbierania danych z badań eksperymentalnych. Statystyka opisowa zajmuje się przede wszystkim metodami prezentacji i interpretacji danych za pomocą wykresów, tabel i zestawień liczbowych. W każdym przypadku, gdy statystycy wykorzystują dane z próby, tj. podzbioru populacji, do formułowania stwierdzeń na temat populacji, przeprowadzają wnioskowanie statystyczne. Estymacja i testowanie hipotez są procedurami używanymi do wnioskowania statystycznego. Dziedziny takie jak opieka zdrowotna, biologia, chemia, fizyka, edukacja, inżynieria, biznes i ekonomia szeroko wykorzystują wnioskowanie statystyczne.
Metody prawdopodobieństwa zostały początkowo opracowane do analizy gier hazardowych. Prawdopodobieństwo odgrywa kluczową rolę we wnioskowaniu statystycznym; jest ono wykorzystywane do dostarczania miar jakości i precyzji wnioskowania. Wiele z metod wnioskowania statystycznego zostało opisanych w tym artykule. Niektóre z tych metod są wykorzystywane głównie do badań jednej zmiennej, podczas gdy inne, takie jak regresja i analiza korelacji, są wykorzystywane do wnioskowania o związkach między dwoma lub więcej zmiennymi.