Statistika, věda o shromažďování, analýze, prezentaci a interpretaci dat. Vládní potřeby týkající se údajů ze sčítání lidu a také informací o nejrůznějších ekonomických činnostech byly velkým impulsem pro vznik oboru statistiky v jeho počátcích. V současné době potřeba přeměnit velké množství dat dostupných v mnoha aplikovaných oborech na užitečné informace podnítila teoretický i praktický rozvoj statistiky.
Data jsou fakta a čísla, která jsou shromažďována, analyzována a shrnuta za účelem prezentace a interpretace. Data mohou být klasifikována jako kvantitativní nebo kvalitativní. Kvantitativní data měří buď kolik nebo kolik něčeho je, a kvalitativní data poskytují označení nebo názvy pro kategorie podobných položek. Předpokládejme například, že určitá studie se zajímá o charakteristiky, jako je věk, pohlaví, rodinný stav a roční příjem u vzorku 100 osob. Tyto charakteristiky by se nazývaly proměnné studie a hodnoty údajů pro každou z proměnných by byly přiřazeny ke každému jednotlivci. Hodnoty údajů 28 let, muž, svobodný a 30 000 USD by tedy byly zaznamenány pro 28letého svobodného muže s ročním příjmem 30 000 USD. Při 100 jedincích a 4 proměnných by soubor dat obsahoval 100 × 4 = 400 položek. V tomto příkladu jsou věk a roční příjem kvantitativní proměnné; odpovídající hodnoty údajů udávají, kolik let a kolik peněz má každý jednotlivec. Pohlaví a rodinný stav jsou kvalitativní proměnné. Značky muž a žena poskytují kvalitativní údaje pro pohlaví a značky svobodný, ženatý, rozvedený a ovdovělý označují rodinný stav.
Metody výběrového šetření se používají pro sběr dat z pozorovacích studií a metody experimentálního designu se používají pro sběr dat z experimentálních studií. Oblast popisné statistiky se zabývá především metodami prezentace a interpretace dat pomocí grafů, tabulek a číselných přehledů. Kdykoli statistikové používají data ze vzorku – tj. podmnožiny populace – k vyjádření tvrzení o populaci, provádějí statistickou inferenci. Odhady a testování hypotéz jsou postupy používané k provádění statistických závěrů. Obory, jako je zdravotnictví, biologie, chemie, fyzika, vzdělávání, inženýrství, obchod a ekonomie, hojně využívají statistické odvozování.
Metody pravděpodobnosti byly původně vyvinuty pro analýzu hazardních her. Pravděpodobnost hraje ve statistickém odvozování klíčovou roli; používá se k zajištění měřítek kvality a přesnosti odvozování. Mnoho metod statistické inference je popsáno v tomto článku. Některé z těchto metod se používají především při studiu jedné proměnné, zatímco jiné, například regresní a korelační analýza, se používají k vyvozování závěrů o vztazích mezi dvěma nebo více proměnnými.