A statisztika az adatok gyűjtésének, elemzésének, bemutatásának és értelmezésének tudománya. A kormányok népszámlálási adatokra, valamint a különböző gazdasági tevékenységekre vonatkozó információkra vonatkozó igényei adták a statisztika területének korai lendületét. Jelenleg a számos alkalmazott területen rendelkezésre álló nagy mennyiségű adat hasznos információvá alakításának igénye ösztönözte a statisztika elméleti és gyakorlati fejlődését.
Az adatok olyan tények és számok, amelyeket összegyűjtenek, elemeznek és összegeznek bemutatás és értelmezés céljából. Az adatok mennyiségi vagy minőségi adatoknak minősíthetők. A mennyiségi adatok azt mérik, hogy valamiből mennyi vagy hány van, a minőségi adatok pedig címkéket vagy neveket adnak a hasonló elemek kategóriáinak. Tegyük fel például, hogy egy adott tanulmány olyan jellemzők iránt érdeklődik, mint az életkor, a nem, a családi állapot és az éves jövedelem egy 100 főből álló minta esetében. Ezeket a jellemzőket a vizsgálat változóinak neveznénk, és az egyes változók adatértékei minden egyes egyénhez kapcsolódnának. Így a 28 éves, férfi, egyedülálló és 30 000 dollár adatértékeket egy 28 éves, egyedülálló férfi esetében rögzítenék, akinek az éves jövedelme 30 000 dollár. 100 egyén és 4 változó esetén az adathalmaz 100 × 4 = 400 elemet tartalmazna. Ebben a példában az életkor és az éves jövedelem mennyiségi változók; a megfelelő adatértékek azt mutatják, hogy az egyes személyeknél hány év és mennyi pénz van. A nem és a családi állapot minőségi változók. A férfi és a nő címkék adják a nemre vonatkozó kvalitatív adatokat, az egyedülálló, házas, elvált és özvegy címkék pedig a családi állapotot jelzik.
A mintavételes felmérési módszereket megfigyelési tanulmányok adatainak gyűjtésére, a kísérleti tervezési módszereket pedig kísérleti tanulmányok adatainak gyűjtésére használják. A leíró statisztika területe elsősorban az adatok grafikonok, táblázatok és numerikus összegzések segítségével történő bemutatásának és értelmezésének módszereivel foglalkozik. Amikor a statisztikusok egy mintából – azaz a populáció egy részhalmazából – származó adatokat használnak fel arra, hogy a populációra vonatkozó kijelentéseket tegyenek, akkor statisztikai következtetést végeznek. A becslés és a hipotézisvizsgálat olyan eljárások, amelyeket statisztikai következtetések levonására használnak. Az olyan területek, mint az egészségügy, a biológia, a kémia, a fizika, az oktatás, a mérnöki tudományok, az üzleti élet és a közgazdaságtan széles körben használják a statisztikai következtetéseket.
A valószínűségszámítás módszereit eredetileg a szerencsejátékok elemzésére fejlesztették ki. A valószínűség kulcsszerepet játszik a statisztikai következtetésben; a következtetések minőségének és pontosságának mérésére használják. A statisztikai következtetés számos módszerét ismertetjük ebben a cikkben. E módszerek némelyikét elsősorban egyváltozós vizsgálatokhoz használják, míg mások, például a regresszió és a korrelációelemzés, két vagy több változó közötti kapcsolatokra vonatkozó következtetések levonására szolgálnak.