Statistik: Medelvärde / Median /Mod / Varians / Standardavvikelse

Bild:Cardiff University
Anjani Kumar

Follow

30 maj, 2020 – 3 min read

Översikt:

Mean / Median /Mode / Varians /Standardavvikelse är alla mycket grundläggande men mycket viktiga begrepp inom statistik som används inom datavetenskap. Nästan alla algoritmer för maskininlärning använder dessa begrepp i förbehandlingen av data. Dessa begrepp är en del av deskriptiv statistik där vi i princip använder dem för att beskriva och förstå data för funktioner i maskininlärning

Medelvärde :

Medelvärdet kallas också för genomsnittet av alla tal i datamängden, vilket beräknas med hjälp av nedanstående ekvation.

Vi kan säga att vi har nedanstående personers höjder.

höjder=

Median :

Median är ett medelvärde i denna ordnade datamängd.

Bild:källa okänd

Sortera data i stigande ordning och hitta sedan medelvärdet.

Om vi har ett jämnt antal värden i datamängden är medianen summan av de två mittersta talen dividerat med. 2

Om vi har ett udda antal i datamängden, t.ex. nedan, där vi har 9 höjder, blir medianen det femte värdet.

Modus :

Modus är det tal som förekommer oftast i datamängden.Här förekommer 150 två gånger, så det är vårt mode.

Varians :

Varians är de numeriska värden som beskriver observationernas variabilitet från dess aritmetiska medelvärde och betecknas med sigma-kvadrat(σ2 )

Varians mäter hur långt individerna i gruppen är utspridda i datamängden från medelvärdet.

Bild:Data Analysis in the Geosciences

Varifrån

Xi : Element i datamängden

mu : populationens medelvärde

=populationens medelvärde

Steg 1: Denna formel säger att man tar varje element från datasetet (populationen) och subtraherar från datasetets medelvärde.Senare summerar du alla värden.

Steg 2: Ta summan i steg 1 och dividera med det totala antalet element.

Kvadraten i ovanstående formel upphäver effekten av det negativa tecknet (-)

Standardavvikelse :

Det är ett mått på spridning av observationer inom datamängden i förhållande till deras medelvärde.Det är kvadratroten av variansen och betecknas med Sigma (σ) .

Standardavvikelsen uttrycks i samma enhet som värdena i datamängden så den mäter hur mycket observationerna i datamängden skiljer sig från dess medelvärde.

Slutsats : Medelvärde, median, metod, varians och standardavvikelse är enkla men mycket viktiga begrepp inom statistiken som alla bör känna till.Hoppas du gillar min artikel.Tryck på Clap 👏(50 gånger) för att motivera mig att skriva vidare.

Vill du ha kontakt :

Linked In : https://www.linkedin.com/in/anjani-kumar-9b969a39/

Om du gillar mina inlägg här på Medium och vill att jag ska fortsätta att göra detta arbete, kan du överväga att stödja mig på patreon

.

Lämna ett svar

Din e-postadress kommer inte publiceras.