

Översikt:
Mean / Median /Mode / Varians /Standardavvikelse är alla mycket grundläggande men mycket viktiga begrepp inom statistik som används inom datavetenskap. Nästan alla algoritmer för maskininlärning använder dessa begrepp i förbehandlingen av data. Dessa begrepp är en del av deskriptiv statistik där vi i princip använder dem för att beskriva och förstå data för funktioner i maskininlärning
Medelvärde :
Medelvärdet kallas också för genomsnittet av alla tal i datamängden, vilket beräknas med hjälp av nedanstående ekvation.

Vi kan säga att vi har nedanstående personers höjder.
höjder=

Median :
Median är ett medelvärde i denna ordnade datamängd.

Sortera data i stigande ordning och hitta sedan medelvärdet.

Om vi har ett jämnt antal värden i datamängden är medianen summan av de två mittersta talen dividerat med. 2

Om vi har ett udda antal i datamängden, t.ex. nedan, där vi har 9 höjder, blir medianen det femte värdet.


Modus :
Modus är det tal som förekommer oftast i datamängden.Här förekommer 150 två gånger, så det är vårt mode.

Varians :
Varians är de numeriska värden som beskriver observationernas variabilitet från dess aritmetiska medelvärde och betecknas med sigma-kvadrat(σ2 )
Varians mäter hur långt individerna i gruppen är utspridda i datamängden från medelvärdet.

Varifrån
Xi : Element i datamängden
mu : populationens medelvärde
=populationens medelvärde
Steg 1: Denna formel säger att man tar varje element från datasetet (populationen) och subtraherar från datasetets medelvärde.Senare summerar du alla värden.
Steg 2: Ta summan i steg 1 och dividera med det totala antalet element.
Kvadraten i ovanstående formel upphäver effekten av det negativa tecknet (-)

Standardavvikelse :
Det är ett mått på spridning av observationer inom datamängden i förhållande till deras medelvärde.Det är kvadratroten av variansen och betecknas med Sigma (σ) .
Standardavvikelsen uttrycks i samma enhet som värdena i datamängden så den mäter hur mycket observationerna i datamängden skiljer sig från dess medelvärde.


Slutsats : Medelvärde, median, metod, varians och standardavvikelse är enkla men mycket viktiga begrepp inom statistiken som alla bör känna till.Hoppas du gillar min artikel.Tryck på Clap 👏(50 gånger) för att motivera mig att skriva vidare.
Vill du ha kontakt :
Linked In : https://www.linkedin.com/in/anjani-kumar-9b969a39/
Om du gillar mina inlägg här på Medium och vill att jag ska fortsätta att göra detta arbete, kan du överväga att stödja mig på patreon
.