Mean / Median /Mode / Varians /Standardavvikelse är alla mycket grundläggande men mycket viktiga begrepp inom statistik som används inom datavetenskap. Nästan alla algoritmer för maskininlärning använder dessa begrepp i förbehandlingen av data. Dessa begrepp är en del av deskriptiv statistik där vi i princip använder dem för att beskriva och förstå data för funktioner i maskininlärning
Medelvärde :
Medelvärdet kallas också för genomsnittet av alla tal i datamängden, vilket beräknas med hjälp av nedanstående ekvation.
Vi kan säga att vi har nedanstående personers höjder.
höjder=
Median :
Median är ett medelvärde i denna ordnade datamängd.
Sortera data i stigande ordning och hitta sedan medelvärdet.
Om vi har ett jämnt antal värden i datamängden är medianen summan av de två mittersta talen dividerat med. 2
Om vi har ett udda antal i datamängden, t.ex. nedan, där vi har 9 höjder, blir medianen det femte värdet.