Yleiskatsaus :
Keskiarvo / mediaani / moodi / varianssi / keskihajonta ovat kaikki hyvin perustavanlaatuisia mutta erittäin tärkeitä tilastotieteen käsitteitä, joita käytetään datatieteessä. Lähes kaikki koneoppimisalgoritmit käyttävät näitä käsitteitä datan esikäsittelyvaiheissa. Nämä käsitteet ovat osa kuvailevaa tilastotiedettä, jota käytetään periaatteessa kuvaamaan ja ymmärtämään dataa koneoppimisen piirteitä varten
Keskiarvo :
Keskiarvo tunnetaan myös datajoukon kaikkien lukujen keskiarvona, joka lasketaan alla olevalla yhtälöllä.
Sanotaanpa, että meillä on alla olevien henkilöiden pituudet.
korkeudet=
Järjestä aineisto kasvavaan järjestykseen ja etsi sitten keskiarvo.
Jos aineistossa on parillinen määrä arvoja, mediaani on kahden keskimmäisen luvun summa jaettuna luvulla 2
Jos meillä on datajoukossa pariton määrä kuten alla meillä on 9 korkeutta mediaani on 5. lukuarvo.
Moduuli :
Moduuli on luku, joka esiintyy useimmin aineistossa.Tässä 150 esiintyy kahdesti, joten tämä on moodi.
Varianssi :
Varianssi on lukuarvo, joka kuvaa havaintojen vaihtelua aritmeettisesta keskiarvosta ja jota merkitään sigma-neliöllä(σ2 )
Varianssi mittaa sitä, kuinka kauas ryhmän yksilöt ovat hajallaan, aineistojoukossa keskiarvosta.
Jossa
Xi : Aineistojoukon elementit
mu : populaation keskiarvo
=populaation keskiarvo
Vaihe 1: Tämä kaava sanoo, että otetaan jokainen elementti aineistosta(populaatio) ja vähennetään aineiston keskiarvosta.Myöhemmin lasketaan kaikki arvot yhteen.
Vaihe 2: Otetaan vaiheen 1 summa ja jaetaan elementtien kokonaismäärällä.
Yllä olevassa kaavassa oleva neliö mitätöi negatiivisen merkin(-)
Keskiarvopoikkeama :
Se on mittari, jolla mitataan havaintojen hajontaa aineistokokonaisuuksissa niiden keskiarvoon nähden.Se on varianssin neliöjuuri ja sitä merkitään Sigmalla (σ) .
Standardipoikkeama ilmaistaan samassa yksikössä kuin aineiston arvot, joten se mittaa, kuinka paljon aineiston havainnot poikkeavat sen keskiarvosta.
Johtopäätös : Keskiarvo / Mediaani /Mode/ Varianssi /Standardipoikkeama ovat yksinkertaisia mutta erittäin tärkeitä tilastotieteen käsitteitä, jotka kaikkien tulisi tuntea .Toivottavasti pidit artikkelistani.Ole hyvä ja paina Clap 👏(50 kertaa) motivoidaksesi minua kirjoittamaan lisää.
Want to connect :
Linked In : https://www.linkedin.com/in/anjani-kumar-9b969a39/
Jos pidät postauksistani täällä Mediumissa ja haluaisit minun jatkavan tätä työtä, harkitse tukeaksesi minua patreonissa
.