Statistik: Middel / Median /Mode / Varians / Standardafvigelse

Billede:Cardiff University
Anjani Kumar

Follow

30. maj, 2020 – 3 min read

Overblik:

Middelværdi / Median /Middelværdi / Varians / Standardafvigelse er alle meget grundlæggende, men meget vigtige statistiske begreber, der anvendes inden for datalogi. Næsten alle maskinlæringsalgoritmer anvender disse begreber i datapræprocesseringstrin. Disse begreber er en del af beskrivende statistik, hvor vi grundlæggende bruger dem til at beskrive og forstå data for funktioner i maskinlæring

Middelværdi :

Middelværdi er også kendt som gennemsnittet af alle tallene i datasættet, som beregnes ved nedenstående ligning.

Lader os sige, at vi har nedenstående højder på personer.

højder=

Median :

Median er midterste værdi i dette ordnede datasæt.

Billede:kilde ukendt

Rangér dataene i stigende orden og find derefter midterværdien.

Hvis vi har et lige antal værdier i datasættet, så er medianen summen af de to midterste tal divideret med 2

Hvis vi har et ulige antal i datasættet som nedenfor, hvor vi har 9 højder, vil medianen være den 5. talværdi.

Mode :

Mode er det tal, der forekommer hyppigst i datasættet.Her forekommer 150 to gange, så det er vores mode.

Varians :

Varians er de numeriske værdier, der beskriver observationernes variabilitet i forhold til det aritmetiske gennemsnit og betegnes ved sigma-kvadrat(σ2 )

Varians måler, hvor langt individerne i gruppen er spredt ud, i datasættet fra gennemsnittet.

Billede:Dataanalyse i geovidenskaberne

Hvor

Xi : Elementer i datasættet

mu : populationens gennemsnit

=populationsgennemsnittet

Strin 1: Denne formel siger, at man tager hvert element fra datasættet (populationen) og trækker det fra datasættets gennemsnit.Senere summeres alle værdierne.

Strin 2: Tag summen i trin 1 og divider den med det samlede antal elementer.

Kvadratet i ovenstående formel vil ophæve effekten af det negative tegn(-)

Standardafvigelse :

Det er et mål for spredningen af observationer inden for datasættet i forhold til deres gennemsnit.Den er kvadratroden af variansen og betegnes Sigma (σ) .

Standardafvigelse udtrykkes i samme enhed som værdierne i datasættet, så den måler, hvor meget observationerne i datasættet afviger fra dets gennemsnit.

Konklusion : Middelværdi / Median /Mode / Varians / Standardafvigelse er enkle, men meget vigtige begreber inden for statistik, som alle bør kende .Håber du kan lide min artikel.Tryk venligst på Clap 👏(50 gange) for at motivere mig til at skrive videre.

Vil du oprette forbindelse :

Linked In : https://www.linkedin.com/in/anjani-kumar-9b969a39/

Hvis du kan lide mine indlæg her på Medium og ønsker, at jeg skal fortsætte med dette arbejde, så overvej at støtte mig på patreon

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.