Statisztikák:

kép:Cardiff University
Anjani Kumar

Follow

május 30, 2020 – 3 min olvasni

Áttekintés :

Az átlag / medián / módusz / szórás / standard eltérés mind nagyon alapvető, de nagyon fontos statisztikai fogalmak, amelyeket az adattudományban használnak. Szinte az összes gépi tanulási algoritmus használja ezeket a fogalmakat az adatok előfeldolgozási lépéseiben. Ezek a fogalmak a leíró statisztika részét képezik, ahol alapvetően az adatok leírására és megértésére használjuk a gépi tanulás jellemzőihez

Medán :

A középérték az adathalmazban lévő összes szám átlagaként is ismert, amelyet az alábbi egyenlet alapján számítunk ki.

Legyen mondjuk, hogy az alábbi személyek magassága van.

magasság=

Medián :

A medián középérték ebben a rendezett adathalmazban.

image:source unknown

Rendezze az adatokat növekvő sorrendbe, majd keresse meg a középértéket.

Ha páros számú érték van az adathalmazban, akkor a medián a két középső szám összege osztva két számmal. 2

Ha páratlan szám van az adathalmazban, mint alább 9 magasság, akkor a medián az 5. számérték lesz.

Mód :

A módusz az a szám, amely a leggyakrabban fordul elő az adathalmazban.Itt a 150 kétszer fordul elő, tehát ez a mi móduszunk.

Variancia :

A variancia az a számérték, amely a megfigyeléseknek a számtani átlagtól való eltérését írja le, és amelyet a szigma-négyzettel(σ2 )

A variancia azt méri, hogy a csoportban lévő egyének mennyire szóródnak el, az adathalmazban az átlagtól.

kép:Adatelemzés a földtudományokban

Hol

Xi : Az adathalmaz elemei

mu : a populáció átlaga

=a populáció átlaga

1. lépés: Ez a képlet azt mondja ki, hogy vegyük az adathalmaz(populáció) minden elemét és vonjuk ki az adathalmaz átlagából.Később összegezzük az összes értéket.

2. lépés: Vegyük az 1. lépés összegét, és osszuk el az elemek teljes számával.

A fenti képletben szereplő négyzet a negatív előjel(-)

Standardeltérés :

Az adathalmazon belüli megfigyelések szórásának mértéke az átlagukhoz képest.Ez a szórás négyzetgyöke és Sigma (σ) .

A standard eltérést ugyanabban az egységben fejezik ki, mint az adathalmazban lévő értékeket, így azt méri, hogy az adathalmaz megfigyelései mennyire térnek el az átlagtól.

Következtetés : Az átlag / medián / módusz / variancia / standard eltérés egyszerű, de nagyon fontos fogalmak a statisztikában, amelyeket mindenkinek ismernie kell .Remélem tetszett a cikkem.Kérem nyomja meg a tapsot 👏(50-szer), hogy motiváljon a további írásra.

Want to connect :

Linked In : https://www.linkedin.com/in/anjani-kumar-9b969a39/

Ha tetszenek a bejegyzéseim itt a Mediumon és szeretné, hogy folytassam ezt a munkát, fontolja meg a patreon

támogatásomat.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.