Áttekintés :
Az átlag / medián / módusz / szórás / standard eltérés mind nagyon alapvető, de nagyon fontos statisztikai fogalmak, amelyeket az adattudományban használnak. Szinte az összes gépi tanulási algoritmus használja ezeket a fogalmakat az adatok előfeldolgozási lépéseiben. Ezek a fogalmak a leíró statisztika részét képezik, ahol alapvetően az adatok leírására és megértésére használjuk a gépi tanulás jellemzőihez
Medán :
A középérték az adathalmazban lévő összes szám átlagaként is ismert, amelyet az alábbi egyenlet alapján számítunk ki.
Legyen mondjuk, hogy az alábbi személyek magassága van.
magasság=
Medián :
A medián középérték ebben a rendezett adathalmazban.
Rendezze az adatokat növekvő sorrendbe, majd keresse meg a középértéket.
Ha páros számú érték van az adathalmazban, akkor a medián a két középső szám összege osztva két számmal. 2
Ha páratlan szám van az adathalmazban, mint alább 9 magasság, akkor a medián az 5. számérték lesz.
Mód :
A módusz az a szám, amely a leggyakrabban fordul elő az adathalmazban.Itt a 150 kétszer fordul elő, tehát ez a mi móduszunk.
Variancia :
A variancia az a számérték, amely a megfigyeléseknek a számtani átlagtól való eltérését írja le, és amelyet a szigma-négyzettel(σ2 )
A variancia azt méri, hogy a csoportban lévő egyének mennyire szóródnak el, az adathalmazban az átlagtól.
Hol
Xi : Az adathalmaz elemei
mu : a populáció átlaga
=a populáció átlaga
1. lépés: Ez a képlet azt mondja ki, hogy vegyük az adathalmaz(populáció) minden elemét és vonjuk ki az adathalmaz átlagából.Később összegezzük az összes értéket.
2. lépés: Vegyük az 1. lépés összegét, és osszuk el az elemek teljes számával.
A fenti képletben szereplő négyzet a negatív előjel(-)
Standardeltérés :
Az adathalmazon belüli megfigyelések szórásának mértéke az átlagukhoz képest.Ez a szórás négyzetgyöke és Sigma (σ) .
A standard eltérést ugyanabban az egységben fejezik ki, mint az adathalmazban lévő értékeket, így azt méri, hogy az adathalmaz megfigyelései mennyire térnek el az átlagtól.
Következtetés : Az átlag / medián / módusz / variancia / standard eltérés egyszerű, de nagyon fontos fogalmak a statisztikában, amelyeket mindenkinek ismernie kell .Remélem tetszett a cikkem.Kérem nyomja meg a tapsot 👏(50-szer), hogy motiváljon a további írásra.
Want to connect :
Linked In : https://www.linkedin.com/in/anjani-kumar-9b969a39/
Ha tetszenek a bejegyzéseim itt a Mediumon és szeretné, hogy folytassam ezt a munkát, fontolja meg a patreon
támogatásomat.