Overview :
Mediana/Mediana/Modul/Varianța/Deviația standard sunt toate concepte de bază, dar foarte importante, ale statisticii utilizate în știința datelor. Aproape toți algoritmii de învățare automată utilizează aceste concepte în etapele de preprocesare a datelor. Aceste concepte fac parte din statistica descriptivă, pe care o folosim, în principiu, pentru a descrie și a înțelege datele pentru caracteristici în învățarea automată
Mediana :
Mediana este, de asemenea, cunoscută ca medie a tuturor numerelor din setul de date, care se calculează prin ecuația de mai jos.
Să spunem că avem mai jos înălțimile persoanelor.
înălțimi=
Mediana :
Mediana este valoarea mediană în acest set de date ordonate.
Aranjați datele în ordine crescătoare și apoi găsiți valoarea mediană.
Dacă avem un număr par de valori în setul de date, atunci mediana este suma celor două numere medii împărțită la 2
În cazul în care avem un număr impar în setul de date, cum ar fi mai jos, avem 9 înălțimi, mediana va fi a 5-a valoare numerică.
Mode :
Mode este numărul care apare cel mai des în setul de date.Aici 150 apare de două ori, deci acesta este modul nostru.
Varianța :
Varianța reprezintă valorile numerice care descriu variabilitatea observațiilor față de media sa aritmetică și se denumește prin sigma pătrat(σ2 )
Varianța măsoară cât de mult sunt răspândiți indivizii din grup, în setul de date față de medie.
Unde
Xi : Elemente din setul de date
mu : media populației
=mediile populației
Pasul 1: Această formulă spune că se ia fiecare element din setul de date (populație) și se scade din media setului de date.Ulterior se însumează toate valorile.
Etapa 2: Se ia suma din etapa 1 și se împarte la numărul total de elemente.
Pătratul din formula de mai sus va anula efectul semnului negativ(-)
Deviația standard :
Este o măsură a dispersiei observațiilor din cadrul setului de date în raport cu media lor.Este rădăcina pătrată a varianței și este notată cu Sigma (σ) .
Deviația standard este exprimată în aceeași unitate cu valorile din setul de date, astfel încât măsoară cât de mult diferă observațiile din setul de date de media sa.
Concluzie : Media / Mediana /Modul /Varianța /Deviația standard sunt concepte simple, dar foarte importante în statistică, pe care toți ar trebui să le cunoască .Sper că vă place articolul meu. vă rog să apăsați Clap 👏 (de 50 de ori) pentru a mă motiva să scriu în continuare.
Vreți să vă conectați :
Linked In : https://www.linkedin.com/in/anjani-kumar-9b969a39/
Dacă vă plac postările mele aici pe Medium și doriți ca eu să continui să fac această muncă, luați în considerare să mă susțineți pe patreon
.