Overview :
Mean / Median /Mode / Variance /Standaardafwijking zijn allemaal zeer basis, maar zeer belangrijk concept van de statistiek gebruikt in data science. Bijna alle machine learning algoritme maakt gebruik van deze concepten in data preprocessing stappen. Deze concepten maken deel uit van beschrijvende statistieken waar we in principe gebruikt om te beschrijven en begrijpen van de gegevens voor functies in Machine learning
Mean :
Mean is ook bekend als gemiddelde van alle nummers in de dataset die wordt berekend door onderstaande vergelijking.
Laten we zeggen dat we onderstaande hoogten van personen hebben.
hoogtes=
Mediaan :
Mediaan is middelste waarde in deze geordende gegevensverzameling.
Rangschik de gegevens in oplopende volgorde en vind dan de middelste waarde.
Als we een even aantal waarden in de gegevensreeks hebben, dan is de mediaan de som van de middelste twee getallen gedeeld door 2
Als de gegevensverzameling een oneven aantal waarden heeft, zoals hieronder, met 9 hoogten, is de mediaan de vijfde waarde.
Mode is het getal dat het vaakst in de gegevensverzameling voorkomt.Hier komt 150 twee keer voor, dus dit is onze modus.
Where
Xi : elementen in de gegevensverzameling
mu : het populatiegemiddelde
=het populatiegemiddelde
Stap 1: Deze formule zegt dat u elk element uit de dataset (populatie) neemt en aftrekt van het gemiddelde van de dataset.Tel later alle waarden bij elkaar op.
Stap 2: Neem de som in stap 1 en deel door het totale aantal elementen.
Het kwadraat in de bovenstaande formule doet het effect van het negatieve teken (-) teniet
Standaardafwijking :
Het is een maat voor de spreiding van waarnemingen binnen de gegevensverzameling ten opzichte van hun gemiddelde.Het is de vierkantswortel van de variantie en wordt aangeduid met Sigma (σ).
Standaardafwijking wordt uitgedrukt in dezelfde eenheid als de waarden in de gegevensreeks, zodat wordt gemeten hoeveel de waarnemingen van de gegevensreeks verschillen van het gemiddelde.
Conclusie : Gemiddelde / Mediaan /Mode / Variantie /Standaardafwijking zijn eenvoudige maar zeer belangrijke concepten in de statistiek die iedereen zou moeten weten.Ik hoop dat je mijn artikel leuk vindt. Klap alsjeblieft 👏(50 keer) om me te motiveren om verder te schrijven.
Wil je contact :
Linked In : https://www.linkedin.com/in/anjani-kumar-9b969a39/
Als je mijn berichten hier op Medium leuk vindt en je wilt dat ik dit werk blijf doen, overweeg dan om me te steunen op patreon