Statistieken: Gemiddelde / Mediaan /Modus /Variantie /Standaardafwijking

afbeelding:Cardiff University
Anjani Kumar

Follow

30 mei, 2020 – 3 min read

Overview :

Mean / Median /Mode / Variance /Standaardafwijking zijn allemaal zeer basis, maar zeer belangrijk concept van de statistiek gebruikt in data science. Bijna alle machine learning algoritme maakt gebruik van deze concepten in data preprocessing stappen. Deze concepten maken deel uit van beschrijvende statistieken waar we in principe gebruikt om te beschrijven en begrijpen van de gegevens voor functies in Machine learning

Mean :

Mean is ook bekend als gemiddelde van alle nummers in de dataset die wordt berekend door onderstaande vergelijking.

Laten we zeggen dat we onderstaande hoogten van personen hebben.

hoogtes=

Mediaan :

Mediaan is middelste waarde in deze geordende gegevensverzameling.

image:bron onbekend

Rangschik de gegevens in oplopende volgorde en vind dan de middelste waarde.

Als we een even aantal waarden in de gegevensreeks hebben, dan is de mediaan de som van de middelste twee getallen gedeeld door 2

Als de gegevensverzameling een oneven aantal waarden heeft, zoals hieronder, met 9 hoogten, is de mediaan de vijfde waarde.

Mode is het getal dat het vaakst in de gegevensverzameling voorkomt.Hier komt 150 twee keer voor, dus dit is onze modus.

Variantie :

Variantie is de numerieke waarde die de variabiliteit van de waarnemingen ten opzichte van het rekenkundig gemiddelde beschrijft en wordt aangeduid met sigma-kwadraat (σ2 )

Variantie meet hoe ver de individuen in de groep verspreid zijn, in de reeks gegevens ten opzichte van het gemiddelde.

image:Data Analysis in the Geosciences

Where

Xi : elementen in de gegevensverzameling

mu : het populatiegemiddelde

=het populatiegemiddelde

Stap 1: Deze formule zegt dat u elk element uit de dataset (populatie) neemt en aftrekt van het gemiddelde van de dataset.Tel later alle waarden bij elkaar op.

Stap 2: Neem de som in stap 1 en deel door het totale aantal elementen.

Het kwadraat in de bovenstaande formule doet het effect van het negatieve teken (-) teniet

Standaardafwijking :

Het is een maat voor de spreiding van waarnemingen binnen de gegevensverzameling ten opzichte van hun gemiddelde.Het is de vierkantswortel van de variantie en wordt aangeduid met Sigma (σ).

Standaardafwijking wordt uitgedrukt in dezelfde eenheid als de waarden in de gegevensreeks, zodat wordt gemeten hoeveel de waarnemingen van de gegevensreeks verschillen van het gemiddelde.

Conclusie : Gemiddelde / Mediaan /Mode / Variantie /Standaardafwijking zijn eenvoudige maar zeer belangrijke concepten in de statistiek die iedereen zou moeten weten.Ik hoop dat je mijn artikel leuk vindt. Klap alsjeblieft 👏(50 keer) om me te motiveren om verder te schrijven.

Wil je contact :

Linked In : https://www.linkedin.com/in/anjani-kumar-9b969a39/

Als je mijn berichten hier op Medium leuk vindt en je wilt dat ik dit werk blijf doen, overweeg dan om me te steunen op patreon

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.