Statistiken: Mittelwert / Median /Modus / Varianz /Standardabweichung

Bild:Cardiff University
Anjani Kumar

Follow

May 30, 2020 – 3 min read

Überblick:

Mittelwert / Median /Modus/ Varianz /Standardabweichung sind alle sehr grundlegende, aber sehr wichtige Konzepte der Statistik, die in der Datenwissenschaft verwendet werden. Fast alle Algorithmen des maschinellen Lernens verwenden diese Konzepte in den Schritten der Datenvorverarbeitung. Diese Konzepte sind Teil der deskriptiven Statistik, wo wir im Grunde verwendet, um zu beschreiben und zu verstehen, die Daten für Features in Machine Learning

Mean :

Mean ist auch bekannt als Durchschnitt aller Zahlen in der Datenmenge, die durch die unten Gleichung berechnet wird.

Sagen wir, wir haben unten Größen von Personen.

Höhen=

Median :

Median ist der mittlere Wert in diesem geordneten Datensatz.

Bild:Quelle unbekannt

Reihen Sie die Daten in aufsteigender Reihenfolge und finden Sie dann den Mittelwert.

Wenn wir eine gerade Anzahl von Werten im Datensatz haben, dann ist der Median die Summe der mittleren zwei Zahlen geteilt durch 2

Wenn wir eine ungerade Anzahl von Werten im Datensatz haben, wie z.B. 9 Höhen, dann ist der Median der fünfte Zahlenwert.

Modus :

Modus ist die Zahl, die am häufigsten im Datensatz auftritt.Hier kommt 150 zweimal vor, also ist dies unser Modus.

Varianz :

Varianz ist der Zahlenwert, der die Streuung der Beobachtungen vom arithmetischen Mittel beschreibt und mit Sigma-Quadrat (σ2 )

Varianz ist ein Maß dafür, wie weit die Individuen der Gruppe in der Datenmenge vom Mittelwert entfernt sind.

Bild:Datenanalyse in den Geowissenschaften

Wo

Xi : Elemente im Datensatz

mu : Mittelwert der Grundgesamtheit

=Mittelwert der Grundgesamtheit

Schritt 1: Diese Formel besagt, dass jedes Element aus dem Datensatz (Grundgesamtheit) genommen und vom Mittelwert des Datensatzes subtrahiert wird.Anschließend werden alle Werte summiert.

Schritt 2: Nimm die Summe aus Schritt 1 und teile sie durch die Gesamtzahl der Elemente.

Das Quadrat in der obigen Formel hebt die Wirkung des negativen Vorzeichens (-)

Standardabweichung :

Sie ist ein Maß für die Streuung der Beobachtungen innerhalb des Datensatzes relativ zu ihrem Mittelwert.Sie ist die Quadratwurzel der Varianz und wird mit Sigma (σ) bezeichnet.

Die Standardabweichung wird in derselben Einheit wie die Werte im Datensatz ausgedrückt, so dass sie misst, wie stark die Beobachtungen des Datensatzes von ihrem Mittelwert abweichen.

Abschluss: Mittelwert / Median /Modus/ Varianz /Standardabweichung sind einfache, aber sehr wichtige Konzepte in der Statistik, die alle kennen sollten.Bitte klatschen Sie 👏(50 mal), um mich zu motivieren, weiter zu schreiben.

Verbinden Sie mich :

Verknüpft : https://www.linkedin.com/in/anjani-kumar-9b969a39/

Wenn Ihnen meine Beiträge hier auf Medium gefallen und Sie möchten, dass ich diese Arbeit fortsetze, sollten Sie in Erwägung ziehen, mich auf Patreon zu unterstützen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.