Resumen :
Media / Mediana /Modalidad/ Varianza /Desviación Estándar son todos conceptos muy básicos pero muy importantes de la estadística utilizados en la ciencia de los datos. Casi todos los algoritmos de aprendizaje automático utilizan estos conceptos en los pasos de preprocesamiento de datos. Estos conceptos son parte de la estadística descriptiva donde básicamente se utiliza para describir y entender los datos para las características en el aprendizaje de la máquina
Media :
La media también se conoce como el promedio de todos los números en el conjunto de datos que se calcula por debajo de la ecuación.
Mediana :
La mediana es el valor medio en este conjunto de datos ordenados.
Ordenar los datos en el orden creciente y luego encontrar el valor medio.
Si tenemos un número par de valores en el conjunto de datos entonces la mediana es la suma de los dos números medios dividida por 2
Si tenemos un número impar en el conjunto de datos como abajo tenemos 9 alturas la mediana será el valor del 5º número.
Modo :
El modo es el número que aparece con más frecuencia en el conjunto de datos.En este caso, 150 aparece dos veces, por lo que es nuestro modo.
Varianza :
La varianza son los valores numéricos que describen la variabilidad de las observaciones a partir de su media aritmética y se denota por sigma-cuadrado(σ2 )
La varianza mide lo lejos que están los individuos del grupo, en el conjunto de datos, de la media.
Where
Xi : Elementos del conjunto de datos
mu : la media de la población
=la media de la población
Paso 1: Esta fórmula dice que se toma cada elemento del conjunto de datos (población) y se resta de la media del conjunto de datos.Después se suman todos los valores.
Paso 2: Se toma la suma del paso 1 y se divide por el número total de elementos.
El cuadrado en la fórmula anterior anulará el efecto del signo negativo (-)
Desviación estándar :
Es una medida de dispersión de la observación dentro del conjunto de datos en relación con su media.Es la raíz cuadrada de la varianza y se denomina Sigma (σ).
La desviación estándar se expresa en la misma unidad que los valores del conjunto de datos, por lo que mide la diferencia entre las observaciones del conjunto de datos y su media.
Conclusión : Media / Mediana /Modalidad/ Varianza /Desviación estándar son conceptos simples pero muy importantes en estadística que todos deberían conocer .Espero que te guste mi artículo.Por favor, pulsa Clap 👏(50 veces) para motivarme a escribir más.
Quieres conectar :
Linked In : https://www.linkedin.com/in/anjani-kumar-9b969a39/
Si te gustan mis posts aquí en Medium y deseas que siga haciendo este trabajo, considera apoyarme en patreon