Técnicas de análisis de datos estadísticos

Técnicas de análisis de datos estadísticos

Estadística es la rama de las matemáticas que se ocupa de organizar datos proporcionar resúmenes útiles. Se utilizan muchas técnicas estadísticas para analizar datos, pero solo algunos de los básicos de aprendizaje y enfoques más ampliamente utilizados le permitirá producir análisis de datos significativos. Estas técnicas caen en dos categorías generales, descriptivas e inferenciales. Pueden servir a muchos propósitos: para resumir los datos de una manera simple, para organizar por lo que es más fácil de entender y utilizar los datos para probar teorías sobre una población más grande.

Estadísticas descriptivas: De tendencia Central

Estadística se puede utilizar para comprimir una gran cantidad de datos hasta unas cifras importantes. Los dos aspectos más importantes de este enfoque son la medida de tendencia central y desviación estándar. Todas las tres medidas de tendencia central dan una idea de donde se encuentra el punto medio de los datos. La media o promedio, se encuentra sumando todos los valores en un conjunto de datos y dividiendo entre el número de valores. Así que la media del conjunto de datos (3,1,2,3,6) es 3 porque (3 + 1 + 2 + 3 + 6) / 5 = 3. El modo es el número que aparece con más frecuencia. Usando el mismo conjunto de datos de ejemplo, 3 es el modo porque aparece dos veces y todos los números aparecen sólo una vez. La mediana es el número que se encuentra en medio del conjunto de datos cuando los números se ordenan de menor a mayor. En el ejemplo anterior del conjunto de datos, la mediana es 3 porque 3 es el número medio de (1,2,3,3,6).

Estadística descriptiva: desviación típica

Desviación estándar es un valor único que indica la dispersión de un conjunto de datos. Un conjunto de datos en la que todos los números están cerca entre sí en valor tiene una desviación estándar pequeña y un conjunto de datos es muy amplio que van tiene una desviación estándar grande. Primero encontrar la media del conjunto, luego buscar la diferencia entre cada número del conjunto y eso significa que calcula la desviación estándar de un conjunto de datos. Estas diferencias entonces son cuadradas, se encuentra su promedio y la raíz cuadrada de esa media es la desviación estándar. Si un conjunto de datos es distribuido uniformemente alrededor de su punto medio, es normal, y casi todos los datos se encuentran dentro del valor de media más o menos tres desviaciones estándar.

Estadística descriptiva: Regresión lineal

En análisis de datos estadísticos a menudo quieren ver si existe una conexión, o correlación, entre pares de dos variables, tales como la velocidad de que un coche es conducido y su kilometraje de gas. Para descubrir, que utilizan análisis de regresión. La forma más simple de análisis de regresión es hacer una gráfica de los datos, con una variable en el eje horizontal y uno en el eje vertical. Si la trama parece seguir un patrón, que es generalmente una línea recta, una correlación es probable. Una calculadora estadística y algunos programas de software de hoja de cálculo pueden encontrar la ecuación de la mejor recta que pasa por una serie de datos. Una vez se conoce la ecuación, puede predecir el valor de una variable en cualquier valor de la otra variable. La calculadora también puede determinar el coeficiente de correlación de un conjunto de datos, abreviado como "r". R es una medida de qué tan bien los pares de datos se ajustan a la mejor recta de ajuste, y así más o menos te dice qué tan fuerte es la relación entre ellos. Un valor de R de 1 indica una perfecta línea recta de ajuste.

Estadística inferencial: Prueba de hipótesis

Cuando los datos son una muestra de una población más grande, se puede utilizar para probar una teoría o hipótesis sobre el verdadero valor promedio de esa población. Para ello, use la "prueba de z". Para encontrar un valor de z para los datos, en primer lugar calcular la diferencia entre la media muestral de datos y la media de población hipotética. Luego divide esa diferencia por la desviación de estándar de datos de muestra dividida por la raíz cuadrada del número de puntos de datos de la muestra. Compare este valor de z calculado a un valor de z crítico, que consultar de una tabla estándar de valores, basado en el grado de confianza que desee en su resultado. Si el valor de z calculado es menor que el valor crítico de z de la tabla, entonces aceptar que tu hipótesis sobre la media de población es cierto.


© 2019 Usroasterie.com | Contact us: webmaster# usroasterie.com