Introducción a la estimación de densidad de Kernel

Estimación de densidad de núcleo es un método estadístico para representar un rango de datos. Relacionados con histogramas, estimación de densidad de Kernel ofrece una manera de estimar la distribución de una variable en la población. El método es relativamente sofisticado pero los resultados a una interpretación visual de la densidad probable de la variable, en otras palabras, la frecuencia con que aparece una variable en una población.

Utiliza

Estimación de densidad de kernel calcula la forma de una función de densidad. Una función de densidad muestra la frecuencia con que aparece una variable en una muestra aleatoria de una población. La estimación de densidad de núcleo se considera un método no paramétrico. En las estadísticas, existen métodos paramétricos y no paramétricos. Métodos paramétricos hacen suposiciones más que las no paramétricas. No supuestos sobre la distribución de medios y desviaciones estándar son necesarios en estadística no paramétrica. Por ejemplo, si usted queria saber si la prueba 10 en una aula tendrían una mayor puntuación que los primeros nueve, en el razonamiento paramétrico tendrías que conocer la media y desviación estándar para derivar una respuesta. En el razonamiento no paramétrica, simplemente sabiendo que el número de pruebas es suficiente para saber la última prueba tiene un 10% de probabilidades de estar por encima de las puntuaciones anteriores.

Núcleo

La estimación de densidad de Kernel tiene dos componentes esenciales: el núcleo y el ancho de banda. El núcleo es la función de densidad. Hay seis tipos comunes de funciones de densidad en estadística no paramétrica: normal, uniforme, triangular, Epanechnikov, cuártica, triweight y coseno. Cada una de estas funciones se utiliza para estimar la frecuencia de una variable aleatoria en una población.

Ancho de banda

El segundo componente, el ancho de banda, suaviza los datos resultantes de la función de densidad del núcleo. El ancho de banda, por lo tanto, tiene fuertemente los impactos la representación visual de los datos. Una línea irregular puede ser alisada progresivamente hasta que los datos ha sido parafraseados así que ya no es útil. En la fórmula de estimación de densidad de Kernel, el ancho de banda está representado por la letra h. Debe ser positivo y dar lugar a una distribución que sumas a uno.

Ventajas

Estimación de densidad de kernel tiene ventajas que otros métodos de estimación no paramétrica, especialmente histogramas. Histogramas de representan la distribución de una variable en contenedores a lo largo de un rango horizontal. Apilar contenedores representan una mayor densidad de la variable en el sector de los datos. Porque histogramas simbolizan los datos a través de contenedores, la variable está compartimentada y diferentes distribuciones son irregulares y discretas, tergiversando la distribución de fluidos de una variable que realmente existe en una población. Estimación de densidad de kernel representa mejor esta fluidez con línea lisa, cuya suavidad está determinada por el ancho de banda en la fórmula de densidad de kernel.


© 2023 Usroasterie.com | Contact us: webmaster# usroasterie.com