GEOPY

Vaya al Contenido

Menu Principal

MEIE1

Métodos de Inferencia Estadística con una población


El término población es utilizado en estadística como sinónimo de grupo experimental. Por consiguiente estudiamos un grupo de individuos o unidades de análisis en los que ha sido definida una variable aleatoria con distribución normal.


[ Definiciones, conceptos y métodos]


  • Explicación del script


Antes de aplicar técnicas de inferencia estadística un paso habitual es la realización de un análisis de estadística descriptiva a los datos experimentales (líneas 26 y 38). Asimismo se obtienen distintas clases de gráficos que nos ayudarán en la interpretación de los resultados, por ejemplo el diagrama de dispersión, gráfico de caja y bigotes, histograma etc. (líneas 44-66). Entre las líneas 54 y 59 se ha incluido el código que permite obtener un histograma gaussiano con el que esposible comparar el histograma de los datos experimentales con la distribución normal o ditribución de Gauss.

Entre las líneas 68 y 81 se muestra el código con el que realizar las pruebas de normalidad de la variable. Se realiza tanto un test general, es decir el test de Kolmogorov-Smirnov, como pruebas específicas de normalidad: tests de Saphiro-Wilks,  D’ Agostino y Anderson-Darling. Obviamente los p-valores obtenidos aunque diferentes deberían conducir a una misma decisión sobre la aceptación o rechazo de la normalidad de la variable.

Obsérvese como el test de normalidad realizado con la prueba general de Kolmogorov-Smirnov requiere de los datos tipificados (línea 72) a una distribución normal Z o N(0,1). Es decir, a cada valor x le restamos la media, dividiéndose el resultado entre la desviación típica. De esta forma obtenemos los datos estandarizados o tipificados, esto es con media cero y desviación típica unidad. El resultado de esta operación es que cualquier variable X, sean cuales sean sus parámetros media y desviación, será reducida a una única distribución normal Z con parámetros N(0, 1). En el script los valores de los parámetros media y desviación poblacionales son estimados de forma puntual, es decir con la media muestral y desviación típica, obtenidos a partir de los datos experimentales.





Si la variable aleatoria se ajusta a la distribución normal entonces se realiza la prueba estadística paramétrica, es decir el t-test. La prueba t-test es realizada entre las líneas 83 y 95. En la línea 85 escribimos la hipótesis nula H0 fijando el valor a contrastar de la media poblacional. La línea 90 muestra el p-valor una vez obtenido. Dependiendo del riesgo que suponga aceptar o rechazar la hipótesis nula, el usuario puede cambiar el valor del nivel de significación en la línea 91. Su valor se ha fijado en 0.05, es decir un 5%. Finalmente, se muestra la conclusión del contraste entre las líneas 91 y 95.

Es importante observar que si el tamaño muestral es grande (n>30) entonces el estadístico con distribución t-student (n<30) se aproxima a una distribución normal estándar Z, y tanto más cuanto mayor sea el tamaño muestral.




[ ver código en Python]





En un análisis de inferencia estadística en Python, la decisión final sobre la aceptación y rechazo de la hipótesis nula depende de que el contraste sea bilateral o unilateral. Asimismo, otros test requieren de las técnicas descritas a continuación:


[ Definiciones, conceptos y métodos]



 

Laboratorio
______________________________________________________________________________________________________________

  • Estudio de los niveles de sodio en agua


En un estudio geoquímico obtenemos el nivel de Na+ en 27 muestras de agua procedente de un pozo de EE.UU. ¿Tiene la variable "nivel de sodio" distribución normal? En caso afirmativo obtener los parámetros media y desviación típica de la distribución:


Solución: ejemplo31.mp4











________________________________________________________________________________________________

  • Estudio de los niveles de calcio en agua


En un estudio geoquímico medimos el nivel del Ca2+ en 27 muestras de agua procedente de un pozo de EE.UU. (a) Obtener el intervalo de confianza para la media y la desviación típica poblacionales del nivel de calcio en agua. (b) Supóngase que el laboratorio de una empresa de prospección sostiene que para ese pozo el contenido medio de calcio es 85.26 y la desviación típica 25. Según sus datos ¿está de acuerdo con esta  afirmación?


Solución: ejemplo32.mp4












Regreso al contenido | Regreso al menu principal