GEOPY

Vaya al Contenido

Menu Principal

MEIE0

Métodos de Estadística Inferencial

La inferencia estadística es el conjunto de técnicas que permiten hacer generalizaciones o inferencias al universo objeto de estudio o conjunto de la población. Dicha generalización es posible utilizando la información contenida en la muestra aleatoria tratándose por tanto de la aplicación de la estadística al llamado método inductivo.

  • Explicación del script


En las líneas 33-60 se calculan las medidas de centralización, dispersión y forma. Se incluye además una prueba de normalidad de los datos. En primer lugar el script obtiene el tamaño muestral, valores mínimo, máximo y rango de la variable (líneas 36-39). A continuación, se calcula la media aritmética (línea 40), media geométrica (línea 41), media harmónica (línea 42) y media cuadrática (línea 43).



Los métodos gráficos más habituales se realizan con el fragmento de código representado en el script entre las líneas 61-93. Las líneas 63-77 muestran distintas versiones de la orden que permite representar un gráfico de caja y bigotes con los datos experimentales. La línea 65 muestra la orden básica para un gráfico de caja y bigotes. Si se desea con una muesca en la caja que repesente un intervalo de confianza para la mediana (Me) entonces la orden es la que se muestra en la línea 68. En la línea 74 el gráfico de caja y bigotes se muestra en horizontal. La detección de valores atípicos o “outliers” y su representación gráfica se realiza utilizando la orden de la línea 71. Finalmente, la línea 77  muestra la orden que permite obtener un gráfico de caja y bigotes con bigotes más largos.


[ver código en Python]

Descargar: Z-Table.py



Entre las líneas 79-83 se representa un histograma. El número de clases y por tanto de barras del histograma puede especificarse o estimarse un valor apropiado con la expresión de Sturges (línea 82). Otras características del histograma son especificadas con la orden:

plt.hist(data,numBins,_,…,_)


La sección de código que sigue (líneas 85-88) representa un diagrama de dispersión simulando con y_data el jitter de los datos y permitiendo al usuario definir algunas características gráficas en plt.scatter(data,y_data,_,…,_). Finalmente, entre las líneas 90-93 se representa un gráfico de probabilidad normal.

[Definiciones, conceptos y métodos]

La moda es calculada en la línea 44, y los cuartiles Q1, Q2 y Q3 en las líneas 46-48. Otros cuantiles pueden obtenerse especificándose en la orden np.percentile(data,_). Las medidas de dispersión son obtenidas a continuación. Varianza, desviación estándar, error estándar de la media, rango intercuartílico y coeficiente devariación de Pearson son calculados en las líneas 49-53. Finalmente, se obtienen las medidas de forma, tanto la asimetría (línea 55) como la curtosis (línea 57). El script efectúa el test de normalidad de D’Agostino y Pearson (línea 59).

 
Regreso al contenido | Regreso al menu principal