Download estadística - Ecomundo Centro de Estudios

Document related concepts
no text concepts found
Transcript
ESTADÍSTICA
Ciencia que estudia los fenómenos sociales, económicos y físicos y que, partiendo de
datos numéricos, es capaz de llegar a predecir resultados.
Estudio estadístico
Consiste en recoger y observar una característica de un conjunto de individuos u objetos
con el fin de extraer conclusiones.
Población
Conjunto objeto del estudio.
Carácter estadístico.
Propiedad que se estudia de una población. Puede ser:
Cualitativo: cuando no se puede contar ni medir
Cuantitativo
Discreto: se puede contar
Continuo: se puede medir
Modalidad:
Es cada uno de los valores que puede tomar el carácter estadístico: xi
Distribución de frecuencias:
Frecuencia absoluta, ni:
Número de individuos de la muestra para los que el carácter estadístico toma esa
modalidad.
Se llama N a la suma de todas las frecuencias absolutas, N=Sni
Frecuencia relativa, fi
Es el cociente entre la frecuancia absoluta y el número total de individuos de la muestra:
fi=ni/N
Frecuencia porcentual, pi
Es la frecuencia relativa con el formato porcentaje
Frecuencias acumuladas Ni, Fi, Pi
Suma de las frecuencias de los valores inferiores o iguales al valor considerado.
MEDIDAS ESTADÍSTICAS:
Medidas de centralización
Valor que representa y resume “hacia donde se concentra” la información de los datos
de una distribución.
Media aritmética: =PROMEDIO(RANGO)
Suma de todos los datos y dividir entre el número total de ellos:
Mediana: =MEDIANA(RANGO)
Valor que ocupa la posición central al ordenar los datos. Solo se puede hallar si los
datos son cualitativos ordenables o cuantitativos.
Moda =MODA(RANGO)
Es la modalidad o valor que tiene mayor frecuencia. Se puede hallar siempre.
Medidas de dispersión
Indican si los valores estan concentrados sobre los valores centraleso, por el contrario,
están alejados de estos. Por tanto miden la representatividad de los parámetros centrales.
Solo se pueden acumular en datos cuantitativos.
Rango o recorrido = MAX(RANGO) – MIN(RANGO)
Es la diferencia entre el valor mayor y el valor menor de la variable.
Varianza = VARP(RANGO)
Es la media aritmética de los cuadrados de las desviaciones de los datos.
Desviación típica (s)=DESVSTP(RANGO)
Es la raíz cuadrada positiva de la varianza
DISTRIBUCIONES BIDIMENSIONALES
Son las que se obtienen el estudiar cualquier fenómeno respecto a dos características o
modalidades. Por ejemplo: la estatura y el peso de los alumnos de una clase.
Nube de puntos:
Es la gráfica que se obtiene al representar una distribución bidimensional.
Medidas marginales:
Son la media aritmética de cada uno de los conjuntos de valores
Centro de gravedad:
Es el punto cuyas coordenadas son la medias marginales:
Desviaciones típicas marginales:
Son las desviaciones típicas de cada uno de los conjuntos de valores.
La función que se usa para cada una de ellas es: =VARP(RANGO)
Covarianza:
Es la media aritmética de los productos de las desviaciones de los valores de cada
variable por su respectiva frecuencia:
Se calcula con la fórmula: =COVAR(RANGO)
La covarianza puede ser positiva negativa.
Positiva si los valores se relacionan de forma directa. Al aumentar los valores de la
variable X, aumentan los valores de la Y
Negativa, en caso contrario.
Correlación
La covarianza indica como es la relación entre dos variables, como se orienta la nube de
puntos, pero no indica de forma objetiva y concreta la magnitud de esta relación.
Por esta razón se necesita definir el concepto de correlación y coeficiente de
correlación.
Correlación
Es la relación que existe entre las dos variables que intervienen en una estadística
bidimensional. Puede ser:
a. Correlación funcional (lineal, trigonométrica, exponencial, ..)
b. Correlación directa: al aumentar una variable también aumenta la otra
c. Correlación inversa: caso contrario
d. Correlación nula: no existe relación entre las variables
REGRESIÓN LINEAL:
Coeficiente de correlación
Nos indica el grado de aproximación de los puntos de la nube a la recta de regresión.
Usar: =COEF.DE.CORREL(RANGO)
Propiedades del coeficiente de correlación lineal (Coeficiente de Pearson):
Cuantifica la dependencia lineal entre dos variables estadísticas.
Está comprendido entre –1 y +1 con las siguiente implicaciones:
a. Si r=-1 o r=1, la relación es perfecta. Existe correlación funcional.
b. Si r está próximo a –1 o a 1 la correlación es fuerte
c. Si r está próximo a cero la correlación es débil
d. Si r>0 la correlación es positiva o directa.
e. Si r<0 la correlación es negativa o inversa.
Recta de regresión
Es la recta que mejor se ajusta a la nube de puntos, y pasa siempre por el centro de
gravedad.
Ecuación de la recta de regresión
y=mx+b
El signo de la pendiente de la recta de regresión, m, es igual al del coeficiente de
correlación, r.
Procedimiento para hallar y representar la recta de regresión
a. Representa la nube de puntos
b. En el gráfico se seleccionan los puntos haciendo clic en uno de ellos.
c. Se activa el menú contextual.
d. Se elige Agregar línea de tendencia....
e. En la ficha Tipo se elige Lineal, en la ficha Opciones se activa la casilla Presentar la
ecuación en el gráfico y Aceptar.
Luego se puede mover la fórmula al lugar más conveniente.
Predicción de resultados
Después de trazar la recta de regresión, se puede predecir lo que ocurre a un valor de la
variable que no se encuentre en la tabla. Para ello, basta averiguar el valor de la otra
variable, utilizando la fórmula de la recta de regresión.