Download estadística - Ecomundo Centro de Estudios

Document related concepts
no text concepts found
Transcript
ESTADÍSTICA
Ciencia que estudia los fenómenos sociales, económicos y físicos y que, partiendo de
datos numéricos, es capaz de llegar a predecir resultados.
Estudio estadístico
Consiste en recoger y observar una
característica de un conjunto de
individuos u objetos con el fin de
extraer conclusiones.
Población
Conjunto objeto del estudio.
Carácter estadístico.
Propiedad que se estudia de una
población. Puede ser:
Cualitativo: cuando no se puede contar
ni medir
Cuantitativo
Discreto: se puede contar
Continuo: se puede medir
Modalidad:
Es cada uno de los valores que puede
tomar el carácter estadístico: xi
Distribución de frecuencias:
Frecuencia absoluta, ni:
Número de individuos de la muestra
para los que el carácter estadístico toma
esa modalidad.
Se llama N a la suma de todas las
frecuencias absolutas, N=∑ni
Frecuencia relativa, fi
Es el cociente entre la frecuencia
absoluta y el número total de individuos
de la muestra:
fi=ni/N
Frecuencia porcentual, pi
Es la frecuencia relativa con el formato
porcentaje
Frecuencias acumuladas Ni, Fi, Pi
Suma de las frecuencias de los valores
inferiores o iguales al valor
considerado.
MEDIDAS ESTADÍSTICAS:
Medidas de centralización
Valor que representa y resume “hacia
donde se concentra” la información de
los datos de una distribución.
Media aritmética:
=PROMEDIO(RANGO)
Suma de todos los datos y dividir entre
∑ 𝑥𝑖 𝑛𝑖
el número total de ellos: 𝑥̅ = 𝑁
Mediana: =MEDIANA(RANGO)
Valor que ocupa la posición central al
ordenar los datos. Solo se puede hallar
si los datos son cualitativos ordenables
o cuantitativos.
Moda =MODA(RANGO)
Es la modalidad o valor que tiene mayor
frecuencia. Se puede hallar siempre.
Medidas de dispersión
Indican si los valores están
concentrados sobre los valores centrales
eso, por el contrario, están alejados de
estos. Por tanto miden la
representatividad de los parámetros
centrales. Solo se pueden acumular en
datos cuantitativos.
Rango o recorrido = MAX (RANGO) –
MIN (RANGO)
Es la diferencia entre el valor mayor y
el valor menor de la variable.
Varianza = VARP(RANGO)
Es la media aritmética de los cuadrados
de las desviaciones de los datos.
∑(𝑋)
𝑉= 𝑁
Desviación típica
(s)=DESVSTP(RANGO)
Es la raíz cuadrada positiva de la
varianza 𝜎 = √𝑉
DISTRIBUCIONES BIDIMENSIONALES
Son las que se obtienen el estudiar cualquier fenómeno respecto a dos características o
modalidades. Por ejemplo: la estatura y el peso de los alumnos de una clase.
Nube de puntos:
Es la gráfica que se obtiene al
representar una distribución
bidimensional.
Medidas marginales:
Son la media aritmética de cada uno de
los conjuntos de valores
Centro de gravedad:
Es el punto cuyas coordenadas son la
medias marginales:
Desviaciones típicas marginales:
Son las desviaciones típicas de cada uno
de los conjuntos de valores.
La función que se usa para cada una de
ellas es: =VARP(RANGO)
Covarianza:
Es la media aritmética de los productos
de las desviaciones de los valores de
cada variable por su respectiva
frecuencia:
Se calcula con la fórmula:
=COVAR(RANGO)
La covarianza puede ser positiva
negativa.
Positiva si los valores se relacionan de
forma directa. Al aumentar los valores
de la variable X, aumentan los valores
de la Y
Negativa, en caso contrario.
Correlación
La covarianza indica como es la
relación entre dos variables, como se
orienta la nube de puntos, pero no
indica de forma objetiva y concreta la
magnitud de esta relación.
Por esta razón se necesita definir el
concepto de correlación y coeficiente de
correlación.
Correlación
Es la relación que existe entre las dos
variables que intervienen en una
estadística bidimensional. Puede ser:
a. Correlación funcional (lineal,
trigonométrica, exponencial, ..)
b. Correlación directa: al aumentar una
variable también aumenta la otra
c. Correlación inversa: caso contrario
d. Correlación nula: no existe relación
entre las variables
REGRESIÓN LINEAL:
Coeficiente de correlación
Nos indica el grado de aproximación de
los puntos de la nube a la recta de
regresión.
Usar: =COEF.DE.CORREL(RANGO)
Propiedades del coeficiente de
correlación lineal (Coeficiente de
Pearson):
Cuantifica la dependencia lineal entre
dos variables estadísticas.
Está comprendido entre –1 y +1 con las
siguiente implicaciones:
a. Si r=-1 o r=1, la relación es perfecta.
Existe correlación funcional.
b. Si r está próximo a –1 o a 1 la
correlación es fuerte
c. Si r está próximo a cero la correlación
es débil
d. Si r>0 la correlación es positiva o
directa.
e. Si r<0 la correlación es negativa o
inversa.
Recta de regresión
Es la recta que mejor se ajusta a la nube
de puntos, y pasa siempre por el centro
de gravedad.
.
Ecuación de la recta de regresión
y=mx+b
El signo de la pendiente de la recta de
regresión, m, es igual al del coeficiente
de correlación, r.
Procedimiento para hallar y
representar la recta de regresión
a. Representa la nube de puntos
b. En el gráfico se seleccionan los
puntos haciendo clic en uno de ellos.
c. Se activa el menú contextual.
d. Se elige Agregar línea de tendencia....
e. En la ficha Tipo se elige Lineal, en la
ficha Opciones se activa la casilla
Presentar la ecuación en el gráfico y
Aceptar.
Luego se puede mover la fórmula al
lugar más conveniente.
Predicción de resultados
Después de trazar la recta de regresión,
se puede predecir lo que ocurre a un
valor de la variable que no se encuentre
en la tabla. Para ello, basta averiguar el
valor de la otra variable, utilizando la
fórmula de la recta de regresión