Download República Bolivariana de Venezuela Universidad Nacional

Document related concepts
no text concepts found
Transcript
República Bolivariana de Venezuela
Universidad Nacional Experimental de la Fuerza Armada
Ministerio del Poder Popular para de Defensa
Departamento de Matemática y Estadística.
Núcleo Naguanagua – Extensión Guacara
Material Instruccional Nº 1
Unidad nº 1: Estadística Descriptiva.
Objetivo Específico: Aplicar estrategias innovadores para la enseñanza de la estadística
descriptiva.
Definiciones de Estadística y Términos Básicos:
 La estadística es una ciencia con base matemática referente a la recolección,
análisis e interpretación de datos, que busca explicar condiciones regulares en
fenómenos de tipo aleatorio. Es transversal a una amplia variedad de disciplinas,
desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el
control de calidad, y es usada para la toma de decisiones en áreas de negocios e
instituciones gubernamentales.(Wikipedia)
 La estadística: es una ciencia cuyo método consiste en recopilar, clasificar,
presentar, analizar e interpretar datos numéricos extraídos de hechos reales y de
inferir de ellos, conclusiones lógicamente aceptables.( Chiurio, J., Pg. 9)






Datos: Es una característica o atributo, de tipo cuali-cuantitativo, de un elemento
del contexto donde existan fenómenos de estudio.
Recolección o recopilación: es el procedimiento que nos permite obtener los datos
o casos con los cuales se va a trabajar. Por ejemplo después de corregir una prueba
se obtienen las calificaciones que vendrían a construir los datos.
Clasificación: Se clasifican reuniéndolos según criterios establecidos previamente.
Presentación: Los datos deben presentarse de una forma práctica que faciliten el
estudio, bien sea a través de gráficos o mediante los variados tipos de tabulación.
Análisis: Se realiza a través de los cálculos de medidas específicas para obtener
ciertas características que nos permitan describirlos de manera más sencilla.
Interpretación: Se logran extraer conclusiones referidas a las propiedades
generales del conjunto en cuestión.
Clasificación de la estadística:

Estadística descriptiva: Que se dedica a los métodos de recolección, descripción,
visualización y resumen de datos originados a partir de los fenómenos en estudio.
(Wikipedia)

Estadística Inductiva, Inferencial o Muestral: Su finalidad es investigar como
pueden ser utilizados los datos de una muestra o muestras, para poder inferir unos
resultados o probar alguna hipótesis sobre el conjunto total al cual pertenecen los
datos.
Estadístico y Parámetro:
 Estadístico: Son todas las características o medidas calculadas a una muestra.
 Parámetro: Son las medidas correspondientes a la población.
Población, Muestra y Muestreo:
 Población: Es el conjunto de elementos o datos que representan características
comunes o muy parecidas. En forma más general, se podría decir que la población
es el conjunto sobre el cual se pretende realizar una investigación. Además, la
misma puede ser infinita o finita, según se pueda o no contar su número de
elementos. Los elementos de la población se representan por medio de la letra “N”.
 Muestra: Es el conjunto de elementos extraídos de una población, para poder
realizar estudios sobre ella y poderlas inferir propiedades a la población; siempre y
cuando esta sea representativa. Los elementos de la muestra se representan con la
letra “n”.
 Muestreo: Es la extracción, de una población, de los elementos de muestra.
Técnicas de Muestreo:
Existen dos técnicas para seleccionar la muestra de una población: El no aleatorio,
también llamado de juicio; y el probabilístico.


No aleatorio: Se escogen los elementos de la muestra tomando en cuenta las
experiencias obtenidas sobre la población.
Aleatorio o Probabilístico: En este caso, todos los elementos de la población
tienen la misma oportunidad ser escogidos para formar parte de la muestra.
Variables:
Es una característica que puede ser medida y tomar diferentes valores de acuerdo en
cada uno de los casos de estudio. Ellas se clasifican en dos clases:
 Variables Cualitativas: Son las variables que representan cualidades, atributos o
características. Ellas se pueden clasificar en:
1. Variable cualitativa Ordinal: La variable puede tomar distintos valores
ordenados siguiendo una escala.
2. Variable cualitativa Nominal: En este tipo de variable los valores no
pueden ser sometidos a un orden.
 Variables Cuantitativas: Son variables que se expresan por medio de cantidades
numéricas. Ellas se clasifican en:


1. Variable cuantitativa Continua: Se dice que una variable es continua, si
puede tomar valores sin sufrir interrupciones.
2. Variable cuantitativa Discreta: Es la variable que presenta saltos o
interrupciones entre los valores que se presentan.
Variables independientes: Son las que el investigador escoge para establecer
agrupaciones en el estudio.
Variables dependientes: Son las variable de respuesta que se observan en el
estudio y que se ven influenciadas por la variables independientes.
Valor real de un número: Los valores obtenidos de una medición, son valores
aproximados, ya que al medir siempre se cometen errores, ya sea por desperfectos de los
instrumentos utilizados o por inexperiencia de quien los maneja. De lo anterior se puede
deducir que el valor real de una cantidad es un valor comprendido en un intervalo, es decir,
el valor real es igual al valor aparente más o menos una porción:
𝑉𝑅 = 𝑉𝐴 ± 𝑝
Por lo tanto, el valor real de una cantidad entera, se define como el valor ubicado entre los
límites que correspondan al valor aparente de la cantidad. Además, el valor menos la
porción determina el límite real inferior y el valor más la porción determina el límite real
superior.
Cifras significativas de una cantidad: El valor numérico de toda medición es siempre una
aproximación. No existe ninguna medida que sea absolutamente precisa. La exactitud de
toda medición está limitada a la precisión de los instrumentos utilizados y estos no son
absolutamente precisos. Por lo tanto, una cifra es significativa cuando se conoce una
precisión razonable.
 El cero como cifra significativa:
1. Los ceros situados entre dos cifras significativas son significativos.
2. Los ceros a la izquierda de la primera cifra significativa no lo son.
3. Para números mayores que 1, los ceros a la derecha de la coma son
significativos.
4. Para números sin coma decimal, los ceros posteriores a la última cifra
distinta de cero pueden o no considerarse significativos.
Redondeo de cantidades: Consiste en suprimir algunas de las últimas cifras de una
cantidad con la finalidad de reducir su extensión guiándose por criterios previamente
establecidos. Algunos de los criterios son:
1. Cuando el dígito que desea redondear esta seguido por otro el cual es menor que
cinco, se suprimen los demás dígitos que estén después del dígito que se pretende
redondear, a este tipo se redondeo se le denomina “redondeo por defecto”.
2. Cuando el dígito que se desea redondear esta seguido de de otro dígito mayor que
cinco; se suprimen todos los dígitos que están después del que se desea redondear y
al redondeado se le suma la unidad. A este tipo de redondeo se le denomina
“redondeo por exceso”.
3. Cuando el dígito que se pretende redondear esta seguido del dígito cinco, se
presentan los siguientes casos:
a. Si el dígito que se pretende redondear es par, se redondea por defecto.
b. Si el dígito que se pretende redondear es impar, se redondea por exceso.
Niveles de medición: son las escalas nominal, ordinal, de intervalo y de razón. Se utilizan
para ayudar en la clasificación de las variables, el diseño de las preguntas para medir
variables, e incluso indican el tipo de análisis estadístico apropiado para el tratamiento de
los datos.




Escala Nominal: Representa el nivel más bajo de medida. Se utiliza cuando un
objeto o evento se diferencia de otro solamente por la nominación con que se
conoce. Los procedimientos estadísticos que más se adaptan son: Chi cuadrado,
coeficiente phi, coeficiente de contingencia, prueba de signo, prueba binomial.
Escala Ordinal: Esta escala distingue los diferentes valores de la variable,
ubicando a los sujetos o eventos en orden desde los más altos hasta los más bajos.
Los intervalos entre rangos no son necesariamente iguales. Aún cuando la escala
ordinal resulta en cierta medida más precisa que la nominal, no alcanza el grado de
precisión deseado en una investigación. Para su análisis estadístico, se utiliza:
Coeficiente de correlación de Spearman, coeficiente tau de Kendall, prueba de la
mediana.
Escala de Intervalos: al utilizar la escala de intervalos, se puede indicar la cantidad
en la que un objeto o evento se diferencia de otro. Las pruebas utilizadas en
investigación educativa, en su mayoría representan escalas de intervalos. Esta escala
posee todas las características de una escala nominal y una ordinal , y además esta
basada en intervalos iguales.
Escala de Razón: Es la más potente y sofisticada de las cuatro escalas de medida.
Su empleo permite señalar en cuantas veces es más grande un objeto o evento que
otro, y además indica la cantidad en que difieren. La escala de la razón contiene
características de otras escalas, y también dispone de cero absoluto, el cual
posibilita las operaciones aritméticas como la diferencia y los cocientes. Para las
escalas de intervalos y de razón se recomienda los siguientes tratamientos
estadísticos: Correlación de Pearson, t de Student, análisis de regresión, análisis
factorial, análisis discriminante.
Representación Gráfica: Cuando se dispone de datos de una población, y antes de abordar
análisis estadísticos más complejos, un primer paso consiste en presentar esa información
de forma que ésta se pueda visualizar de una manera más sistemática y resumida. Los datos
que nos interesan dependen, en cada caso, del tipo de variables que estemos manejando.
Puntaje Bruto: Son los valores observados después de procesar el instrumento aplicado
con la finalidad de recolectar o recopilar los datos necesarios para emprender la
investigación que nos hayamos propuesto.
Dato Estadístico: Son los resultados obtenidos de los cálculos realizados con los datos
directos de una distribución de frecuencias.
Distribución de frecuencias por dato directo:
Supóngase que se conocen los resultados de una prueba objetiva de geografía para un
máximo de 30 preguntas con cuatro alternativas cada una, aplicad a un grupo de alumnos
de primer año, ubicado en el Edo. Carabobo.
28
20
24
20
28
24
20
28
28
22
27
27
26
23
20
22
22
25
20
28
25
24
23
Procedimiento:
1. Se ordenan los datos recolectados de mayor a menor o viceversa.
28 28 28 28 28 27 27 27 26 25 25 25
24
23 23 22 22 22 20 20 20 20 20
n=25
X
T
f
F
h=f/n
28
27
26
25
24
23
22
21
20
∑
..…
…
.
…
…
..
…
5
3
1
3
3
2
3
0
5
25
25
20
17
16
13
10
8
5
5
0.2
0.12
0.04
0.12
0.12
0.08
0.12
0
0.2
1.00
…..
H=F/n P=H*100
1
0.8
0.68
0.64
0.52
0.4
0.32
0.2
0.2
100
80
68
64
52
40
32
20
20
27
25
24
24
X: Es la letra que identifica la variable (Puntuaciones, tallas, edades, entre otras), y
representa cada uno de los valores que esta toma.
T: Son los trazos, es decir, la marca que se coloca cada vez que aparezca un dato.
f: Son las frecuencia ordinarias absolutas y representan el número de veces que un dato se
repite.
F: Son las frecuencias acumuladas absolutas y representan el número de datos
comprendidos entre dos valores dados, uno de los cuales, es el límite inferior real (Li) de
toda la distribución.
h: Son las frecuencia ordinarias relativas e indican la proporción que representan los datos
de una casilla determinada en relación al total de datos (n). La suma de las h debe ser igual
a uno.
H: Son la frecuencia acumuladas relativas y representa la proporción de casos ubicados
entre el extremo inferior (Li mínimo) de la distribución y un valor superior.
P: Son los porcentajes acumulados o rangos percentiles. Representa el porcentaje de datos
acumulados desde el extremo inferior (Li mínimo) hasta un valor dado de la distribución.
Para variables discretas:
 Diagrama de Barras: Es un sistema de coordenadas cartesianas, donde; en el eje
horizontal, o eje de abscisas, se representan los datos o modalidades; en el eje
vertical o de ordenadas, se representan las frecuencias de cada dato o modalidad.
 Diagrama sectorial o circular: Es una circunferencia, donde cada proporción se
multiplica por 360º, para obtener así los grados correspondientes a cada dato.
Distribución de frecuencia por datos agrupados en intervalos de clase: Los intervalos
de clase permiten simplificar el manejo de los datos, sin embargo, los resultados obtenidos
se tornan menos precisos que trabajando con datos directos. Este tipo de distribución se
realiza cuando existe un gran número de datos; se consideran para una cantidad mayor a 30.
Intervalo de clase:
Un intervalo de clase lo podemos definir como el conjunto de datos que se encuentran
ubicados entre los límites establecidos.
Elementos de un intervalo de clase:
Xm
Li
Li
Li
Ls
i
Xi, Xs: Son los límites aparentes del intervalo de clase.(inferior y superior respectivamente)
Li, Ls: Son los límites reales del intervalo de clase. (inferior y superior respectivamente)
i: Es la amplitud de cada intervalo (cantidad de valores cubiertos por el intervalo), y se
obtiene si se conoces los límites del intervalo, mediante la siguiente ecuación:
𝑖 = 𝑋𝑠 − 𝑋𝑖 + 1 = 𝐿𝑠 − 𝐿𝑖
Xm: Es el punto medio del intervalo (valor que está situado a igual distancia delos
extremos del intervalo). Para calcular el punto medio de un intervalo de clasese utiliza la
siguiente fórmula:
𝑋𝑚 =
𝑋𝑠 + 𝑋𝑖 𝐿𝑠 + 𝐿𝑖
=
2
2
Para variables continuas:
 Histograma: Es una representación gráfica de una variable en forma de barras,
donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. En el eje vertical se representan las frecuencias, y en el eje horizontal
los valores de las variables, normalmente señalando las marcas de clase, es decir, la
mitad del intervalo en el que están agrupados los datos.
 Ojiva: Es una gráfica asociada a la distribución de frecuencias, es decir que en ella
se permite ver cuántas observaciones se encuentran por encima o debajo de ciertos
valores, en lugar de solo exhibir los números asignados a cada intervalo.
 Polígono de frecuencia: Un gráfico hecho uniendo los puntos medios de la cima de
las columnas de un histograma de frecuencia.