Download psicoestadistica_resumen2

Document related concepts
no text concepts found
Transcript
Con este trabajo se pretende formarnos una idea de los conceptos básicos de la
estadística aplicada; para facilitar nuestra inducción al curso.
En nuestros días, la estadística se ha convertido en un método efectivo para
describir con exactitud los valores de datos económicos, políticos, sociales,
psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y
analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en
reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa
información.
El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las
aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar,
con gran exactitud, utilizando determinadas distribuciones probabilísticas; los
resultados de éstas se pueden utilizar para analizar datos estadísticos.
TRABABJO # 1
CONCEPTOS BASICOS PARA EL DESARROLLO DEL CURSO DE
ESTADISTICA.
1. Definición de estadística
Rama de las matemáticas que se refiere a un conjunto de métodos, normas,
reglas y principios para observar, agrupar, describir, cuantificar y analizar el
comportamiento de un grupo.
2. División de la estadística
Generalmente se considera que la estadística tiene dos funciones ( divisiones).
Una es describir conjuntos de datos ( estadística descriptiva); la otra es ayudar a
hacer inferencias.Como ejemplo del uso descriptivo, se quiere saber cuantas
mujeres zurdas fueron recluidas en la prision
en Holloway en 1976. Para
responder e esta pregunta, debe obtenerse información sobre la mano que usaban
las prisioneras en 1976 y contar simplemente cuantas eran zurdas.
Para ilustrar el uso inferencial ( estadística inferencial), pudiera haber interés en
averiguar si es más probable que las personas que conducen automóviles grandes
sean más agresivas que aquellas que conducen automóviles pequeños. Debido al
gran numero de personas que habría sondear, estaría fuera de consideración la
investigación de cada conductor de automóvil. Seria necesario estudiar una
muestra de ellos, y usar los resultados de la muestra para hacer inferencias que
se espera serán aplicables a todos los conductores de automóviles. Sin embargo,
como solo sé esta estudiando una muestra, hay la posibilidad de que las
conclusiones pueden no ser del todo precisas y nunca puede tenerse la certeza de
que se ha hecho la inferencia correcta. Por esta razón el uso de la estadística
inferencial puede considerarse como una ayuda para tomar decisiones en
condiciones de incertidumbre. No obstante, es diferente de la conjeturacion,
puesto que en la estadística se proporciona también un método para estimar el
grado de confiabilidad de las conclusiones. En cada proposición estadística que
se hace, se indica la probabilidad de que los descubrimientos como los hechos
podrían haber sido el resultado de factores casuales.
3. Que es población?
Una población es el conjunto total de eventos que sé esta considerando. La
población de interés podría ser el conjunto de toas las personas, o el conjunto de
las personas que residían en Londres en 1982, o el conjunto de todos los niños en
edad escolar que provienen de un hogar malogrado. Una población es su uso
estadístico no tiene que estar formado por personas. Por ejemplo, pudiera haber
interés en la población de utensilios de la edad de hierro, i en la población de las
calculadoras de bolsillo fabricadas por cierta compañía o en la población de
palabras de la novela de Rex Stout o en la población de los resultados del examen
del primer año de psicología en 1968 de la Universidad de Newcastle en Tyne.
Cualquier conjunto completo de personas objetos o resultados que tengan alguna
característica observable común constituyen una población.
4. Que es muestra?
Se dice de cualquier fracción de una población y sobre la que se estudian ciertas
características que posteriormente se
generalizan
a todo el conjunto. La
selección de la muestra se efectúa según un criterio determinado y sus
características dependen del muestreo que se tiene que realizar. Por ejemplo, el
conjunto de palabras del capitulo 2 de la novela de Rex Stout es una muestra de la
población de palabras de la novela completa.
5. Que es muestreo?
Estudio, por medio de muestras representativas y debidamente elegidas, de las
características de una población. En su empleo interesa tener en cuenta los
siguientes
factores:
Los
procedimientos
para
obtener
una
muestra
verdaderamente representativa, para determinar la probabilidad de que posea las
características de la población y para determinar el tamaño según la precisión que
de ella se quiere obtener en las conclusiones estadísticas posteriores.
6. Tipos de muestreo
Fundamentalmente el muestreo es de dos tipos:
1) Probabilistico : permite calcular el posible error de la muestra, y
2) No probabilistico: En el que el calculo del error no es posible
De entre los primeros él mas utilizado es el llamado aleatorio o al azar, en el cual
la muestra se obtiene mediante sorteo de los individuos que la tienen que formar.
El segundo puede ser de dos clases: por cuotas, en el que solo se especifica el
tamaño de la muestra y las características que tienen que tener los individuos que
la componen, y por juicio, en el que el investigador selecciona los individuos de la
muestra según su representatividad.
7. Tamaño muestral
Es la unión de todos los efectos posibles de una serie de pruebas estadísticas.
8. Que es atributo y coloque un ejemplo.
Las características de los elementos que no se pueden medir se denominan
atributos o variables cualitativas. Ejemplo : hombre – mujer es lo mismo; pero hay
una distincion.
9. Que es variable y ejemplo.
Se le llama variable a cualquier cantidad medible que puede variar de un individuo
a otro. Un ejemplo en la población de palabras de la novela de Rex Stout, la
variable
en la que había interés era la longitud de las palabras; cada palabra
individual tiene una longitud particular y esta puede variar de una palabra a otra.
10. Tipos de variables y ejemplo.

Variable cualitativa: esta constituida por la marca, el tipo, el color y el estado
general; que corresponde a aspectos que no se pueden medir sino observar, y
por ello se denominan variables cualitativas. Pueden ser nominales o
ordinarias.

Variable cuantitativa: esta constituida por el tiempo de uso, el precio, el tamaño
del marco y él numero de velocidades, que corresponden a aspectos que son
medibles y por ello se denominan cuantitativas. Puede ser discreta o continua.

Variable aleatoria: Una variable aleatoria es una función que asigna un numero
real a cada resultado en el espacio muestral de un experimento aleatorio. Las
variables aleatorias se denotan con una letra mayúscula, tal como X, y con una
letra minúscula, como x, el valor posible de x. El conjunto de los posibles
valores de la variable aleatoria X recibe el nombre de rango de X.
Ejemplo: El sistema de comunicación por voz de una empresa tiene 48 líneas
externas. En un
determinado momento, se observa el sistema y algunas líneas
están ocupadas. Sea X la variable aleatoria que denota él numero de líneas en
uso. Entonces X puede tomar cualquier valor entero de cero a 48.
-
Variable aleatoria discreta: Es una variable aleatoria con un rango finito.
-
Variable aleatoria discreta uniforme: Una variable aleatoria X es una variable
aleatoria discreta uniforma si cada uno de los n valores que están en el rango
de esta, x1, x2, …x11, tiene la misma probabilidad.

Variable aleatoria continua: Si el rango de una variable aleatoria X contiene un
intervalo ( ya sea finito o infinita) de numera reales.
En algunos ejemplos, la variable aleatoria en realidad es discreta, pero como el
rango de todos los valores posibles es muy grande, puede resultar más
conveniente utilizar un modelo basado en una variable aleatoria continua. Por
ejemplo, una escala digital puede mostrar el peso de una pieza redondeado hasta
centésimos de gramo, tal vez sea conveniente pensar el peso de la pieza como
una variable aleatoria continua. Como otro ejemplo, es posible medir la corriente
hasta el microampere más cercano. Dado que solo es posible un numero entero
de microamperes, la variable aleatoria es discreta. Sin embargo, tal vez sea más
conveniente suponer que las mediciones de corriente corresponden a valores de
una variable aleatoria continua.
- Variable aleatoria normal estándar: Una variable aleatoria normal con  = 0 y 
=1 y se denota por Z.
11. Distribución de frecuencias
Los datos recogidos deben ser organizados, tabulados y presentados para que
su análisis e interpretación sean rápidos y útiles. Por ejemplo, para estudiar e
interpretar la distribución de las notas o calificaciones de un examen en una
clase con 30 alumnos, primero se ordenan las notas en orden creciente: 3,0; 3,5;
4,3; 5,2; 6,1; 6,5; 6,5; 6,5; 6,8; 7,0; 7,2; 7,2; 7,3; 7,5; 7,5; 7,6; 7,7; 7,8; 7,8; 8,0;
8,3; 8,5; 8,8; 8,8; 9,0; 9,1; 9,6; 9,7; 10 y 10. Esta secuencia muestra, a primera
vista, que la máxima nota es un 10, y la mínima es un 3; el rango, diferencia
entre la máxima y la mínima es 7.
En un diagrama de frecuencia acumulada, como el de la figura 1, las notas
aparecen en el eje horizontal y el número de alumnos en el eje vertical izquierdo,
con el correspondiente porcentaje a la derecha. Cada punto representa el
número total de estudiantes que han obtenido una calificación menor o igual que
el valor dado. Por ejemplo, el punto A corresponde a 7,2, y según el eje vertical,
hay 12 alumnos, o un 40%, con calificaciones menores o iguales que 7,2.
Para analizar las calificaciones obtenidas por 10 clases de 30 alumnos cada una
en cuatro exámenes distintos (un total de 1.200 calificaciones), hay que tener en
cuenta que la cantidad de datos es demasiado grande para representarlos como
en la figura 1. El estadístico tiene que separar los datos en grupos elegidos
previamente denominados intervalos. Por ejemplo, se pueden utilizar 10
intervalos para tabular las 1.200 calificaciones, que se muestran en la columna
(a) de la tabla de distribución de datos adjunta; el número de calificaciones por
cada intervalo, llamado frecuencia del intervalo, se muestra en la columna (c).
Los números que definen el rango de un intervalo se denominan límites. Es
conveniente elegir los límites de manera que los rangos de todos los intervalos
sean iguales y que los puntos medios sean números sencillos. Una calificación
de 8,7 se cuenta en el intervalo entre 8 y 9; una calificación igual a un límite de
intervalo, como 9, se puede asignar a cualquiera de los dos intervalos, aunque
se debe hacer de la misma manera a lo largo de toda la muestra. La frecuencia
relativa, columna (d), es la proporción entre la frecuencia de un intervalo y el
número total de datos. La frecuencia acumulada, columna (e), es el número de
estudiantes con calificaciones iguales o menores que el rango de cada intervalo
sucesivo. Así, el número de estudiantes con calificaciones menores o iguales a 3
se calcula sumando las frecuencias de la columna (c) de los tres primeros
intervalos, dando 53. La frecuencia acumulada relativa, columna (f), es el
cociente entre la frecuencia acumulada y el número total de notas.
Los datos de una tabla de distribución de frecuencias se pueden representar
gráficamente utilizando un histograma o diagrama de barras (como en la figura
2), o como un polígono de frecuencias acumuladas (como en la figura 3). El
histograma es una serie de rectángulos con bases iguales al rango de los
intervalos y con área proporcional a sus frecuencias. El polígono de la figura 3 se
obtiene conectando los puntos medios de cada intervalo de un histograma de
frecuencias acumuladas con segmentos rectilíneos.
En los periódicos y otros medios de comunicación los datos se representan
gráficamente utilizando símbolos de diferente longitud o tamaño que representan
las distintas frecuencias.
12. Tabla de frecuencias
(a)
(b)
(c)
(d)
(e)
(f)
RANGO
PUNTO MEDIO
DEL RANGO
FRECUENCIA
FRECUENCIA
RELATIVA
FRECUENCIA
ACUMULADA
FRECUENCIA
ACUMULADA RELATIVA
0-1
0,5
20
0,017
20
0,017
1-2
1,5
15
0,012
35
0,029
2-3
2,5
18
0,015
53
0,044
3-4
3,5
25
0,021
78
0,065
4-5
4,5
44
0,037
122
0,102
5-6
5,5
88
0,073
210
0,175
6-7
6,5
222
0,185
432
0,360
7-8
7,5
335
0,279
767
0,639
8-9
8,5
218
0,182
985
0,821
9-10
9,5
215
0,179
1.200
1,000
EXÁMENES 1,2,3,4; CLASES 1-10; 1.200 CALIFICACIONES
13. Que se entiende por frecuencia
· Frecuencia absoluta: En una muestra estadística, numero de veces que aparece
un determinado carácter.
· Frecuencia acumulada: Suma de todas las frecuencias que corresponden a las
clases o elementos de una muestra en los que la variable tiene un valor inferior a
uno dado.
· Frecuencia relativa: Cociente entre la frecuencia absoluta y el numero de casos
de una muestra.
14. Cuales son los gráficos más utilizados.
S bien es útil ordenar los valores en un conjunto de datos del menor al mayor o
clasificarlos datos en categorías y determinar las frecuencias absolutas y relativas,
muchos analistas prefieren una representación gráfica. Quizá
la gráfica más
común es aquella en que las clases se representan en el eje horizontal y las
frecuencias en el vertical. Este tipo de gráfica se llama histograma o diagrama de
barra que es el que muestra la figura.
Un útil agregado al histograma es el polígono de frecuencias, que se construye
uniendo con segmentos de recta los puntos medios de los intervalos adyacentes.
El polígono de frecuencias esta dibujado con trazos discontinuos, proporciona una
representación “ suavizada “ de un conjunto de valores. La ventaja que se obtiene
con el uso de las aproximaciones resulta generalmente mucho más fácil.
15. Clasificación de las medidas estadísticas
* MEDIDAS DE LOCALIZACION: Con frecuencia es útil tener un medio numerico
simple para representar la localización entre distribuciones que sean complicadas.
· Media: Una manera es localizar la media aritmética del conjunto de resultados, a
la que por lo general se le llama simplemente la media. Esta se calcula
encontrando la suma de los resultados y dividiéndola por él numero de resultados.
Para los resultados llamados xi , a la media se le denomina  ( léase “ x barras “ ).
Media =  = 1/ N  xi
· Moda: Una segunda medida de localización usada comúnmente es la mediana,
que es el punto medio de la distribución de los resultados. Con mayor precisión, la
mediana es el resultado arriba del cual se localiza la mitad de los resultados
restantes y abajo del cual se localiza la otra mitad. En general, si n es él numero
de resultados, la mediana es él ( n+1 )/ 2avo resultado del menor al mayor cuando
n es impar o él numero de en medio entre el n/2avo resultado y él ( n+1 )/2avo
resultado cuando n es par.
· Moda: La tercera medida de localización es la moda, que es el valor más
frecuente o típico de la distribución, esto es, el resultado que ocurre con mayor
frecuencia. En algunos casos habrá mas de un valor típico, en cuyo caso no hay
ninguna moda definida de una manera única y se hace referencia a la distribución
como multimodal.
Percentiles, deciles y cuartiles son útiles cuando se necesita dividir un conjunto de
datos en determinado numero de grupos, de modo que cada uno de ellos
mantenga el mismo numero de valores.

MEDIDAS DE DISPERSION : En las medidas de localización discutidas
anteriormente solo se considera un aspecto de una distribución de frecuencias,
es decir, su valor promedio y no se resume en ellas toda la información
representada. Las medidas de dispersión, nos hablan de cómo se concentra o
se dispersa la masa de probabilidades en torno al valor central.
· Recorrido: La medida de dispersión más simple es el recorrido de los resultados,
que es la
diferencia entre los valores menor y mayor. Entre mas separados
estén los resultados, mayor será el recorrido.
·Varianza: Esta medida es un poco más compleja, ya que en ella se usan todos
los números de la distribución. En la varianza se reflejan las distancias de los
resultados a la media. Para calcularla, primero necesita conocerse la media de la
distribución. La media se resta entonces de cada uno de los resultados.
Varianza = 1/ N  ( xi - ) 2
16. Cuales son las más utilizadas?
La medida más importante referente a una información numérica es la que indica
la posición central de los datos. Él termino posición central puede referirse a la
media, a la mediana o a la ,moda cada una de estas medidas es apropiada para
ciertos propósitos descriptivos, pero resulta completamente inadecuadas para
otras. En general la más utilizada es la media aritmética.
17. Que es estadigrafo?
Son las características numéricas de las muestras.
18. Que utilidad tiene para usted el estudio de la estadística en su programa
académico.
La importancia de la estadística en general en las ciencias , ingenierias y
administración ha sido subrayado por la participación de la industria en el aumento
de la calidad.
El campo de la estadística inferencial se ha desarrollado principalmente desde
comienzos de este siglo. Es resultado de los métodos para organizar y resumir
datos, cuyos orígenes se remontan a varios siglos atrás. Estos métodos para
resumir y organizar datos se denominan estadística descriptiva. La mayor parte
del uso moderno de la estadística , particularmente de la ciencia y la ingeniería, se
dirige mas hacia la inferencia que a la descriptiva. Por ejemplo, un ingeniero que
diseña un nuevo circuito de computadora fabricara una muestra ( prototipo ) de
ellos, y entonces querrá obtener conclusiones sobre la forma en que estos
dispositivos funcionaran una vez que se produzcan a gran escala.
19. Comente levemente la utilidad que tiene la estadística para su empresa, si no
las llevas como las podría llevar?
Muchas compañías se han dado cuenta de que la baja calidad de un producto ( ya
sea en la forma de defectos de fabricación, en una baja confiabilidad en su
rendimiento, o en ambos ), tiene un efecto muy pronunciado en la productividad
global de la compañía, en el mercado y la posición competitiva y, finalmente, en la
rentabilidad de la empresa. Mejorar estos aspectos de la calidad puede eliminar el
desperdicio; Disminuir la cantidad de material de desecho, la necesidad de volver
a maquilizar piezas, los requerimientos para inspección y prueba y las perdidas
por garantía; ademas de majorar la satisfaccion del consumidor y permitir que la
empresa se convierta en un productor de alta calidad y bajo costo en el mercado.
La estadística es un elemento decisivo en el incremento de la calidad, ya que las
técnicas estadísticas pueden emplearsen para describir y comprender la
variabilidad.
20. Al realizar una investigación científica que papel juega la estadística y explique
en que fases se presenta.
Los experimentos son una parte natural de la ingeniería y de los procesos de toma
de decisiones científicos.
Las técnicas de diseño experimental basadas en la
estadística son particularmente útiles en el mundo de la ingeniería en lo que toca a
la mejora del rendimiento de los procesos de manufactura. Estas técnicas también
tienen una aplicación extensa en el desarrollo de nuevos procesos. Muchos
procesos pueden describirse en términos de varias variables controladas, tales
como temperatura, presión y tasa de abastecimiento. Mediante el empleo de
experimentos diseñados, los ingenieros pueden determinar el subconjunto de
variables del proceso que tienen la mayor influencia sobre el rendimiento de este.
Los resultados de estos experimentos pueden conducir a :
1. Mejorar el rendimiento del proceso.
2. Reducir la variabilidad del proceso y acercarlo a los requerimientos nominales.
3. Disminución del tiempo de diseño y desarrollo.
4. Disminución del costo de operación.
Los experimentos diseñados se utilizan, de manera usual, secuencialmente. Esto
es, el primer experimento con un sistema complejo ( quizá un proceso de
fabricación ) que tiene muchas variables controladas es, a menudo, un
experimento de diagnostico diseñado para determinar que variables son las más
importantes. Los experimentos que siguen a este se utilizan para refinar la
información y determinar los ajustes que deben hacerse a las variables criticas
para mejorar el proceso. Finalmente, el objetivo del experimentador es la
optimización; esto es, la determinacion de los niveles que deben tener las
variables criticas para obtener el mejor desempeño del proceso.
Todo experimento implica una secuencia de actividades:
1. CONJETURA: La hipótesis original que motiva el experimento.
2. EXPERIMENTO: Prueba efectuada para investigar la conjetura.
3. ANALISIS: Análisis estadístico de los datos obtenidos del experimento.
4. CONCLUSION: Lo que se ha aprendido de la conjetura original con la
realización del experimento. A menudo, este conduce a una conjetura nueva y
a un experimento nuevo, y asi sucesivamente.
OBJETIVOS

OBJETIVO GENERAL
Investigar acerca de los fundamentos de la estadística para proporcionarnos una
ayuda en el desempeño a lo largo de este curso.

OBJETIVOS ESPECIFICOS:
-
Comprender la importancia de la estadística en nuestra carrera y en general.
-
Dar la debida importancia a esta ciencia empírica que cada día toma mas
importancia en el desempeño de la industria.
CONCLUSIONES

La probabilidad, como cualquier otro concepto matemático, es una elaboración
del pensamiento en el cual cada generación construye sobre los esfuerzos de
sus predecesores.

El campo de la estadística tiene que ver con la recopilación, presentación,
análisis y uso de datos para tomar decisiones y resolver problemas.

El campo de la estadística y la probabilidad consiste de métodos tanto para
describir y modelar la variabilidad, como para tomar decisiones en presencia
de esta.
BIBLIOGRAFIA
CHRIS, Leach. Fundamentos de estadística. Editorial Limusa. Mexico.1982
NIETO DE ALBA, Ubaldo. Introducción a la estadística. Editorial Aguilar. Madrid.
1984
MONTGOMERY , Douglas y RUNGER , George. Probabilidad y Estadística.
McGraw-Hill. Arizona.1996.