Download psicoestadistica_resumen2
Document related concepts
no text concepts found
Transcript
Con este trabajo se pretende formarnos una idea de los conceptos básicos de la estadística aplicada; para facilitar nuestra inducción al curso. En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. TRABABJO # 1 CONCEPTOS BASICOS PARA EL DESARROLLO DEL CURSO DE ESTADISTICA. 1. Definición de estadística Rama de las matemáticas que se refiere a un conjunto de métodos, normas, reglas y principios para observar, agrupar, describir, cuantificar y analizar el comportamiento de un grupo. 2. División de la estadística Generalmente se considera que la estadística tiene dos funciones ( divisiones). Una es describir conjuntos de datos ( estadística descriptiva); la otra es ayudar a hacer inferencias.Como ejemplo del uso descriptivo, se quiere saber cuantas mujeres zurdas fueron recluidas en la prision en Holloway en 1976. Para responder e esta pregunta, debe obtenerse información sobre la mano que usaban las prisioneras en 1976 y contar simplemente cuantas eran zurdas. Para ilustrar el uso inferencial ( estadística inferencial), pudiera haber interés en averiguar si es más probable que las personas que conducen automóviles grandes sean más agresivas que aquellas que conducen automóviles pequeños. Debido al gran numero de personas que habría sondear, estaría fuera de consideración la investigación de cada conductor de automóvil. Seria necesario estudiar una muestra de ellos, y usar los resultados de la muestra para hacer inferencias que se espera serán aplicables a todos los conductores de automóviles. Sin embargo, como solo sé esta estudiando una muestra, hay la posibilidad de que las conclusiones pueden no ser del todo precisas y nunca puede tenerse la certeza de que se ha hecho la inferencia correcta. Por esta razón el uso de la estadística inferencial puede considerarse como una ayuda para tomar decisiones en condiciones de incertidumbre. No obstante, es diferente de la conjeturacion, puesto que en la estadística se proporciona también un método para estimar el grado de confiabilidad de las conclusiones. En cada proposición estadística que se hace, se indica la probabilidad de que los descubrimientos como los hechos podrían haber sido el resultado de factores casuales. 3. Que es población? Una población es el conjunto total de eventos que sé esta considerando. La población de interés podría ser el conjunto de toas las personas, o el conjunto de las personas que residían en Londres en 1982, o el conjunto de todos los niños en edad escolar que provienen de un hogar malogrado. Una población es su uso estadístico no tiene que estar formado por personas. Por ejemplo, pudiera haber interés en la población de utensilios de la edad de hierro, i en la población de las calculadoras de bolsillo fabricadas por cierta compañía o en la población de palabras de la novela de Rex Stout o en la población de los resultados del examen del primer año de psicología en 1968 de la Universidad de Newcastle en Tyne. Cualquier conjunto completo de personas objetos o resultados que tengan alguna característica observable común constituyen una población. 4. Que es muestra? Se dice de cualquier fracción de una población y sobre la que se estudian ciertas características que posteriormente se generalizan a todo el conjunto. La selección de la muestra se efectúa según un criterio determinado y sus características dependen del muestreo que se tiene que realizar. Por ejemplo, el conjunto de palabras del capitulo 2 de la novela de Rex Stout es una muestra de la población de palabras de la novela completa. 5. Que es muestreo? Estudio, por medio de muestras representativas y debidamente elegidas, de las características de una población. En su empleo interesa tener en cuenta los siguientes factores: Los procedimientos para obtener una muestra verdaderamente representativa, para determinar la probabilidad de que posea las características de la población y para determinar el tamaño según la precisión que de ella se quiere obtener en las conclusiones estadísticas posteriores. 6. Tipos de muestreo Fundamentalmente el muestreo es de dos tipos: 1) Probabilistico : permite calcular el posible error de la muestra, y 2) No probabilistico: En el que el calculo del error no es posible De entre los primeros él mas utilizado es el llamado aleatorio o al azar, en el cual la muestra se obtiene mediante sorteo de los individuos que la tienen que formar. El segundo puede ser de dos clases: por cuotas, en el que solo se especifica el tamaño de la muestra y las características que tienen que tener los individuos que la componen, y por juicio, en el que el investigador selecciona los individuos de la muestra según su representatividad. 7. Tamaño muestral Es la unión de todos los efectos posibles de una serie de pruebas estadísticas. 8. Que es atributo y coloque un ejemplo. Las características de los elementos que no se pueden medir se denominan atributos o variables cualitativas. Ejemplo : hombre – mujer es lo mismo; pero hay una distincion. 9. Que es variable y ejemplo. Se le llama variable a cualquier cantidad medible que puede variar de un individuo a otro. Un ejemplo en la población de palabras de la novela de Rex Stout, la variable en la que había interés era la longitud de las palabras; cada palabra individual tiene una longitud particular y esta puede variar de una palabra a otra. 10. Tipos de variables y ejemplo. Variable cualitativa: esta constituida por la marca, el tipo, el color y el estado general; que corresponde a aspectos que no se pueden medir sino observar, y por ello se denominan variables cualitativas. Pueden ser nominales o ordinarias. Variable cuantitativa: esta constituida por el tiempo de uso, el precio, el tamaño del marco y él numero de velocidades, que corresponden a aspectos que son medibles y por ello se denominan cuantitativas. Puede ser discreta o continua. Variable aleatoria: Una variable aleatoria es una función que asigna un numero real a cada resultado en el espacio muestral de un experimento aleatorio. Las variables aleatorias se denotan con una letra mayúscula, tal como X, y con una letra minúscula, como x, el valor posible de x. El conjunto de los posibles valores de la variable aleatoria X recibe el nombre de rango de X. Ejemplo: El sistema de comunicación por voz de una empresa tiene 48 líneas externas. En un determinado momento, se observa el sistema y algunas líneas están ocupadas. Sea X la variable aleatoria que denota él numero de líneas en uso. Entonces X puede tomar cualquier valor entero de cero a 48. - Variable aleatoria discreta: Es una variable aleatoria con un rango finito. - Variable aleatoria discreta uniforme: Una variable aleatoria X es una variable aleatoria discreta uniforma si cada uno de los n valores que están en el rango de esta, x1, x2, …x11, tiene la misma probabilidad. Variable aleatoria continua: Si el rango de una variable aleatoria X contiene un intervalo ( ya sea finito o infinita) de numera reales. En algunos ejemplos, la variable aleatoria en realidad es discreta, pero como el rango de todos los valores posibles es muy grande, puede resultar más conveniente utilizar un modelo basado en una variable aleatoria continua. Por ejemplo, una escala digital puede mostrar el peso de una pieza redondeado hasta centésimos de gramo, tal vez sea conveniente pensar el peso de la pieza como una variable aleatoria continua. Como otro ejemplo, es posible medir la corriente hasta el microampere más cercano. Dado que solo es posible un numero entero de microamperes, la variable aleatoria es discreta. Sin embargo, tal vez sea más conveniente suponer que las mediciones de corriente corresponden a valores de una variable aleatoria continua. - Variable aleatoria normal estándar: Una variable aleatoria normal con = 0 y =1 y se denota por Z. 11. Distribución de frecuencias Los datos recogidos deben ser organizados, tabulados y presentados para que su análisis e interpretación sean rápidos y útiles. Por ejemplo, para estudiar e interpretar la distribución de las notas o calificaciones de un examen en una clase con 30 alumnos, primero se ordenan las notas en orden creciente: 3,0; 3,5; 4,3; 5,2; 6,1; 6,5; 6,5; 6,5; 6,8; 7,0; 7,2; 7,2; 7,3; 7,5; 7,5; 7,6; 7,7; 7,8; 7,8; 8,0; 8,3; 8,5; 8,8; 8,8; 9,0; 9,1; 9,6; 9,7; 10 y 10. Esta secuencia muestra, a primera vista, que la máxima nota es un 10, y la mínima es un 3; el rango, diferencia entre la máxima y la mínima es 7. En un diagrama de frecuencia acumulada, como el de la figura 1, las notas aparecen en el eje horizontal y el número de alumnos en el eje vertical izquierdo, con el correspondiente porcentaje a la derecha. Cada punto representa el número total de estudiantes que han obtenido una calificación menor o igual que el valor dado. Por ejemplo, el punto A corresponde a 7,2, y según el eje vertical, hay 12 alumnos, o un 40%, con calificaciones menores o iguales que 7,2. Para analizar las calificaciones obtenidas por 10 clases de 30 alumnos cada una en cuatro exámenes distintos (un total de 1.200 calificaciones), hay que tener en cuenta que la cantidad de datos es demasiado grande para representarlos como en la figura 1. El estadístico tiene que separar los datos en grupos elegidos previamente denominados intervalos. Por ejemplo, se pueden utilizar 10 intervalos para tabular las 1.200 calificaciones, que se muestran en la columna (a) de la tabla de distribución de datos adjunta; el número de calificaciones por cada intervalo, llamado frecuencia del intervalo, se muestra en la columna (c). Los números que definen el rango de un intervalo se denominan límites. Es conveniente elegir los límites de manera que los rangos de todos los intervalos sean iguales y que los puntos medios sean números sencillos. Una calificación de 8,7 se cuenta en el intervalo entre 8 y 9; una calificación igual a un límite de intervalo, como 9, se puede asignar a cualquiera de los dos intervalos, aunque se debe hacer de la misma manera a lo largo de toda la muestra. La frecuencia relativa, columna (d), es la proporción entre la frecuencia de un intervalo y el número total de datos. La frecuencia acumulada, columna (e), es el número de estudiantes con calificaciones iguales o menores que el rango de cada intervalo sucesivo. Así, el número de estudiantes con calificaciones menores o iguales a 3 se calcula sumando las frecuencias de la columna (c) de los tres primeros intervalos, dando 53. La frecuencia acumulada relativa, columna (f), es el cociente entre la frecuencia acumulada y el número total de notas. Los datos de una tabla de distribución de frecuencias se pueden representar gráficamente utilizando un histograma o diagrama de barras (como en la figura 2), o como un polígono de frecuencias acumuladas (como en la figura 3). El histograma es una serie de rectángulos con bases iguales al rango de los intervalos y con área proporcional a sus frecuencias. El polígono de la figura 3 se obtiene conectando los puntos medios de cada intervalo de un histograma de frecuencias acumuladas con segmentos rectilíneos. En los periódicos y otros medios de comunicación los datos se representan gráficamente utilizando símbolos de diferente longitud o tamaño que representan las distintas frecuencias. 12. Tabla de frecuencias (a) (b) (c) (d) (e) (f) RANGO PUNTO MEDIO DEL RANGO FRECUENCIA FRECUENCIA RELATIVA FRECUENCIA ACUMULADA FRECUENCIA ACUMULADA RELATIVA 0-1 0,5 20 0,017 20 0,017 1-2 1,5 15 0,012 35 0,029 2-3 2,5 18 0,015 53 0,044 3-4 3,5 25 0,021 78 0,065 4-5 4,5 44 0,037 122 0,102 5-6 5,5 88 0,073 210 0,175 6-7 6,5 222 0,185 432 0,360 7-8 7,5 335 0,279 767 0,639 8-9 8,5 218 0,182 985 0,821 9-10 9,5 215 0,179 1.200 1,000 EXÁMENES 1,2,3,4; CLASES 1-10; 1.200 CALIFICACIONES 13. Que se entiende por frecuencia · Frecuencia absoluta: En una muestra estadística, numero de veces que aparece un determinado carácter. · Frecuencia acumulada: Suma de todas las frecuencias que corresponden a las clases o elementos de una muestra en los que la variable tiene un valor inferior a uno dado. · Frecuencia relativa: Cociente entre la frecuencia absoluta y el numero de casos de una muestra. 14. Cuales son los gráficos más utilizados. S bien es útil ordenar los valores en un conjunto de datos del menor al mayor o clasificarlos datos en categorías y determinar las frecuencias absolutas y relativas, muchos analistas prefieren una representación gráfica. Quizá la gráfica más común es aquella en que las clases se representan en el eje horizontal y las frecuencias en el vertical. Este tipo de gráfica se llama histograma o diagrama de barra que es el que muestra la figura. Un útil agregado al histograma es el polígono de frecuencias, que se construye uniendo con segmentos de recta los puntos medios de los intervalos adyacentes. El polígono de frecuencias esta dibujado con trazos discontinuos, proporciona una representación “ suavizada “ de un conjunto de valores. La ventaja que se obtiene con el uso de las aproximaciones resulta generalmente mucho más fácil. 15. Clasificación de las medidas estadísticas * MEDIDAS DE LOCALIZACION: Con frecuencia es útil tener un medio numerico simple para representar la localización entre distribuciones que sean complicadas. · Media: Una manera es localizar la media aritmética del conjunto de resultados, a la que por lo general se le llama simplemente la media. Esta se calcula encontrando la suma de los resultados y dividiéndola por él numero de resultados. Para los resultados llamados xi , a la media se le denomina ( léase “ x barras “ ). Media = = 1/ N xi · Moda: Una segunda medida de localización usada comúnmente es la mediana, que es el punto medio de la distribución de los resultados. Con mayor precisión, la mediana es el resultado arriba del cual se localiza la mitad de los resultados restantes y abajo del cual se localiza la otra mitad. En general, si n es él numero de resultados, la mediana es él ( n+1 )/ 2avo resultado del menor al mayor cuando n es impar o él numero de en medio entre el n/2avo resultado y él ( n+1 )/2avo resultado cuando n es par. · Moda: La tercera medida de localización es la moda, que es el valor más frecuente o típico de la distribución, esto es, el resultado que ocurre con mayor frecuencia. En algunos casos habrá mas de un valor típico, en cuyo caso no hay ninguna moda definida de una manera única y se hace referencia a la distribución como multimodal. Percentiles, deciles y cuartiles son útiles cuando se necesita dividir un conjunto de datos en determinado numero de grupos, de modo que cada uno de ellos mantenga el mismo numero de valores. MEDIDAS DE DISPERSION : En las medidas de localización discutidas anteriormente solo se considera un aspecto de una distribución de frecuencias, es decir, su valor promedio y no se resume en ellas toda la información representada. Las medidas de dispersión, nos hablan de cómo se concentra o se dispersa la masa de probabilidades en torno al valor central. · Recorrido: La medida de dispersión más simple es el recorrido de los resultados, que es la diferencia entre los valores menor y mayor. Entre mas separados estén los resultados, mayor será el recorrido. ·Varianza: Esta medida es un poco más compleja, ya que en ella se usan todos los números de la distribución. En la varianza se reflejan las distancias de los resultados a la media. Para calcularla, primero necesita conocerse la media de la distribución. La media se resta entonces de cada uno de los resultados. Varianza = 1/ N ( xi - ) 2 16. Cuales son las más utilizadas? La medida más importante referente a una información numérica es la que indica la posición central de los datos. Él termino posición central puede referirse a la media, a la mediana o a la ,moda cada una de estas medidas es apropiada para ciertos propósitos descriptivos, pero resulta completamente inadecuadas para otras. En general la más utilizada es la media aritmética. 17. Que es estadigrafo? Son las características numéricas de las muestras. 18. Que utilidad tiene para usted el estudio de la estadística en su programa académico. La importancia de la estadística en general en las ciencias , ingenierias y administración ha sido subrayado por la participación de la industria en el aumento de la calidad. El campo de la estadística inferencial se ha desarrollado principalmente desde comienzos de este siglo. Es resultado de los métodos para organizar y resumir datos, cuyos orígenes se remontan a varios siglos atrás. Estos métodos para resumir y organizar datos se denominan estadística descriptiva. La mayor parte del uso moderno de la estadística , particularmente de la ciencia y la ingeniería, se dirige mas hacia la inferencia que a la descriptiva. Por ejemplo, un ingeniero que diseña un nuevo circuito de computadora fabricara una muestra ( prototipo ) de ellos, y entonces querrá obtener conclusiones sobre la forma en que estos dispositivos funcionaran una vez que se produzcan a gran escala. 19. Comente levemente la utilidad que tiene la estadística para su empresa, si no las llevas como las podría llevar? Muchas compañías se han dado cuenta de que la baja calidad de un producto ( ya sea en la forma de defectos de fabricación, en una baja confiabilidad en su rendimiento, o en ambos ), tiene un efecto muy pronunciado en la productividad global de la compañía, en el mercado y la posición competitiva y, finalmente, en la rentabilidad de la empresa. Mejorar estos aspectos de la calidad puede eliminar el desperdicio; Disminuir la cantidad de material de desecho, la necesidad de volver a maquilizar piezas, los requerimientos para inspección y prueba y las perdidas por garantía; ademas de majorar la satisfaccion del consumidor y permitir que la empresa se convierta en un productor de alta calidad y bajo costo en el mercado. La estadística es un elemento decisivo en el incremento de la calidad, ya que las técnicas estadísticas pueden emplearsen para describir y comprender la variabilidad. 20. Al realizar una investigación científica que papel juega la estadística y explique en que fases se presenta. Los experimentos son una parte natural de la ingeniería y de los procesos de toma de decisiones científicos. Las técnicas de diseño experimental basadas en la estadística son particularmente útiles en el mundo de la ingeniería en lo que toca a la mejora del rendimiento de los procesos de manufactura. Estas técnicas también tienen una aplicación extensa en el desarrollo de nuevos procesos. Muchos procesos pueden describirse en términos de varias variables controladas, tales como temperatura, presión y tasa de abastecimiento. Mediante el empleo de experimentos diseñados, los ingenieros pueden determinar el subconjunto de variables del proceso que tienen la mayor influencia sobre el rendimiento de este. Los resultados de estos experimentos pueden conducir a : 1. Mejorar el rendimiento del proceso. 2. Reducir la variabilidad del proceso y acercarlo a los requerimientos nominales. 3. Disminución del tiempo de diseño y desarrollo. 4. Disminución del costo de operación. Los experimentos diseñados se utilizan, de manera usual, secuencialmente. Esto es, el primer experimento con un sistema complejo ( quizá un proceso de fabricación ) que tiene muchas variables controladas es, a menudo, un experimento de diagnostico diseñado para determinar que variables son las más importantes. Los experimentos que siguen a este se utilizan para refinar la información y determinar los ajustes que deben hacerse a las variables criticas para mejorar el proceso. Finalmente, el objetivo del experimentador es la optimización; esto es, la determinacion de los niveles que deben tener las variables criticas para obtener el mejor desempeño del proceso. Todo experimento implica una secuencia de actividades: 1. CONJETURA: La hipótesis original que motiva el experimento. 2. EXPERIMENTO: Prueba efectuada para investigar la conjetura. 3. ANALISIS: Análisis estadístico de los datos obtenidos del experimento. 4. CONCLUSION: Lo que se ha aprendido de la conjetura original con la realización del experimento. A menudo, este conduce a una conjetura nueva y a un experimento nuevo, y asi sucesivamente. OBJETIVOS OBJETIVO GENERAL Investigar acerca de los fundamentos de la estadística para proporcionarnos una ayuda en el desempeño a lo largo de este curso. OBJETIVOS ESPECIFICOS: - Comprender la importancia de la estadística en nuestra carrera y en general. - Dar la debida importancia a esta ciencia empírica que cada día toma mas importancia en el desempeño de la industria. CONCLUSIONES La probabilidad, como cualquier otro concepto matemático, es una elaboración del pensamiento en el cual cada generación construye sobre los esfuerzos de sus predecesores. El campo de la estadística tiene que ver con la recopilación, presentación, análisis y uso de datos para tomar decisiones y resolver problemas. El campo de la estadística y la probabilidad consiste de métodos tanto para describir y modelar la variabilidad, como para tomar decisiones en presencia de esta. BIBLIOGRAFIA CHRIS, Leach. Fundamentos de estadística. Editorial Limusa. Mexico.1982 NIETO DE ALBA, Ubaldo. Introducción a la estadística. Editorial Aguilar. Madrid. 1984 MONTGOMERY , Douglas y RUNGER , George. Probabilidad y Estadística. McGraw-Hill. Arizona.1996.