Download ANÁLISIS DE LA INFORMACIÓN ESTADÍSTICA SENA Por: Miguel
Document related concepts
no text concepts found
Transcript
ANÁLISIS DE LA INFORMACIÓN ESTADÍSTICA SENA Por: Miguel ángel solano rojas Para: Joaquín Páez Henao Fecha: 31/08/2010 FICHA: 34733 D.O.L.C.A. BOGOTÁ DISTRITO CAPITAL Defina estadística El término estadística tiene su raíz en la palabra Estado. Surge cuando se hace necesario para sus intereses cuantificar conceptos. En la mayoría de los casos esta cuantificación se hará en función de unos fines económicos o militares. El estado quiere conocer censo de personas, de infraestructura, de recursos en general, para poder obtener conclusiones de esta información. Actualmente la estadística es una ciencia. No es ya una cuestión reservada al estado. Podríamos decir que se encuentra en la totalidad del resto de ciencias. La razón es clara: por una parte la estadística proporciona técnicas precisas para obtener información, (recogida y descripción de datos) y por otra parte proporciona métodos para el análisis de esta información. De ahí el nombre de ESTADÍSTICA DESCRIPTIVA, ya que el objetivo será, a partir de una muestra de datos (recogida según una técnica concreta), la descripción de las características más importantes, entendiendo como características, aquellas cantidades que nos proporcionen información sobre el tema de interés del cual hacemos el estudio. De qué manera la estadística ha venido penetrando en el sector empresarial? Se utiliza en diferentes maneras pero regresión es una técnica estadística utilizada para simular la relación existente entre dos o más variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada. La regresión es muy utilizada para interpretar situaciones reales, pero comúnmente se hace de mala forma, por lo cual es necesario realizar una selección adecuada de las variables que van a construir las ecuaciones de la regresión, ya que tomar variables que no tengan relación en la práctica, nos arrojará un modelo carente de sentido, es decir ilógico. Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras. Las ecuaciones de cada relación se presentan en la siguiente tabla. Bien quedó ello claramente expuesto, una enumeración nunca está demás. Así pues las estadísticas son fundamentales a los efectos de gestionar y mejorar temas o actividades tales como: El control de calidad. El nivel de averías y sus frecuencias. Los tiempos para cambios o preparación de herramientas. Los niveles de productividad de distintos procesos, actividades y productos. Los costos correspondientes a distintos tipos de conceptos y actividades. La gestión de créditos y cobranzas. El seguimiento del flujo de fondos. Los niveles de satisfacción de los clientes y usuarios. Los tipos de accidentes y sus frecuencias. El análisis paretiano de defectos, costes, rentabilidades, ventas. Ventas por clientes, vendedores, zonas y productos. Predicciones de ventas por zonas, productos, servicios o sucursales. Capacidad de los procesos en cuanto a generación de niveles de costes, calidad y productividad. Tiempos totales de ciclos productivos. Tiempos de respuestas. Gestión de inventarios. Cumplimiento de aprovisionamiento por parte de los proveedores. Predicción de ventas por canales de comercialización. Proyectos de inversión. Probabilidades para la construcción del "Árbol para la Toma de Decisiones". Evolución de los distintos ratios económicos – financieros y patrimoniales a lo largo del tiempo. Estudios e investigación de mercado. Tiempos de máquinas y personas por actividad. Cantidad y representación porcentual de distintos problemas y sus efectos económicos en la organización. Tasa de polivalencia del personal. Productos más demandados, a nivel global, por zona y por canal de comercialización. Porcentajes de actividades generadoras de valor agregado para los clientes finales, de valor agregado para la empresa y carentes de valor agregado. Tiempos promedios, máximos y mínimos de reparaciones por tipo de averías. Cálculos de costes y en especial para el Costeo Basado en Actividades. Para los cálculos de productividades. Coeficientes de correlación. Estadística del personal (directivo y empleado). Porque dentro de la estadística se presentan variaciones en la información. En la estadística el coeficiente de variación, es una medida de dispersión útil para comparar dispersiones a escalas distintas pues es una medida invariante ante cambios de escala. Sirve para comparar variables que están a distintas escalas pero que están correlacionadas estadísticamente y sustantivamente con un factor en común. Es decir, ambas variables tienen una relación causal con ese factor. Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar. Por otro lado presenta problemas ya que a diferencia de la desviación típica este coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media de por tanto un valor positivo. A mayor valor de C.V. mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Unificar resultados: Profe Joaquín la verdad no supe hacer ese punto discúlpeme. Trabajo en equipo Defina variables, atributos y de tres ejemplos de cada uno Defina Variables, atributos y de ejemplos de cada uno. 1. Variables: Son atributos, cualidades, características observables que poseen las personas, objetos, instituciones que expresan magnitudes que varían discretamente o en forma continua. Ejemplo: son variables de las personas: la edad, sexo, talla, peso, contextura, color del cabello, color de ojos, grado de atención, conocimientos previos, confesión religiosa, procedencia, clase social, etc. Son variables de las cosas, objetos: forma, color, tamaño, peso, conservación, antigüedad, etc. Las instituciones también poseen variables como: antigüedad, organización, eficiencia, magnitud, productividad, etc. 2. Clasificación: Existen diversas clasificaciones de variables. 2.1. Por su Grado de abstracción o concreción. a. Variables Teóricas: Son aquellas que son abstractas que no se entienden porque no son observables o medibles sino se definen. Ejemplos: estatus socioeconómico, rendimiento académico, imperialismo, dependencia, dominación, infraestructura, etc. b. Variables Intermedias: Son aquellas que permiten comprender a las variables teóricas. Ejemplo El rendimiento académico no se entiende sino está referida a los calificativos, a la asistencia, a la dedicación al estudio, puntualidad del estudiante. c. Variables empíricas: Indicadores, son aquellas que permiten entender mejor a las variables intermedias y por tanto a las variables teóricas. No necesitan definirse por cuanto son fácilmente entendibles, medibles u observables. Ejemplos: la variable calificativa puede ser muy buena, buena, regular, mala y pésima. Las variables empíricas pueden expresarse cuantitativamente. 2.2. Por su posición en la investigación: a. Variable Dependiente: Es aquella que dentro de una hipótesis representa la consecuencia, el efecto, el fenómeno que se estudia. Se simboliza con la letra Y. Ejemplo: entre las variables de rendimiento académico y aplicación de métodos, la variable dependiente es rendimiento académico. En una función matemática como la típica: Y= (f) X (Se lee Y está en función de X; ó Y depende de X) b. Variable Independiente: Es aquella que influye en la variable dependiente y no de depende de otra variable, dentro de una hipótesis. Se simboliza con la letra X. Ejemplo: entre las variables hiperactividad y falta de autoestima, la variable autoestima es independiente, ya que explica o influye en la hiperactividad del niño. c. Variable Extrañas: Externas son aquellas que provienen del exterior al campo de investigación y por ello se denominan también intervinientes. Son de varias clases pero lo que ahora nos interesa son las variables conexas, o variables sujeto y orgánicas, como son las cualidades del sujeto que se investiga por ejemplo: edad, sexo, inteligencia, conocimientos previos, procedencia, etc. y que pueden influir en la variable dependiente, por ejemplo rendimiento académico. En otras hipótesis las variables extrañas pueden provenir de fuera del sujeto de estudio. Se simbolizan con la letra Z. 2.2. Por su Naturaleza: Pueden ser cualitativas, ordinales y cuantitativas. a. Variables Cualitativas: son aquellas que nominan o señalan cualidades. Ejemplo: La variable talla puede expresarse: muy alto, alto, mediano, bajo, muy bajo. b. Variables Ordinales: son las que expresan una clasificación jerarquizada, en orden de importancia. Ejemplo: la variable nivel de instrucción comprende: iletrado, primaria, secundaria, superior. c. Variables Cuantitativas: pueden ser discretas y continuas c.1. Variables Discretas: son las que expresan números enteros, por tanto pueden ser contados. Ejemplo población escolar, producción de petróleo, nacimientos, muerto, etc. c.2. Variables Continuas: son las que expresan en números decimales, por tanto pueden ser medidos con mayor exactitud. Ejemplo: el peso, edad ó talla de una persona. 2. Atributos: Las variables, también suelen ser llamados caracteres cuantitativos, son aquellos que pueden ser expresados mediante números. Son caracteres susceptibles de medición. Como por ejemplo, la estatura, el peso, el salario, la edad, etc. Según, Murray R. Siebel, (1992) "una variable es un símbolo, tal como X, Y, Hx, que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor, se llama constante." Todos los elementos de la población poseen los mismos tipos de caracteres, pero como estos en general no suelen representarse con la misma intensidad, es obvio que las variables toman distintos valores. Por lo tanto estos distintos números o medidas que toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una variable. Los atributos también llamados caracteres cualitativos, son aquellos que no son susceptibles de medición, es decir que no se pueden expresar mediante un número. IUTIN (1997). "Reciben el nombre de variables cualitativas o atributos, aquellas características que pueden presentarse en individuos que constituyen un conjunto. La forma de expresar los atributos es mediante palabras, por ejemplo; profesión, estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en todos los elementos. Estas distintas formas en que se presentan los atributos reciben el nombre de "modalidades". Ejemplo: El estado civil de cada uno de los estudiantes del curso de estadísticas I, no se presenta en la misma modalidad en todos. Variables cualitativas Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir: o Variable cualitativa ordinal: También llamada variable cuasicuantitativa. La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave. o Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia. En un cuadro sinóptico, muestre los métodos de recolección de la información. Defina universo, población, muestra y de un ejemplo de cada uno. Población y muestra Puesto que la estadística se ocupa de una gran cantidad de datos, debe primeramente definir de cuáles datos se va a ocupar. El conjunto de datos de los cuales se ocupa un determinado estudio estadístico se llama población. No debe confundirse la población en sentido demográfico y la población en sentido estadístico. La población en sentido demográfico es un conjunto de individuos (todos los habitantes de un país, todas las ratas de una ciudad), mientras que una población en sentido estadístico es un conjunto de datos referidos a determinada característica o atributo de los individuos (las edades de todos los individuos de un país, el color de todas las ratas de una ciudad). Incluso una población en sentido estadístico no tiene porqué referirse a muchos individuos. Una población estadística puede ser también el conjunto de calificaciones obtenidas por un individuo a lo largo de sus estudios universitarios. Los datos de la totalidad de una población pueden obtenerse a través de un censo. Sin embargo, en la mayoría de los casos no es posible obtenerlos por razones de esfuerzo, tiempo y dinero, razón por la cual se extrae, de la población, una muestra, mediante un procedimiento llamado muestreo. Se llama muestra a un subconjunto de la población, preferiblemente representativo de la misma. Ejemplo, si la población es el conjunto de todas las edades de los estudiantes de la provincia de Buenos Aires, una muestra será conjunto de edades de 2000 estudiantes de la provincia de Buenos Aires tomados al azar. Universo: El Universo es generalmente definido como todo lo que existe físicamente: la totalidad del espacio y del tiempo, de todas las formas de la materia, la energía y el impulso, las leyes y constantes físicas que las gobiernan. Muestre la formulación matemática para el cálculo de la muestra. Estudios para contraste de hipótesis. Es decir pretendemos comparar si las medias o las proporciones de las muestras son diferentes. Tabla 1. Elementos de la Inferencia Estadística A. Estudios para determinar parámetros Con estos estudios pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra. A.1. Estimar una proporción: Si deseamos estimar una proporción, debemos saber: a. El nivel de confianza o seguridad (1- ). El nivel de confianza prefijado da lugar a un coeficiente (Z ). Para una seguridad del 95% = 1.96, para una seguridad del 99% = 2.58. b. La precisión que deseamos para nuestro estudio. c. Una idea del valor aproximado del parámetro que queremos medir (en este caso una proporción). Esta idea se puede obtener revisando la literatura, por estudio pilotos previos. En caso de no tener dicha información utilizaremos el valor p = 0.5 (50%). Ejemplo: ¿A cuántas personas tendríamos que estudiar para conocer la prevalencia de diabetes? Seguridad = 95%; Precisión = 3%: Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p = 0,5 (50%) que maximiza el tamaño muestra: