Download ANÁLISIS DE LA INFORMACIÓN ESTADÍSTICA SENA Por: Miguel

Document related concepts
no text concepts found
Transcript
ANÁLISIS DE LA INFORMACIÓN
ESTADÍSTICA
SENA
Por:
Miguel ángel solano rojas
Para:
Joaquín Páez Henao
Fecha:
31/08/2010
FICHA: 34733
D.O.L.C.A.
BOGOTÁ DISTRITO CAPITAL
Defina estadística
El término estadística tiene su raíz en la palabra Estado. Surge cuando se hace
necesario para sus intereses cuantificar conceptos. En la mayoría de los casos
esta cuantificación se hará en función de unos fines económicos o militares. El
estado quiere conocer censo de personas, de infraestructura, de recursos en
general, para poder obtener conclusiones de esta información.
Actualmente la estadística es una ciencia. No es ya una cuestión reservada al
estado. Podríamos decir que se encuentra en la totalidad del resto de ciencias.
La razón es clara: por una parte la estadística proporciona técnicas precisas
para obtener información, (recogida y descripción de datos) y por otra parte
proporciona métodos para el análisis de esta información.
De ahí el nombre de ESTADÍSTICA DESCRIPTIVA, ya que el objetivo será, a
partir de una muestra de datos (recogida según una técnica concreta), la
descripción de las características más importantes, entendiendo como
características, aquellas cantidades que nos proporcionen información sobre el
tema de interés del cual hacemos el estudio.
De qué manera la estadística ha venido penetrando en el sector
empresarial?
Se
utiliza
en
diferentes
maneras
pero
regresión
es
una
técnica estadística utilizada para simular la relación existente entre dos o más
variables. Por lo tanto se puede emplear para construir un modelo que permita
predecir
el
comportamiento
de
una
variable
dada.
La regresión es muy utilizada para interpretar situaciones reales, pero
comúnmente se hace de mala forma, por lo cual es necesario realizar una
selección adecuada de las variables que van a construir las ecuaciones de la
regresión, ya que tomar variables que no tengan relación en la práctica, nos
arrojará un modelo carente de sentido, es decir ilógico.
Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano,
pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica,
Exponencial, Cuadrática, entre otras. Las ecuaciones de cada relación se
presentan en la siguiente tabla.
Bien quedó ello claramente expuesto, una enumeración nunca está demás.
Así pues las estadísticas son fundamentales a los efectos de gestionar y
mejorar temas o actividades tales como:
El control de calidad.
El nivel de averías y sus frecuencias.
Los tiempos para cambios o preparación de herramientas.
Los niveles de productividad de distintos procesos, actividades y productos.
Los costos correspondientes a distintos tipos de conceptos y actividades.
La gestión de créditos y cobranzas.
El seguimiento del flujo de fondos.
Los niveles de satisfacción de los clientes y usuarios.
Los tipos de accidentes y sus frecuencias.
El análisis paretiano de defectos, costes, rentabilidades, ventas.
Ventas por clientes, vendedores, zonas y productos.
Predicciones de ventas por zonas, productos, servicios o sucursales.
Capacidad de los procesos en cuanto a generación de niveles de costes,
calidad y productividad.
Tiempos totales de ciclos productivos.
Tiempos de respuestas.
Gestión de inventarios.
Cumplimiento de aprovisionamiento por parte de los proveedores.
Predicción de ventas por canales de comercialización.
Proyectos de inversión.
Probabilidades para la construcción del "Árbol para la Toma de Decisiones".
Evolución de los distintos ratios económicos – financieros y patrimoniales a lo
largo del tiempo.
Estudios e investigación de mercado.
Tiempos de máquinas y personas por actividad.
Cantidad y representación porcentual de distintos problemas y sus efectos
económicos en la organización.
Tasa de polivalencia del personal.
Productos más demandados, a nivel global, por zona y por canal de
comercialización.
Porcentajes de actividades generadoras de valor agregado para los clientes
finales, de valor agregado para la empresa y carentes de valor agregado.
Tiempos promedios, máximos y mínimos de reparaciones por tipo de averías.
Cálculos de costes y en especial para el Costeo Basado en Actividades.
Para los cálculos de productividades.
Coeficientes de correlación.
Estadística del personal (directivo y empleado).
Porque dentro de la estadística se presentan variaciones en la
información.
En la estadística el coeficiente de variación, es una medida de dispersión útil
para comparar dispersiones a escalas distintas pues es una medida invariante
ante cambios de escala. Sirve para comparar variables que están a distintas
escalas pero que están correlacionadas estadísticamente y sustantivamente
con un factor en común. Es decir, ambas variables tienen una relación causal
con ese factor. Su fórmula expresa la desviación estándar como porcentaje de
la media aritmética, mostrando una mejor interpretación porcentual del grado
de variabilidad que la desviación típica o estándar. Por otro lado presenta
problemas ya que a diferencia de la desviación típica este coeficiente es
variable ante cambios de origen. Por ello es importante que todos los valores
sean positivos y su media de por tanto un valor positivo. A mayor valor de C.V.
mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor
homogeneidad en los valores de la variable.
Unificar resultados:
Profe Joaquín la verdad no supe hacer ese punto discúlpeme.
Trabajo en equipo
Defina variables, atributos y de tres ejemplos de cada uno
Defina Variables, atributos y de ejemplos de cada uno.
1. Variables:
Son atributos, cualidades, características observables que poseen las
personas, objetos, instituciones que expresan magnitudes que varían
discretamente o en forma continua.
Ejemplo: son variables de las personas: la edad, sexo, talla, peso,
contextura, color del cabello, color de ojos, grado de atención,
conocimientos previos, confesión religiosa, procedencia, clase social,
etc.
Son variables de las cosas, objetos: forma, color, tamaño, peso,
conservación, antigüedad, etc. Las instituciones también poseen
variables como: antigüedad, organización, eficiencia, magnitud,
productividad, etc.
2.
Clasificación: Existen diversas clasificaciones de variables.
2.1.
Por su Grado de abstracción o concreción.
a. Variables Teóricas: Son aquellas que son abstractas que no se
entienden porque no son observables o medibles sino se definen.
Ejemplos:
estatus
socioeconómico,
rendimiento
académico,
imperialismo, dependencia, dominación, infraestructura, etc.
b. Variables Intermedias: Son aquellas que permiten comprender a las
variables teóricas. Ejemplo El rendimiento académico no se entiende
sino está referida a los calificativos, a la asistencia, a la dedicación al
estudio, puntualidad del estudiante.
c. Variables empíricas: Indicadores, son aquellas que permiten
entender mejor a las variables intermedias y por tanto a las variables
teóricas. No necesitan definirse por cuanto son fácilmente entendibles,
medibles u observables. Ejemplos: la variable calificativa puede ser muy
buena, buena, regular, mala y pésima. Las variables empíricas pueden
expresarse cuantitativamente.
2.2. Por su posición en la investigación:
a. Variable Dependiente: Es aquella que dentro de una hipótesis
representa la consecuencia, el efecto, el fenómeno que se estudia. Se
simboliza con la letra Y. Ejemplo: entre las variables de rendimiento
académico y aplicación de métodos, la variable dependiente es
rendimiento académico. En una función matemática como la típica: Y=
(f) X (Se lee Y está en función de X; ó Y depende de X)
b. Variable Independiente: Es aquella que influye en la variable
dependiente y no de depende de otra variable, dentro de una hipótesis.
Se simboliza con la letra X. Ejemplo: entre las variables hiperactividad y
falta de autoestima, la variable autoestima es independiente, ya que
explica o influye en la hiperactividad del niño.
c. Variable Extrañas: Externas son aquellas que provienen del exterior
al campo de investigación y por ello se denominan también
intervinientes. Son de varias clases pero lo que ahora nos interesa son
las variables conexas, o variables sujeto y orgánicas, como son las
cualidades del sujeto que se investiga por ejemplo: edad, sexo,
inteligencia, conocimientos previos, procedencia, etc. y que pueden
influir en la variable dependiente, por ejemplo rendimiento académico.
En otras hipótesis las variables extrañas pueden provenir de fuera del
sujeto de estudio. Se simbolizan con la letra Z.
2.2. Por su Naturaleza: Pueden ser cualitativas, ordinales y
cuantitativas.
a. Variables Cualitativas: son aquellas que nominan o señalan
cualidades. Ejemplo: La variable talla puede expresarse: muy alto, alto,
mediano, bajo, muy bajo.
b. Variables Ordinales: son las que expresan una clasificación
jerarquizada, en orden de importancia. Ejemplo: la variable nivel de
instrucción comprende: iletrado, primaria, secundaria, superior.
c. Variables Cuantitativas: pueden ser discretas y continuas
c.1. Variables Discretas: son las que expresan números enteros,
por tanto pueden ser contados. Ejemplo población escolar,
producción de petróleo, nacimientos, muerto, etc.
c.2. Variables Continuas: son las que expresan en números
decimales, por tanto pueden ser medidos con mayor exactitud.
Ejemplo: el peso, edad ó talla de una persona.
2. Atributos:
Las variables, también suelen ser llamados caracteres cuantitativos, son
aquellos que pueden ser expresados mediante números. Son caracteres
susceptibles de medición. Como por ejemplo, la estatura, el peso, el salario,
la edad, etc.
Según, Murray R. Siebel, (1992) "una variable es un símbolo, tal como X, Y,
Hx, que puede tomar un valor cualquiera de un conjunto determinado de
ellos, llamado dominio de la variable. Si la variable puede tomar solamente
un valor, se llama constante."
Todos los elementos de la población poseen los mismos tipos de
caracteres, pero como estos en general no suelen representarse con la
misma intensidad, es obvio que las variables toman distintos valores. Por lo
tanto estos distintos números o medidas que toman los caracteres son los
"valores de la variable". Todos ellos juntos constituyen una variable.
Los atributos también llamados caracteres cualitativos, son aquellos que
no son susceptibles de medición, es decir que no se pueden expresar
mediante un número.
IUTIN (1997). "Reciben el nombre de variables cualitativas o atributos,
aquellas características que pueden presentarse en individuos que
constituyen un conjunto.
La forma de expresar los atributos es mediante palabras, por ejemplo;
profesión, estado civil, sexo, nacionalidad, etc. Puede notar que los
atributos no se presentan en la misma forma en todos los elementos. Estas
distintas formas en que se presentan los atributos reciben el nombre de
"modalidades".
Ejemplo:
El estado civil de cada uno de los estudiantes del curso de estadísticas I, no
se presenta en la misma modalidad en todos.
 Variables cualitativas
Son las variables que expresan distintas cualidades, características o
modalidad. Cada modalidad que se presenta se denomina atributo o
categoría y la medición consiste en una clasificación de dichos atributos.
Las variables cualitativas pueden ser ordinales y nominales. Las variables
cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores
posibles como sí y no, hombre y mujer o son politómicas cuando pueden
adquirir tres o más valores.
Dentro de ellas podemos distinguir:
o Variable cualitativa ordinal: También llamada variable
cuasicuantitativa. La variable puede tomar distintos valores
ordenados siguiendo una escala establecida, aunque no es
necesario que el intervalo entre mediciones sea uniforme, por
ejemplo: leve, moderado, grave.
o Variable cualitativa nominal: En esta variable los valores no
pueden ser sometidos a un criterio de orden como por ejemplo los
colores o el lugar de residencia.
En un cuadro sinóptico, muestre los métodos de recolección de la
información.
Defina universo, población, muestra y de un ejemplo de cada uno.
Población y muestra
Puesto que la estadística se ocupa de una gran cantidad de datos, debe
primeramente definir de cuáles datos se va a ocupar. El conjunto de datos de
los cuales se ocupa un determinado estudio estadístico se llama población.
No debe confundirse la población en sentido demográfico y la población en
sentido estadístico.
La población en sentido demográfico es un conjunto de individuos (todos los
habitantes de un país, todas las ratas de una ciudad), mientras que una
población en sentido estadístico es un conjunto de datos referidos a
determinada característica o atributo de los individuos (las edades de todos los
individuos de un país, el color de todas las ratas de una ciudad).
Incluso una población en sentido estadístico no tiene porqué referirse a muchos
individuos. Una población estadística puede ser también el conjunto de
calificaciones obtenidas por un individuo a lo largo de sus estudios
universitarios.
Los datos de la totalidad de una población pueden obtenerse a través de un
censo. Sin embargo, en la mayoría de los casos no es posible obtenerlos por
razones de esfuerzo, tiempo y dinero, razón por la cual se extrae, de la
población, una muestra, mediante un procedimiento llamado muestreo.
Se llama muestra a un subconjunto de la población, preferiblemente
representativo de la misma.
Ejemplo, si la población es el conjunto de todas las edades de los estudiantes
de la provincia de Buenos Aires, una muestra será conjunto de edades de 2000
estudiantes de la provincia de Buenos Aires tomados al azar.
Universo: El Universo es generalmente definido como todo lo que existe
físicamente: la totalidad del espacio y del tiempo, de todas las formas de la
materia, la energía y el impulso, las leyes y constantes físicas que las
gobiernan.
Muestre la formulación matemática para el cálculo de la muestra.
Estudios para contraste de hipótesis. Es decir pretendemos
comparar si las medias o las proporciones de las muestras son
diferentes.
Tabla 1. Elementos de la Inferencia Estadística
A. Estudios para determinar parámetros
Con estos estudios pretendemos hacer inferencias a valores
poblacionales (proporciones, medias) a partir de una muestra.
A.1. Estimar una proporción:
Si deseamos estimar una proporción, debemos saber:
a. El nivel de confianza o seguridad (1- ). El nivel de
confianza prefijado da lugar a un coeficiente (Z ). Para
una seguridad del 95% = 1.96, para una seguridad del
99% = 2.58.
b. La precisión que deseamos para nuestro estudio.
c. Una idea del valor aproximado del parámetro que
queremos medir (en este caso una proporción). Esta idea
se puede obtener revisando la literatura, por estudio
pilotos previos. En caso de no tener dicha información
utilizaremos el valor p = 0.5 (50%).
Ejemplo: ¿A cuántas personas tendríamos que estudiar para conocer
la prevalencia de diabetes?
Seguridad = 95%; Precisión = 3%: Proporción esperada =
asumamos que puede ser próxima al 5%; si no tuviésemos ninguna
idea de dicha proporción utilizaríamos el valor p = 0,5 (50%) que
maximiza el tamaño muestra: