Download tamaño de muestra

Document related concepts

Distribución t de Student wikipedia , lookup

Estadístico muestral wikipedia , lookup

Prueba t de Student wikipedia , lookup

Muestra estadística wikipedia , lookup

Error estándar wikipedia , lookup

Transcript
DICCIONARIO
MEDIA
En matemáticas y estadística, la media aritmética (también llamada promedio o simplemente
media) de un conjunto finito de números es el valor característico de una serie de datos
cuantitativos objeto de estudio que parte del principio de la esperanza matemática o valor
esperado, se obtiene a partir de la suma de todos sus valores dividida entre el número de
sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral
siendo uno de los principales estadísticos muestrales.
Por ejemplo, la media aritmética de 8, 5 y -1 es igual a:
Se utiliza la letra X con una barra horizontal sobre el símbolo para representar la media de
una muestra , mientras que la letra µ (mu) se usa para la media aritmética de una
población, es decir, el valor esperado de una variable.
En otras palabras, es la suma de n valores de la variable y luego dividido por n : donde n es
el número de sumandos, o en el caso de estadística el número de datos se da el resultado
La media (
nos muestra cualquier cambio en el valor promedio de un proceso
TAMAÑO DE MUESTRA
En estadística el tamaño de la muestra es el número de sujetos que componen la muestra
extraída de una población, necesarios para que los datos obtenidos sean representativos de la
población.
1. Estimar un parámetro determinado con el nivel de confianza deseado.
2. Detectar una determinada diferencia, si realmente existe, entre los grupos de estudio
con un mínimo de garantía.
3. Reducir costes o aumentar la rapidez del estudio.
Por ejemplo, en un estudio de investigación epidemiológico la determinación de un tamaño
adecuado de la muestra tendría como objetivo su factibilidad. Así:
1. Si el número de sujetos es insuficiente habría que modificar los criterios de
selección, solicitar la colaboración de otros centros o ampliar el período de
reclutamiento. Los estudios con tamaños muestrales insuficientes, no son capaces de
detectar diferencias entre grupos, llegando a la conclusión errónea de que no existe
tal diferencia.
2. Si el número de sujetos es excesivo, el estudio se encarece desde el punto de vista
económico y humano. Además es poco ético al someter a más individuos a una
intervención que puede ser menos eficaz o incluso perjudicial.
El tamaño de una muestra es el número de individuos que contiene.
Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la muestra para
datos globales es la siguiente:
N: es el tamaño de la población o universo (número total de posibles encuestados).
Zα: es una constante que depende del nivel de confianza que asignemos. El nivel de
confianza indica la probabilidad de que los resultados de nuestra investigación sean ciertos:
un 95,5 % de confianza es lo mismo que decir que nos podemos equivocar con una
probabilidad del 4,5%. Los valores de Zα se obtienen de la tabla de la distribución normal
estándar N(0,1).
Los valores de Zα más utilizados y sus niveles de confianza son:
Valor de Zα
1,15 1,28 1,44 1,65 1,96 2,24 2,58
Nivel de confianza 75% 80% 85% 90% 95% 97,5% 99%
(Por tanto si pretendemos obtener un nivel de confianza del 95% necesitamos poner en la
fórmula Zα=1.96)
e: es el error muestral deseado, en tanto por ciento. El error muestral es la diferencia que
puede haber entre el resultado que obtenemos preguntando a una muestra de la población y
el que obtendríamos si preguntáramos al total de ella. Ejemplos:
Ejemplo 1: si los resultados de una encuesta dicen que 100 personas comprarían un
producto y tenemos un error muestral del 5% comprarán entre 95 y 105 personas.
POBLACION
En estadística, también llamada universo, es el conjunto de elementos de referencia sobre el que
se realizan las observaciones.
En epidemiología una población es un conjunto de sujetos o individuos con determinadas
características demográficas, de la que se obtiene la muestra o participantes en un estudio
epidemiológico a la que se quiere extrapolar los resultados de dicho estudio (inferencia
estadística). La estadística es comúnmente considerada como una colección de hechos numéricos
expresados en términos de una relación sumisa, y que han sido recopilado a partir de otros datos
numéricos. Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la
estadística como un valor resumido, calculado, como base en una muestra de observaciones que
generalmente, aunque no por necesidad, se considera como una estimación de parámetro de
determinada población; es decir, una función de valores de muestra.
DISTRIBUCION T
En probabilidad y estadística, la distribución t (de Student) es una distribución de
probabilidad que surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las
diferencias entre dos medias muestrales y para la construcción del intervalo de confianza
para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación
típica de una población y ésta debe ser estimada a partir de los datos de una muestra.
La distribución t de Student es la distribución de probabilidad del cociente
donde

Z es una variable aleatoria distribuida según una normal típica (de media nula y

varianza 1). V es una variable aleatoria que sigue una distribución χ² con
grados de libertad.
Z y V son independientes

Si μ es una constante no nula, el cociente
es una variable aleatoria que sigue la
distribución t de Student no central con parámetro de no-centralidad
.
TIPO DE DATOS
En ciencias de la computación un tipo de dato informático o simplemente tipo es un
atributo de los datos que indica al ordenador (y/o al programador) sobre la clase de datos
que se va a trabajar. Esto incluye imponer restricciones en los datos, como qué valores
pueden tomar y qué operaciones se pueden realizar.
Los tipos de datos comunes son: números enteros, números con signo (negativos), números
de coma flotante (decimales), cadenas alfanuméricas (y unicodes), estados, etc.
DISTRIBUCION Z
La distribución normal también aparece en muchas áreas de la propia estadística. Por
ejemplo, la distribución muestral de las medias muestrales es aproximadamente normal,
cuando la distribución de la población de la cual se extrae la muestra no es normal.1
Además, la distribución normal maximiza la entropía entre todas las distribuciones con
media y varianza conocidas, lo cual la convierte en la elección natural de la distribución
subyacente a una lista de datos resumidos en términos de media muestral y varianza. La
distribución normal es la más extendida en estadística y muchos tests estadísticos están
basados en una "normalidad" más o menos justificada de la variable aleatoria bajo estudio.
En probabilidad, la distribución normal aparece como el límite de varias distribuciones de
probabilidad continuas y discretas.
DESVACION ESTANDAR
La desviación típica o desviación estándar (denotada con el símbolo σ o s, dependiendo
de la procedencia del conjunto de datos) es una medida de dispersión para variables de
razón (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz
cuadrada de la varianza de la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer también la desviación que presentan los
datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de
tener una visión de los mismos más acorde con la realidad al momento de describirlos e
interpretarlos para la toma de decisiones
MUESTRA
En estadística, una muestra es un subconjunto de casos o individuos de una población estadística.
En diversas aplicaciones interesa que una muestra sea una muestra representativa y para ello
debe escogerse una técnica de muestreo adecuada que produzca una muestra aleatoria adecuada
(contrariamente se obtiene una muestra sesgada cuyo interés y utilidad es más limitado
dependiendo del grado de sesgo que presente). La muestra es por lo tanto el grupo al que se le
aplican las pruebas.
DISTRIBUCION JI CUADRADA
La distribución χ² tiene muchas aplicaciones en inferencia estadística. La más conocida es
la de la denominada prueba χ² utilizada como prueba de independencia y como prueba de
bondad de ajuste y en la estimación de varianzas. Pero también está involucrada en el
problema de estimar la media de una población normalmente distribuida y en el problema
de estimar la pendiente de una recta de regresión lineal, a través de su papel en la
distribución t de Student.
Aparece también en todos los problemas de análisis de varianza por su relación con la
distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias
independientes con distribución χ².
DISTRIBUCION T CUADRADA
En estadística la distribución T² (T-cuadrado) de Hotelling es importante porque se
presenta como la distribución de un conjunto de estadísticas que son una generalización
natural de las estadísticas subayacentes distribución t de Student. En particular, la
distribución se presenta en estadísticas multivariadas en pruebas de diferencias entre las
medias (multivariadas) de diferentes poblaciones, donde las pruebas para problemas
univariados usarían la Prueba t. Es proporcional a la distribución F.
La distribución recibe su nombre de Harold Hotelling, quien la desarrollo1 como una
generalización de la distribución t de Student
MEDIANA
En el ámbito de la estadística, la mediana (del latín mediānus 'del medio'1 ) representa el
valor de la va Existen dos m étodos para el cálculo de la mediana: