Download Estadística Introducción Para la mayoría de la gente la estadística

Document related concepts

Estadístico muestral wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Muestra estadística wikipedia , lookup

Estimación estadística wikipedia , lookup

Error cuadrático medio wikipedia , lookup

Transcript
Estadística
Introducción
Para la mayoría de la gente la estadística significa números. En forma cotidiana se encuentran en
los medios de comunicación, estadísticas de delitos en la ciudad, o las estadísticas de desempleo;
o los ultimas estadísticas de nacimientos y muertes; o estadísticas de triunfos de un equipo de
fútbol.
La estadística como una rama de las matemáticas aplicadas no es un ciencia, es un
conjunto de técnicas que a lo sumo pueden construir un método de estudio. Estas técnicas
tienen aplicación en las más diversas disciplinas científicas, es por esto que la aplicación en
cada una de estas, requiere por parte del Estadístico, un cierto conocimiento de la disciplina
a la que sirve, y una cierta asimilación al científico que la practica.
Concepto de Estadística
Pueden existir diferentes definiciones para el concepto de estadística. Pero cada definición implica
una recopilación de datos teniendo como objetivo la inferencia.
Entonces, la estadística puede definirse como una teoría de la información que tiene como objetivo
hacer inferencias.
La estadística se relaciona con el método científico, el cual puede definirse como el
conjunto de reglas que señalan el procedimiento para llevar acabo una investigación. Las reglas
más importantes desde el punto de vista estadístico son: Formulación de la hipótesis, obtención
de datos y confrontación de la información obtenida con las hipótesis postuladas.
Terminología
Entidad.
Estará definido por el conjunto de personas, lugares o cosas, en la que se enfoca el análisis
estadístico.
Variable.
Características que describen a las entidades, y en las cuales se esta interesado para una
investigación científica.
Variable aleatoria.
Si la cantidad numérica que toma una variable proviene de factores aleatorios (al azar) y
no es posible predecirlo con anticipación, se dice que la variable es aleatoria.
Población.
En el caso estadístico la población no es un conjunto conformado por personas, como la
población de una ciudad. El termino será utilizado con mayor frecuencia para referirnos a un
conjunto de valores de alguna variable aleatoria relacionada con una entidad. Es decir, la
población puede representar el conjunto mas grande de valores de una variable en la cual se
tiene cierto interés.
Muestra.
Una muestra es una parte de una población, es decir es un conjunto de valores mas
pequeño proveniente de una población.
Estadística Descriptiva
Medidas de Tendencia Central
Supongamos que se tiene un conjunto de observaciones que se obtienen al medir una
característica relevante. Estas mediciones constituyen el conjunto de datos de que disponemos.
Dados dichos datos, tenemos una inclinación natural a buscar una representación de ellos que, de
manera condensada, nos permita tener una idea global de ese conjunto. De aquí surge el concepto
de”Promedio” y, más generalmente el de”Tendencia Central”. Hay desde luego, una multitud de
posibilidades de definir un cierto número que tenga validez como”representante” de todos los
datos.
Media Aritmética.
Esta medida es la más común de las utilizadas para describir una distribución X de
_
frecuencia. La media aritmética de n observaciones de la variable X se denotará por el símbolo X ,
y se define coma la suma de ellas dividida por n. Simbólicamente:
n
X
x
i 1
i
n
Por ejemplo, supongamos que una muestra consta de de las observaciones 7,4,3,2. La media de la
muestra se calcula de la siguiente manera:
4
X 
x
i 1
n
i

7 43 2
4
4
Medidas de Dispersión
La media de un conjunto de mediciones solamente localiza el centro de la distribución de
los datos; por si misma, no ofrece una descripción adecuada de un conjunto de mediciones. Dos
conjuntos de mediciones podrían tener sus distribuciones de frecuencias muy diferentes pero con
la misma media, obsérvese la figura siguiente. La diferencia entre las dos distribuciones de la
figura, se presenta en la variación o dispersión de las mediciones a ambos lados de la media. Una
descripción adecuada de un conjunto de datos requiere de la definición de unas medidas de
variabilidad ( o dispersión) de los datos.
Varianza
La varianza de un conjunto de mediciones y1 , y 2 ,..., y n es la media del cuadrado de las
desviaciones de las mediciones con respecto a su media. Simbólicamente la varianza de la
muestra esta dada por
n
s2 
donde y es la media de la muestra.
 y
i 1
i
 y
n
2
Probabilidad
En el capítulo 1, al discutir el papel de la estadística en la investigación científica, se dijo que
una de sus partes fundamentales, la estadística inductiva, tiene entre sus objetivos el de
cuantificar la incertidumbre que caracteriza a todo proceso de razonamiento en el que se avanza
de lo particular a lo general. Se dijo también que esta cuantificación se realiza mediante la
aplicación de principios probabilísticos. En los capítulos 2,3 y 4 se presentan las técnicas más
usadas de la estadística descriptiva, por medio de las cuales tratamos de encontrar patrones que
caractericen a un fenómeno (tabla de frecuencias y sus presentaciones gráficas) ó cantidades que
sinteticen la información contenida en los datos (medidas de tendencia central y de dispersión). En
estas condiciones, las técnicas de la estadística descriptiva se vuelven de utilidad limitada, puesto
que disponiendo de información sólo sobre una parte del todo queremos extrapolar nuestras
conclusiones hacia un conjunto mayor que es objeto de nuestro interés, por lo que para poder
contestar preguntas con respecto al conjunto llamado población, se hace uso de herramientas que
nos proporciona la estadística, las cuales nos permiten cuantificar al grado de incertidumbre en
nuestra respuesta. La cuantificación se lleva a cabo usando principios probabilísticos. Por esta
razón dedicaremos este capítulo a estudiar las nociones de probabilidad que son indispensables
para comprender los técnicas que presentaremos en los capítulos siguientes.
Inferencia Estadistica
En el capítulo uno se menciono que el objetivo de la estadística es hacer inferencias con respecto a
la población basándose en la información contenida en una muestra. Debido a que las poblaciones
se describen mediante medias numéricas a las que se denominan parámetros, el objetivo de la
mayoría de las investigaciones estadísticas es hacer una inferencia con respecto a uno o mas
parámetros de la población. Generalmente los procedimientos de la inferencia estadística
involucran ya sea la estimación o bien la prueba de hipótesis. En éste capitulo se tratará la
estimación.
El procedimiento de estimación se puede presentar de dos manera distintas: La
estimación puntual, la cual utiliza la información de las muestras para obtener un solo numero o
punto que estima el parámetro de interés. El procedimiento de estimación por intervalo hace uso
de la información de la muestra para obtener dos números que se supone van a incluir el
parámetro de estudio. En cada caso la estimación real se hace mediante un estimador, que es un
regla que establece como utilizar los datos de la muestra para determinar el valor (o valores) que
utilizamos como la estimación puntual (o por intervalo).
Definición.
Un estimador es un regla que establece como calcular una estimación basada en
las mediciones contenidas en una muestra.
Comúnmente el estimador se expresa mediante una formula. Por ejemplo, la media de la
muestra
Y
1 n
 Yi
n i 1
es un posible estimador puntual para la media de la población  .