Download funciones de densidad de probabilidad

Document related concepts

Distribución normal wikipedia , lookup

Distribución log wikipedia , lookup

Distribución normal multivariante wikipedia , lookup

Clasificador bayesiano ingenuo wikipedia , lookup

Función de densidad de probabilidad wikipedia , lookup

Transcript
FUNCIONES DE
DENSIDAD DE
PROBABILIDAD
Alumno: Medina Vieyra F. Javier
Cálculo II







La función de densidad se utiliza en la ciencia estadística con el
proposito de conocer cómo se distribuyen las probabilidades de un
evento en relación al resultado del evento. En este caso se llama
función de densidad de probabilidad.
Matemáticamente la FDP (función densidad de probabilidad) es la
derivada de la función distribución de probabilidad.
Y las propiedades de FDP (a veces visto como PDF del inglés) son:
FDP(x) 0.
La integral de FDP(x) en el rango especificado para la función,
siempre es 1.
Algunas FDP están declaradas en rangos de a , como la de la
distribución normal
En la siguiente imagen se puede ver el aspecto de la gráfica de la
función de densidad para la distribución Norma N(0,1)
La función de densidad de
probabilidad normal





Es bien conocido que el clasificador de Bayes minimiza la
probabilidad de error de clasificación. Recordando la
regla de clasificación de Bayes,
Seleccionar si P(| X) > P(| X) para toda j i.
o de otra forma,
Seleccionar si P(X|) > P(X|) para toda j i.
esta regla está determinada por la función de densidad
de probabilidad, p (X|). Así, suponiendo conocidas las
probabilidades a priori, el cálculo de la densidad de
probabilidad es un requisito indispensable para poder
clasificar por esta regla cualquier patrón X y si se conoce
la forma funcional de P(X|) el problema es trivial.





Entre las funciones de densidad de probabilidad, la función de densidad normal
(gaussiana) es la más tratada en la Literatura por su tratabilidad analítica y sus
interesantes propiedades. Algunas de ellas son:
Parámetros que especifican la distribución. La función de densidad normal
queda completamente especificada por pocos parámetros. En el caso unidimensional,
bastan únicamente dos parámetros: la media y la varianza. En el caso
multidimensional, el vector medio y la matriz de covarianza.
Incorrelación e independencia. Dado un conjunto de patrones que siguen una
distribución normal, si las variables asociadas están incorreladas, entonces son
independientes.
Justificación física. La suposición de normalidad es una aproximación razonable
para la mayor parte de los datos tomados de la Naturaleza. Esto es cierto, en
particular, para variables aleatorias que son suma de otras variables y el teorema
central del límite puede aplicarse.
La función de densidad normal es acertada en situaciones en las que un conjunto de
patrones de una determinada clase toman valores en un rango contínuo y alrededor
de un patrón promedio. Esto es, considera que los patrones de clases diferentes
tienen distintos valores pero los valores de los patrones de una clase son lo más
parecidos posible.




4.
Densidades marginales y condicionadas. Las densidades marginales y
condicionadas de una distribución normal son también normales.
5.
Invarianza frente a transformaciones lineales. La distribución que
sigue cualquier combinación lineal de una variable aleatoria normal es
también normal (con diferentes parámetros). Además, siempre es posible
encontrar una transformación lineal y no singular que hace que la nueva
matriz de covarianza sea diagonal, esto es, siempre puede encontrarse,
para una distribución normal, un nuevo conjunto de ejes tal que las nuevas
variables son independientes en este nuevo sistema.
Esta propiedad es particularmente interesante cuando se aplican
transformaciones lineales a los datos, con objeto de resaltar algunas
características que se ponen de manifiesto con estas transformaciones.
Además, desde un punto de vista práctico (dada su tratabilidad analítica) la
relación calidad-costo de la clasificación es mucho mejor que con otros
modelos más complejos y los clasificadores diseñados bajo esta suposición
son clasificadores robustos.
La función de densidad de
probabilidad normal unidimensional





La forma de funcional de la función de densidad de
probabilidad normal para una variable es la siguiente:
P (x| ) = exp - (1)que inidica la probabilidad de que,
asumiendo que la clase cierta sea , el patrón observado
tenga el valor x. En la ecuación 1,
= E [ x| ] es la media de la clase i.
= E [ (x - )2| ] es la varianza de la clase i.
La función de densidad de probabilidad normal
(unidimensional) está completamente especificada por
dos parámetros: y . Por simplicidad, la ecuación 1 se
suele abreviar por P (x| )N(,).

En la figura 2 representamos tres funciones de densidad
de probabilidad normales de media 0 y varianzas: 0.15,
1 y 2. Observar la forma simétrica y de ``campana'' que
caracteriza a estas funciones. Recordar que el área bajo
cada campana es 1 por lo que, informalmente hablando,
las campanas bajas serán anchas mientras que las
campanas estrechas serán altas. La ``anchura'' de las
campanas está en relación inversa con el valor de la
varianza: a menor varianza, los datos estarán más
concentrados alrededor de la media y por lo tanto, la
probabilidad de encontrar un valor cercano a la media
aumenta: la altura de la campana es mayor.

Una propiedad interesante y útil de la función de densidad normal es la siguiente: el
área bajo la curva de la función de densidad de probabilidad normal puede calcularse
de forma precisa según el número de desviaciones típicas
Areas bajo la curva de la fdp gaussiana en función del número de desviaciones
típicasEste valor indica la proporción de la población que se encuentra en
determinados intervalos centrados en la media. Así, si es el valor medio y es la
desviación típica,








El 68.3% de las observaciones están en el intervalo [ - , + ].
El 95.4% de las observaciones están en el intervalo [ - 2, + 2].
El 99.7% de las observaciones están en el intervalo [ - 3, + 3].
En la práctica, y son desconocidos y deben estimarse a partir de los
prototipos de la clase . En la literatura pueden encontrarse
diferentes estimadores para estos parámetros. Nosotros utilizaremos
los siguientes estimadores, que tienen la propiedad de no estar
sesgados:
= xj (2)
= (xj-)2 (3)donde:
Ni es el número de prototipos de la clase i.
xj es el j-ésimo prototipo de la clase i.
La función de densidad de probabilidad
normal multidimensional







La forma de funcional de la función de densidad
de probabilidad normal para d variables es una
extensión directa de la expresión dada en la
ecuación 4:
P (X|) = exp - (X-)T (X-) (4)donde:
= E [ X| ] es el vector medio de la clase i,
= E [ (X - )(X - )T| ] es la matriz de
covarianza de la clase i,
|| es el determinante de ;/DD>
es la matriz inversa de ,
(X - )T es el vector traspuesto de (X - ).


La función de densidad de probabilidad
normal multivariante está completamente
especificada por los parámetros recogidos
en y . Por simplicidad, la ecuación 4 se
suele abreviar por P (X| )N(,).
En la figura 4 mostramos la representación
de una función de densidad de
probabilidad normal para un conjunto de
patrones bidimensionales


En la práctica, los parámetros que
definen la distribución,
=
= son desconocidos y deben
estimarse a partir del conjunto de
prototipos.