Download ERRORES EN LOS ANALISIS QUIMICOS

Document related concepts

Precisión y exactitud wikipedia , lookup

Error estándar wikipedia , lookup

Desviación típica wikipedia , lookup

Varianza wikipedia , lookup

Error experimental wikipedia , lookup

Transcript
ESTADÍSTICA
EN QUÍMICA ANALÍTICA
calidadbioquimica.com.ar/error.htm
Gloria María Mejía Z
IMPORTANCIA DE LA ESTADÍSTICA Y
LA QUIMIOMETRÍA EN LA QUÍMICA ANALÍTICA
Durante la realización de una análisis
cuantitativo es muy importante tomar en cuenta
todas las variables que pueden afectar nuestro
resultado, dentro de estos están los factores
provocados por los instrumentos utilizados y los
errores provocados por quien maneja el
material.
En el reporte de cualquier análisis químico,
es importante tomar en cuenta este tipo de
errores , hacer un análisis de los resultados
y así se podrá concluir sobre él.
Gloria María Mejía Z
¿ Qué es estadística?
La estadística es una colección de
métodos
para
planificar
y
realizar experimentos, obtener datos
y luego analizar, interpretar, y formular
una conclusión basada en esos datos.
Es la ciencia encargada de recopilar,
organizar, analizar e interpretar
información numérica o cualitativa, de
manera
que
pueda
llevar
a
conclusiones válidas.
Gloria María Mejía Z
ESTADISTICA
DESCRIPTIVA
Es la ciencia que
recopila, organiza e
interpreta la
información numérica
o cualitativa
INFERENCIAL
Es la ciencia que
interpreta información
de manera que pueda
llevar a conclusiones
válidas.
Gloria María Mejía Z
La Estadística se utiliza como tecnología al
servicio de las ciencias donde la
variabilidad y la incertidumbre forman parte
de su naturaleza.
La Estadística es la Ciencia de la
Sistematización,
recolección,
ordenación
y
presentación de los datos referentes a un fenómeno que
presenta variabilidad o incertidumbre para su estudio
metódico, con objeto de
deducir las leyes que rigen esos fenómenos,
y poder de esa forma hacer previsiones sobre los
mismos, tomar decisiones u obtener conclusiones.
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
Gloria María Mejía Z
DATOS NO AGRUPADOS
• Medidas de
tendencia central
Medidas de
dispersión
Media aritmética
Mediana
Moda
Percentiles
(posición)
Rango (amplitud)
Rango intercuartílico
Varianza
Coef. de variación
Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
6
Gloria María Mejía Z
MAGNITUD
MESURANDO
O MEDIDA
VARIABLE
ANALSIS
• Atributo o propiedad que puede ser medida
• Ejemplos de magnitudes : La longitud, la masa, concentración de una
solución, Absortividad molar volumen de un líquido, absorbancia, etc.
• Magnitud de un objeto específico que estamos interesado en medir
• Es la determinación experimental de la MAGNITUD
• Toda MAGNITUD que permite diferenciar entre si a los componentes
de una población
• Proceso que nos da una información física o química acerca de los
componentes de una muestra
Gloria María Mejía Z
Medidas de tendencia central
• Mediana
– En una serie de datos ordenados (creciente o
decreciente) es la puntuación o valor central de
la distribución estadística
• Datos no agrupados
– Si el nº de datos es impar: valor central
– Si el nº de datos es par: media aritmética de los 2 puntos
centrales
Gloria María Mejía Z
Medidas de tendencia central
• Mediana
– Características
• Menos sensible que la media a la variación de las
puntuaciones.
• Se puede calcular aunque algún intervalo carezca
de límite.
• Más representativa que la media cuando
puntuaciones muy extremas.
Gloria María Mejía Z
Medidas de tendencia central
• Moda
– Valor de la variable que más veces se
repite en una serie estadística (máxima
frecuencia)
• Distribuciones: Unimodales o multimodales
• Marca de clase (en intervalos)
– Características:
• Sencilla de calcular
• Se puede calcular si algún intervalo no tiene límites
• Poco representativa
Gloria María Mejía Z
Medidas de tendencia central
• Media
–Suma de todos los valores de una
variable dividida por el número
total de valores
–Sólo en variables cuantitativas
• X =  xi / N
Gloria María Mejía Z
Medidas de tendencia central
• Media. Cálculo
– Datos no agrupados: aplicar fórmula
– Datos agrupados
• En tabla de frecuencia: Suma de todos los valores
multiplicados por sus frecuencias y dividido por el
nº total.
X =  x i fi / N
Gloria María Mejía Z
Medidas de tendencia central
• Media
– Características
• La media es sensible a la variación de las
puntuaciones.
• No se puede calcular si algún intervalo es de límite
abierto.
• No es recomendable si valores muy extremos
Gloria María Mejía Z
Medidas de dispersión
• Reflejan la dispersión, oscilación de los
datos,
respecto
al
fenómeno
estudiado.
• Complementan las de tendencia
central para la descripción de una
distribución
Gloria María Mejía Z
Medidas de dispersión
• Amplitud o rango
– Diferencia entre el valor más alto y más bajo
de la distribución.
• Ofrece poca información sobre la agrupación de
los datos.
• Indica el “campo de variabilidad”.
• Suele acompañar a la moda.
Gloria María Mejía Z
Medidas de dispersión
• Varianza
– Junto a la desviación típica, la que mejor expresa
la variabilidad del fenómeno
– Media de los cuadrados de las diferencias entre
cada valor de la variable y la media aritmética
•S2 =  (xi – x)2 / N
•S2 =  xi2 / N – x2
– Para datos agrupados:
•S2 =  fi(xi – x) 2 / N
•S2 =  fixi2 / N – x2
Gloria María Mejía Z
Medidas de dispersión
• Desviación típica
– Es la raíz cuadrada de la varianza
•S2 =
 x i2 / N – x 2
– Para datos agrupados:
•S2 =
 fixi2 / N –x2
Gloria María Mejía Z
Medidas de dispersión
• Varianza y desviación típica
– Características
• Ambas toman siempre valores positivos.
• Si todos los datos de una distribución son
iguales entre sí, toman el valor 0.
• Sólo son aplicables a variables cuantitativas
• La que más se suele usar es la desviación típica.
• Si los datos están muy dispersos, la desviación típica será
muy grande.
Gloria María Mejía Z
Medidas de dispersión
• Coeficiente de variación de Pearson
– Para poder comparar la dispersión entre 2
ó más variables entre sí, o una misma
variable en 2 ó más grupos estudiados
– Es una medida relativa: Relaciona la
media con la desviación típica
• CV = S / X . 100
Gloria María Mejía Z
calidadbioquimica.com.ar/error.htm
Gloria María Mejía Z
Gloria María Mejía Z
Gloria María Mejía Z
Gloria María Mejía Z
Gloria María Mejía Z
DISTRIBUCIO DE FRECUENCIAS
• En una distribución de datos estos pueden estar o no
agrupados.
DATOS AGRUPADOS EN INTERVALOS:
DATOS NO AGRUPADOS EN
INTERVALOS:
X
n
Xi
4
3
2
1
0
Xi
4
3
2
1
0
SUPUESTO DE CONCENTRACION EN
EL PUNTO MEDIO (Xi):
X
i
i
n
n X
i i
X
n
ni
1
3
7
6
3
ni
1
3
7
6
3
mitjana=
Gloria María Mejía Z
Xi*ni
4
9
14
6
0
33
33/5=
6,6
Xi
18 20
15 17
12 14
9 11
6 8
3 5
ni
20
30
60
40
30
20
P. M.
19
16
13
10
7
4
mitjanna=
Xi
18-20
15-17
12-14
9-11
6-8
3-5
PM*ni
380
480
780
400
210
80
2330
2330/200=
ni
20
30
60
40
30
20
11,65
¿CUANDO ELEGIR LA MEDIANA EN LUGAR DE LA MEDIA?:
1. CUANDO LA VARIABLE ESTE MEDIDA EN UNA ESCALA ORDINAL.
2. CUANDO HAYA VALORES EXTREMOS, PUES ESTOS DISTORSIONAN LA
INTERPRETACION DE LA MEDIA. EJEMPLO: 3,4,8,5,6,124 Media=25
LA MEDIA ES MUY SENSIBLE A LAS PUNTUACIONES EXTREMAS
3. CUANDO HAYA INTERVALOS ABIERTOS, YA QUE ESTOS CARECEN
DE PUNTO MEDIO.
Gloria María Mejía Z
LAS TRES MEDIDAS DE TENDENCIA CENTRAL COINCIDEN CUANDO LA
DISTRIBUCION ES UNIMODAL Y SIMETRICA (EJEMPLO: DISTRIBUCION
NORMAL).
CUANTO MAS ASIMETRIA, MAS DIFERENCIAS ENTRE ELLAS.
Gloria María Mejía Z
La distribución normal
f(X)
Media
Mediana
Moda
X
• Datos simétricos: coinciden la media, la
mediana y la moda
Gloria María Mejía Z
Propiedades de la distribución
normal:
El área bajo la curva aproximado del promedio μ a
más o menos una desviación estándar (1σ) es de
0.68, a más o menos 2σ es de .0 95 y a más o menos
3σ es de 0.99.
Gloria María Mejía Z
(Las propiedades continuan en la próxima lámina)
Propiedades de la distribución
normal:
La forma de la campana de Gauss depende de los parámetros
μ y σ.
Tiene una única moda que coincide con su media y su mediana.
La curva normal es asintótica al eje de X.
Es simétrica con respecto a su media μ . Según esto, para este
tipo de variables existe una probabilidad de un 50% de observar
un dato mayor que la media, y un 50% de observar un dato
menor.
Gloria María Mejía Z
En resumen
• Podemos concluir que hay una familia de
distribuciones con una forma común, diferenciadas por
los valores de su media y su varianza.
• La desviación estándar (σ ) determina el grado de
apuntamiento de la curva. Cuanto mayor sea el valor
de σ, más se dispersarán los datos en torno a la media
y la curva será más plana.
• La media indica la posición de la campana, de modo
que para diferentes valores de μ la gráfica es
desplazada a lo largo del eje horizontal.
• De entre todas ellas, la más utilizada es la
distribución normal estándar, que corresponde a
una distribución de media 0 y varianza 1.
Gloria María Mejía Z
ERRORES EN LOS ANALISIS
QUIMICOS
• Es imposible efectuar análisis químicos
totalmente
libres
de
errores
o
incertidumbres.
• La fiabilidad de un resultado se analiza de
diferentes maneras
• Se analizan patrones de composición
conocida
• Se aplican pruebas estadísticas a los
datos
Gloria María Mejía Z
En ciencias e ingeniería, el concepto de error
tiene un significado diferente del uso habitual de
este término. Coloquialmente, es usual el
empleo del término error como análogo o
equivalente a equivocación.
En ciencia e ingeniería, el error, está más
bien asociado al concepto de INCERTEZA,
INCERTIDUMBRE, en la determinación del
resultado de una medición.
Gloria María Mejía Z
ERROR: es la medida del sesgo en el resultado de
una medición.
INCERTIDUMBRE: es el intervalo o rango de los valores
posibles de una medida. Incluye tanto los errores
sistemáticos como aleatorios.
La incertidumbre de un resultado es bien diferente de
la precisión, ésta da una medida del error aleatorio.
Error: Es la medida del sesgo en el resultado de una
medición
Incertidumbre: Es el intervalo o rango de los valores
posibles de una medida. Incluye tanto errores aleatorios
como sistemáticos
La incertidumbre de un resultado es bien diferente de
la precisión, ésta da una medida del error aleatorio.
Más precisamente, lo que procuramos en toda
medición es conocer las cotas (o límites
probabilísticos) de estas incertezas.
Gloria María Mejía Z
Errores
Groseros o accidentales
Son errores que son tan
importantes que no existe alternativa
real que abandonar el experimento y
empezar de nuevo por completo.
Aleatorio
Estos provocan que
los resultados
individuales difieran uno
del otro de manera
que caigan a ambos lados
del valor medio.
Estos errores
afectan la precisión
de un experimento.
Este tipo de errores son
los que comete el operador
del instrumento utilizado.
Sistemáticos
Provocan que todos los
resultados
sean erróneos en el mismo
sentido, son demasiado
grandes, y se denomina también
sesgo de la medida. Este tipo
de error es
responsabilidad
del material empleado
y de su origen y presión
de fabricación.
Gloria María Mejía Z
Sistemáticos
• Determinados: Posibles de evitar y o
de corregir. Pueden ser constantes
como pesar en una balanza
descalibrada, o variables.
Aleatorios
• Indeterminados: A menudo se
llaman accidentales. Estos errores
se
evidencian
por
pequeñas
diferencias
en
mediciones
sucesivas.
Gloria María Mejía Z
Errores experimentales
• Error absoluto.-
Nos indica si medimos u obtuvimos
mas o menos que el valor experimental, y en qué cantidad
excedimos del valor real o qué cantidad nos faltó; esto
según el signo de la sustracción.
EA = valor experimental – valor teórico
• Error relativo.- Es una forma de conocer el porcentaje
de error que obtuvimos en nuestros resultados.
ER = (valor experimental – valor teórico) x 100
(valor teórico)
Gloria María Mejía Z
Los errores presentes en un estudio analítico modifican:
• Precisión
Es el grado de confianza con que se puede repetir un
experimento y este puede dar los mismo resultados. Es
utilizado como sinónimo de repetitibilidad.
• Exactitud
Es el grado de concordancia entre el resultado de un
ensayo y el valor de referencia aceptado.
Gloria María Mejía Z
TERMINOS IMPORTANTES
Media, Media aritmética y promedio (X) son
términos sinónimos. Es la medida de tendencia
central mas utilizada .Se obtiene dividiendo la
suma de los valores de una serie y dividiendo
por el numero de medidas del conjunto.
• Mediana es el resultado alrededor del cual se
reparten los demás por igual. Si la serie es un
numero impar la mediana es el numero de la
mitad. Si la serie es un numero par se toma el
promedio del par central después de haber
ordenado la serie de menor a mayor.
TERMINOS IMPORTANTES
• Ejemplo: calcular la media y la mediana
de 10.06, 10.20, 10.08, 10.10.
• Media = X =10.06+10.20+10.08+10.10 = 10.11
4
Mediana = 10.08 +10.10 = 10.09
2
Gloria María Mejía Z
CIFRAS SIGNIFICATIVAS
• Es el numero necesario de dígitos para expresar
los resultados de una medición congruente con
la precisión de medida.
237 :
2 centenas, 3 decenas y
7 unidades
• El numero de cifras significativas
incluye todos los dígitos que se
conocen mas el primer digito incierto.
Gloria María Mejía Z
El
numero
de
cifras
significativas en una medición
es
independiente
de
la
colocación del punto decimal.
Por ejemplo el numero 92.067: Este numero
tiene cinco cifras significativas independiente
dondese coloque el punto decimal. En este
caso el cero si es una cifra significativa.
En el numero 727.0 el cero no se usa para
localizar el punto decimal es significativo
Gloria María Mejía Z
Ejemplos:
0.216
Tres Cifras significativas.
90.7
Tres cifras significativas.
800.0
Cuatro cifras significativas.
0.0670
Tres cifras significativas
Gloria María Mejía Z
TERMINOS IMPORTANTES
Precisión.
• El término precisión describe la reproducibilidad de los
resultados y se puede definir como la concordancia que
hay entre los valores numéricos de dos o más
mediciones que se han realizado de idéntica manera.
La precisión sólo depende
de la distribución
de los errores aleatorios
y no se relaciona
con el valor verdadero ni
con el valor especificado.
Gloria María Mejía Z
PRECISION
• Para describir la precisión de un conjunto
de datos repetidos se utilizan tres
términos muy conocidos:
• La desviación estándar, la varianza y el
coeficiente de variación.
Gloria María Mejía Z
• La desviación estándar (DS/DE) es una
medida de dispersión usada en estadística
que nos dice cuánto tienden a alejarse los
valores puntuales del promedio en una
distribución.
Asi la varianza es la media de los cuadrados de las
diferencias entre cada valor de la variable y la media
aritmética de la distribución. Aunque esta fórmula es
correcta, en la práctica interesa realizar inferencias
poblacionales, por lo que en el denominador en vez
de n, se usa n-1
Gloria María Mejía Z
TERMINOS IMPORTANTES
• METODOS ABSOLUTOS PARA EXPRESAR LA PRECISION
• Desviación estándar S=
Xi-X
n-1
• Desviación respecto a la media
es la diferencia
numérica entre un valor experimental y la media
• Varianza: S2
• Coeficiente de variación. C.V = S/Media *100
Gloria María Mejía Z
TERMINOS IMPORTANTES
• Desviación estándar relativa (DER) : se
calcula al dividir la desviación estándar
entre la media del conjunto de datos.
• DER se expresa en partes por mil o en %.
• DER * 100% = CV.
• Dispersión (W): Es la diferencia entre el
valor mas alto y el valor mas bajo del
conjunto
Gloria María Mejía Z
TERMINOS IMPORTANTES
• EXACTITUD : El término denota el grado
de coincidencia del resultado de una
medición con el valor verdadero o
aceptado de la misma y se expresa en
función del error. La exactitud implica una
comparación con el valor verdadero o
aceptado como tal.
• Cuando no se conoce el valor verdadero
se debe usar un valor aceptado.
Gloria María Mejía Z
TERMINOS IMPORTANTES
• METODOS PARA MEDIR LA EXACTITUD
• Error absoluto: Es la diferencia entre el valor
experimental y el valor real.
• Error relativo: Es el error absoluto dividido por la
cantidad medida.
• Ejemplo:
• Una muestra tiene 20.34% de Fe y un analista
encuentra que es 20.44%.
• Error Absoluto = 20.44-20.34 = 0.10%
• Error relativo = 0.1/20.34 = 0.0049 = 4.9 partes por
mil
Gloria María Mejía Z
TERMINOS IMPORTANTES
• En términos generales la exactitud
supone una comparación con un valor
verdadero o aceptado como tal, la
precisión indica la concordancia entre las
medidas que han sido realizadas de una
misma forma.
Gloria María Mejía Z
Esquema gráfico para comprender la
relación entre exactitud y precisión
www.galeon.com/scienceducation/error00.htm
En C existe buena precisión, pero no buena exactitud;
en A buena exactitud y precisión, y en B mala exactitud
y precisión.
Gloria María Mejía Z
Diagrama precisión y exactitud
Gloria María Mejía Z
EVALUACION DE LOS DATOS ANALITICOS
• ESTUDIANTE
RESULTADOS
DE UNA TITULACION
A
10.08
10.11
10.09
10.10
10.12
B
9.88
10.14
10.02
9.80
10.21
C
10.19
9.79
9.69
10.05
9.78
COMENTARIO
Preciso pero
inexacto
Exacto pero
impreciso
Inexacto e
impreciso
Gloria María Mejía Z
EVALUACION DE LOS DATOS ANALITICOS
• ESTUDIANTE
D
RESULTADOS
DE UNA TITULACION
10.04
9.98
10.02
9.97
10.04
COMENTARIO
EXACTO Y
PRECISO
Gloria María Mejía Z
TIPOS DE ERRORES EN DATOS
EXPERIMENTALES
ERRORES
• Bruto
Ocurre de manera
Ocasional . suele ser
Grandes. Dan como
resultado valores
atípicos que difieren
mucho de los demás.
Aleatorios
Sistemáticos
- = indeterminados
- = determinados
-Afectan la presicion
- Afectan la exactitud
o la reproducibilidad o sea la proxim al valor
verdadero.
- Los resultados caen - Todos los resultados
a lado y lado de la X
son erróneos en el
mismo sentido.
Gloria María Mejía Z
ERRORES DETERMINADOS O SISTEMATICOS
FUENTES DE ERRORES
SISTEMÁTICOS
• Errores instrumentales: Calibraciones deficientes
• Errores del método: Dificiles de identificar
• Errores personales: Descuido, Falta de atención
Gloria María Mejía Z
EFECTO DE LOS ERRORES SISTEMATICOS
EN LOS RESULTADOS ANALITICOS
• Los errores sistemáticos pueden ser constantes o
proporcionales
• En los errores constantes el error absoluto es invariable
con el tamaño de la muestra ,mientras el error relativo
cambia al modificar dicho tamaño.
• Los errores proporcionales aumentan o disminuyen
según el tamaño de la muestra. Con los errores
proporcionales el error absoluto varia con el tamaño de
la muestra, en cambio el error relativo permanece
constante.
Gloria María Mejía Z
EFECTO DE LOS ERRORES SISTEMATICOS
EN LOS RESULTADOS ANALITICOS
• Los errores sistemáticos pueden ser constantes
o proporcionales.
• En los errores constantes, el error absoluto es
invariable con el tamaño de la muestra, mientras
en el error relativo cambia al modificar el
tamaño de la muestra.
• Los errores proporcionales aumentan o
disminuyen según el tamaño de la muestra; con
estos errores el error absoluto varia con el
tamaño de la muestra en cambio el error relativo
permanece constante.
Gloria María Mejía Z
EVALUACION DE LOS DATOS
ANALITICOS
KAl(SO4)2.12H2O Al2O3 Al2O3
g tomados
g
Encontrados
tomados con el NH3
almacenado
1
0.1077 0.1288
2
0.2154 0.2384
3
0.3231 0.3489
4
0.4308 0.4588
Diferencia Al2O3
en g
Encontrados
con el NH3
Nuevo
0.0211 0.1087
0.0230 0.2187
0.0258 0.3258
0.0280 0.4352
Diferencia
en g
0.001
0.0024
0.0027
0.0044
Gloria María Mejía Z
EVALUACION DE LOS DATOS
ANALITICOS
• Los errores ocasionados por el amoniaco
envasado durante mucho tiempo fueron
constantes por que se utilizo el mismo
volumen y el aporte de Si fue el mismo. El
NH3 del envase recién utilizado fueron
muy pequeños y proporcionales al tamaño
de muestra.
Gloria María Mejía Z
ERRORES ALEATORIOS
• Son la principal fuente de incertidumbre
en una determinación.
• Muchas variables no controladas y de no
fácil
identificación
causan
errores
aleatorios.
• El
efecto
acumulativo
de
las
incertidumbres, aunque estas sean muy
pequeñas, hace que las mediciones por
duplicado de una serie fluctúen al azar.
Gloria María Mejía Z
FUENTES DE LOS ERRORES
ALEATORIOS
Los errores aleatorios obedecen una curva
normal de error o curva de gauss.
meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm
Gloria María Mejía Z
meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm
Gloria María Mejía Z
Distribución normal
• Al iniciar el análisis estadístico de una
serie de datos, y después de la etapa de
detección y corrección de errores, un
primer paso consiste en describir la
distribución de las variables estudiadas y,
en particular, de los datos numéricos.
• Un modo es con la curva de distribución
normal que muestra la frecuencia con que
se repiten los datos.
Gloria María Mejía Z
TRATAMIENTO ESTADISTICO DEL ERROR
ALEATORIO
• Los métodos estadísticos permiten categorizar y
caracterizar los datos, y tomar decisiones
objetivas en cuanto a su calidad e
interpretación.
• Hay que diferenciar entre muestra y población o
universo. ( caso del análisis de Ca en agua. La
población seria un numero de medidas muy
grande cercano al infinito).
• Las leyes de la estadística se dedujeron para
usarlas en poblaciones. Para aplicarlas a
muestras se debe hacer ajustes.
Gloria María Mejía Z
TRATAMIENTO ESTADISTICO DEL
ERROR ALEATORIO
•
Las curvas gaussianas se pueden
representar por medio de una ecuación
que tiene la media de la población µ, y la
desviación estándar de la población σ.
•
La media de la población es µ y la media
de la muestra es X.
Gloria María Mejía Z
Gloria María Mejía Z
Gloria María Mejía Z
EVALUACION DE METODOS
ANALITICOS
• Ejemplo 2.
•
•
•
•
•
•
La N de una solución se calculo con 4
titulaciones por separado y los resultados fueron 0.2041,
0.2049, 0.2039, y 0.2043. Calcular la X, la Mediana, El
rango , La S. la desviación relativa y el C.V.
X = (0.2041+0.2049+0.2039+0.2043)/4 = 0.2043
Mediana M= (0.2041+0.2043)/2 = 0.2042
Rango R = 0.2049-0.2039 = 0.001
La desviación relativa= Sumatoria de (Xi-X)/4=0.0003
S= 0.0004
C.V = (0.0004/0.2043)*100 = 0.2%
Gloria María Mejía Z
Gloria María Mejía Z
PRESENTACION DE LOS DATOS CALCULADOS
• Siempre es necesario indicar el nivel de
confianza de los datos.
• Es un rango de valores en los que con
una probabilidad determinada está un
valor verdadero poblacional.
• Generalmente son del 95% o 99%.
• La probabilidad de equivocarnos se llama
nivel de significancia y se simboliza α
Gloria María Mejía Z
PRUEBA DE SIGNIFICANCIA
• Se utiliza para comparar el resultado de
un análisis realizado por dos métodos
diferentes. Se trabaja con las X
• Se aplica el T de student. Plantea la
hipótesis de que las dos X son iguales. La
prueba T da una respuesta si o no a la
hipótesis nula con cierta exactitud como
del 95 o 99%
Gloria María Mejía Z
Prueba de significancia
• t = X1 – X2
S
n1n2
n1+n2
Si t calculado es mayor que t de la tabla
entonces los dos métodos son iguales
Para poder calcular t hay que calcular
primero la s de cada serie de datos
Gloria María Mejía Z
• Cuando se escoge el nivel de
significación 0,05 (ó 5%),
tenemos un 95% de confianza
de que hemos adoptado la
decisión correcta y una
probabilidad 0,05 de ser falsa.
Gloria María Mejía Z
Cómo determina si un valor es realmente un
valor atípico y cómo decide si debe continuar
o no con el análisis de datos?
Uno de los problemas en el análisis de datos es
manejar los valores atípicos dentro de un grupo
de datos.
Un valor atípico es una observación con un valor
que no parece corresponderse con el resto de los
valores en el grupo de datos.
Por lo general surgen dos preguntas:
1)¿Es este valor realmente un valor atípico?
2)¿Puedo eliminar este valor y continuar con el
análisis de datos?
Gloria María Mejía Z
DATOS ATIPICOS
Con respecto a la pregunta 2, debe saberse
que las pruebas estadísticas se utilizan
para identificar valores atípicos, no para
retirarlos del grupo de datos.
Técnicamente, una observación no debe
retirarse a menos que una investigación
halle una causa probable para justificar
esta acción
Gloria María Mejía Z
DATOS ATIPICOS
Si en la investigación no se encuentra una causa
probable, ¿qué debe hacerse?
Un enfoque sería realizar un análisis de datos con
el valor atípico y sin él. Si las conclusiones son
diferentes, entonces se considera que el valor
atípico tiene influencia y esto debería indicarse
en el informe.
Otra opción es utilizar estimadores rigurosos para
caracterizar los grupos de datos, tal como la
mediana de la muestra en lugar de la media.
Gloria María Mejía Z
RECHAZO DE DATOS
• Dos de las pruebas estadísticas utilizadas
con mayor frecuencia en un grupo de
datos son la prueba de Dixon y la prueba
de Grubbs.
• La prueba de Dixon utiliza relaciones de
las diferencias entre datos que parecen
atípicos comparados con los valores del
grupo de datos.
Gloria María Mejía Z
RECHAZO DE DATOS
• Estas técnicas están diseñadas para detectar un
único valor atípico en un grupo de datos, y por
lo tanto no son adecuadas para la detección de
múltiples valores atípicos.
• Una técnica rigurosa y amplia para identificar
eficazmente múltiples valores atípicos es el
procedimiento para muchos valores atípicos con
generalización extrema de la desviación de
Student.
Gloria María Mejía Z
DIXON
Por ejemplo, tomemos los datos 5.3, 3.1,
4.9, 3.9, 7.8, 4.7 y 4.3
Ordenando los datos:
3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8
El tamaño de la muestra es 7, y la relación utilizada es el espacio
entre el valor atípico (7.8) y su vecino más próximo (5.3) dividido
por el espacio entre los valores más grandes y más pequeños en
el grupo.
Por lo tanto, el índice de Dixon es:
(7.8 – 5.3)/(7.8 – 3.1) = 2.5/4.7 = 0.532
Gloria María Mejía Z
RECHAZO DE DATOS
Este valor se compara con un valor crítico de una tabla, y
el valor se declara valor atípico si supera ese valor
crítico.
Si Dcalculado>Dtabulado se rechaza el dato
El valor tabulado depende del tamaño de la muestra, n, y
de un nivel de confianza elegido, que es el riesgo de
rechazar una observación válida. La tabla por lo general
utiliza niveles de baja confianza tal como 1% o 5%.
Para un n = 7 y un riesgo del 5%, el valor en la tabla es
0.507. El índice de Dixon 0.532 excede este valor crítico,
indicando que el valor 7.8 es un valor atípico.
Gloria María Mejía Z
DIXON
La prueba de Dixon se usa en un número
pequeño de observaciones (menor a 26) y
detecta elementos que se encuentren
sesgados o que son extremos.
Para aplicar la prueba de Dixon se
requiere de un número de observaciones
igual o mayor a 10. En el caso que las
observaciones sean menores a 10 se
utiliza como valor esperado el valor de
preparación.
Gloria María Mejía Z
GRUBBS
La prueba de Grubbs utiliza una estadística
de prueba, T, que es la diferencia absoluta
entre el valor atípico, XO, y el promedio de
la muestra (X)
dividida por la desviación
estándar de la muestra, s.
Para el ejemplo anterior, el promedio de la
muestra es = 4.86 y la desviación estándar
de la muestra es = 1.48. La estadística
calculada de la prueba es:
Gloria María Mejía Z
GRUBBS
Para un n = 7 y un riesgo del 5%, el valor
tabulado es 1.938 y el TCalculado = 1.99
excede este valor crítico, indicando que el
valor 7.8 es un valor atípico.
Gloria María Mejía Z
TEST DE GRUBB PARA DATOS
SOSPECHOSOS
Recomendado por las normas ISO
G= Valor Sospechoso – X
S
(Con el valor sospechoso incluido)
Si Gcalculada > Gtabulada el valor sospechoso se rechaza
Gloria María Mejía Z
TEST Q DE DATOS SOSPECHOSOS
Aceptar o rechazar un resultado anómalo (outlier)
Normalmente se producen al cometer errores o fallos
en la metodología aplicada.
Se ordenan los datos en forma creciente y se calcula Q
Q = desvío = Diferencia entre el dato sospechosos y su vecino más cercano
recorrido Diferencia numérica entre el dato de mayor valor y el de menor valor
Si Qcalculada > Qtabulada el dato se rechaza
Gloria María Mejía Z
Ejemplo:
Al efectuar una serie de réplicas para determinar la
concentración del ión sulfato en una muestra de agua
para riego se obtuvieron los siguientes resultados.
Determinar si la medida 6.0 es un valor rechazable.
Medida Valor
1
5.0
2
5.2
3
5.5
4
5.6
5
6.0
1. Se ordenan los datos en orden de valor
decreciente
6.0, 5.6, 5.5, 5.2, 5.0
2. Se calcula Q
Q= (6.0-5.6)/ (6.0-5.0) =0.40
3. Se compara Q calculado con Q tabulado
para 5 medidas y un nivel de confianza del
90. Qtab=0.64
0.40<0.64, luego el valor 6.0 no es
rechazable
Gloria María Mejía Z
DESCARTE DE DATOS
1.
Definir que tan grande es la Diferencia entre el valor
sospechoso y los otros datos.
2. Aplicar Prueba Q.
a) Ordenar los datos
b) Calcular el rango
c) Encontrar la diferencia entre el resultado sospechosos
y su vecino mas cercano
3. Dividir la diferencia obtenida en el paso 2 entre el
Rango. Así se obtiene el coeficiente de descartacion
Q.
4. Consultar la tabla de valores Q. Si el valor calculado es
mayor que el de latabla el resultado se puede
descartar con un 90% de confianza de que si se podia.
Gloria María Mejía Z
Gloria María Mejía Z
DESCARTE DE DATOS
• EJEMPLO
• 4 Resultados de N de una solución fueron
0.1014, 0.1012, 0.1019, 0.1016. Se podrá
descartar 0.1019?
• X sin el 0.1019 = 0.1014
0.1019-0.01014 =0.0005
• Q = 0.1019 - 0.1016 =0.43
0.1019 – 0.1012
• 0.43 es menor que 0.76. NO SE DESCARTA
Gloria María Mejía Z
Gloria María Mejía Z
PRESENTACION DE LOS DATOS
CALCULADOS
• Un indicador de la calidad de los datos es
la utilización de las cifras significativas.
• Cifras significativas: Son todos los dígitos
que se conocen con certeza y el primer
digito incierto. Por ejemplo 30.24 tiene 4
cifras significativas (4, el ultimo digito, es
incierto)
Gloria María Mejía Z
PRESENTACION DE LOS DATOS
CALCULADOS
• El cero puede ser significativo o no según
su ubicación en el numero. Un cero
rodeado por otros dígitos siempre es
significativo.
• Los ceros al final pueden o no ser
significativos. 2.0 tiene dos cifras
significativas. 2000 tiene una cifra
significativa. 2x103 tiene una.
Gloria María Mejía Z
PRESENTACION DE LOS DATOS
CALCULADOS
• Para las sumas y las restas el resultado debe
tener el mismo numero de decimales que el
numero que tiene menos decimales.
• Cuando se suman o restan números con
notación científica se debe expresar el
resultado en la misma potencia de 10.
• En la multiplicación y la división se debe
expresar el resultado con las cifras
significativas del numero que tenga menor
cifras significativas.
Gloria María Mejía Z
PRESENTACION DE LOS DATOS
CALCULADOS
• Redondeo de datos:
• Se debe aproximar al numero mayor si el ultimo
es mayor de 5 y al menor si el ultimo es menor
de 5.
• 61.555 se aproxima al numero par mas cercano
. Queda 61.56
• De todas maneras el resultado debe expresarse
con la desviación estándar calculada.
Gloria María Mejía Z
OBJETIVOS DEL MUESTREO
• Estadísticamente los objetivos del proceso
de muestreo son:
• 1. Obtener el valor medio
• 2. Obtener una varianza que sea una
estimación de la varianza poblacional con
limites de confianza validos para la media.
Gloria María Mejía Z
VALIDACION DE METODOS ANALITICOS
Calidad de resultados
•
•
•
•
•
•
•
Selectividad Analito en medio de interferencias
Limite de detección Promedio de bcos +3(desviación)
Limite de cuantificación 5 ò 10 L.D.
Intervalo de trabajo Rango en que el método es exacto y preciso.
Rango lineal
Exactitud. Valor de referencia
Precisión Desviación y CV
• Sensibilidad Pendiente
• % Recuperación. Adición de cantidades conocidas
• GRÁFICOS DE CONTROL.
Gloria María Mejía Z
VALIDACION DE METODOS ANALITICOS
•
•
•
•
•
•
Curvas de calibración
Linealidad
Pendiente
Sensibilidad
Residuales
Coeficiente de correlación
Gloria María Mejía Z
VALIDACION DE METODOS
ANALITICOS
• Curvas
de
calibración:
Cuadrados
• Modelo de regresión: Y=mx+b
Mínimos
• Cuanto mas cercanos están los datos a la
línea que se obtiene del análisis por
mínimos cuadrados, menores son los
residuales
Gloria María Mejía Z
VALIDACION DE METODOS
ANALITICOS
• Variables transformadas.
• Transformaciones para linearizar las
funciones.
Gloria María Mejía Z