Download Metodología observacional

Document related concepts

Coeficiente kappa de Cohen wikipedia , lookup

Paradoja del observador wikipedia , lookup

Fiabilidad (psicometría) wikipedia , lookup

Principio de relatividad wikipedia , lookup

Kappa Aquilae wikipedia , lookup

Transcript
Metodología observacional
E
L método de observación pretende recoger el significado de una conducta,
evitando su manipulación, a través del sistema de observación más adecuado
(Anguera, 1983a). No existe manipulación (a diferencia de la metodología
experimental y cuasi-experimental) de la conducta pero sí control de las posibles
variables extrañas que distorsionarían los datos. Con dicho control se pretende que la
variable o variables independientes sean las únicas responsables directas de los valores
de la o las variables dependientes.
El grado de control que el investigador puede lograr de la situación a observar depende
en gran medida de la situación de observación: ambiente natural / ambiente de
laboratorio. En el primer caso la conducta a estudiar ‘forma parte’ del repertorio de
respuestas del sujeto mientras que en el ambiente de laboratorio (también llamado
‘método de análogos’) la conducta ‘se produce’ en un entorno totalmente diferente,
existiendo una cierta manipulabilidad de la misma.
En las situaciones artificiales de laboratorio se crean situaciones análogas que requieren
que el sujeto responda a estímulos que simulan a aquellos que se podrían encontrar en el
ambiente natural. El sujeto tiene que desempeñar el papel que se le adjudica como si se
encontrara en la situación propuesta por el investigador, incrementándose la validez
interna del estudio en comparación con los estudios en ambiente natural. A pesar de
ello, se recomienda utilizar la situación artificial solamente cuando es totalmente
imposible recoger las mediciones en ambiente natural (Anguera, 1983b).
Cuando llevamos a cabo un estudio con metodología observacional es necesario que el
investigador complete las tres fases siguientes:
 observar la conducta-foco u objeto del estudio, elaborando las correspondientes
categorías de las conductas
 categorizar la conducta para poder ser medida mediante el sistema de códigos o
categorías que se ha desarrollado en la fase anterior y
 realizar el análisis de los datos registrados
La cumplimentación de estas fases permite obtener un conocimiento fiable y válido de
las conductas observadas, recogiendo información sobre la frecuencia y periodicidad de
los fenómenos y asegurando así la representatividad de los datos en unas condiciones
concretas de muestra y ambiente. A diferencia de la metodología experimental, no trata
de encontrar leyes causales (Riba, 1991).
Los indicadores básicos que se utilizan en la metodología observacional se basan en la
medición de la frecuencia y la duración de la conducta especialmente y su latencia e
intensidad (Carreras, 1991). El registro puede ser continuo o completo, cuando el
observador anota la ocurrencia de las diferentes categorías a lo largo de toda la sesión
de observación, o discontinuo. En este último caso, el observador registra las categorías
77
78
Metodología observacional
en determinados momentos de la sesión de observación establecidos a priori (Bakeman
y Gottman, 1986).
El tipo de soporte o instrumento utilizado para la recogida de los datos está conexionado
con la metodología aplicada (Losada, 1993). Dentro del ámbito de la metodología
experimental, el laboratorio y las ‘máquinas de medir’ constituyen las dos piezas claves
para la medición. La metodología cuasi experimental suele basar la recogida de datos en
los cuestionarios, entrevistas y encuestas y la metodología observacional requiere del
‘observador’ apoyado por instrumentos mecánicos (sistemas de codificación y plantillas
de registros) y tecnológicos (soportes magnéticos como magnetófono, vídeo, foto y
memorias portátiles).
Un claro ejemplo de sistema de codificación (Blanco y Anguera, 1991) lo constituye el
sistema de Kent, O´Leary y Broderick (citado en Losada, 1993). Este sistema tiene
como objetivo básico identificar ciertas conductas disruptivas del niño en el aula y así
poder perfilar ciertos objetivos de intervención. Los registros se refieren a la conducta
del niño en clase y durante la realización de una prueba. Este sistema de codificación
requiere un proceso de categorización de las conductas logrado a través de un sistema
de categorías que permita registrar las conductas-foco con un alto grado de
sistematización.
Estimación de la fiabilidad de datos
observacionales
La utilización de instrumentos de observación supone hablar de fiabilidad de los datos
observacionales obtenidos, no circunscribiendo el término al instrumento en sí mismo.
La fiabilidad del instrumento permite conocer la calidad de las mediciones llevadas a
cabo (Anguera, 1990). Se considera que es fiable si hay pocos errores de medida, si
existe estabilidad, consistencia y dependencia en las puntuaciones individuales de las
características evaluadas (Blanco, 1989).
Los resultados originados a través de la aplicación de instrumentos de medición
requieren la comprobación de su fiabilidad como producto de la utilización de un
sistema de registro dado, de un observador determinado y de unas condiciones
ambientales específicas. La fiabilidad de los datos depende así de muchos factores y no
sólo del propio sistema de registro empleado (Suen y Ary, 1989). La estimación del
acuerdo en los registros de observadores simultáneos facilita una medida de la
fiabilidad existente (Anguera, 1983a).
El cálculo repetido de las propiedades psicométricas del instrumento de observación se
convierte en tarea obligada para cada conjunto de datos obtenidos, dado que el factor
humano-observador requiere un continuo control de la calidad de sus registros. Dicho
factor no es un elemento fijo del instrumento ya que va cambiando en función de la
persona encargada del registro e incluso para un observador dado la eficacia de los datos
recogidos puede variar de sesión a sesión de observación. Por ello, es recomendable
realizar evaluaciones periódicas de la fiabilidad de las observaciones realizadas aunque
los observadores ya sean expertos en el manejo del instrumento de observación.
78
Coeficientes de fiabilidad
79
Cuando un investigador decide aplicar un método de recogida de datos basado en la
observación, es necesario llevar a cabo en primer lugar un entrenamiento de
observadores con el fin de que sean expertos en el registro de los datos, asegurando la
calidad y objetividad de la información proporcionada por dicha metodología.
Para garantizar la certeza de los registros se suele estimar la similitud de los juicios
emitidos por al menos dos observadores expertos que observan simultáneamente una
misma situación o también la proximidad del registro de un único observador en
relación a una plantilla estándar que se considera que recoge la codificación del
instrumento con alta perfección. Estos acuerdos o correlación entre las observaciones
realizadas de una misma situación se reseñan como estimación de la fiabilidad y
proporcionan la base para afirmar que los registros realizados son el producto replicable
del proceso de observación utilizado y no del juicio idiosincrásico de los observadores.
Se considera que existe acuerdo entre dos o más observadores cuando al observar una
situación dada coinciden en la codificación de presencia o ausencia de una determinada
conducta, código o categoría.
Existe un amplio número de índices que permiten estimar la fiabilidad de datos
observacionales. Por ejemplo, Berk (1979) describe 16 diferentes índices de acuerdo
entre-observadores mientras que Blanco (1993) presenta 22. Sin embargo, es
conveniente señalar que muchos de ellos se solapan en sus indicaciones. Los
coeficientes de fiabilidad entre observadores más utilizados por los investigadores se
presentan a continuación, destacando por su mayor frecuencia de uso el porcentaje de
acuerdo entre observadores y especialmente el coeficiente kappa de Cohen (1960).
Coeficientes de fiabilidad
Existe una amplia variedad de métodos para computar la fiabilidad de datos nominales.
La elección del método constituye una labor cuidadosa por parte del investigador ya que
determinará la confianza de las conclusiones obtenidas. Partiendo de la idea de que la
fiabilidad es una medida de la similitud de los registros observacionales realizados en
un momento determinado, se van a tratar diferentes coeficientes junto con sus
características más destacadas.
Si dos observadores observan una misma conducta, los datos obtenidos pueden ser
representados por medio de una tabla de doble entrada con j filas y k columnas. Los
códigos recogen información no ordinal. En la Figura 27 se representa en una matriz
2  2 las posibilidades de acuerdo / no acuerdo entre ambos observadores. En dicha
matriz se observa el registro realizado por cada observador como presencia (conducta
presente) o ausencia (conducta ausente) del código que se está analizando. Vamos a
suponer que el investigador desea analizar la fiabilidad entre observadores al codificar
la presencia o ausencia de una determinada variable o conducta.
 La celdilla A representa la frecuencia con que los dos observadores están de acuerdo
en registrar presencia del código que recoge la variable objeto de estudio.
 La celdilla D representa el acuerdo de ausencia del código o no ocurrencia.
79
80
Metodología observacional
 La celdilla B representa aquellos casos en los que el observador 1 registra presencia
del código pero el observador 2 registra ausencia.
 Y la celdilla C representa el caso contrario, es decir, cuando el observador 1 registra
ausencia y el observador 2 presencia del código.
Observador 1
Conducta
presente
Observador 2
Conducta
ausente
NO ACUERDO
Conducta
presente
A
C
P2
Conducta
ausente
B
D
A2
ACUERDO
P1
Frecuencia total de observación del código
A1
N=A+B+C+D
Frecuencia de presencia de conducta registrada por el observador 1
P1=A+B
Frecuencia de presencia de conducta registrada por el observador 2
P2=A+C
Frecuencia de ausencia de conducta registrada por el observador 1
A1=C+D
Frecuencia de ausencia de conducta registrada por el observador 2
A2=B+D
Figura 27 Matriz de acuerdo / no acuerdo para dos observadores con registro
simultáneo
La matriz obtenida permite observar los acuerdos y desacuerdos producidos entre los
dos registros aportados por los observadores. Para poder completar la matriz es
necesario definir previamente qué es lo que se considera acuerdo y qué se considera noacuerdo (Bakeman y Gottman, 1986). En general, los propios sistemas o instrumentos
de observación ya reflejan tal tipo de decisiones.
Una vez conocida dicha matriz ya es posible calcular el coeficiente más apropiado que
informe así de la fiabilidad de los datos observacionales recogidos por los dos
observadores.
El porcentaje de acuerdo indica el porcentaje de veces que dos observadores están de
acuerdo respecto a que una determinada conducta está presente o de acuerdo en cuanto a
la ausencia o no ocurrencia de dicha conducta. Supone sumar el acuerdo de los
observadores, dividir por el total y multiplicarlo por cien.
A+D
100
[1]
A+B+C+D
En definitiva, la proporción de acuerdo es la suma de las entradas de la diagonal
principal de la matriz de frecuencias (Acuerdo) divido por N. El rango de A% varía entre
0% y 100%.
A% =
El porcentaje de acuerdo (Kent y Foster, 1977) recibe diversos nombres según los
autores. Hartmann (1977) lo denomina acuerdo en porcentajes, Hawkins y Dotson
80
Coeficientes de fiabilidad
81
(1975) lo califican como acuerdo intervalo por intervalo, Repp, Roberts, Slack, Repp
y Berkler (1976) le asignan el término de acuerdo exacto, House, House y Campbell
(1981) le suscriben el término de acuerdo total y Kelly (1977) lo distingue con la
calificación de fiabilidad punto por punto.
La utilización del porcentaje de acuerdo ha sido criticada dado que su valor está inflado
por el acuerdo entre los observadores producido por el mero azar. La problemática del
aumento de su valor por el azar se endurece cuando la ocurrencia de las conductas o
códigos de observación es extremadamente alta o extremadamente baja. En este sentido,
cuando una determinada conducta o código es infrecuente, la fiabilidad por acuerdo
puede dar lugar a altos valores de los coeficientes debido al acuerdo por azar de la no
ocurrencia o ausencia de dicha conducta. Si los análisis están basados sobre la
frecuencia con la que la conducta foco ocurre, una alta fiabilidad al registrar la ausencia
de dicha conducta no es especialmente relevante.
Una solución a este último punto consiste en aplicar índices de porcentaje de acuerdo
que valoren en concreto la presencia del código o su ausencia. Ambos índices de
acuerdo solamente son aplicables cuando hay dos observadores.
El porcentaje de acuerdo de ‘presencia’ de código se utiliza cuando la presencia de la
conducta es baja:
P% = A + BA + C 100
[2]
y el porcentaje de acuerdo de ‘ausencia’ de código:
AU% = B + DC + D 100
[3]
se aplica cuando la ausencia del código es alta o, lo que es lo mismo, su ocurrencia es
baja, disminuyendo la inflación de acuerdo producida por azar (Bijou, Peterson, Harris,
Allen y Johnson 1969; Hawkins y Dotson, 1975) aunque por supuesto no eliminándola.
Observe el lector también que el N total varía en cada índice.
El porcentaje medio de acuerdo en conductas en presencia y ausencia de conducta se
obtiene a través de:
A
D
+
–
A+B+C B+C+D
X% =
100
2
[4]
Cohen (1960) describió un estadístico denominado kappa, el cual representa una
medida de acuerdo tanto para la presencia como para la ausencia de conductas
corrigiendo el acuerdo producido por azar.
El estadístico kappa corrige la fórmula de la fiabilidad por acuerdo al sustraer el
acuerdo por azar tanto para la presencia como ausencia en el numerador y denominador.
Su cálculo se expresa como:
81
82
Metodología observacional
k=
po – pe
1 – pe
[5]
donde
 po es la proporción de acuerdo observado realmente, estaría indicado por el porcentaje de
acuerdo mencionado anteriormente:
A+D
N
[6]
 pe la proporción de acuerdo esperada por azar:
(A + B) (A + C) (B + D) (C + D)
+
N2
N2
[7]
Los coeficientes anteriores a kappa están de hecho inflados por el acuerdo producido
por azar entre los observadores que registran presencia y/o ausencia de conductas.
El cómputo corregido del acuerdo por azar sobre la presencia de la conducta implica
multiplicar (A + B) por (A + C) y dividir el producto por el total (N). El acuerdo por azar
sobre la ausencia de la conducta se determina multiplicando (B + D) por (C + D) y
dividiendo el producto por el total (A + B + C + D).
Así, en la fórmula de kappa el numerador indica la diferencia entre el acuerdo
observado real y el esperado por azar, mientras que el denominador recoge la diferencia
posible total entre el acuerdo observado y el esperado por azar. A partir de esta fórmula
podemos desarrollar la siguiente expresión:
A – (A + B) (A + C) + D – (B + D) (C + D)
A + B + C + D 
A+B+C+D

k=
(A
+
B)
(A
+
C)
A –
 + B + C + D – (B + D) (C + D)
A + B + C + D
A+B+C+D


[8]
Por lo tanto, el coeficiente kappa es la razón entre el acuerdo observado y no azaroso
dividido por el posible acuerdo total no producido por azar.
Como se observa po representa lo mismo que A% pero sin multiplicar por 100 mientras
que pe alude al sumatorio de las probabilidades de acuerdo por azar y consiste en la
suma de los productos marginales.
En el cálculo del coeficiente kappa, el término pe supone tener en cuenta el posible
acuerdo por azar de los dos observadores tanto en relación a la presencia del código
como a su ausencia, eliminándolo o restándolo de la proporción de acuerdo observado
(po); dicho coeficiente queda tipificado al dividirlo por 1 – pe.
Si el observador 1 informa que el código ocurre o está presente en una proporción de
P1 y el observador 2 en una proporción de P2, el producto de P1 por P2 indica la
proporción de acuerdo de presencia de código que se puede esperar por azar. Del
mismo modo, el posible acuerdo por azar respecto a la ausencia de código viene
indicado por el producto de A1 por A2. La proporción total de acuerdo por azar será la
suma de ambos productos.
82
Coeficientes de fiabilidad
83
Por lo tanto, el acuerdo esperado por azar es el siguiente:
pe = P1 P2 + A1 A2
[9]
El rango de valores que puede alcanzar el coeficiente kappa oscila entre +1 y -1. Un
kappa positivo indica que los observadores están de acuerdo más frecuentemente que lo
que se podría esperar por azar. Si el valor es de 1 entonces el acuerdo es absoluto.
Cuando kappa es igual a cero, el acuerdo entre los observadores no está más allá del que
se puede esperar por azar.
Resultados negativos de kappa indican que el desacuerdo entre los observadores es más
frecuente de lo que se puede esperar por azar. Si el valor es de -1, entonces el
desacuerdo entre los observadores es total.
Gelfand y Hartmann (1975) consideran que 0.60 es el valor mínimo aceptable de
kappa como acuerdo entre los observadores. Landis y Koch (1977) señalan que un
valor de 0.80 indica una fiabilidad buena y Bakeman y Gottman (1986) consideran
con preocupación valores de kappa menores a 0.70. Fleiss (1981) caracteriza como
‘regulares’ los valores que se hallan entre 0.40 y 0.60, ‘buenos’ los que se
encuentran entre 0.60 y 0.75 y ‘excelentes’ por encima de 0.75. Otros autores han
descrito la distribución de muestreo del coeficiente kappa, determinando también qué
valores de kappa difieren significativamente de cero (Hubert, 1977).
Existen variaciones de este estadístico que pueden ser empleados como medidas de
fiabilidad tanto para la presencia como para la ausencia del código simplemente
sustrayendo la corrección de acuerdo por azar del numerador y denominador.
En el caso del estudio de la fiabilidad cuando el código está presente la formula es la
siguiente:
(A + B) (A + C)
A+B+C
(A + B) (A + C)
B+C+A–
A+B+C
A–
kpresencia =
[10]
mientras que cuando se trata de analizar la fiabilidad para ausencia de código la fórmula
sería:
(B + D) (C + D)
B+C+D
(B + D) (C + D)
B+C+D–
B+C+D
D–
kausencia =
[11]
Algunos investigadores utilizan el coeficiente de correlación dos-por-dos phi
expresado a continuación:
=
AD–BC
(A + B) (C + D) (A + C) (B + D)
[12]
Este estadístico es una correlación producto momento de Pearson para variables
dicotómicas. En general, los valores absolutos de kappa y phi se corresponden
íntimamente (Wakefield, 1980) pudiendo alcanzar ambos índices valores entre 1 y -1.
El índice lambda (Goodman y Kruskal, 1954) solamente considera los acuerdos y
desacuerdos referidos a la presencia de conducta aunque, por supuesto también se puede
83
84
Metodología observacional
calcular para los desacuerdos. Su rango se encuentra entre 1 (acuerdo o asociación
completa) y -1 (desacuerdo total). La fórmula se expresa así:
 = 22 AA –+ BB –+ CC
[13]
El coeficiente de asociación Q de Yule (Yule, 1912) varía entre 1 y -1 y solamente
mostrará una asociada completa o acuerdo exacto entre los dos observadores cuando no
aparezca ninguna frecuencia en las celdillas de desacuerdos B o C.
Se obtiene a través de la siguiente formulación:
Q = AA DD –+ BB CC
[14]
Cómputo de los coeficientes de fiabilidad
Realicemos a continuación un ejemplo con el objetivo de calcular los diferentes
coeficientes apuntados anteriormente.
Los datos que se presentan se han obtenido en una sesión de observación en la que dos
observadores llevan a cabo el proceso de registro de una determinada conducta de forma
independiente (por ejemplo la conducta de ‘mirar hacia el compañero de la derecha en
el aula cuando el profesor está explicando un tema’).
Se computará:
 ‘acuerdo’ cuando ambos coincidan en codificar que la conducta fue realizada o no
realizada por el niño y
 ‘desacuerdo’ cuando uno de ellos codifique que el niño estaba atento y el otro
observador codifique que no lo estaba
Supuesto 1
Supongamos que un investigador desea conocer la fiabilidad de los datos observacionales
obtenidos por dos observadores respecto a una determinada conducta codificada.
La duración de la sesión de observación es de diez minutos (registrándose de forma artificial en
intervalos de un minuto) y los datos obtenidos son los presentados en la Figura 28.
84
Coeficientes de fiabilidad
85
1= presencia/0= ausencia
REGISTROS
Observador 1
Observador 2
Intervalos
ACUERDO PRESENCIA
1
1
1
2
1
0
3
0
0
4
0
0
ACUERDO AUSENCIA
ACUERDO AUSENCIA
5
0
0
ACUERDO AUSENCIA
6
1
0
NO ACUERDO
7
0
1
8
1
1
NO ACUERDO
ACUERDO PRESENCIA
9
0
0
ACUERDO AUSENCIA
10
0
0
ACUERDO AUSENCIA
NO ACUERDO
Figura 28 Resultados obtenidos por dos observadores tras una sesión de observación
de diez intervalos
Realicemos a continuación la tabla de contingencia 2  2 representando las frecuencias
de acuerdos y desacuerdos (véase Figura 29). Se han registrado en la tabla las letras A,
B, C y D para facilitar al lector el cálculo de los diferentes coeficientes.
Observador 1
Conducta
presente
Conducta
presente
Observador 2
Conducta
ausente
2
2
Conducta
ausente
A
C
1
B
D
5
4
3
6
7
N=10
Figura 29 Frecuencias de Acuerdo y No Acuerdo
Los resultados para cada uno de los coeficientes de estimación de la fiabilidad entreobservadores se detallan en la Tabla 7.
Tabla 7 Estimación de la fiabilidad
A%
P%
AU%
–
X%
k
kpresencia
kausencia


Q

70%

40%

62.5%

51.25%

0.348

-0.153

-0.091

0.143

0.356

0.667
El desarrollo de los cálculos es el siguiente:
1. El porcentaje de acuerdo:
A+D
2+5
A% = A + B + C + D 100 = 2 + 2 + 1 + 5 100 = 70.0%
85
86
Metodología observacional
2. El porcentaje de acuerdo de presencia de código:
A
2
P% = A + B + C 100 = 2 + 2 + 1 100 = 40.0%
3. El porcentaje de acuerdo de ausencia de código:
D
5
AU% = B + C + D 100 = 2 + 1 + 5 100 = 62.5%
4. El porcentaje medio de acuerdo:
A
D
+
A+B+C B+C+D
–
X% =
100 =
2
2
5
2+2+1+2+1+5
=
100 = 51.25%
2
5. El coeficiente kappa de Cohen:
A – (A + B) (A + C) + D – (B + D) (C + D)
A + B + C + D 
A+B+C+D

k=
=
(A
+
B)
(A
+
C)
A –
 + B + C + D – (B + D) (C + D)
A + B + C + D
A+B+C+D


2 – (2 + 2) (2 + 1) + 5 – (2 + 5) (1 + 5)
 2+2+1+5  2+2+1+5
=
=
2 – (2 + 2) (2 + 1) + 2 + 1 + 5 – (2 + 5) (1 + 5)
 2+2+1+5
 2+2+1+5
6. El coeficiente kappa de Cohen para presencia de conducta:
(A + B) (A + C)
A+B+C
=
(A + B) (A + C)
B+C+A–
A+B+C
A–
kpresencia =
(2 + 2) (2 + 1)
2+2+1
=
= -0.153
(2 + 2) (2 + 1)
2+1+2–
2+2+1
2–
7. El coeficiente kappa de Cohen para ausencia de conducta:
(B + D) (C + D)
B+C+D
=
(B + D) (C + D)
B+C+D–
B+C+D
D–
kausencia =
(2 + 5) (1 + 5)
2+1+5
=
= -0.091
(2 + 5) (1 + 5)
2+1+5–
2+1+5
5–
8. El coeficiente de correlación Phi:
=
AD–BC
(A + B) (C + D) (A + C) (B + D)
86
=
0.348
Coeficientes de fiabilidad
87
2·5–2·1
=
(2 + 2) (1 + 5) (2 + 1) (2 + 5)
=
0.356
9. El coeficiente lambda:
–2–1
=
2 ·2 + 2 + 1
0.143
2·5–2·1
Q = AA DD –+ BB CC = 2 · 5 + 2 · 1 =
0.667
 = 22 AA –+ BB –+CC =
2·2
10. El coeficiente Q de Yule:
Observando los resultados obtenidos se puede concluir que existe un 70% de acuerdo
entre los dos observadores respecto a la presencia y ausencia del código estudiado,
siendo mayor el acuerdo cuando se trata de codificar ausencia del código o conducta
(62.5%). El acuerdo medio es del 51.25%. Sin embargo cuando calculamos el
coeficiente kappa de Cohen (1960) y el posible acuerdo por azar es tenido en cuenta, las
conclusiones se modifican.
El valor de kappa obtenido al analizar la codificación registrada por cada observador es
de 0.348, resultado considerado por los diferentes investigadores como bajo, no
acercándose ni al valor mínimo aceptable de acuerdo de 0.60 propuesto por Gelfand y
Hartmann (1975), siendo categorizado en todo caso como acuerdo ‘regular’ (Fleiss,
1981) al rozar al valor de 0.40. Si analizamos este coeficiente para la codificación de
‘presencia’ y de ‘ausencia’ de conducta independientemente, la interpretación de los
resultados es aún más dramática ya que el signo negativo indica que el desacuerdo entre
los observadores es más frecuente de lo que se puede esperar por azar.
87