Download Resultados

Document related concepts
no text concepts found
Transcript
Métodos cuantitativos
avanzados
William L. Holzemer, RN, Ph.D., FAAN
Profesor, Escuela de Enfermería
Universidad de California, San Francisco
[email protected]
Objetivos
• Desarrollar la definición de ciencia de
enfermería
• Uso del Modelo de Resultados para
pensar acerca de su área de interés
• Revisar los métodos cuantitativos
• Pensar en cómo generar conocimiento
para mejorar la salud y la práctica de la
enfermería.
2
Asignaciones
• Estudiantes de doctorado en SP
asignaciones individuales
• Estudiantes de Maestría – asignaciones
grupales
– Mini-revisión de la literatura
•
•
•
•
Modelo de resultados
Substruction
Tablas de síntesis
Resumen
3
¿Enfermería = Ciencia de
enfermería?
Definición de enfermería
Asociación Americana de Enfermería:
“Enfermería es la evaluación, diagnóstico y
tratamiento de las respuestas humanas”
4
Definición de enfermería
Asociación Japonesa de Enfermería
“Enfermería es definida como la
asistencia al individuo y al grupo,
sano o enfermo, para mantener,
promover y restaurar la salud.”
5
Definición de Enfermería
Consejo Internacional de Enfermería
“Enfermería comprende atención autónoma y
colaboradora de individuos de todas las edades,
familias, grupos y comunidades, sanos o enfermos
en todos los lugares. Enfermería incluye la
promoción de la salud, prevención de enfermedad y
la atención del enfermo, discapacitado y el
moribundo. Consejo, promoción de un ambiente
seguro, investigación, participación en modelación
de políticas en salud y manejo de sistemas de salud
y del paciente hospitalizado y educación, son
también roles claves de enfermería.”
6
Elementos comunes:
Definiciones de Enfermería
•
•
•
•
Persona (individual, familia, comunidad)
Salud (Bienestar y enfermedad)
Ambiente
Enfermería (atención, intervenciones,
tratamientos)
7
Ciencia de Enfermería
El cuerpo de conocimiento que apoya la
práctica basada en evidencias
8
Ciencia de Enfermería usa varias
metodologías de investigación
Cualitativa
Entendimiento
Entrevista/observación
Descubriendo esquemas
Textual (palabras)
Generación de teorías
Calidad del informante más
importante que el tamaño de
muestra
Rigor
Subjetiva
Intuitiva
Conocimiento encajado
Cuantitativa
Predicción
Encuesta/cuestionarios
Esquemas existentes
Numérica
Prueba de teorías (ECA)
Tamaño de muestra, esencial en
el tema de confiabilidad de los
datos
Rigor
Objetiva
Pública
9
Tipos de métodos de investigación:
(¡todos tienen reglas de evidencia!)
Cualitativa
Cuantitativa
Teoría aterrizada
Etnografía
Teoría feminista crítica
Fenomenología
No experimental o
descriptiva
Experimental o estudios
aleatorizados controlados
Etnografía
Análisis de contenido
Modelos de análisis:
fidelidad al texto o
palabras de entrevistas
Modelos de análisis:
Paramétrico vs no
paramétrico
10
Modelo de resultados para investigación en
atención en salud
(Holzemer, 1994)
Ingresos
1970’s
Procesos 
1980’s
Resultados
1990’s
Cliente
Proveedor
Sitio
11
Modelo de resultados
• Heurístico
• Modelo de sistemas (ingresos son
egresos, egresos se convierten en
ingresos)
• Relacionado al trabajo de Donabedian
sobre la calidad de la atención (estructura,
proceso, y resultado estándar)
12
Modelo de resultados: proceso de
enfermería
Ingresos
Cliente
Proveedor
Procesos 
Problema
Resultados
Resultado
Intervención
Sitio
13
Modelo de resultados para investigación en
atención en salud
Ingresos 
Procesos 
Resultados
(Covariados,
confusoras)
(Variable
independiente)
(Variable
resultado)
Cliente
Edad, género. Nivel
socioeconómico,
etnicidad, severidad
de enfermedad
Auto cuidado
Adherencia
Atención familiar
Calidad de vida,
control de dolor,
satisfacción del
paciente, caídas del
paciente
Proveedor
Edad, género, Nivel
socioeconómico,
educación,
experiencia,
certificación,
autonomía percibida
Intervenciones
Atención
Hablar, toque, tiempo
Vigilancia, comunicación
Calidad de vida de
trabajo
Errores
Satisfacción
Sitio
Recursos
Filosofía
Niveles del personal
Razones actuales de
personal
Mortalidad
Morbilidad
Costo
14
Modelo de resultados: Tu tarea
(Piense acerca de un proyecto o un programa de
investigación)
Ingresos 
Z
Procesos 
x
Resultados
y
Cliente
Proveedor
Sitio
15
¿Dónde encontramos guías de la
práctica basada en evidencias?
• Guías prácticas clínicas
• Estándares de enfermería/ Manuales de
procedimientos
• Gran demanda, bajo nivel de entrega
(Gran demanda, creciente nivel de
entrega)
• Conocimiento base de revisión de
literatura
16
Tipos de evidencia:
¿Cómo sabemos que sabemos?
•
•
•
•
Experiencia clínica
Intuición
Historias
Preferencias, valores, creencias y
derechos
• Estudios descriptivos/
cuasiexperimentales
• Estudios aleatorizados clínicos
(controlados)(ECA) – el estándar dorado
17
Resumen: introducción a la
investigación
• Piense acerca de la investigación en enfermería
– ciencia de enfermería
• Modelo de resultados diseñado para poner
límites alrededor de tu área de estudio y
experiencia (¡reto muy difícil en enfermería!)
• Identificación de variables
• Entendimiento del rigor – métodos correctos
para cualquier tipo de diseño de investigación.
• Fomentar la diversión al leer artículos de
investigación
• Entender el reto de que las palabras sean
fácilmente usadas, “práctica basada en
evidencias”.
18
Algunos retos:
• Pensar en desarrollar su definición de ciencia de
enfermería.
• Uso del Modelo de Resultados para ayudar a
pensar en su programa de investigación.
• Fomentar tu entendimiento de rigor en todos los
diseños de investigación.
• Aumento de diversión al leer artículos de
investigación.
• Entender las complejidades de “la práctica
basada en evidencias”.
19
Cuando piense en su problema de
investigación:
•
•
•
•
¿Es significante?
¿Estás realmente interesado?
¿Es novedoso?
¿Es un área importante?
– ¿Alto costo, alto riesgo?
• ¿Puede estudiarse?
• ¿Es relevante para la práctica clínica?
20
¿De dónde vienen las ideas?
•
•
•
•
•
•
•
•
Revisiones de literatura
Historias en periódicos
Siendo un asistente de investigador
Mentor/profesor
Estudiantes compañeros
Pacientes
Experiencia clínica
Expertos en el campo
Construya su área de experiencia de múltiples fuentes.
21
Usos de Substruction
• Critique un estudio publicado
• Planee un estudio nuevo
22
Substruction
• Una estrategia para ayudar a entender la
teoría y métodos (sistema operacional) en un
estudio de investigación
• Aplica a estudios de investigación
cuantitativos, empíricos.
• No hay la palabra, Substruction, en el
diccionario. Tiene un significado inductivo y
un significado deductivo, deconstruyendo
• Huerístico
23
Substruction
Teoría
(sistema
teorético)
Constructo
Métodos
(sistema
operacional)
Mediciones

Concepto

Escalas/
análisis de
datos
Deductiva (cualitativa)












(cuantitativa)
Inductiva
24
Substruction:
Construyendo bloques o señalamientos de
relaciones
Constructo
Dolor

Concepto
Intensidad

Medición
Escala de 10 cm
axioma
proposición
hipótesis
Constructo
Calidad de vida

Concepto
Status funcional

Medición
Escala de
movilidad
25
Señalamientos de relaciones
Constructo:
Postulado:
Señalamiento
de relación
entre un
constructo y
conceptos
Dolor consiste en tres
conceptos
Conceptos:
Intensidad
Localización
Duración
26
Substruction:
Perspectiva de diseño de investigación
Enfoque del estudio
(¿ECCA?)
Co-variables Z
Severidad de enfermedad
para ajuste de riesgos
(análisis de covarianza)
Tratamiento de la
variable independiente
¿Cómo medirla?
Variable dependiente Y
27
Substruction: sistema teórico,
un ejemplo
Estudio intervencional sobre dolor
Paciente post quirúrgico
Severidad de
enfermedad
Enfermedad
Edad
Género
Intervención de manejo del
dolor
Comunicación con el paciente
Standing PRN orders
No tratamiento farmacológico
Control del dolor
Longitud de la estancia
Satisfacción del paciente
28
Substruction: sistema
operacional
Intensidad del dolor
Instrumento:
Escala VAS 10 cm
(dolor bajo a alto)
Status funcional:
Instrumento: escala de
Likert 1-5, 1=baja y
5=alta función
Escala: ¿continua o
discreta?
Escala: ¿continua o
discreta?
29
Escalas
Discreta: no-paramétrica (X2)
• Nominal
género
• Ordinal
ingreso bajo, medio, alto
Continua: paramétrica (Pruebas t o F)
• Intervalo
Escala de Likert, 1-5
funcionalidad
• Razón
dinero, edad, tensión
arterial
30
Temas
•
•
•
•
•
•
¿Cuáles son las bases conceptuales del estudio?
¿Cuáles son los principales conceptos y sus relaciones?
¿Las relaciones propuestas entre los constructos y los
conceptos lógicos y defendibles?
¿Cómo se miden los conceptos? ¿Válidas?
¿Confiables?
¿Cuáles son los niveles de escalas y se relacionan al
plan estadístico apropiado o de análisis de datos?
¿Hay consistencia lógica entre el sistema teórico y el
sistema operativo?
31
¿Hay una relación entre el toque y control
del dolor , contando el dolor inicial postoperatorio? rx,y.z
Ingreso
Z
Cliente
Proveedor
Proceso 
X
Dolor postoperatorio
Resultado
Y
Control de
dolor
Toque
terapeútico vs
atención NL
Lugar
32
Revisión de la literatura
• Revisamos la literatura para entender los
sistemas teóricos y operativos relevantes
a nuestra área de interés.
• ¿Qué se sabe acerca de los constructos y
conceptos en nuestra área de interés?
• ¿Qué teorías son propuestas que liguen a
nuestras variables de interés?
33
Revisión de la literatura
• ¿Qué se conoce?
• ¿Qué no se conoce?
• Recursos
– La biblioteca Cochran
– Biblioteca de bases de datos
• PubMed
• CINYL
34
Revisión de la literatura:
¿Cómo combinar, sintetizar y demostrar la
dirección?
Tópico
Topic
Study
Estudio 1
1
Study
Estudio 2
2
Study
Estudio 3
3
35
Revisión de la literatura
Topic
Tópico
Estudio 11
Study
Estudio 2
Study
2
Estudio 33
Study
36
Tabla 1. Borrador de variables de estudio
relacionados a tu tema
Covariables
Estudios
Z
Intervenciones Resultados
Variable
Variable
independiente dependiente
X
Y
Smith (1999)
Jones (2003)
Etc.
37
Tabla 2. Amenazas a la validez de estudios
de investigación relacionados al tópico
Autor (año)
Tipo de
diseño
Diagrama
Smith
(1999)
RCT
O X1 O
O X2 O
O
O
Conclusión
estadística
Validez
Constructo Validez
Validez de interna
causa y
efecto
Validez
externa
n/a
Jones
(2003)
38
Tabla 3. Instrumentos
Instrumento
Estudios
Smith (1999)
#
items
Validez
Confiabilidad
Utilidad
Cuestionario
McGill de dolor
Jones (2003)
39
Tabla 4. Poder del análisis para
revisión de la literatura sobre un tema.
Estudios
Smith (1999)
Tamaño
de
muestra
Alfa
Poder
32 expuestos
40 –
controles
0.05
0.60
Tamaño
de
efecto
Est. al
medio
Jones
(2003)
40
Síntesis de la literatura
• Síntesis - ¿qué sabemos y que no
sabemos?
• Fortalezas – ¿rigor, tipos de diseño,
instrumento?
• Debilidades – ¿ausencia de rigor, no ECA,
pobre desarrollo de instrumentos?
• Necesidades futuras – ¿cuál es el
siguiente paso?
41
Diseños de investigación
42
Diseño de investigación: cualitativa
•
•
•
•
•
•
•
Etnografía
Fenomenología
Hermenéutica
Teoría aterrizada
Histórico
Estudio de caso
Narrativa
43
Rigor en investigación cualitativa
•
•
•
•
Dependiente
Creíble
Transferible
Confirmable
44
Tipos de diseños de investigación
cuantitativa
• Nos enfocaremos en RIGOR:
– Experimental
– No experimental
45
Notación X,Y, Z
• Z = covariable
• Severidad de enfermedad
• X = variable independiente
(intervenciones)
• Manejo propio de síntomas
• Y = variable dependiente (resultado)
• Calidad de vida
46
Tipos de diseños de investigación
cuantitativa
– Descriptiva
X? Y? Z?
• ¿Qué es X, Y, y Z?
– Correlacional
rxy.z
• ¿Hay una relación entre X y Y?
– Causal
ΔX  ΔY?
• ¿Un cambio en X causa un cambio en Y?
47
Rigor en investigación cuantitativa
• Teoría aterrizada: Axiomas y postulados –
substruction-validez de relaciones
hipotéticas
• Validez de diseño (interna y externa) del
diseño de investigación; validez y
confiabilidad del instrumento
• Suposiciones estadísticas satisfechas
(escala, curva Normal, relación lineal, etc.)
(Nota: Polit y Beck: confiabilidad, validez,
generalización, objetividad)
48
Revisión de la literatura
Enfoque del estudio
Enfoque del estudio
Pregunta de estudio
Pregunta de estudio
Hipótesis de estudio
49
Enfoque, pregunta e hipótesis
• Enfoque del estudio: explorar si es posible
reducir las caídas de los pacientes ancianos en
casas de cuidado.
• Pregunta del estudio: ¿colocando un “sitter” en
el cuarto de un paciente reduce la incidencia de
caídas?
• Hipótesis del estudio:
Nula: H0: no hay diferencia entre pacientes que
tienen un “sitter” y aquellos que no lo tienen, en
la incidencia de caídas.
50
Diseños experimentales
51
Definición: diseño experimental
1. Hay una intervención que es controlada
2. Hay un grupo experimental y uno control
3. Hay un asignación aleatoria a los grupos
52
Diseño experimental clásico

O1exp X
O2exp
O1con
O2con
R

(pretest)
(posttest)
O=observación
1 = pretest o tiempo uno; 2 = posttest o tiempo dos
X = intervención
R = asignación aleatoria a los grupos
53
Diseño experimental clásico
O1exp X
O2exp
O1con
O2con

R

(pretest)
(posttest)
El ECA es el estándar dorado para la práctica
basada en evidencias
54
Aleatorización
1. Asignación aleatoria a grupos
(validez interna) – iguales variables Z
en ambos grupos
2. Selección aleatoria de una muestra
de la población (validez interna) –
variables Z iguales en la muestra que
en la población
55
Meta:
Señalar si hay una relación causal
56
Condiciones requeridas para hacer un
señalamiento de causalidad: X causa Y
1. X precede Y
2. X y Y están correlacionadas
3. Todo está controlado o eliminado.
Las variables Z no impactan al
resultado
4. Nunca probamos algo, reunimos
evidencia que apoye nuestra
conclusión
57
Controlando variables Z:
1. Minimiza amenazas la validez
interna
2. Limita la muestra (e.g. sólo
menores de 35 años) o control
de variación
3. Manipulación estadística
(ANCOVA)
4. Asignación a grupo aleatoria
58
Dimensiones del diseño de
investigación:
Grupos y tiempo
O1exp X
O2exp

Grupos (n=2 experimental y control)

O1con
O2con
-----------------------------------------------
 Tiempo (n=2) 
(mediciones repetidas)
59
Dimensiones de diseño de
investigación:
grupos y tiempo
Grupos = entre factores
Tiempo = dentro de factores
60
Tipos de diseños
• O - descriptivo, un tiempo
• O1 O2 O3 - descriptivo, cohorte, mediciones
repetidas)
• O1 X O2 (¡diseño no experimental!) - prepost-test
61
Tipos de diseños
• O1
O1
X O2
O2
ECA estudios controlados aleatorizados
62
Tipos de diseños
• O 1 O 2 O 3 X O4 O 5 O 6
O 1 O2 O3 O4 O5 O6
• O1 X O2 Xno O3 X O4 Xno O5
(mediciones repetidas vs diseño de series
de tiempo)
63
Tipos de diseño
R
O1
O1
O1
X1
X2
O2
O2
O2
# de grupos? ___
# puntos en el tiempo? ___
64
Tipos de diseños
Diseño de post-test sólo:
X O2
O2
¿Cuál es la mayor amenaza a este
diseño de sólo post-test?
65
Tipos de diseño de investigación
• Experimental (verdad)
• Cuasi-Experimental (caso)
– Asignación no aleatoria a grupos
66
Validez de diseño
– Conclusión estadística válida
– Validez de constructo de causa y
efecto (X y Y)
– Validez interna
– Externa
67
Validez del diseño
• Validez de la conclusión estadística rxy?
– Error tipo I (alfa 0.05)
– Error tipo II (beta) Poder = 1- beta,
inadecuado poder, i.e. pequeño tamaño de
muestra
– Confiabilidad de mediciones
¿Puedes creer en los hallazgos estadísticos?
68
Validez del diseño
• Validez de contructo de causa supuesta y
efecto (X  Y?)
– Bases teóricas uniendo constructos y
conceptos (substruction)
– Resultados sensibles a atención de
enfermería
– Intervención ligada a resultado, teoricamente
¿Hay una razonamiento teórico de por qué X y
Y deberían estar relacionadas?
69
Validez de diseño
Validez interna
–
–
–
–
–
–
Amenaza de historia (evento que interviene)
Amenaza de maduración (cambio por el desarrollo)
Amenaza de la prueba (instrumento causa un efecto)
Amenaza de instrumentación (confiabilidad de medición)
Amenaza de mortalidad (sujetos eliminados)
Amenaza de sesgo de selección (pobre selección de
sujetos)
¿Cualquiera de las variables Z están causando los
cambios en las variables Y?
70
Validez de diseño
Validez externa
– Amenaza de baja generalización para
personas, lugares y tiempo
– ¿Puede generalizarse a otros?
71
Construyendo el conocimiento
• La meta es tener confianza en nuestros
datos descriptivos, correlacionales y
causales.
• Rigor significa seguir las técnicas
requeridas y estrategias para incrementar
nuestra confianza en los hallazgos de la
investigación.
72
Muestreo
[Selección de la muestra, no asignación]
73
Términos
• Población
- Todos los sujetos posibles
• Muestra
- Un subgrupo de sujetos
• Elemento
- Un sujeto
74
¿Qué muestreamos?
• Personas (e.g. sujetos)
• Sitios (e.g. hospitales,
unidades, ciudades)
• Tiempo (e.g. temporada,
cambio am vs pm)
75
Muestreo: ¿Qué hacemos?
• Asignación aleatoria
• Selección aleatoria
- Es diseñada para
- Es diseñada para
equilibrar las
equilibrar la
variables “Z” en los
distribución de las
grupos experimental y
variables “Z” que
control
existen en la
población, en una
muestra
76
Tipos de muestreo de probabilidad
Probabilidad
Muestreo simple aleatorio – usa una tabla de
números aleatorios
Muestreo aleatorio estratificado – divide o
estratifica por género y muestrea dentro del
grupo
Muestreo aleatorio sistemático – toma cada
10° nombre
Muestreo agrupado – selecciona unidades
(grupos) para acceder a pacientes o
enfermeras
77
Tipos de muestreo no probabilístico
• Conveniencia – primeros pacientes que
crucen la puerta
• Intención – pacientes viviendo con una
enfermedad
• Cuota – igual número de hombres y
mujeres
• (voluntarios)
• (conveniencia)
78
Tipos de muestras
Homogéneas: sujetos son similares, todos
femeninos, todos entre edad de 21-35
Heterogéneas: sujetos son diferentes,
amplio rango de edad, pacientes con todo
tipo de cáncer
79
Error de muestreo
Población (n=1000)
Media de edad:
36.5 años
Muestras (n=50)
Media de edad: 34.6 años
37.1 años 36.4 años.
80
¿Cómo controlar el error de
muestreo?
• Use selección aleatoria de los
participantes
• Use asignación aleatoria de sujetos a los
grupos
• Estime el tamaño de muestra requerido
usando análisis de poder para asegurar
adecuado poder
• Sobreestime el tamaño de muestra
requerido para muestra de mortalidad
81
Tamaño de muestra y error de
muestreo
Pequeño
Error de
muestreo
Grande
Pequeño
Grande
Tamaño de muestra
82
Cálculo de tamaño de muestra
• Tipo de diseño
• Accesibilidad de
participantes
• Planeación de pruebas
estadísticas
• Revisión de la literatura
• Costo (tiempo y dinero)
83
Estrategias para estimar tamaño de
muestra
• Razón de sujetos a variables en análisis
correlacional. 3:1 hasta 30:1 sujetos por
variables. Cuestionarios de 30 items
requieren 90 a 900 sujetos.
• Chi cuadrada – no puede trabajar si hay
menos de 5 sujetos por celda
84
Poder
Poder – comúnmente situado en 0.80
Alfa – comúnmente situado en 0.05 ó 0.01
Tamaño de efecto – basado en estudios piloto o
revisión de literatura; pequeño, medio, grande
Tamaño de muestra - # sujetos requeridos para
asegurar poder adecuado
Poder es una función de alfa, tamaño de efecto y
tamaño de muestra.
85
Programas de análisis de poder
• Paquete SPSS
• nQuery Adviser Release 4.0 (¿más
reciente?)
http://www.statsolusa.com
86
Poder
• Poder es la capacidad de detectar una
diferencia entre las medias de los puntajes
o la magnitud de una correlación.
• Si no hay suficiente poder en el estudio,
no importa el tamaño del efecto detectado,
i.e. sin importar lo exitoso de la
intervención no se puede detectar
estadísticamente el efecto.
• Muchos estudios tienen bajo poder.
87
Tamaño del efecto
• El tamaño del efecto, se piensa como qué
tan grande diferencia hizo la intervención.
• Significancia estadística y significancia
clínica, con frecuencia no significan lo
mismo.
88
Tamaño del efecto
• Pequeño (correlaciones alrededor de
0.20)
– Requiere gran tamaño de muestra
• Medio (correlaciones alrededor de 0.40)
– Requiere tamaño de muestra medio
• Grande (correlaciones alrededor de 0.6)
– Requiere tamaño de muestra pequeño
89
Tamaño de efecto
Mediaexp – Mediacon
Tamaño de efecto =------------------------------DS e y c
90
Eta cuadrada (ŋ2)
• En ANOVA, es la proporción de la
variable dependiente (Y)
explicada.
• Estima el tamaño del efecto
• Similar a R2 en análisis de
regresión múltiple.
91
alfa
• Alfa relaciona para probar hipótesis y qué tan
frecuente tenemos un error al extraer una
conclusión
• Alfa es equivalente a error tipo 1 – o decir
que la intervención fue efectiva, cuando en
efecto, el tamaño del efecto observado es
por el azar
• Alfa de 0.01 es más conservador que 0.05 y
por lo tano, más difícil detectar diferencias
92
Prueba de hipótesis:
¿Es verdad o falso?
• Hipótesis nula: H0
– Media (experimental) = Media (control)
• Hipótesis alterna: H1
– Media (experimental) ≠ Media (control)
93
Prueba de hipótesis y poder
Meta:
Rechazar H0
REALIDAD
REALIDAD
Nula H0 Verdad
H0: Mc=Me
Nula H0 Falsa
H0: Mc=/=Me
DECISIÓN
Rechazar H0
Error tipo I
Poder
(1-Beta)
DECISIÓN
Aceptar H0
Decisión
correcta
Error tipo II
(Beta)
94
Quiz:
• Si el tamaño de muestra crece, ¿qué sucede al
poder?
• Si alfa va de 0.05 a 0.01, ¿qué sucede al
tamaño de muestra requerido?
• Si el poder cae de 0.80 a 0.60, ¿qué tipo de
error es más probable que ocurra?
• Si el tamaño de efecto es estimado basado en la
literatura, es grande, ¿qué efecto tendrá en el
tamaño de muestra requerido?
95
Perdida de muestra en ECA
N=243
Aleatorización
N=118
N=122
1 mes
N=105
N=110
6 meses
N=91
N=89
96
Medición
“Si existe, puede ser medido”
R. Cronbach
97
Qué medimos:
• Conocimiento, actitudes, conductas
(CAC)
• Variables fisiológicas
• Síntomas
• Aptitudes
• Costos
98
Teoría de medición clásica:
Medición:
Confibilidad
Observación = Verdad (hecho) +/- Error
Validez
99
Tipos de mediciones
•
Estandarizada – evidencia como sigue:
1.
2.
3.
4.
•
Desarrollada sistemáticamente
Evidencia para validez del instrumento
Evidencia de confiabilidad del instrumento
Evidencia de utilidad del instrumento –
tiempo, puntaje, costos, sensible a cambios
en el tiempo
No estandarizada
100
Tipos de error de medición
• Sistemático - se puede trabajar para
minimizar el error sistemático debido a
pobres instrucciones, confiabilidad pobre
de mediciones, etc.
• Aleatorio – no podemos hacer nada,
siempre presente, nunca medimos nada
en forma perfecta, siempre hay algo de
error.
101
Validez
Pregunta: ¿el cuestionario mide los
que se supone debe medir?
• Validez relacionada a la teoría
– Validez de presencia
– Validez de contenido
– Validez de constructo
• Validez relacionada a criterios
– Validez concurrente
– Validez predictiva
102
Teoría relacionada a la validez
• Validez de presencia
– credibilidad del participante
• Validez de contenido
(observable)
– Blue print
– Lista de herramientas
• Validez de constructo (no
observable)
– Diferencias de grupo
– Cambios de tiempos
– Análisis de correlaciones/factor
103
Criterios relacionados a validez
• Concurrente
– Mide dos variables y las correlaciona
para demostrar que la medida 1 está
midiendo lo mismo que la medida 2 – en
el mimso punto del tiempo.
• Predictivo
– Medición de dos variables, una ahora y
la otra en el futuro, las correlaciona para
demostrar que la medida 1 es predictiva
de la medida 2, en el futuro.
104
Recuerde:
• Validez de diseño
¿El diseño de la
investigación permite
al investigador probar
su hipótesis?
(amenazas de validez
interna y externa)
• Validez del
instrumento
¿El instrumento mide
lo que se supone
debe medir?
105
Confiabilidad del instrumento
Pregunta: ¿Puede confiar en los datos?
• Estabilidad – cambio en el tiempo
• Consistencia – concordancia dentro de
preguntas
• Calificación de confiabilidad – calificación
de concordancia
106
Confiabilidad del instrumento
• Confiabilidad prueba – re-prueba (estabilidad)
– Correlaciones de Pearson
• Alfa de Cronbach (consistencia) – un punto en
el tiempo, mediciones de correlaciones entreítems o concordancias.
• Calificación de confiabilidad (corregir para
cambio de concordancia)
– Confiabilidad inter-observador Kapa de Cohen
– Confiabilidad intra-observador Pi de Scott
107
Alfa de Cronbach
n


2
1   SD items  

n
1


alfa =
2
n 1 
SD



n
SD =
2


m

X
n

1
n 1
108
Estimaciones de confiabilidad del alfa de
Cronbach:
• > 0.90
– Excelente confiabilidad, requerido para toma de
decisiones al nivel individual.
• 0.80
– Buena confiabilidad, requerido para toma de
decisiones al nivel grupal.
• 0.70
– Adecuada confiabilidad, cercana a no aceptable por
demasiados errores en los datos ¿Por qué?
109
Consistencia interna: alfa de Cronbach
Persona A: Internamente consistente
Persona B: Internamente inconsistente
Todas
las
veces
La
mayoría
de las
veces
Unas
pocas
veces
Rara
vez
1
4
A
3
2
1
B
2
4
B
3
A
2
1
3
4
3
A
2
B
1
4
4
A
3
B
2
1
Ítem
110
Error en estimaciones de
confiabilidad
“Error = 1 – (estimado de confiabilidad)2”
si alfa = 0.90,
1-(0.90)2
1-0.89 = .11 error
si alfa = 0.70, 1 – (0.70)2
1-.49 = .51 error
si alfa = 0.70, es el punto 50:50 de error
vs. verdadero valor
111
Valores de confiabilidad
• Rango: 0 a 1
• No signos negativos
• Kappa de Cohen y π de Scott
son siempre más bajos, i.e.
0.50, 0.60
112
Utilidad
Cosas que debes saber acerca de tu instrumento.
• Tiempo para completar (¿fatiga del
sujeto?)
• ¿Es molesto para los participantes?
• Número de ítems (¿análisis de poder?)
• ¿Apropiado para rasgos culturales, de
género, étnicos?
• ¿Instrucciones para puntaje?
• ¿Datos normativos disponibles?
113
Reporte de instrumentos
• Concepto (s) siendo medidos
• Longitud del instrumento o número de
ítems
• Formato de respuestas (escala de
Likert, etc.)
• Evidencia de validez
• Evidencia de confiabilidad
• Evidencia de utilidad
114
Pregunta:
• ¿Puede una escala ser válida y no
confiable?
• ¿Puede ser una escala confiable y no
válida?
115
Desarrollo de escalas
• Generación de ítems de entrevistas/grupo de
enfoque
• Escala de decisiones variación de captura
• Validez – chequeo con expertos y participantes
• Estandarizar la escala (evidencia para validez,
confiabilidad y utilidad)
• Correlaciones estimadas de concepto
• Explora sensibilidad para cambiar sobre el
tiempo
116
Traducción
• Traducción prospectiva (A a B)
• Traducción retrospectiva (B a A)
• Equivalencias conceptuales a través
de culturas
• Usando jerigonza, modismos, etc.
117
Análisis de datos
118
Análisis de datos: ¿Por qué?
• Captura variabilidad (varianza) – como los
puntajes varían entre las personas
• Parsimonia – técnica de reducción de
datos, como describir muchos puntos de
datos en números simples
• Descubrir significados y relaciones
• Explorar sesgos potenciales en datos
(muestreo)
• Probar hipótesis
119
Donde iniciar:
• Después de la colección de datos,
iniciamos un largo proceso de entrada de
datos y clarificación.
• La entrada de datos requiere una lista de
códigos desarrollado para el programa de
estadística que planeamos usar, como
SPSS.
• Lista de códigos nos permite dar a las
variables nombres, valores y etiquetas.
120
Entrada y limpieza de datos
• La entrada de datos es una GRAN fuente
de error en los datos.
• La doble entrada de datos es una
estrategia
• Limpieza de datos, buscando valores
fuera de los rangos, e.g. edad de 154 es
probablemente un error al escribir.
• Examinamos frecuencias, puntaje alto,
puntaje abajo. Extremos, etc.
121
Codificando variables
Capture datos en su forma más continua posible.
Edad: 35 años – tenga el valor actual
vs.
Señale uno: _<25
_ 25-35
_ 36-45
_ >45
122
Variable dicotómicas
No haga esto:
1 = Masculino
2= Femenino
¡Haga esto!
1 = masculino
0 = femenino
¿Por qué? Función aditiva
123
Codoficando falso
Etnicidad
1 = Negro; 2 = Blanco; 3 = Hispánico
N-1 o 3-1 = 2 variables
Negro: 1 = Negro; 0 = Blanco e hispánico
Blanco: 1 = Blanco; 0 = Negro e hispánico
124
Datos desaparecidos
• SPSS asigna un punto “.” a datos
desaparecidos
• SPSS con frecuencia te da a elegir borrar
pares o lista para datos desaparecidos.
Substitución de media: da el promedio de la
variable del grupo, por ejemplo, edad, no da
variación en el grupo de datos.
125
Datos desaparecidos
Pares: una correlación en particular es
removida, mejor elección para conservar
poder
Lista: variables removidas, requerida en
diseños de mediciones repetidas.
126
Mediciones:
• Tendencia central
• Relaciones
• Efectos
127
Medidas de tendencia central
• Media – promedio aritmético
• Desviación estándar (SD) – como las
medidas están agrupadas en la media
• Rango – medición alta y baja.
(Ejemplo: M = 36.4 años
SD= 4.2
Rango: 22-45)
128
Fórmulas
n
X
n
1
Media =
N
n
2


m

X
n

SD =
1
n 1
129
Medidas de tendencia central
• Media – promedio aritmético
• Mediana – punto que divide la distribución
a la mitad (50% por arriba y 50% por
debajo)
• Modo – el valor que ocurre con mayor
frecuencia
¿Cuando la media=mediana=modo?
130
Curva Normal: ¡muy robusta!
34%
34%
2.5%
2.5%
-2
-1
M
+1
+2
131
Curvas Normales
132
Curva Normal
(Media=Mediana=Modo)
Frequency
Frecuencia
50% 50%
Mean
Media
Median
Mediana
Mode
Modo
133
Y-Axis
Curvas no Normales
Y-Axis
X-Axis
X-Axis
134
Escalas
• Discreta
(cualitativa)
– Nominal
– Ordinal
• Continua
(cuantitativa)
– Intervalo
– razón
• No paramétrica
(no requiere
suposiciones; Chi
cuadrada)
• Paramétrica
(asume la curva
Normal, por ejemplo
prueba F)
135
Grados de libertad
• Corrección estadística para no
sobreestimar
136
¿Grados de libertad para balón 1?
137
¿Grados de libertad para balón 2?
138
Grados de libertad para balón 3
139
Grados de libertad
• Tamaño de muestra (n-1)
• Número de grupos (k-1)
• Número de puntos en el tiempo (l-1)
140
Relaciones o asociaciones
141
Medidas de asociación: Correlaciones
• Rango: -1 a 1
• Dimensiones:
– Fuerza (0-1)
– Dirección (+ o -)
• Definición: un cambio en X resulta en un
cambio predecible en Y; variación o
varianza compartida.
142
Correlaciones
• Específica a la muestra (cada muestra es
un subgrupo de la población)
• Inestable
• Depende del tamaño de muestra
• Todo es estadísticamente significativo con
un tamaño de muestra los suficientemente
grande; puede no ser clínicamente
significantivo.
• Expresa relación no causalidad
143
Tipos de correlaciones
• Producto del momento r de Pearson
– Variable continua por continua
• Correlación Phi
– Variable discreta por discreta (Chi
cuadrada)
• Correlación de orden de ranking Rho
– Ranking por ranking discretos
• Punto biserial
– Variable discreta por continua
• Eta cuadrada
144
X-Axis
Y-Axis
r=?
X-Axis
Y-Axis
r=?
Y-Axis
Estimado del valor de correlación
r=?
X-Axis
145
Varianza
2 2
= SD
curve
Area
Área under
bajo lathe
curva
= DS
Variance
Varianza
146
Varianza compartida r2
Si
0.64
0.80, rr22 == 0.64
If r = 0.80,
64%
147
Varianza compartida r2
Si
1,
If rr== 1,
= 0,
IfSir r=
100%
0%
148
Tipos de análisis de datos
Descriptivo
X? Y? Z?
Medidas de tendencia central
Correlacional
rx,y?
¿Hay una relación entre x y y?
Mediciones de relaciones
(correlaciones)
Causal
ΔX  ΔY?
• ¿El cambio en x causa un cambio en y?
Probando diferencias en grupos (pruebas t
o F)
149
Probando efectos de
intervenciones
150
Probando diferencias en grupos
• Pruebas t
• Pruebas F (Análisis de varianza o ANOVA)
(Pruebas t y F con dos grupos)
151
Tipos de pruebas de diferencias de
grupos
• Entre grupos
– (no pareados)
• En grupos
– (pareados o mediciones repetidas; si son dos
grupos son también test-re-test)
– Requiere sujetos identificados
152
Diseño experimental clásico
O1exp X
O2exp
O1con
O2con

R

(pretest)
(posttest)
Grupo: entre factor
Tiempo: dentro de factor
153
Pruebas de significancia
3
4
1
O1
X O2
2
O1
O2
154
Probando diferencias entre grupos
Entre varianzas
F (o t) =
Dentro de varianzas
155
Examinando varianzas
Entre
Between
Variance
varianzas
Dentro
Withinde
varianzas
Variance
Mc
Me
156
Examinando varianzas:
No diferencia entre medias
Mc Me
157
Examinando la varianza:
Grandes diferencias entre medias
Mc
Me
158
Examinando varianzas: tres grupos
Mc
Me2
Me1
159
Tipos de diseños
O 1 O2 O3
Cambio dentro del grupo en el tiempo,
diseño de mediciones repetidas.
160
Tipos de diseños
O1e
O1c
X O2e
O2c
cambio dentro del grupo de O1e a O2e
cambio entre grupos O2e y O2c
161
¿Cómo analizar este diseño?
• O1e O2e O3e X O4e O5e O6e
O1c O2c O3c O4c O5c O6c
• Análisis de varianza de mediciones
repetidas en dos grupos.
• Uno entre factor (grupo) y uno dentro
factor (tiempo) con seis niveles.
162
Diseño sólo post-prueba
• X O2e
O2c
Prueba de t no pareada
Hipótesis nula:
H0: O2e = O2c
Hipótesis alternativa direccional:
H1: O2e > O2c
163
• Desviación estándar
– Cómo las mediciones varían alrededor de la
media
• Error estándar de la media
– Cómo las mediciones de las medias varían
alrededor de la media de la población
164
Error estándar de la media:
Promedio de DS de la muestra
Población (n=1000)
Media de edad:
36.5 años
Muestras (n=50)
Media de edad: 34.6 años
SD
3.4
37.1 años 36.4 años
3.8
4.1
165
Conceptual:
MediaE – MediaC
t=
error estándar de la media
166
Suposiciones de ANOVA
•
•
•
•
Distribución Normal
Independencia de mediciones
Escala continua
Relación lineal entre variables
167
ANOVA 3 X 2

R

O1exp X1
O2exp
O1exp X2
O2exp
O1con
O2con
Uno entre factor: grupo (3 niveles)
Uno dentro factor: tiempo (2 niveles)
168
Prueba de F Ómnibus

R

O1exp X1
O2exp
O1exp X2
O2exp
O1con
O2con
Prueba F de grupo: ¿hay una diferencia entre los tres
grupos?
Prueba F de tiempo: ¿hay una diferencia entre tiempo 1
y 2?
Si es sí, ¿dónde está la diferencia?
Interacción: Grupo por tiempo
169
Comparaciones post-hoc
O1exp1 X1
O2exp1
O1exp2 X2
O2exp2
O1con
O2con

R

Tipos: Scheffé, Tukey – control para grados de libertad en
diferentes formas; compara todas las comparaciones posibles
en dos formas
H0: O2exp1 = O2exp2 = O2con Si rechazas la nula. La
prueba F es significativa, puedes buscar diferencias de
dos formas.
(O2exp1= O2exp2?) o (O2exp2= O2con?) o (O2exp1 = O2con?)
170
Pruebas de significancia
No-paramétricas Paramétricas
Dos grupos
Pareados Wilcoxon Rank
No pareados Mann-Whitney U
Prueba t pareada
Prueba t no pareada
Más de dos grupos
Mediciones repetidas Prueba Friedman
Grupos independientes Kruskal –Wallis
ANOVA
ANOVA de mediciones
repetidas
171
Alfa galopante
• Peligro en conducir múltiples pruebas t o haciendo
análisis al nivel de ítem en encuestas
• alfa = probabilidad de rechazar la hipótesis nula
• Alfa 0.05 dividido entre el número de pruebas t,
distribuye el alfa entre las pruebas
• Si se conducen 10 pruebas t, alfa a 0.005 por
prueba (0.05/10=0.005)
172
ANOVA
• ANOVA – análisis de varianza
• ANCOVA – análisis de co-varianza,
incluye variable (s) Z
• MANOVA – análisis multivariado de
varianza (más de una variable
dependiente)
• MANCOVA – análisis multivariado de
co-varianza, incluye variable (s) Z.
173
Análisis de regresión múltiple
Técnica de correlación
– Valores inestables
– Muestra específica
– Confiabilidad de mediciones muy
importante
– Requiere gran tamaño de muestra
– Fácil para obtener significancia
con gran tamaño de muestra
174
Análisis de regresión múltiple
Intentos para hacer señalamientos de relaciones
causales
Y = X1+X2+X3
Y = variable dependiente (status de
salud)
X1-3 = predictores o variables
independientes
Status de salud = Edad + Género +
Tabaquismo
175
Preguntas de regresión múltiple:
• ¿Cual es la contribución de edad, género y
tabaquismo al status de salud?
• ¿Qué tanto de la variación en status de salud
es debido a variaciones en edad, género,
tabaquismo?
176
Análisis de regresión múltiple
• Crea una matriz de correlación.
• Selecciona la variable independiente más
altamente correlacionada con la variable
dependiente primero.
• Extrae la varianza en Y contada por la
variable X.
• Repite el proceso (iterativo) hasta no más
de la varianza en Y es estadísticamente
explicada por la suma de otra variable X.
177
Status de salud= edad + género +
tabaquismo
Status de
salud
Y
Edad
X1
Género
X2
Tabaquismo
Status de
salud
Y
Edad
X1
r2
Género
X2
R2
Tabaquismo
1
0.25
6%
0.04
0%
0.40
16%
1
0.11
1%
.05
0%
1
.20
4%
X3
r2
1
X3
178
Regresión múltiple: varianza
compartida
Tabaquismo
40%
Status de salud
Edad 25%
Género 4%
Edad
Tabaquismo
Género
179
Regresión múltiple
• Correlación resulta en una r
• Regresión múltiple resulta en una r2
• R al cuadrado es la cantidad total de la
varianza en Y que es explicada por los
predictores, removiendo la superposición
entre los predictores.
180
Regresión múltiple
Tipos
• Escalonada = basada en la correlación
más alta, que variable entra primero (la
computadora hace la decisión),
construcción de teoría
• Jerárquica = elije el orden de entrada,
entrada forzada, prueba de teoría.
181
Regresión múltiple
• Nos permite agrupar variables en bloques.
• Bloque 1: variables demográficas
– (edad, género, nivel socioeconómico)
• Bloque 2: bienestar psicológico
– (depresión, apoyo social)
• Bloque 3: severidad de enfermedad
– (cuenta de CD4, diagnóstico SIDA, carga viral, OI)
• Bloque 4: tratamiento o control
– 1= tratamiento y 0 = control
182
Análisis de regresión
• Regresión múltiple: una Y, múltiples X.
• Regresión logística: Y es dicotómica, popular
en epidemiología, Y=enfermedad o no
enfermedad; razón de momios – razón de
riesgos (varianza no explicada)
• Análisis variado canónico: múltiples Y y
múltiples variables X: Y1+Y2+Y3=X1+X2+X3
-ligando variables fisiológicas con variables
psicológicas.
183
Modelos de regresión multivariable:
• Ruta de análisis y ahora Ecuación estructural de
modelaje
• Programa de software: AMOS
• Modelo de medición está combinado con
modelo predictivo
• Conserve la multicolinearidad de variables
(¡están correlacionadas!)
• Permita variables moderadoras (efectos directos
e indirectos).
184
Ruta de análisis de modelaje múltiple
independiente y dependiente
Relaciones están basadas en la
revisión de la literatura y luego
potencialmente exploradas,
descubiertas, probadas o validadas
Edad
Severidad
de la
enfermedad
Adherencia
a la dieta
Género
Apoyo
social
Control
diabético
Habilidad
cognitiva
lity
185
Modelando ecuación estructural
Dolor
muscular
mes 0
Fatiga mes
0
Inter sección
Intersección
Dolor
muscular
mes 1
Fatiga mes
1
Dolor
muscular
mes 3
Fatiga mes
3
Dolor
muscular
mes 6
Pendiente
Pendient
e
Fatiga mes
6
186
Factor de análisis
• Exploración de la validez de constructo de
un instrumento
• Técnica correlacional
• Requiere sólo una administración de un
instrumento
• Técnica de reducción de datos
• Un procedimiento estadístico que requiere
aptitudes artísticas
187
Tipos conceptuales de factor de
análisis
• Exploratorio – ver que está en el
grupo de datos
• Confirmatorio – ver si tu puedes
replicar la estructura reportada.
188
Factor de análisis
• Componentes principales –
(factor principal
o
ejes principales)
189
Matriz de correlación de la escala de
ítems:
¿Cuáles ítems están relacionados?
Item 1
Item 2
Item 3
Item 4
Item 1
Item 2
Item 3
Item 4
1
0.80
0.30
0.25
1
0.40
0.25
1
0.70
1
190
Factor de análisis:
Un proceso interactivo
Factor de extracción
191
Factor de análisis
Factor I
Factor II
Factor III
Comunalidad
Item 1
0.80
0.20
-0.30
0.77
Item 2
0.75
0.30
0.01
0.65
Item 3
0.30
0.80
0.05
0.63
Item 4
0.25
0.75
0.20
0.67
Eigenvalue
2.10
2.05
0.56
% var
34%
30%
10%
192
Definiciones:
• Comunalidad: ítem al cuadrado cargado
sobre cada factor y suma sobre cada
ÍTEM
• Eigenvalue: ítems al cuadrado
descargado para cada factor y suma
sobre cada FACTOR
• Etiqueta de factores: producto de la
imaginación del autor. Ítems 1 y 2 = factor
I; ítems 3 y 4 = factor II.
193
Factor de rotación
Factores son matemáticamente rotados
dependiendo de la perspectiva del autor.
• Ortogonal – ángulos rectos, bajas
correlaciones interfactores, crea mayores
factores de independencia, bueno para
análisis de regresión múltiple, puede no
reflejar los datos actuales (varimax)
• Oblicuo – diferentes tipos, deja que los
factores se correlacionen entre ellos al grado
de que actualmente se correlacionan y se
cree que reflejan mejor los datos actuales
difícil de usar en múltiple regresión debido a
194
la multicolinearidad (oblimax)
Resumen: Análisis de datos
•
•
•
•
•
Medidas de tendencia central
Medidas de relación
Probando diferencias de grupos
Correlación
Técnica de regresión múltiple
como predicción (causal).
• Factor de análisis como una
escala de desarrollo, técnica de
validez de constructo.
195
Guías éticas para investigación en
enfermería
Vulnerabilidad – una relación de poder
entre el proveedor de atención en
salud y paciente, familia, cliente.
Participantes vulnerables en
investigación, requieren más
protección de daños.
196
Principios éticos que guían la
investigación
•
•
•
•
•
•
Beneficiencia – hacer el bien
No maleficiencia – no hacer mal
Fidelidad – creando confianza
Justicia – siendo justo
Veracidad – diciendo la verdad
Confidencialidad – protegiendo o
salvaguardando la información que identifique a
los participantes
197
Principios éticos que guían la
investigación
Confidencial
– Nombres conservados en lugar seguro
vs.
Anónimo
– Sin identificadores
198
Mejores deseos