Download IBM SPSS Advanced Statistics

Document related concepts
no text concepts found
Transcript
IBM Software
Business Analytics
IBM SPSS Advanced Statistics 22
IBM SPSS
Advanced Statistics
Analice de forma más precisa relaciones complejas
Logre análisis más precisos y obtenga conclusiones más seguras con los
procedimientos diseñados para ajustarse a las características inherentes de
los datos que describen relaciones complejas. IBM SPSS Advanced
Statistics cuenta con un potente conjunto de sofisticadas técnicas analíticas
univariadas y multivariadas para problemas del mundo real como:
Características
• Construya modelos
flexibles utilizando varias
opciones para la
construcción de modelos
• Obtenga modelos
predictivos más precisos
utilizando un amplio rango
de técnicas de modelo
• Identifique efectos
aleatorios
• Analice resultados
utilizando varios métodos
• Investigación médica – Análisis de tasas de supervivencia de pacientes
• Manufactura – Evaluación de procesos de producción
• Industria farmacéutica – Informe de resultados de pruebas para
organizaciones oficiales
• Investigación de mercados – Determine el nivel de interés en sus
productos
Acceso a un amplio rango de poderosos modelos
Tenga acceso a un amplio rango de potentes modelos
Además del Modelo Lineal General (GLM), la mezcla de procedimientos
de modelos, el Modelo Lineal Generalizado (GENLIN) y los
Procedimientos Generalizados de Estimación de Ecuaciones (GEE) IBM
SPSS Advanced Statistics ofrece Modelos Lineales Mixtos Generalizados
(GLMM).
Los modelos lineales mixtos generalizados incluyen un amplio rango de
modelos, desde una simple regresión lineal hasta modelos multinivel
complejos para datos longitudinales anormales. El procedimiento GLMM
produce modelos más precisos al predecir resultados no lineales (como por
ejemplo, qué productos los clientes comprarán) considerando estructuras de
datos jerárquicos (por ejemplo, clientes anidados en una organización).
GENLIN incluye los modelos estadísticos más utilizados, como regresión
lineal para respuestas con distribución normal, modelos logísticos para
datos binarios, y modelos loglineales para datos de frecuencia. Este
procedimiento también ofrece muchos modelos estadísticos útiles a través
de su formulación general de modelos como: regresión de Poisson,
regresión Gamma y regresión negativa binomial. GEE extiende los
modelos lineales generalizados para acomodar datos longitudinales
correlacionados y datos segmentados.
IBM Software
Business Analytics
GENLIN y GEE proveen un marco común para las
siguientes salidas:
• Numérica: Regresión lineal, análisis de varianza,
análisis de covarianza, análisis de medias repetidas
y regresión Gamma
• Datos de frecuencia: Modelos loglineales,
regresión logística, regresión probit, regresión de
Poisson, regresión binomial negativa
• Datos ordinales: Regresión ordinal
• Datos de ensayo/evento: Regresión logística
• Datos de reclamos: Regresión inversa de Gauss
• Combinación de variables discretas y continuas:
Regresión Tweedie
• Respuestas correlacionadas con sujetos: GEE o
modelos de respuestas correlacionadas
Obtenga modelos predictivos más precisos
trabajando con una estructura de datos
anidada
Los modelos lineales mixtos mejoran las
capacidades del Modelo Lineal General utilizado en
el procedimiento GLM, pudiendo así analizar datos
que muestran correlación y variabilidad no
constante. Los modelos lineales mixtos le permiten
hacer modelos no sólo de medias sino de varianzas y
covarianzas de sus datos.
La flexibilidad del procedimiento le facilita formular
una gran variedad de modelos, incluyendo modelos
ANOVA de efectos fijos, diseño de bloques
completamente aleatorios, diseño split-plot, modelo
de efectos puramente aleatorios, modelo de
coeficiente aleatorio, análisis multinivel, modelo
lineal de crecimiento incondicional, modelo lineal de
crecimiento con covarianza de Pearson, análisis de
medidas repetidas, análisis de medidas repetidas con
covarianza dependiente del tiempo. Trabajar con
diseños de medida repetida, incluyendo medidas
repetidas incompletas en las cuales el número de
observaciones varía para los distintos sujetos.
IBM SPSS Advanced Statistics 22
Construya modelos flexibles
El procedimiento de Modelo Lineal General (GLM)
ofrece más flexibilidad para describir las relaciones
entre una variable dependiente y un conjunto de
variables independientes. Entre los modelos que se
encuentran en la regresión lineal están: ANOVA,
ANCOVA, MANOVA y MANCOVA. GLM incluye
también funciones para medidas repetidas, modelos
mixtos, pruebas post-hoc y pruebas post-hoc para
medidas repetidas, cuatro tipos de sumas de
cuadrados, comparaciones por pares de medias
marginales esperadas, tratamiento complejo de
celdas perdidas y la opción de guardar las matrices
de diseño y los archivos de efectos.
Aplique modelos más sofisticados
Utilice IBM SPSS Advanced Statistics cuando los
datos no se ajusten a las hipótesis que requieren
técnicas más simples. IBM SPSS Advanced
Statistics cuenta con análisis loglineal y loglineal
jerárquico para modelar tablas multifactoriales. El
análisis general loglineal le facilita el análisis de las
frecuencias de las observaciones de cada una de las
categorías en una tabla de contingencia. Usted puede
seleccionar hasta diez factores para definir las celdas
de la tabla.
La información modelada y la bondad del ajuste de
los estadísticos aparecen automáticamente en
pantalla. Muestra una gran variedad de estadísticos y
gráficos con capacidad de guardar los residuos y
valores predichos en el archivo de datos.
Analice datos históricos y datos de duración
Puede analizar tiempo de vida o duración para
comprender eventos terminales, como fallo de un
componente, muerte o supervivencia. IBM SPSS
Advanced Statistics incluye los procedimientos de
supervivencia Kaplan-Meier y la regresión de Cox,
el estado del arte en procedimientos de
supervivencia. Utilice las estimaciones de KaplanMeier para calibrar la duración de un suceso; y la
regresión de Cox para ejecutar una regresión del
modelo de riesgos proporcionales con el tiempo de
respuesta (o duración de la respuesta) como variable
dependiente. Estos procedimientos junto con el
análisis de tablas de mortalidad proporcionan un
conjunto de técnicas flexibles y completas para el
trabajo con datos de supervivencia.
IBM Software
Business Analytics
IBM SPSS Advanced Statistics 22
Obtenga un valor adicional con colaboración
GENLIN y GEE
Compartir y re-utilizar sus activos eficientemente,
protegerlos de forma tal que se cumplan
requerimientos internos y externos, y publicar
resultados para que varios usuarios pueden
visualizarlos e interactuar con ellos es posible con
IBM® SPSS® Collaboration and Deployment
Services.
Los procedimientos GENLIN proveen un marco
unificado que incluye modelos lineales clásicos con
distribución normal de la variable dependiente,
logística y modelos probit para datos binarios y
modelos loglineal para datos de frecuencia, así como
otros modelos no estándar de tipo regresión. Los
procedimientos GEE extienden el modelo lineal
generalizado a datos longitudinales correlacionados
y a datos segmentados. Específicamente el modelo
GEE se correlaciona con sujetos.
• Beneficios para el usuario:
- Salidas continuas: regresión lineal, análisis de
varianza, análisis de covarianza, análisis de medidas
repetidas y regresión Gamma
- Datos ordinales: regresión ordinal
- Datos de frecuencia: modelo loglineal, regresión
logística, regresión probit, regresión Poisson,
regresión negativa binomial
- Datos de ensayo/evento: regresión logística
- Datos de reclamos: regresión inversa Gaussiana
- Combinación de variables discretas y continuas:
regresión de Tweedie
- Respuestas correlacionadas con sujetos: GEE o
modelos de respuestas correlacionadas
• El subcomando MODEL es utilizado para efectos
específicos, una variable de ponderación o
compensación si existe, la distribución de
probabilidad y la función de enlace:
- Ofrece una opción para incluir o excluir el término
de intersección
- Especifica una variable de acomodación o fija la
acomodación a un número
- Especifica una variable que contenga valores de
peso Omega para la escala de parámetro
- Le permite al usuario escoger entre las siguientes
distribuciones de probabilidad: binomial, Gamma,
Gaussian inversa, binomial negativa, normal y
Poisson
- Ofrece las siguientes funciones de enlace: log-log
complementario, identidad, log, complemento log,
logit, binomial negativo, log-log negativo, poder de
odds, probit y log cumulativo
• El subcomando CRITERIA controla el criterio
estadístico para modelos lineales generalizados y
especifica la tolerancia numérica para revisar
singularidad. Provee opciones para especificar:
- El tipo de análisis para cada efecto de modelo: tipo
I, tipo III o ambos
- Un valor por iteración inicial para revisar
separaciones completas o casi completas
- El nivel del intervalo de confianza para
coeficientes estimados y medias marginales
estimadas
Características
Modelos Lineales Mixtos Generalizados
(GLMM)
GLMM amplía el modelo lineal para que: 1) el
objetivo lineal sea realacionado a los factores y
covarianzas a través de una función de vinculación
específica; 2) el objetivo pueda tener distribución
anormal y; 3) las observaciones puedan ser
correlacionadas.
• Realice el procedimiento GLMM con valores
ordinales para modelos más precisos al predecir
resultados no lineales
• Especifique la estructura el objeto para mediciones
repetidas y cómo las medidas de error repetidas
son correlacionadas
• Elija entre 8 tipos de covarianza
• Especifique el objetivo, las compensaciones
opcionales y las ponderaciones opcionales del
análisis (regresión)
• Elija entre las siguientes distribuciones de
probabilidad: binomial, gamma, Gaussiana
inversa, multinomial, binomial negativa, normal,
Poisson
• Elija entre las siguientes funciones de vinculación:
identidad, complemetario log-log, vinculación log,
log complementaria, logit, negativa log-log,
power, probit
• Especifique (opcional) los efectos de los modelos
fijos, incluyendo intercept
• Especifique los efectos aleatorios en el modelo
mixto
• Despliegue las ponderaciones marginales
estimadas de los objetivos para todos los niveles
de combinaciones de un conjunto de factores
• Guarde un archivo que contenga el modelo de
ponderación
• Escriba campos temporales opcionales en el
conjunto de datos activos
IBM Software
Business Analytics
- Matriz de covarianza para parámetros estimados:
estimador basado en el modelo, o estimador robusto
- El criterio de convergencia Hessiana
- Valor inicial para parámetros estimados
- Forma de la función log-probabilidad
- Número máximo de iteraciones para la estimación
de parámetros y log-probabilidad
- Número máximo de pasos en el método de pasoreducción
- Método para la estimación de parámetros del
modelo: método de Fisher o método NewtonRaphson
- Criterio de parámetro de convergencia
- Método para ajustar el parámetro de escala:
probabilidad máxima, desviación, Pearson, Chicuadrado, o ajustar a un número
- Valor de tolerancia usado para evaluar
singularidad
• El subcomando REPEATED especifica la
estructura matricial para la correlación trabajada
utilizada para estimaciones de ecuaciones
generalizadas para modelos de correlación con
sujetos y criterios de control estadístico en el
algoritmo basado en la no probabilidad de ajuste
iterativo. Provee opciones para especificar lo
siguiente:
- El sujeto interno o el tiempo del efecto
- Estructura de la matriz de correlación: matriz de
correlación de trabajo independiente, AR(1) matriz
de correlación de trabajo, matriz de correlación de
trabajo intercambiable, matriz de correlación de
trabajo ajustable, matriz de correlación de trabajo mdependiente, matriz de correlación de trabajo no
estructurada
- Ajustar o no el estimado de la matriz de
correlación de trabajo por el número de parámetros
no redundantes
- Usar estimador robusto o el estimador basado en el
modelo o el parámetro de estimación de la matriz de
covarianza para la estimación de ecuaciones
generalizadas
- El criterio de convergencia Hessiana para
ecuaciones estimadas generalizadas
- Máximo de iteraciones
- Parámetro relativo o absoluto del criterio de
convergencia
- El número de iteraciones entre actualizaciones de
la matriz de correlación de trabajo
- Mostrar la media marginal estimada de la variable
dependiente para todos los niveles de combinación
de un grupo de factores
IBM SPSS Advanced Statistics 22
• El subcomando EMMEANS muestra loas medias
marginales estimadas de la variable dependiente
para todos los niveles de combinación de un grupo
de factores. Ofrece la opción para especificar lo
siguiente:
- Las celdas para las cuales se muestra la media
marginal estimada
- Los valores de covarianza para usar cuando se está
calculando la media marginal estimada
- Computar o no la media marginal estimada basada
en la escala original de la variable dependiente o en
la transformación de la función de enlace
- El factor o grupo de factores cruzados, el nivel o
niveles de combinación, los cuales están comparados
usando el tipo de contraste especificado usando la
palabra CONTRAST
- El tipo de contraste a utilizar para los niveles del
factor o niveles de combinación de los factores
cruzados, usando la palabra COMPARE. Los
siguientes tipos de contraste están disponibles:
pareada, desviación, diferencia, Helmert, polinomial,
repetida y simple
- El método de ajuste del nivel de significancia
utilizado en las pruebas de contraste: diferencia
menos significativa, Bonferroni, Bonferroni
secuencial, Sidak y Sidak secuencial
• El subcomando MISSING especifica cómo son
manejados los valores perdidos
El subcomando PRINT ofrece opciones para mostrar
lo siguiente: matriz de correlación para estimar
parámetros, matriz de covarianza para estimar
parámetros, resumen de casos procesados,
estadísticos descriptivos, bondad de ajuste, función
estimable general, historia de iteración, multiplicador
de Lagrange, grupo de coeficientes de matrices de
contraste (L), información del modelo, parámetros
estimados y estadísticos correspondientes, resumen
de modelos estadísticos, matriz de correlación de
trabajo
• El subcomando SAVE ofrece opciones para
guardar lo siguiente, en el archivo de los datos de
trabajo: valores predichos por el predictor lineal,
error estándar estimado del valor predicho para el
predictor lineal, valor predicho para la media de
las respuestas, intervalo de confianza para la media
de las respuestas, valor promedio, raíz residual,
residual de Pearson, desviación residual,
desviación residual estándar, probabilidad residual
y distancia de Cook
IBM Software
Business Analytics
• El subcomando OUTFILE ofrece opciones para
guardar lo siguiente en un archivo externo: la
matriz de parámetro de correlación y otros
estadísticos en un conjunto de datos de Statistics.
La matriz del parámetro de covarianza y otros
estadísticos en un conjunto de datos de Statistics y
el parámetro de covarianza en un archivo XML
GENLIN: verifica el subcomando HCONVERGE
después de la correlación aún cuando no se
especifica
MIXTOS
Los modelos lineales mixtos mejoran el Modelo
Lineal General utilizado en el procedimiento GLM,
así puede analizar datos que muestran correlación y
variabilidad no constante.
• Comprende los modelos siguientes:
- Modelo ANOVA de efectos fijos, diseño de
bloques completamente aleatorios, diseño de splitplot, modelo de efectos puramente aleatorios,
modelo de coeficiente aleatorio, análisis multinivel,
modelo lineal de crecimiento incondicional, modelo
lineal de crecimiento con covariables a nivel
individuo, análisis de medidas repetidas, análisis de
medidas repetidas con covarianza dependiente del
tiempo
• Posibilidad de ponderar las frecuencias o las
regresiones
• Seis estructuras de covarianzas: auto regresivo de
primer orden, simetría compuesta, Huynh-Feldt,
identidad, no estructurado y componentes de la
varianza
• Once tipos de covarianzas no espaciales:
antidependencia de primer orden, heterogénea,
auto regresivo de primer orden, ARIMA (1,1), de
simetría heterogénea compuesta, de simetría
compuesta con parameterización y correlación,
diagonal, factor analítico de primer orden,
Toeplitz, Toeplitz heterogéneo y correlaciones no
estructuradas
• Elija CRITERIA para el control del algoritmo
iterativa utilizado en la estimación y especifique la
tolerancia numérica para probar la singularidad:
nivel del intervalo de confianza, criterio de
convergencia de la función de máximo
verosimilitud, máximo número de iteraciones,
criterio de convergencia de parámetros estimados
(absoluta y relativa, máxima división por pasos
permitida, aplicación del algoritmo de calificación
y valores empleados como tolerancia para
contrastar la singularidad
IBM SPSS Advanced Statistics 22
• Especificación de los efectos fijos en el modelo
mixto: sin ordenar en el origen, sumas de
cuadrados (tipo I y III)
• Especificación de los efectos aleatorios:
identificación de los sujetos, estructura de la
covarianza (auto regresivo de primer orden,
simetría compuesta, Huynh-Feldt, identidad,
componentes de la varianza no estructurada)
• Atendiendo al tipo de covarianza que se
especifique, los efectos aleatorios especificados en
el subcomando RANDOM deben estar
correlacionados
• Métodos de estimación: máxima verosimilitud,
máxima verosimilitud restringida
• Opciones de impresión: matriz de correlaciones
asintóticas de los parámetros estimados de los
efectos fijos, matriz de covarianzas asintóticas de
los parámetros estimados de los efectos fijos,
resumen de los casos procesados, estadísticos
descriptivos, matriz de covarianzas estimadas de
efectos aleatorios, historial de iteraciones,
funciones estimables, matriz de covarianzas
estimadas de los residuos, soluciones para los
efectos fijos y aleatorios, y pruebas de covarianza
para parámetros
• Subcomando REPEATED para especificar la
matriz de covarianza de los residuos en el modelo
de efectos mixtos: identificar los sujetos y
estructura de la covarianza (auto regresivo de
primer orden, simetría compuesta, Huynh-Feldt,
identidad, no estructurado, componentes de la
varianza)
• Guarda los valores fijos pronosticados, valores
pronosticados, residuos
• Subcomando TEST para personalizar pruebas de
hipótesis especificando directamente hipótesis
nulas como combinaciones lineales de los
parámetros
- Divisor para los coeficientes de los efectos
aleatorios
• Guardo los errores estándar de predicción
• Subcomando MEANS para los efectos fijos, que
muestra la media marginal estimada en las celdas
de las variables dependientes y sus errores
estándar para los factores especificados
IBM Software
Business Analytics
GLM
Describe la relación entre una variable dependiente y
un grupo de variables independientes
• Pruebas de falta de ajuste uni y multivariante
• Modelo de regresión
• ANOVA, ANCOVA, MANOVA y MANCOVA
de efecto fijo
• ANOVA y ANCOVA aleatorio o mixto
• Medidas repetidas: uni o multivariante
• Diseño multivariante Doubly
• Cuatro tipos de sumas cuadradas
• Método de parameterización completo para
estimar parámetros en el modelo
• Contrastes de hipótesis lineales generales para los
parámetros del modelo
Escribe una matriz de varianza o correlación de las
estimaciones de parámetros del modelo en un
archivo matricial
• Diagramas: de dispersión Vs. Nivel residual y
perfil
• Los diálogos de las medidas repetidas GLM
ofrecen la opción “ningún contraste” que no tiene
efecto en los resultados
• Pruebas post-hoc para media observadas de las
celdas: Student-Newman-Keuls; prueba de
diferencia honestamente significativa de Tukey; la
b de Tukey; método de comparaciones múltiples
de Duncan basado en el contraste de rango de
student; prueba t de Scheffé de comparaciones
múltiples; prueba t de Dunnett unilateral (compara
si la media a cualquier nivel es menor que la de la
categoría de referencia); prueba t de Dunett
bilateral (compara si la media de cualquier nivel es
mayor que la de la categoría de referencia); prueba
t de Bonferroni; prueba t de diferencia mínima
significativa; prueba t de Sidak, GT2 de Hochberg;
prueba de comparaciones de pares de Gabriel
basados en el contraste de módulo máximo
student; método de múltiples pasos de Ryan-EinotGabriel-Welsch basados en la prueba F; método de
múltiples pasos de Ryan-Einot-Gabriel-Welsch
basados en la prueba del rango student; T2 de
Tamhane, T3 de Dunnett, juegos y prueba Howell
de comparaciones de pares basados en la prueba
del rango student; C de Dunnett; prueba t de
Waller-Duncan
• Término de error especificado por el usuario en el
análisis post-hoc
• Medias marginales de población estimadas para
medias de celdas pronosticadas
IBM SPSS Advanced Statistics 22
• Guarda variables temporales en el archivo activo:
valores pronosticados no estandarizados, valores
pronosticados, valores pronosticados ponderados,
residuos no estandarizados, residuos no
estandarizados ponderados, residuos eliminados,
residuos tipificados, residuos student, errores
estándar de predicción, distancia de Cook, valores
no centrados de influencia
• Números fraccionarios en los subcomandos
LMATRIX, MMATRIX y KMATRIX
• Comparaciones por pares de media marginales
esperadas
• Prueba de hipótesis lineales de un efecto frente a
una combinación lineal de efectos
• Opción de almacenamiento de las matrices de
diseño
• Contrastes: desviación, simple, diferencia,
Helmert, polinomial y repetida
• Impresión: estadísticos descriptivos, prueba de
homogeneidad de la varianza, estimación de
parámetros, Eta2, función general estimable,
contraste de falta de ajuste, potencia observada de
cada prueba, matrices de coeficientes de contrastes
(L)
VARCOMP
Estimación de los componentes de la varianza
• Métodos de estimación: ANOVA MINQUE,
máxima verosimilitud (ML) y máxima verosimilitud
restringida (REML)
• Sumas de cuadrados de tipo I y III con el método
ANOVA
• Elección de métodos de ponderación cero o
uniforme
• Elección de métodos de cálculo ML y REML:
método de puntuación de Fisher o Newton-Raphson
• Guarda las estimaciones de los componentes de
varianza y las matrices de covarianza
• Criterio de especificación: iteraciones,
convergencia, valores Epsilon como tolerancia
empleados para comprobar la singularidad
• Impresión: medias esperadas al cuadrado,
iteraciones, suma de cuadrados
IBM Software
Business Analytics
SURVIVAL
Análisis de tablas de supervivencia
• Tablas de supervivencia para grupos individuales
• Longitudes de intervalos variables
• Diagramas: distribución de supervivencia
acumulada en escala logarítmica o lineal, función de
impacto, función de densidad
• Comparaciones de subgrupo
• Diagrama de uno-menos la función de
supervivencia
• Variables de estado que indican si el suceso ocurrió
realmente para la observación
• Impresión de tablas de supervivencia
• Cálculo de comparación de subgrupos: exactas,
aproximadas, condicional, pareada y comparada
• Opción de escribir tablas de supervivencia de los
registros de los datos y archivos de los nombres de
los registros
LOGLINEAR
Modelos generales de tablas de contingencia
multifactoriales (sólo sintaxis)
• Estimación por máxima verosimilitud
• Modelos: saturado, particiones de un solo grado de
libertad jerárquicas o no jerárquicas, modelos logit
• Frecuencias observadas y esperadas
• Residuos tipificados y no tipificados
• Estimaciones de parámetros
• Ponderación de celdas y especificación de cero
estructural
• Diagramas de residuos corregidos frente a
frecuencias observadas y esperadas
• Diagramas con probabilidad normal y sin
tendencias de residuos corregidos
• Razón de verosimilitud y Chi-cuadrado de Pearson
• Contrastes: desviación, diferencia, Helmert, simple,
repetida, polinomial y especial
HILOGLINEAR
Modelos loglineales jerárquicos para tablas de
contingencia multifactoriales
• Métodos de entrada simultánea y eliminación
regresiva
• Impresión: frecuencias y residuos
• Estimaciones de parámetros y asociaciones
parciales para modelos saturados
• Especificación de criterios: convergencia, máximo
de iteraciones, probabilidad de Chi-cuadrado para
el modelo y número máximo de pasos
IBM SPSS Advanced Statistics 22
• Especificación de ponderaciones de celdas y orden
máximo de los términos
• Diagramas de residuos tipificados frente a
frecuencias observadas y esperadas
• Diagramas con probabilidad normal de residuos
tipificados
• Tablas pivote de resultados
GENLOG
Ajusta los modelos loglineal y logit con datos de
frecuencia por medio de un modelo lineal
generalizado (GLM)
• Ajusta dos modelos: estimación de máxima
verosimilitud bajo el modelo loglineal de Poisson
y modelos loglineales multinomiales
• Exponencial de Beta
• El método GLM permite tratar datos no
organizados
• Especificación de la estructura de celdas
• Especificación del diseño de los modelos con la
sintaxis del modelo GLM
• Admite ceros estructurales
• Impresión de estadísticos de bondad de ajuste Chicuadrado
• Pruebas generalizadas para el logaritmo de la
razón de ventajas que comprueba si los ratios de
log-odds son iguales a cero, e imprime los
intervalos confidenciales
• Estadísticos de celdas que incluyen la frecuencia
esperada: residuo tipificado; residuo no tipificado,
corregido y de la desviación
• Incluye funciones de residuos generalizados
• Diagramas de diagnóstico que incluyen diagramas
de dispersión de alta resolución y diagramas con
probabilidad normal de estadísticos de residuos
• Impresión de estimaciones de parámetros, junto
con correlaciones y covarianzas de las
estimaciones
• Almacenamiento de los residuos, residuos
estandarizados, residuos ajustados, residuos
desviados, valores pronosticados
Criterio de especificación, intervalo de confianza,
iteraciones, convergencia, Delta, valores Epsilon
como tolerancia en la prueba de singularidad
IBM Software
Business Analytics
IBM SPSS Advanced Statistics 22
KAPLAN-MEIER
REGRESION DE COX
Estimación de la duración de un evento con los
métodos de estimación de Kaplan-Meier
• Definición de factores y estratos
• Diagrama: funciones de impacto acumulado,
supervivencia acumulada y logarítmica
• Presentación de casos marcados y censurados
• Almacenamiento de variables en un archivo:
número de eventos acumulados, error típico, función
de supervivencia
• Presentación de estadísticos: eventos acumulados y
supervivencia acumulada, media y mediana de los
tiempos con error típico, números bajo riesgo,
percentiles, error típico
• Pruebas de igualdad de distribuciones de
supervivencia: Breslow, longrank y Tarone
• Especificación de un componente de tendencia para
niveles de factor con una métrica
• Diagrama de uno menos la función de
supervivencia
• Variables de estado para indicar si el evento
sucedió para la observación
• Especificación de los estratos dentro de las
categorías de los factores
• Comparación de las distribuciones de supervivencia
para los diferentes niveles del factor: comparación de
todos los niveles en una única prueba; comparación
de cada par de niveles del factor; prueba estadística
en todos los estratos, comparación de los niveles de
los factores en cada uno de los estratos
Riesgos proporcionales con covariables dependientes
del tiempo
• Contrastes: igual que para la regresión logística
• Definición de estratos para estimar funciones de
base independientes
• Métodos: por pasos regresivos y progresivo,
entrada directa
• Diagramas: supervivencia acumulada, impacto,
diagramas log-menos-log para cada estrato
• Eliminación de variables: cambio en razón de
verosimilitud condicional, Wald
• Almacenamiento de variables en un archivo:
funciones de línea base con sus errores típicos,
función de impacto acumulada, cambio en Beta,
función de supervivencia log-menos-log, residuos,
función de supervivencia
• Diagrama de uno menos la función de
supervivencia
• Variables de estatus para indicar si el evento
sucedió para la observación
• Especificación de los predictores ordinales o
nominales
• Impresión: resultado completo de la regresión
incluyendo el modelo estadístico para las variables
(tanto dentro de la ecuación como fuera), resumen de
la información, matriz de covarianzas/correlaciones
de los parámetros estimados para las variables del
modelo; tablas de las líneas base, intervalos de
confianza para exponencial de Beta
• Criterio: cambio en los parámetros estimados al
acabar con las iteraciones; máximo número de
iteraciones, porcentaje de cambio en la razón de
máxima verosimilitud de las iteraciones finales,
probabilidad de las puntuaciones de los estadísticos
de las variables de entrada, probabilidad de Wald,
estadístico LR o condicional LR para mover
variables
• Especificación del modelo de los valores de la
covarianza utilizados en los diagramas y tablas de
coeficientes
• Almacenado en archivos externos de SPSS:
coeficientes en el modelo final
IBM Software
Business Analytics
IBM SPSS Advanced Statistics 22
Sobre IBM SPSS Business Analytics
Requerimientos del sistema
Los requerimientos varían según la plataforma.
Encuentre los requerimientos del sistema para su
sistema operativo en:
ibm.com/software/analytics/spss/products/statistics/
requirements
El software de IBM SPSS Business Analytics le
proporciona conocimiento a través de sus datos que
le ayuda a las organizaciones a trabajar de manera
más inteligente y a superar a sus competidores. Este
portafolio incluye soluciones para inteligencia de
negocios, análisis predictivo, administración de
decisiones, del desempeño y del riesgo.
Las soluciones Business Analytics le permiten a las
empresas identificar y visualizar tendencias y
patrones en áreas como análisis de clientes, la cual
tiene un efecto importante en el desempeño de los
negocios. Podrá comparar escenarios, anticipar
amenazas potenciales y oportunidades, realizar una
mejor planeación de presupuestos y pronóstico de
recursos, balancear el riesgo contra los ingresos
esperados y trabajar para alcanzar los requerimientos
regulatorios. Al hacer el análisis más disponible, las
empresas alinean el proceso de decisión táctico y
estratégico para alcanzar los objetivos del negocio.
© Copyright IBM Corporation 2012
IBM Corporation
Software Group
Route 100
Somers, NY 10589
IBM, the IBM logo, ibm.com and SPSS are trademarks of International
Business Machines Corporation registered in many jurisdictions worldwide.
Other product and services names might be trademarks of IBM or other
companies. A current list of IBM trademarks is available on the Web at
“Copyright and trademark information” at
www.ibm.com/legal/copytrade.shtml
BeSmart, antes AMSS
Mardoqueo Fernández 207
Providencia | Santiago
F: +56 224153478
M: [email protected]
The content in this document (including currency or printing references
which exclude applicable taxes) is current as of the initial date of publication
and may be changed by IBM at any time. Not all offerings are available in
every country in which IBM operates.
THE INFORMATION IN THIS DOCUMENT IS PROVIDED “AS IS”
WITHOUT ANY WARRANTY, EXPRESS OR IMPLIED, INCLUDING
WITHOUT ANY WARRANTIES OF MERCHANT ABILITY, FITNESS
FOR A PARTICULAR PURPOSE AND ANY WARRANTY OR
CONDITION OF NON-INFRIGEMENT. IBM products are warranted
according to the terms and conditions of the agreements under which they
are provided.