Download Ejemplo 1 NAMP Módulo 17: “Introducción al Análisis Multivariable”

Document related concepts
no text concepts found
Transcript
ACP: Gráfica de Entradas (p1/p3)
34-meses de 1 día rev. 2 (incl. Datos de astillas) no. 2.M4 (PCA-X), Residuos removidos
p[1]/p[3]
X
TEMPORADA
52XQI195.AI
53PIC210.PV 52TI031.AI
52TI011.AI
85LCS320.AI
Pex_L1_R14
Pex_L1_Blan
53PIC309.PV
52XIC811.PV
85LCB320.AI
52TIC793.PV
53LIC301.PV
52PI706.AI
52FIC167.PV
Pex_L1_R100
52FIC116.PV
52PIC705.PV
52TIC711.PV
811FI102.AI
Cop>9/8
52PIB143.AI
53PIC308.PV
53FFC455.PV
CopSICC
53NI716.AI
52TIC102.PV
Cop>7/8
52PIB193.AI
53NIC100.PV
Pex_L1_PFM
53AI054.AI
52FIC115.PV
53HIC762.PV
53LIC510.PV
Cop>5/8 52XPI130.AI
Pex_L1_PFL
52TI118.AI
52SIC110.PV
52JCC139.PV
52JIC139.AI
52SIA110.AI
53LV301.AI
53AI034.AI53LIC011.PV
52TI168.AI
52XIC130.AI
52SQI110.AI
52KQC139.AI
52XAI130.AI
52HIC812.PV
52PIP143.AI
CopECOR
52XIC180.AI52FIC154.PV
53PIC305.PV
CopCAR
CopECLA
85FQ101.AI
52FIC165.PV
52KQC189.AI
53LR405.AI
52PIC159.PV
52IIC178.PV
52PIC961.PV
52PIC105.PV
52LIC106.PV
52FIC164.PV
52FIC104.PV
52X_130.AI_split_L1.52PCB111.PV
52FRA703.AI
52ZIC148.PV
52PCA111.PV
52PCA161.PV
52TIC010.CO
52PI178.AI
52ZI194.AI
52SI055.AI
52JI189.AI
Cop<3/16
Pex_L1_PFC
CopDENS
53FI012.AI
52PI128.AI
52FFC117.PV
52IIC128.PV
52PIA193.AI
52PIA143.AI
53WI012.AI
Cop>3/16
52FIC177.PV
52ZIC198.PV
52PCB161.PV Cop>3/8 33LI214.AI
53NIC013.PV
53AIC453.PV
52ZIC147.PV52ZIC197.PV
Pex_L1_CSF
52FFC166.PV
811FI104.AI
Pex_L1_Cons
52FR960.AI
Pex_L1_P200
52PIP193.AI
Pex_L1_R28
Pex_L1_LMF
52TR964.AI
52ZI144.AI
Pex_L1_R48
Temporada
0.20
p[3]
0.10
0.00
-0.10
-0.20
-0.20
-0.10
0.00
0.10
p[1]
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2, Rev.: 5
Conclusiones: p3
34-meses de 1 día rev. 2 (incl. Datos de astillas) no. 2.M4 (PCA-X), Residuos removidos
p[1]/p[3]
X
Verano
0.20
p[3]
0.10
0.00
-0.10
-0.20
Invierno
SEASON
52XQI195.AI
53PIC210.PV 52TI031.AI
52TI011.AI
85LCS320.AI
Pex_L1_R14
Pex_L1_Blan
53PIC309.PV
52XIC811.PV
85LCB320.AI
52TIC793.PV
53LIC301.PV
52PI706.AI
52FIC167.PV
Pex_L1_R100
52FIC116.PV
52PIC705.PV
52TIC711.PV
811FI102.AI
Cop>9/8
52PIB143.AI
53PIC308.PV
53FFC455.PV
CopSICC
53NI716.AI
52TIC102.PV
Cop>7/8
52PIB193.AI
53NIC100.PV
Pex_L1_PFM
53AI054.AI
52FIC115.PV
53HIC762.PV
53LIC510.PV
Cop>5/8 52XPI130.AI
Pex_L1_PFL
52TI118.AI
52SIC110.PV
52JCC139.PV
52JIC139.AI
52SIA110.AI
53LV301.AI
53AI034.AI53LIC011.PV
52TI168.AI
52XIC130.AI
52SQI110.AI
52KQC139.AI
52XAI130.AI
52HIC812.PV
52PIP143.AI
CopECOR
52XIC180.AI52FIC154.PV
53PIC305.PV
CopCAR
CopECLA
85FQ101.AI
52FIC165.PV
52KQC189.AI
53LR405.AI
52PIC159.PV
52IIC178.PV
52PIC961.PV
52PIC105.PV
52LIC106.PV
52FIC164.PV
52FIC104.PV
52X_130.AI_split_L1.52PCB111.PV
52FRA703.AI
52ZIC148.PV
52PCA111.PV
52PCA161.PV
52TIC010.CO
52PI178.AI
52ZI194.AI
52SI055.AI
52JI189.AI
Cop<3/16
Pex_L1_PFC
CopDENS
53FI012.AI
52PI128.AI
52FFC117.PV
52IIC128.PV
52PIA193.AI
52PIA143.AI
53WI012.AI
Cop>3/16
52FIC177.PV
52ZIC198.PV
52PCB161.PV Cop>3/8 33LI214.AI
53NIC013.PV
53AIC453.PV
52ZIC147.PV52ZIC197.PV
Pex_L1_CSF
52FFC166.PV
811FI104.AI
Pex_L1_Cons
52FR960.AI
Pex_L1_P200
52PIP193.AI
Pex_L1_R28
Pex_L1_LMF
52TR964.AI
52ZI144.AI
Pex_L1_R48
INTERPRETACIÓN
Componente 3:
-0.20
-0.10
Astillas de verano vs.
astillas de invierno
0.00
0.10
p[1]
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2, Rev.: 5
¿Qué hemos logrado?
VERANO / INVIERNO
Usando el ACP, hemos determinado que el 45% de la variabilidad en
las 130 variables originales pueden ser representadas usando sólo 3
variables o “componentes”. Estos tres componentes son ortogonales,
lo que significa que la variación en cada uno ocurre
independientemente de los otros. En otras palabras, los nuevos
componentes están no correlacionados uno con otro.
Componente 3
Ajusta el 6%
RENDIMIENTO DE REFINADO Componente 1
Ajusta el 32%
Componente 2
Ajusta el 7%
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 1
Tier 2, Rev.: 5
¿Qué tan exactos son los nuevos
componentes?
Cada nuevo componente es una combinación linear simple de las
variables originales. Por ejemplo, en este caso el componente 3 es
nada más y nada menos que la siguiente ecuación:
Componente 3 =
0.242472 x “TEMPORADA”
+ 0.159948 x “85LCS320.AI”
+ varios términos positivos …
– 0.224472 x “52ZI144.AI”
– 0.214372 x “52TR964.AI”
– varios términos negativos…
Obviamente esta ecuación, cuando se escribe completa, tiene 130
términos, uno para cada variable original. Varios de éstos, sin
embargo, tienen coeficientes cercanos a cero, lo que indica que
tienen un impacto muy pequeño en ese componente.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 1
Tier 2, Rev.: 5
¿Qué hay sobre la varianza no ajustada?
Nuestro modelo de ACP ha capturado el 45% de la variabilidad en el
conjunto original de datos. ¿Qué hay del otro 55%?
La varianza no ajustada tiene varias fuentes:
• Sólo retenemos tres componentes. Mayor varianza es capturada
por componentes de mayor orden, pero mucho de éste es ruido y no
tiene uso para los ingenieros de proceso.
• Nuestro modelo linear es una simplificación del conjunto original de
datos, y por lo tanto no puede ajustar el 100% de la varianza.
• Desviaciones y otros problemas con el conjunto original de datos
puede debilitar seriamente el modelo (“Basura dentro, basura fuera”)
• Algunas de las variables que impactan el proceso no fueron
medidas ( o hasta podrían ser “inmedibles”)
El último punto es muy importante para nuestro ejemplo, ya que muchas
características clave de las astillas, incluyendo la especie de madera,
nunca fueron medidas.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 1
Tier 2, Rev.: 5
Uso del PEL
Ahora daremos una pequeña mirada al uso del PEL, usando los
mismos datos.
Una característica importante de la pulpa es la longitud promedio de
la fibra, porque mientras más largas sean las fibras se obtendrá un
papel más resistente. Esta característica está representada en
nuestros datos por tres variables: “Pex_L1_LMF”, “Pex_L1_R28” y
“Pex_L1_R28”. Designaremos estas tres variables como Y’s.
El resto de las características de la pulpa fueron excluidas del análisis
PEL.
Todas las otras variables fueron designadas como X’s.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 1
Tier 2, Rev.: 5
Resultados para el Modelo PEL
34-months of 1 day rev. 2 (incl. chip data) no. 2.M8 (PLS), Untitled
R2Y(cum)
Q2(cum)
1.00
0.90
0.80
0.70
0.60
0.50
0.40
0.30
0.20
Comp[3]
Comp[2]
0.00
Comp[1]
0.10
Comp No.
Esta es la gráfica de R2 y Q2 para el modelo PEL. Los valores de R2
nos indican que el primer componente ajusta el 23% de la variabilidad
en las Y´s originales, el segundo otro 13% y el tercero otro 8%, para un
total de 44%.
Los valores de Q2 son sólo un poco más bajos, lo que indica que el
modelo trabaja relativamente bien en la predicción de los nuevos
valores de Y.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 1
Tier 2, Rev.: 5
PEL: Gráfica Resultado/Entradas
Al realizar el PEL, una de las principales cosas por saber son cuáles
X’s son importantes para el modelo. En otras palabras, ¿qué X’s están
correlacionadas con nuestras Y’s?
Esto se puede determinar estudiando las gráficas de resultados y
entradas que muestran las X’s e Y’s en relación a los nuevos
componentes. Sin embargo, estas gráficas pueden ser muy
desordenadas y complicadas de leer, como se muestra en la siguiente
página.
Observe que los ejes están etiquetados diferente para las gráficas
PEL. En lugar de p(1), por ejemplo, la absisa es designada como
w*c(1). Esto refiere la naturaleza dual de la gráfica, mostrando en el
mismo espacio a X e Y.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 1
Tier 2, Rev.: 5
Gráfica de Entradas de PEL
Jun
02(1). 10 seconds
WITH
45 min LAG.M9
(PLS),no
Untitled
La 20
interpretación
deCOMPLETE
esta gráfica
revuelta
y confusa
es
w*c[1]/w*c[2]
X
Y
obvia. Por lo cual recurrimos a otras salidas…
52TR964.AI
53HIC762.PV
52PCB111.PV
0.30
52ZI144.AI
0.20
w*c[2]
0.10
0.00
-0.10
53PIC308.PV
-0.20
53PIC305.PV
52FIC154.PV
52FFC166.PV
53LIC301.PV
53LR405.AI
52TI168.AI
52ZIC198.PV
52PCA111.PV
52PCB161.PV
52SIA110.AI
52PI128.AI
52SQI110.AI
52KQC189.AI
52KQC139.AI
Pex_L1_CSF
52XQI195.AI
52TIC711.PV
52PIA193.AI
52XPI130.AI
52X_130.AI_split_L1.
53AIC453.PV52PIC961.PV
52FIC165.PV
Pex_L1_Cons
52FIC167.PV 52FIC164.PV
85LCB320.AI
53PIC309.PV
52FFC117.PV
52PIB143.AI
53WI012.AI
53FI012.AI
52PI178.AI
Pex_L1_Blan
52XIC130.AI
52PIP193.AI
52TI118.AI
52PIP143.AI
52ZIC197.PV
52TI031.AI
52JCC139.PV
52JIC139.AI
52LIC106.PV
52PIA143.AI
52PCA161.PV
52FR960.AI
52IIC128.PV
52TIC010.CO
52SI055.AI
52SIC110.PV
33LI214.AI
52IIC178.PV
52PIC159.PV
53LIC510.PV
52TIC102.PV
53LV301.AI
52ZIC147.PV
53LIC011.PV
52XAI130.AI
52JI189.AI
52XIC180.AI
52PIC105.PV
52FIC116.PV
52ZIC148.PV
52TIC793.PV 52TI011.AI
52PIB193.AI
52FIC177.PV
52FIC115.PV
52HIC812.PV 52ZI194.AI
-0.30
-0.20
-0.10
0.00
0.10
0.20
0.30
w *c[1]
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2, Rev.: 5
PEL: Otras gráficas
Ahora veremos el número de diferentes gráficas que nos pueden
ayudar para interpretar los resultados del PEL.
La primera es la “gráfica general X/Y”, que da R2 y Q2 para cada X
original. Esto nos dice qué tan bien fue modelada cada variable
original.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 1
Tier 2, Rev.: 5
0.00
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 1
CONS. PTM VERS MACH.
32-meses de 1 día.M2 (PEL), Sin Título
VAPEUR RAFF.VERS GEN
PRESS VAP DES CYCLON
PTM VAPEUR GENEREE
Pex_L1_R48
Pex_L1_R28
Pex_L1_R14
Pex_L1_R100
Pex_L1_PFM
Pex_L1_PFL
Pex_L1_PFC
Pex_L1_P200
Pex_L1_LMF
Pex_L1_CSF
Pex_L1_Cons
Pex_L1_Blan
PRESS ACCP EPUR PRIM
CONS REG 1 CUV DET
CONSIS DRAIN GENER.
HYDRO VERS NIVELLEME
EGOUT REJETS RAFFINE
EGOUT ACC.TAMIS PRIM
VAPEUR ENTREE GENERA
X/Y General
R2VY[4](cum)
Q2VY[4](cum)
1.00
0.80
0.60
0.40
0.20
Var ID (Var. Sec. ID:1)
Tier 2, Rev.: 5
PEL: Otras gráficas
El siguiente tipo de gráfica es la “gráfica de coeficiente”, que muestra la
ecuación del PEL en forma gráfica. Los coeficientes para X son
mostrados como barras positivas y negativas.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 1
Tier 2, Rev.: 5
CoeffCS[1](53NIC013.PV)
-0.020
-0.030
SEASON
NIVEAU SILO A COPEAU
DIL HP CYCL 1 LX10
DIL MP Z CEN R5 LX1
DEBIT VAPEUR AU RAF
DIL MP Z CEN R1 LX1
DEBIT VAPEUR AU RAF
DIL HP Z CON R5 LX1
HYDRO. SULF.RAFF.NO.
DIL HP CYCL 5 LX10
CH DIL CYCL 5 KLX100
NOMBRE RAFF. SELECTI
CHARGE VIS CYCLONE 1
CHARGE VIS CYCLONE 5
CONTR. ENERGIE (éner
CHARGE RAFFINEUR 5 (
CHARGE RAFFINEUR 1 (
NIVEAU PRECHAUFFEUR
PRESS RAFF. NO 1 GEN
PRESS RAFF. NO 5 GEN
PRESS RAFF. NO 1 ATM
PRESS RAFF. NO 5 ATM
PRESS PRECHAUFFEUR
PRESS ALIMENT. RAFF.
PRESS VAPEUR HP PTM
PRODUC LIGNE 1 VIS 0
TOTAL PRODUC. RAFF 1
TEMP EGOUTTEUR NO 1
TEMP EGOUTTEUR NO 2
TEMP RAFFINEUR NO 1
TEMP RAFFINEUR NO 5
TEMP. EAU LAVAGE COP
TEMP RECHAUF EAU BL
ENERGI SPECIF LIGNE
ENERGI SPEC RAF NO
ENERGI SPEC RAF NO
RATIO ENERGIE SPEC.
TOTAL FEEDG. FICTIFS
POSIT PLAQUES V RAF
POSIT PLAQUES H RAF
POSIT PLAQUES V RAF
POSIT PLAQUES H RAF
DEBIT PATE CUV.DET.1
BYPASS ALIM FILT DSM
NIVEAU CU.DET.P531-4
NIVEAU CUV.EAU BLC.B
PRESS EAU DILUTION M
PRESS EAU DILUTION H
PRESS EAU DILUTION
PROD. LIGNE 1 DETENT
NIVEAU RES.NAOH 5 (%
DEBIT VAPEUR HP PTM
RAFF 1 VIE DES PLAQU
RAFF 5 VIE DES PLAQU
PRESS. CYCLONE RAFF.
PRESS CYCLONE RAFF 5
FORCE CHAMBRE A RAF
FORCE CHAMBRE A RAF
FORCE CHAMBRE B RAF
FORCE CHAMBRE B RAF
PRESS CHAMBRE P RAF
PRESS CHAMBRE P RAF
VITESS VIS SORTI PRE
VITESS VIS ALIM RAF
TEMP TREMIE TEM NO 1
TEMP CONDENSATS LAV
TEMP VAPEUR HP PTM
Split Ligne #1
POSIT STATOR RAF 1
POSIT STATOR RAF 5
PH PATE VERS NIVEL
NIVEAU TOTAL HD.1 A
SORTIE VALVE 301
DEBIT PTM M.P. 1 ET
DEBIT CASSE M.P. 1TOTAL PATE THERM.MEC
SORTIE VALVE LV-320B
POINT CONS.NIV.LCB32
Coeficientes PEL
32-meses de 1 día.M2 (PLS), Sin título
CoeffCS[1](53NIC013.PV)
0.050
0.040
0.030
0.020
0.010
0.000
-0.010
Var ID (Var. Sec. ID:1)
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 1
Tier 2, Rev.: 5
PEL: gráficas GIV
Otra gráfica útil es la “Gráfica de Importancia de Variable” (GIV) que
cataloga las X’s en términos de importancia al modelo.
Observe que, como no se ha utilizado un ejemplo planeado, no
podemos deducir que estas X’s influencian las Y’s. El AMV por sí solo
no prueba la causa y efecto. Todo lo que podemos decir es que están
correlacionados, lo que indica que tienen a cambiar al mismo tiempo.
La causa real puede ser externa, como un cambio en la calidad de la
materia prima.
Veamos la gráfica GIV.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 1
Tier 2, Rev.: 5
“Gráfica de Importancia de Variable”
34-meses de 1 día rev. 2 (incl. chip data) no. 2.M8 (PLS), PEL de Y1's solo
VIP[3]
2 .5 0
VIP[3]
2 .0 0
1 .5 0
1 .0 0
0 .5 0
52PCA161.PV
Cop>3/8
52FR960.AI
52TI118.AI
52FFC117.PV
52ZIC197.PV
53FI012.AI
52X_130.AI_split_L1.
52XQI195.AI
52JI189.AI
52FIC164.PV
52PI128.AI
52FIC116.PV
52TI031.AI
52PIC961.PV
811FI102.AI
52TI011.AI
52FIC167.PV
52TR964.AI
52TIC102.PV
52PIP143.AI
52PIA193.AI
52ZIC148.PV
52PIP193.AI
53PIC308.PV
52ZI144.AI
53PIC305.PV
X’s
SEASON
0 .0 0
Var ID (Primary)
Estas son las X’s que tienen la
correlación más fuerte con
nuestras Y’s.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Y’s
Variaciones de
la longitud de la
fibra
Ejemplo 1
Tier 2, Rev.: 5
Las X’s más importantes
La X más importante, de a cuerdo a la gráfica GIV, es la “Temporada”.
Esto significa que la longitud de la longitud de la fibra varía más con la
temporada que con cualquier otra variable X.
Las otras X´s en la lista son principalmente parámetros de las
operaciones de refinado como el flujo del agua de dilución, presión
hidráulica y las entradas de energía. Un experto en operaciones de
refinado encontraría estos resultados interesantes, pero no los
examinaremos a detalle en este ejercicio.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 1
Tier 2, Rev.: 5
Los Límites del PEL
Los resultados del PEL son difíciles de interpretar. Siempre es
preferible efectuar primero un ACP en todo el conjunto de datos, para
predecir la tendencia general.
Uno de los aspectos más complicados es que el primer componente en
el espacio X debe corresponder al primer componente en el espacio Y,
el segundo con el segundo, y así sucesivamente. Encontrar una
explicación física para esto puede ser extremadamente difícil.
El AMV no es
mágico
Es crítico para el estudiante entender que sólo estas X’s que fueron
medidas pueden ser incluidas en la gráfica del modelo PEL. No hay
nada mágico en el ACP o PEL. Estas técnicas pueden sólo encontrar
patrones y correlaciones existentes en los datos originales en primer
lugar.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 1
Tier 2, Rev.: 5
Fin del Ejemplo 1:
¡Estamos empezando a domar al león del AMV!
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2, Rev.: 5
2.2: Ejemplo (2)
Uso de Pocas Variables
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2, Rev.: 5
¿Por qué usar pocas variables?
Un problema obvio con el ejemplo anterior es que las gráficas son muy
difíciles de leer, porque tienen muchas variables. Por lo tanto,
buscaremos un número menor de variables para el mismo conjunto de
datos.
Existe otra buena razón para hacer esto. En el ejemplo anterior,
nuestro primer componente de “rendimiento” dominaba a los otros,
probablemente porque varias variables del proceso están asociadas
directa o indirectamente con el flujo total a través del sistema.
En otras palabras, existía una gran redundancia en la elección de
variables. Esto no es intrínsicamente malo, fuimos capaces de
aprender algunas cosas útiles a cerca de nuestro proceso, pero quizá
al reducir el número inicial de variables podemos aprender más cosas
aún.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 2
Tier 2, Rev.: 5
Naturaleza Iterativa del AMV
En este punto, nuestra aproximación es probable que parezca
CONFUSA. El estudiante debe estar preguntándose:
• ¿Usamos todos los datos o primero removemos las
desviaciones?
• ¿Trabajamos con ACP o PEL?
• ¿Usamos todas las variables o pocas variables?
La respuesta es que el AMV es muy iterativo y no es infalible. Los
resultados de un paso guían al siguiente. Algunas veces se deben
tratar cosas diferentes para obtener resultados útiles, teniendo en
mente lo que sabe usted del proceso y del conjunto de datos.
Los expertos en el AMV tienen la costumbre de tratar todo tipo de
cosas, todo de diferente manera. De hecho, el hacer un ACP básico es
una parte sencilla. La parte difícil es decidir que hacer después, porque
hay un sinfín de posibilidades. El conocimiento del proceso es la clave,
por lo tanto este trabajo es para los ingenieros químicos y no para los
estadistas.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 2
Tier 2, Rev.: 5
¿Qué variables usar?
Volviendo al ejemplo, hicimos una “lista corta” de las variables clave
basada en nuestro conocimiento del proceso. Sólo porque cientos de
variables están disponibles no significa que estamos obligados a
usarlas todas para el AMV.
Las variables relacionadas íntimamente a la calidad de las astillas
(densidad y contenido de humedad) y a la calidad de la pulpa (brillo,
consistencia,…), también se incluye la “TEMPORADA”, debido a su
importancia en el análisis anterior de ACP, consumo de blanqueador y
la energía específica de refinado.
Con todo, sólo 14 variables fueron usadas.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 2
Tier 2, Rev.: 5
ACP con 14 variables
34-months of 1 day rev. 2 (incl. chip data) no. 2.M25 (PCA-X), PCA of Tom Browne variables
R2X(cum)
Q2(cum)
1.00
0.90
0.80
0.70
0.60
0.50
0.40
0.30
0.20
Comp[2]
0.00
Comp[1]
0.10
Comp No.
Esta es la gráfica R2 y Q2 para las 14 variables. El software del AMV sólo
encontró 2 componentes, lo cual no es común cunado se tienen tan pocas
variables iniciales. El primer componente ajusta el 28% de la variabilidad en
los datos originales, el segundo otro 16% para un total de 44%.
Los valores de Q2 son mucho más pequeños, con un casi un 24% acumulado.
Esto significa que el valor predictivo del modelo es mucho más pequeño que
antes. Esto no es sorprendente, ya que la información inherente contenida
dentro de las 116 variables excluidas está ahora desaparecida.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 2
Tier 2, Rev.: 5
Gráfica de Resultados para 14 variables
La gráfica de resultados para 14 variables se muestra en la siguiente
página. Es imposible crear una gráfica de resultados en 3-D en este
caso porque sólo se tienen 2 componentes.
Otoño: Sep 1 – Nov 30
Invierno: Dic 1 – Feb 28
Primavera: Mar 1 – May 31
Verano: Jun 1 – Ago 31
La gran mayoría de los días caen dentro o cerca del primer
componente. Es bastante obvio en esta gráfica que el primer
componente está relacionado a las temporadas individuales, con una
clara segregación entre los tres años.
Observe cómo este primer componente se parece al segundo
componente del ejemplo 1 (más de esto después…)
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 2
Tier 2, Rev.: 5
Gráfica de Resultados
34-meses de 1 día rev. 2 (incl. Datos de astillas) no. 2.M25 (PCA-X), ACP de varibles Tom Browne
t[1]/t[2]
Colores de acuerdo a las clases en M25
Sin Clase
Clase 1
Clase 2
Clase 3
Clase 4
2do componente
altamente
influenciado por
estos tres puntos
Otoño: Sep 1 – Nov 30
Invierno: Dic 1 – Feb 28
14
Primavera:
Mar 1 – May 31
12
Verano:
Jun 1 – Ago 31
Jun 25 –
Jul 1, 01
10
t[2]
8
Ago 8 –
12, 01
6
4
2
2002
0
2000
-2
2001
2001/2002
2000
-4
-5
-4
-3
-2
-1
0
1
2
3
4
5
t[1]
INVIERNO INTERPRETACIÓN
Componente 1: Temporadas individuales
NAMP Módulo 17: “Introducción al Análisis Multivariable”
VERANO
Tier 2, Rev.: 5
Segundo componente
El segundo componente es ampliamente influenciado por las
observaciones en el cuadrante superior derecho (recuerde, son las
observaciones que influencian los componentes, y no al revés).
Volviendo a observar los datos originales, vemos que estas
observaciones cayeron dentro de ciertos periodos específicos en
Junio y Agosto del 2001.
¿Qué diferencia a estos periodos del resto del marco de los tres
años?
Tratar de comprender esto observando los datos originales seria
tedioso, o hasta imposible. Por lo tanto, hacemos uso de la “Gráfica
de contribución” para los mismos datos de interés.
La gráfica de contribución muestra los valores de las variables
originales para ese punto de observación (Junio 29, 2001) relativo al
promedio de todas las observaciones tomadas juntas. Esto nos da un
respuesta visual rápida a “¿Cuál es la diferencia sobre esta
observación?”
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 2
Tier 2, Rev.: 5
Gráfica de Contribución:
Junio 29, 2001
Score Contrib(Obs 584 - Average), Weight=p1p2
34-meses de 1 día rev. 2 (incl. Datos de astillas) no. 2.M25 (PCA-X), ACP de variables Tom Browne
Score Contrib(Obs 584 - Average), Weight=p1p2
12
Más finas que el
promedio
10
8
6
4
2
0
-2
-4
Fibras más
cortas que el
promedio
-6
-8
CopSICC
CopDENS
Pex_L1_R48
Pex_L1_R28
Pex_L1_R14
Pex_L1_R100
Pex_L1_P200
Pex_L1_LMF
Pex_L1_CSF
Pex_L1_Cons
Pex_L1_Blan
52XAI130.AI
52FIC165.PV
SEASON
-10
Var ID (Primary)
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2, Rev.: 5
Resultados de la Gráfica de contribución
Las barras en la gráfica de contribución dicen una historia importante:
durante el periodo de interés, los refinadores generaron fibras más finas y
menos largas que lo usual. Pareciera que los refinadores cortaron las
fibras, eliminando las fracciones largas y generando fragmentos finos.
Este no es el comportamiento deseable del proceso y por lo tanto, es un
descubrimiento importante.
Un estudio de la gráfica de entrada confirma que el segundo componente
está definitivamente relacionado a la longitud de la fibra (variables en
óvalos rojos). Observe que una variable no cae directamente en un
componente para influenciarlo; en este caso, muy pocas de las
variablesestán cerca de la línea del componente, claramente la afectan.
Si distancia desde el eje podría significar que están relacionadas al
segundo componente. Observe que la energía específica también está
relacionada al segundo componente (óvalo verde). Esto es muy
importante, ya que es la energía que corta las fibras.
El consumo de blanqueador, brillo de la pulpa y la temporada están
relacionadas al primer componente (óvalos azules). Otra vez, es similar
al ejemplo 2.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 2
Tier 2, Rev.: 5
Gráfica de Entradas
INTERPRETACIÓN
34-months of 2:
1 day rev. 2 (incl. chip data) no. 2.M25 (PCA-X), PCA of Tom Browne variables
Componente
p[1]/p[2]
Longitud de la fibra
0.50
-
X
Pex_L1_P200
0.40
0.30
Pex_L1_R100
ENERGI SPECIF LIGNE 1
0.20
p[2]
0.10
0.00
Pex_L1_Cons
Pex_L1_CSF
Copeaux DENSITE
HYDRO. SULF.RAFF.NO.5
Pex_L1_R48
SEASON
Copeaux SICCITE
_Blan
Pex_L1_Blan
-0.10
-0.20
-0.30
+
Pex_L1_R28
-0.40
Pex_L1_R14
-0.50
Pex_L1_LMF
-0.40
-0.30
-0.20
-0.10
0.00
0.10
0.20
0.30
p[1]
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2, Rev.: 5
¿Los mismos dos componentes?
La diferencia más obvia entre los resultados del ejemplo 1 y 2 es que
el componente “rendimiento” ha desaparecido. Esto se debe a que
hemos removido todas las variables relacionadas a los parámetros del
proceso.
Esto nos hace preguntarnos si los dos componentes que encontramos
en el ejemplo 2 son el segundo y tercer componente del ejemplo 1. En
otras palabras, ahora que hemos eliminado el rendimiento, el
siguiente componente en importancia ha sido “promovido” para ser el
primer componente y el tercero al segundo. Como todos los
componentes son estadísticamente independientes, esto es plausible.
1
2
X
3
La interpretación física de estos componentes parece ser compatible,
así que este cambio es totalmente positivo. Por lo tanto, una
comparación entre los ejemplos 1 y 2 podría darnos una mayor
comprensión del proceso.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 2
Tier 2, Rev.: 5
¿Vale la pena intentar con menos
variables?
¡Absolutamente!
Somos capaces de generar gráficas más limpias y fácil de interpretar,
mientras nos enfocamos en las variables de interés.
Otra vez, vimos la importancia de la Temporada, dando crédito a nuestra
interpretación física en el Ejemplo 1. Otras similitudes con los resultados
del ejemplo 1, particularmente con los dos componentes, podría permitir
una mayor comprensión de lo que está sucediendo en el proceso.
Sin embargo, la Q2 para este caso de “huesos-expuestos” es baja, lo que
indica que el modelo tiene un pobre valor predictivo. También, muchas
variables importantes no fueron consideradas en lo absoluto, así que no
se obtuvo una imagen completa, pero provee de una vista adicional al
conjunto original de datos.
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Ejemplo 2
Tier 2, Rev.: 5
Fin del Ejemplo 2:
Haciéndote más listo…
NAMP Módulo 17: “Introducción al Análisis Multivariable”
Tier 2, Rev.: 5