Download Estructuras geométricas para las variedades de
Document related concepts
Transcript
Gabriel Larotonda Estructuras geométricas para las V ARIEDADES DE BANACH i Dedicado a la memoria de Ángel Rafael Larotonda (1939-2005). Índice general Introducción XI I Estructuras Diferenciables 1 1 Cálculo Diferencial e Integral 1.1. Operadores lineales . . . . . . . . . . . . . . 1.1.1. Algunos teoremas útiles . . . . . . . 1.2. Diferenciabilidad en espacios de Banach . . 1.2.1. Operadores bilineales y cuadráticos . 1.3. Integración . . . . . . . . . . . . . . . . . . 1.4. Aproximaciones, acotaciones . . . . . . . . . 1.4.1. Fórmula de Taylor . . . . . . . . . . 1.5. Funciones Inversa e Implícita . . . . . . . . 1.5.1. Función Inversa . . . . . . . . . . . . 1.5.2. Función Implícita . . . . . . . . . . . 1.5.2.1. Subespacios sin suplemento 1.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 4 5 7 9 10 11 13 13 14 16 17 2 Variedades Diferenciables 2.1. Cartas y Atlas . . . . . . . . . . . . 2.2. Espacio y Fibrado tangente . . . . . 2.2.1. Espacio tangente . . . . . . . 2.2.2. Fibrado tangente . . . . . . . 2.2.2.1. Fibrados . . . . . . 2.2.2.2. Fibrados vectoriales 2.2.2.3. Fibrado Tangente . 2.2.3. Diferencial de una función . . 2.3. Curvas . . . . . . . . . . . . . . . . . 2.3.1. Levantadas de una curva . . . 2.4. Subvariedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 21 22 22 23 24 24 25 26 26 26 27 iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Índice general iv 2.4.1. Subvariedades no regulares . . . . . . . . . . . . . 2.4.2. Subvariedades de un espacio de Banach . . . . . . 2.4.2.1. La esfera de un espacio de Hilbert . . . . 2.5. Campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1. Corchetes de Lie . . . . . . . . . . . . . . . . . . . 2.5.1.1. El corchete de Lie de campos en la esfera 2.5.1.2. El corchete de Lie en superficies de nivel 2.5.1.3. Derivada de Lie . . . . . . . . . . . . . . 2.5.1.4. Derivaciones . . . . . . . . . . . . . . . . 2.5.2. Campos f-relacionados . . . . . . . . . . . . . . . . 2.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 30 31 32 33 34 35 36 38 39 39 3 Grupos de Lie 3.1. Teoría general . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1. Campos invariantes . . . . . . . . . . . . . . . . 3.1.2. Grupos a un parámetro y exponencial . . . . . . 3.1.2.1. La exponencial del grupo . . . . . . . . 3.1.3. La representación adjunta y morfismos . . . . . . 3.1.3.1. Homomorfismos y la naturalidad de exp 3.2. Subgrupos de Lie-Banach . . . . . . . . . . . . . . . . . 3.3. Espacios homogéneos . . . . . . . . . . . . . . . . . . . . 3.3.1. Órbitas . . . . . . . . . . . . . . . . . . . . . . . 3.4. Grupos lineales de matrices: un vistazo rápido . . . . . . 3.4.1. El grupo lineal GL(n, C) . . . . . . . . . . . . . . 3.4.2. El grupo de matrices unitarias . . . . . . . . . . 3.4.3. El grupo ortogonal . . . . . . . . . . . . . . . . . 3.4.4. El grupo simpléctico . . . . . . . . . . . . . . . . 3.5. Espacios homogéneos de grupos de matrices . . . . . . . 3.5.1. La variedad de Grassmann . . . . . . . . . . . . 3.5.2. Matrices positivas inversibles . . . . . . . . . . . 3.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 41 42 43 43 44 45 46 48 50 52 53 54 56 56 57 58 59 59 4 El Grupo Lineal 4.1. El grupo de elementos inversibles, estructura local 4.1.1. Las representaciones L y R . . . . . . . . . . 4.1.2. La diferencial del mapa exponencial . . . . 4.1.3. Factorización de la diferencial de exp . . . . 4.1.4. La serie de Baker-Campbell-Hausdorff . . . 4.1.4.1. Fórmulas de Lie-Trotter . . . . . . 4.2. Subgrupos . . . . . . . . . . . . . . . . . . . . . . . 4.2.1. El álgebra de Lie de un subgrupo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 64 64 65 66 67 70 71 71 . . . . . . . . . . . . . . . . . . . . . . . . Índice general v 4.3. Subgrupos algebraicos . . . . . . . . . . . . . . . . . . . . . . 4.4. El grupo de isometrías . . . . . . . . . . . . . . . . . . . . . . 4.4.1. El grupo unitario de un álgebra C∗ . . . . . . . . . . . 4.4.1.1. Logaritmos de operadores unitarios . . . . . 4.5. El cono positivo de un álgebra C∗ . . . . . . . . . . . . . . . 4.5.1. Conos positivos . . . . . . . . . . . . . . . . . . . . . . 4.5.2. Descomposición de Cartan y conmutadores . . . . . . 4.6. Órbitas de similaridad y coadjuntas . . . . . . . . . . . . . . 4.6.1. La órbita de similaridad de un inversible autoadjunto 4.6.2. La órbita coadjunta de un operador autoadjunto . . . 4.6.3. La Grassmanniana como la órbita de un proyector . . 4.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 77 80 81 83 84 86 87 88 88 89 95 5 El Fibrado TTM 5.1. Expresiones locales para TTM y sus proyecciones . . 5.1.1. Proyecciones de TTM en TM . . . . . . . . . 5.1.1.1. Fibrados verticales . . . . . . . . . . 5.2. Subvariedades de un espacio lineal . . . . . . . . . . 5.2.1. La esfera de un espacio de Hilbert . . . . . . 5.2.2. Superficies de nivel . . . . . . . . . . . . . . . 5.2.2.1. Fibrados verticales en subvariedades 5.3. El flip canónico . . . . . . . . . . . . . . . . . . . . . 5.4. Aceleraciones y 2-jets . . . . . . . . . . . . . . . . . . 5.4.1. 2-jets . . . . . . . . . . . . . . . . . . . . . . 5.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 98 98 99 100 100 102 104 104 106 107 108 6 Conexiones y Sprays 6.1. Sprays . . . . . . . . . . . . . . . . . . . . . . . 6.1.1. Geodésicas . . . . . . . . . . . . . . . . 6.1.2. Exponencial . . . . . . . . . . . . . . . . 6.2. Sprays cuadráticos o afines . . . . . . . . . . . 6.2.1. Entornos normales . . . . . . . . . . . . 6.3. Conexiones . . . . . . . . . . . . . . . . . . . . 6.4. Conexión de Koszul . . . . . . . . . . . . . . . 6.5. Sprays canónicos . . . . . . . . . . . . . . . . . 6.6. La derivada covariante: derivar y proyectar . . 6.7. Derivada covariante y transporte paralelo . . . 6.7.1. Derivada covariante de levantadas . . . 6.7.2. Transporte paralelo . . . . . . . . . . . 6.8. El tensor de curvatura y campos de Jacobi . . . 6.8.1. Subvariedades de un espacio de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 110 115 116 116 118 119 122 123 124 127 127 128 130 131 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Índice general vi 6.8.2. Campos de Jacobi . . . . . . . . . . . . . . . . . 6.8.2.1. Campos de Jacobi versus exponencial . 6.9. Ejemplos de sprays . . . . . . . . . . . . . . . . . . . . . 6.9.1. Espacios lineales . . . . . . . . . . . . . . . . . . 6.9.2. La esfera de un espacio de Hilbert . . . . . . . . 6.9.2.1. Un spray no cuadrático en la esfera . . 6.9.3. El grupo de inversibles de un álgebra de Banach 6.9.4. El grupo de operadores unitarios . . . . . . . . . 6.9.5. Operadores positivos e inversibles . . . . . . . . 6.9.5.1. El spray trivial . . . . . . . . . . . . . . 6.9.5.2. El spray canónico . . . . . . . . . . . . 6.9.6. La Grassmanniana . . . . . . . . . . . . . . . . . 6.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . II Estructuras Métricas 7 Espacios de Métrica Interior 7.1. La distancia rectificable . . . . . . . . . . 7.1.1. Espacios de métrica interior . . . . 7.1.2. Geodésicas . . . . . . . . . . . . . 7.2. El teorema de Hopf-Rinow métrico . . . . 7.2.1. El teorema de Ascoli . . . . . . . . 7.2.2. El teorema de Hopf-Rinow métrico 7.A. Problemas . . . . . . . . . . . . . . . . . . 131 134 134 134 135 137 138 140 141 141 141 143 145 147 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 149 153 156 157 157 157 160 8 Variedades de Finsler 8.1. Métricas de Finsler . . . . . . . . . . . . . . . . . . . . 8.1.1. Funcionales longitud y energía . . . . . . . . . 8.1.1.1. Las variedades de Finsler . . . . . . . 8.1.2. Normas acotadas y compatibles . . . . . . . . . 8.1.2.1. Hopf-Rinow en variedades de Finsler . 8.2. Variedades de Finsler con spray . . . . . . . . . . . . . 8.3. Métricas de Finsler vía operadores acotados . . . . . . 8.4. Métricas invariantes . . . . . . . . . . . . . . . . . . . 8.4.1. Métricas invariantes y el spray canónico . . . . 8.4.2. Espacios homogéneos y métricas cocientes . . . 8.4.3. Operadores positivos con métricas simétricas . 8.5. El teorema de Cartan . . . . . . . . . . . . . . . . . . 8.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 161 162 163 163 168 169 170 171 172 172 173 177 183 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Índice general 9 Variedades Riemannianas y pseudo-Riemannianas 9.1. La derivada de Levi-Civita . . . . . . . . . . . . . . . . . . . . . 9.1.1. La derivada de Levi-Civita de una subvariedad . . . . . 9.1.1.1. La Grassmanniana dentro de los autoadjuntos 9.1.2. Sprays métricos en espacios homogéneos . . . . . . . . . 9.1.2.1. El spray métrico del grupo de inversibles . . . 9.1.2.2. Geodésicas . . . . . . . . . . . . . . . . . . . . 9.2. Cálculo de variaciones . . . . . . . . . . . . . . . . . . . . . . . 9.2.1. Fórmulas variacionales . . . . . . . . . . . . . . . . . . . 9.2.1.1. La variación de la energía . . . . . . . . . . . . 9.3. Las geodésicas son localmente minimizantes . . . . . . . . . . . 9.3.1. El lema de Gauss . . . . . . . . . . . . . . . . . . . . . . 9.3.2. Coordenadas polares . . . . . . . . . . . . . . . . . . . . 9.3.3. Minimalidad de las geodésicas . . . . . . . . . . . . . . . 9.3.3.1. Variedades Riemannianas débiles . . . . . . . . 9.3.4. Las curvas continuas minimales . . . . . . . . . . . . . . 9.3.5. La esfera, grupos unitarios y la Grassmanniana . . . . . 9.3.5.1. La esfera de un espacio de Hilbert . . . . . . . 9.3.5.2. El grupo de operadores unitarios . . . . . . . . 9.3.5.3. El grupo de unitarios con la norma uniforme . 9.3.5.4. El grupo de unitarios con una norma simétrica 9.3.5.5. La Grassmanniana . . . . . . . . . . . . . . . . 9.4. Existencia global de geodésicas cortas . . . . . . . . . . . . . . 9.5. Convexidad local . . . . . . . . . . . . . . . . . . . . . . . . . . 9.6. Curvatura seccional . . . . . . . . . . . . . . . . . . . . . . . . 9.6.1. Curvatura de grupos lineales y espacios homogéneos . . 9.6.1.1. La esfera de un espacio de Hilbert . . . . . . . 9.6.1.2. El spray métrico del grupo de inversibles . . . 9.6.1.3. El grupo unitario . . . . . . . . . . . . . . . . 9.6.1.4. Operadores positivos inversibles . . . . . . . . 9.6.1.5. La Grassmanniana . . . . . . . . . . . . . . . . 9.6.2. Isometrías y curvatura seccional . . . . . . . . . . . . . 9.6.2.1. Variedades planas . . . . . . . . . . . . . . . . 9.6.2.2. Campos de Jacobi versus curvatura . . . . . . 9.7. El teorema de Cartan . . . . . . . . . . . . . . . . . . . . . . . 9.7.1. La adjunta de la diferencial de exp . . . . . . . . . . . . 9.7.2. Curvatura no positiva . . . . . . . . . . . . . . . . . . . 9.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 186 188 189 190 191 191 193 195 197 198 199 199 200 202 203 204 204 206 210 212 212 213 217 219 220 220 221 221 222 224 224 225 226 227 227 228 230 Índice general viii III Álgebras de Operadores 235 A Álgebras de Banach A.1. Álgebras con involución . . . . . . . . . . . . . . . . . A.2. Cálculo funcional analítico . . . . . . . . . . . . . . . . A.2.1. Propiedades del espectro . . . . . . . . . . . . . A.2.1.1. Radio espectral . . . . . . . . . . . . . A.2.2. El grupo de inversibles . . . . . . . . . . . . . . A.2.3. Cálculo funcional de Cauchy . . . . . . . . . . A.3. Rango y radio numérico . . . . . . . . . . . . . . . . . A.3.1. El rango numérico y los grupos a un parámetro A.3.2. La relación entre rango numérico y espectro . . A.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 237 238 238 239 240 242 246 249 252 254 B Álgebras C∗ B.1. El radio espectral de un operador normal . . . . . . . . . . . . . B.2. Cálculo funcional continuo . . . . . . . . . . . . . . . . . . . . . . B.3. Teorema de Gelfand y la representación GNS . . . . . . . . . . . B.3.1. El espacio de caracteres . . . . . . . . . . . . . . . . . . . B.3.2. La transformada de Gelfand en C∗ -álgebras . . . . . . . . B.3.2.1. Invariancia del espectro . . . . . . . . . . . . . . B.3.3. El Teorema de Gelfand . . . . . . . . . . . . . . . . . . . B.3.4. Propiedades del cálculo funcional continuo . . . . . . . . B.3.4.1. Elementos positivos . . . . . . . . . . . . . . . . B.3.4.2. Funciones monótonas y convexas de operadores B.3.4.3. Los ∗-morfismos . . . . . . . . . . . . . . . . . . B.3.5. La representación GNS . . . . . . . . . . . . . . . . . . . B.3.5.1. Funcionales positivas y estados . . . . . . . . . . B.3.5.2. Estados normizantes . . . . . . . . . . . . . . . . B.3.6. La construcción de Gelfand, Naimark y Segal . . . . . . . B.3.6.1. Vectores normizantes . . . . . . . . . . . . . . . B.4. Descomposición polar . . . . . . . . . . . . . . . . . . . . . . . . B.4.1. Descomposición polar . . . . . . . . . . . . . . . . . . . . B.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255 255 256 258 259 260 261 261 263 263 264 265 265 266 268 268 270 270 271 271 C Álgebras de von Neumann C.1. Cálculo funcional Boreliano . . . . . . . . . . C.1.1. Teorema espectral . . . . . . . . . . . C.1.2. Medida espectral . . . . . . . . . . . . C.1.3. Descomposición polar en W ∗ -algebras C.2. Problemas . . . . . . . . . . . . . . . . . . . . 273 273 273 275 275 276 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Índice general D Normas en Álgebras de Operadores D.1. Ideales en B(H) . . . . . . . . . . . . . . . . . . . . . . . . . . . D.1.1. Descomposición en valores singulares . . . . . . . . . . . D.1.1.1. Espacios de sucesiones . . . . . . . . . . . . . . D.1.2. Ideales de operadores compactos . . . . . . . . . . . . . D.1.3. Operadores compactos de Schatten . . . . . . . . . . . . D.1.4. Desigualdad de Hölder, dualidades, norma Frobenius . . D.1.5. El teorema de Lidskii y la propiedad cíclica de la traza . D.2. Normas simétricas en álgebras C∗ . . . . . . . . . . . . . . . . . D.2.1. Álgebras con traza finita . . . . . . . . . . . . . . . . . . D.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix . . . . . . . . . . 277 277 277 279 281 285 287 288 289 289 293 Bibliografía 295 Índice alfabético 301 Índice de símbolos 307 Introducción Nadie puede escribir un libro. Para que un libro sea verdaderamente, Se requieren la aurora y el poniente, Siglos, armas, y el mar que une y separa. E J. L. Borges ste texto nace con la idea de presentar una exposición sistemática del estudio de la geometría de los grupos de Lie-Banach y sus espacios homogéneos, con especial énfasis en las nociones métricas de la geometría diferencial, cuyo primer problema a nuestro entender es el de las curvas minimales. Habitualmente, se presentan las conexiones, las geodésicas y otros objetos geométricos como derivados de una métrica inevitablemente Riemanniana, soslayando el hecho de que una conexión es simplemente una elección de suplementos en cierto fibrado vectorial sobre la variedad, y que esto no implica necesariamente la existencia de un producto interno en este fibrado. La elección de estos suplementos se puede presentar, en particular, como un spray en la variedad (una familia de ecuaciones diferenciales ordinarias en el fibrado tangente), que permite introducir de manera natural la noción de geodésica como la solución local de este sistema de ecuaciones. Este es el enfoque con el que queremos abordar los problemas de geometría que hacen a las curvas cortas y la curvatura: una perspectiva que nos permita trabajar en modelos sin limitaciones de dimensión, y sin supuestos sobre una estructura Hilbertiana o pre-Hilbertiana en el espacio vectorial que modela la variedad. En particular, estamos interesados en aquellos modelos que surgen de los grupos lineales y sus espacios homogéneos, tanto en dimensión finita como infinita, donde puede observarse que, desde el punto de vista del álgebra de operadores, las normas o métricas a introducir no suelen derivarse de una estructura Hilbertiana: el caso paradigmático es la norma uniforme del álgebra de operadores acotados, la cual no proviene de ningún xi xii Introducción producto interno, y no es equivalente a ninguna norma con estas características en el caso infinito dimensional. Este contexto de matrices y operadores es rico en ejemplos que nos permiten introducir estas nociones de spray o conexión de manera concreta e independiente de la métrica a partir de proyectores, idempotentes y esperanzas condicionales; en los últimos años esta manera de trabajar ha tenido un desarrollo notable especialmente en el contexto de dimensión infinita vinculado con las álgebras C∗ y las álgebras de von Neumann. Por otra parte, estas álgebras son ricas en normas simétricas (invariantes por la acción del grupo de unitario, que es el grupo de isometrías del espacio de Hilbert subyacente al álgebra de operadores) y estas normas nos proveen de una importante cantidad de ejemplos de métricas de Finsler en las variedades, es decir, elecciones continuas de normas en el fibrado tangente de la variedad (nos desviamos aquí de la noción clásica de métrica de Finsler donde se supone que la norma introducida es dos veces diferenciable fuera del origen y su Hessiano es definido positivo). Entre las clases más relevantes de normas simétricas en operadores en un espacio de Hilbert, se hallan las normas de p-Schatten, que se computan como la norma p usual de la sucesión de valores singulares del operador en cuestión; en este contexto son conocidos una serie de resultados geométricos vinculados con la convexidad uniforme del espacio normado subyacente. En la segunda parte del libro abordaremos la noción de espacio de longitud o espacio de métrica interior, que a partir del trabajo de Mikhail Gromov en gupos hiperbólicos [36], ha cobrado especial relevancia, en particular relacionada con aquellos espacios que son de curvatura no positiva. En este contexto, la distancia entre dos puntos se obtiene como el ínfimo de las longitudes de arcos rectificables que los unen. Como estaremos interesados en la noción de curva corta, presentaremos la versión métrica del Teorema Hopf-Rinow que establece la existencia de geodésicas (entendidas como arcos rectificables de longitud mínima) en espacios localmente compactos. Estudiaremos la relación entre variedades de Finsler y espacios de métrica interior, amalgamando los resultados de la primera parte del libro con la teoría métrica introducida en la segunda. Abordaremos las nociones de curvatura y curvatura seccional, presentando la primera como derivada del spray, es decir independiente de la métrica, y estudiando la segunda como el puente que une la noción de spray con la de geometría Riemanniana. La curvatura seccional separa los espacios Riemannianos en dos categorías importantes (no exhaustivas), según estos tengan curvatura seccional positiva o negativa en todos sus puntos; el comportamiento de las curvas cortas es drásticamente distinto según sea el caso. Para ilustrar esta afirmación, basta considerar dos ejemplos muy sencillos, como la circunferencia unitaria S1 ⊂ R2 y una rama de hipérbola P ⊂ R2 , de curvatura seccional positiva y negativa respectivamente (aunque cabe aclarar Introducción xiii que en el primer caso la curvatura es constante y en el segundo no lo es): de acuerdo al teorema de Cartan-Hadamard (que presentamos en este texto en el contexto de variedades de Finsler con spray), en una variedad de curvatura no positiva simplemente conexa, se da siempre este fenónomeno de unicidad de curvas cortas. Por otra parte el Teorema de Hopf-Rinow establece la equivalencia (en dimensión finita) entre completitud métrica y completitud geodésica, garantizando la existencia de curvas cortas que unen dos puntos dados. Sin embargo, hay ejemplos sencillos de variedades Riemannianas de dimensión infinita donde ambos conceptos no son equivalentes. En casos concretos, herramientas desarrolladas ad-hoc para el ejemplo permiten encarar el problema de manera exitosa y no sólo determinar la existencia de geodésicas minimales, sino construirlas explícitamente: presentaremos en este texto una serie de problemas y resultados sobre minimalidad de curvas que hasta ahora sólo se hallan publicados en revistas especializadas, concernientes tanto a variedades de dimensión infinita como a variedades de Finsler donde la norma no es diferenciable y por lo tanto no está disponible el cálculo de variaciones usual. Nos enfocaremos en ejemplos provenientes de la teoría de operadores, especialmente aquellos que provienen de los llamados grupos de Lie-Banach clásicos, de las álgebras C∗ y las álgebras de von Neumann, que juegan una parte importante en esta exposición, no sólo como modelos geométricos, sino también a traves de las técnicas propias de las álgebras de operadores, que permiten abordar ciertos problemas de geometría de una manera novedosa. Prerequisitos: Para la lectura de este texto estimamos suficiente que el lector conozca en profundidad la geometría de curvas y superfices en el plano y en el espacio, como es abordada por ejemplo en el texto de do Carmo [21]. Respecto de la teoría de grupos y sus espacios homogéneos, es recomendable que el lector tenga cierta familiaridad con las nociones topológicas generales vinculadas a estos espacios, o por lo menos domine los aspectos básicos de espacios topológicos en general, como cubrimientos, bases de entornos, sucesiones, topologías cociente, etc.; si sumamos ciertas nociones básicas de análisis funcional, todos estos temas ocupan por ejemplo los primeros cuatro capítulos del libro de Reed y Simon [62]. Los temas más especializados de álgebras de operadores se encuentran desarrollados para beneficio del lector en los apéndices de este libro. Agradecimientos: vaya mi agradecimiento expreso para todos aquellos matemáticos que me mostraron en primera persona cómo pensar la geometría de esta manera singular, a través de problemas concretos en álgebras de operadores; en particular Esteban Andruchow, Gustavo Corach y Lázaro Recht. Un agradecimiento especial para Cristian Conde, colega, amigo, editor y corrector xiv Introducción desinteresado. También quiero agradecer a Martín Miglioli que estudió y corrigió minuciosamente el manuscrito. Por último, no puedo dejar de mencionar la contribución de los dos evaluadores anónimos del libro, que mediante sus observaciones y correcciones hicieron sin duda de este un manuscrito mejor. De todas las posibles faltas e imprecisiones que puedan quedar en el libro, sólo puedo culpar a mis limitaciones como escritor y matemático, esperando que puedan ser tolerables para el lector, o que sean enmascaradas por el entusiasmo que espero compartan conmigo sobre los temas aquí abordados. Parte I Estructuras Diferenciables E n esta primera parte del libro, desarrollaremos herramientas geométricas que no involucren la elección explícita de una norma o métrica en la variedad diferenciable a estudiar. Como veremos, las variedades de Banach tienen una gran riqueza geométrica una vez que uno consigue introducir una conexión o spray en ellas, independientemente de si esta proviene de una métrica o no. De particular relevancia son aquellas variedades que provienen del grupo de inversibles de un álgebra de Banach, y sus espacios homogéneos. En los apéndices del libro introducimos las nociones básicas del cálculo funcional y la teoría de operadores para poder trabajar con una familia de ejemplos que ilustren las nociones y provoquen nuevas preguntas, siempre con el espíritu de entender los objetos de forma geométrica, sin necesidad de usar coordenadas y por consiguiente sin limitaciones de dimensión. 1 Capítulo Cálculo Diferencial e Integral Where ignorance is bliss, ’tis folly to be wise. Thomas Gray C omenzamos en este capítulo con los fundamentos de la teoría de operadores acotados en espacios de Banach, que nos permitirán introducir nociones de diferenciación e integración. Luego presentamos versiones infinito-dimensionales de los teoremas de la función inversa y de la función implícita. Este capítulo no debe tomarse como un capítulo de prerequisitos, sino como una parte integral de nuestro acercamiento sin coordenadas a la geometría: revisaremos resultados clásicos del cálculo con una mirada no clásica. Le debemos mucho de nuestra presentación al excelente libro de Lang [47] de geometría Riemanniana. 1.1. Operadores lineales Todos nuestros espacios vectoriales serán sobre R ó C. Sean E, F espacios normados, o en particular espacios de Banach, es decir, espacio vectoriales normados completos. Empecemos por recordar que T ∈ B(E, F) si T es lineal y además es acotado en el siguiente sentido kTxk sup : x ∈ E, x 6= 0 < ∞. kxk Notar que la norma del numerador es la norma de F, mientras que la del denominador es la de E. Equivalentemente, T ∈ B(E, F) si T es lineal y continuo. En 3 1 4 Cálculo Diferencial e Integral el caso acotado se suele denominar a este número norma uniforme de T , kTxk kT k = sup : x ∈ E, x = 6 0 = sup {kTxk : x ∈ E, kxk ≤ 1} kxk o norma supremo. Notemos que el conjunto B(E, F) con la norma recién definida es un espacio de Banach: en efecto es un espacio vectorial y no es difícil probar que es completo, usando (únicamente) la completitud de F. Como veremos más adelante en contextos específicos, la norma uniforme no es la única manera de definir una norma en el conjunto de operadores lineales. En el caso E = F se suele abreviar B(E, E) = B(E) al conjunto de endomorfismos acotados y nos referiremos a ellos como operadores lineales acotados actuando en E o directamente operadores acotados en E. En el caso F = k el cuerpo base, al espacio E ′ = B(E, k) se lo denomina espacio dual de E. No debe confundirse con el dual algebraico, que consiste de todas las funcionales lineales de E en k. Para distinguirlos, a veces se dice que E ′ es el dual topológico de E. 1.1.1. Algunos teoremas útiles Listamos a continuación algunas herramientas fundamentales. La primera es un teorema de separación de objetos convexos en espacios normados mediante hiperplanos, que en el contexto de espacios de Banach enunciamos en una de sus posibles formas equivalentes. Teorema 1.1.1 (Teorema de Hahn-Banach). Sea E un espacio de Banach, S ⊂ E un subespacio. Sea N : E → R≥0 una funcional convexa, es decir si a, b ∈ k (k es R o C) son tales que |a| + |b| ≤ 1, entonces N(av + bw) ≤ |a|N(v) + |b|N(w) para todo v, w ∈ E. Entonces si ψ : S → k es una funcional lineal tal que |ψ(s)| ≤ N(s) para todo s ∈ S, existe ϕ ∈ E ′ tal que ϕ = ψ en S y |ϕ| ≤ N en todo E. En particular, dado v ∈ E, existe ϕ ∈ E ′ tal que ϕ(v) = kvk, kϕk = 1. La prueba puede verse en el tomo I de “Methods of modern mathematical physics", por Michael Reed y Barry Simon [62], Teorema III.5. Teorema 1.1.2 (Teorema de la función abierta (Banach-Schauder)). Si E, F son espacios de Banach y T ∈ B(E, F) es sobreyectiva, entonces T es abierta. Es decir, si U ⊂ E es abierto, entonces TU ⊂ F es abierto. 1.2. Diferenciabilidad en espacios de Banach 5 Corolario 1.1.3. Si E, F son espacios de Banach y T ∈ B(E, F) es biyectivo, entonces la inversa T −1 : F → E es continua. Es decir T es un isomorfismo topológico de espacios de Banach. Teorema 1.1.4 (Teorema del gráfico cerrado). Si E, F son espacios de Banach y T : E → F es lineal, entonces T ∈ B(E, F) si y sólo si Gr(T ) = {(v, Tv) : v ∈ E} ⊂ E × F es un subespacio cerrado. El siguiente resultado debido a Banach y Steinhaus es conocido como principio de acotación uniforme o por su sigla en castellano PAU. Teorema 1.1.5 (Teorema de Banach-Steinhaus). Sea E un espacio de Banach y F un espacio normado. Sea F una familia de operadores acotados de E en F. Supongamos que para cada x ∈ E, el conjunto {kTxk : T ∈ F} es acotado. Entonces el conjunto {kT k : T ∈ F} es acotado. El Teorema del gráfico cerrado y el de la función abierta son equivalentes, y todos son consecuencia del teorema de categoría de Baire. Todos estos resultados del análisis funcional pueden verse en la Sección III.5 del libro de Reed-Simon [62]. 1.2. Diferenciabilidad en espacios de Banach Sean E, F espacios de Banach, y f : E → F una función. Diremos que f es diferenciable en v ∈ E si existe un operador lineal acotado Lv ∈ B(E, F) tal que lı́m khk→0 1 kf(v + h) − f(v) − Lv hk = 0. khk (1.1) En ese caso al operador Lv lo denotaremos Dfv ó f∗v , usualmente leído como diferencial de f en v. Observemos que, si f es diferenciable en v ∈ E, entonces Lv x = lı́m t→0 f(v + tx) − f(v) t para todo x ∈ E. Toda función diferenciable es continua. Si f es diferenciable en todo v ∈ U para algún abierto U ∈ E, diremos que f es diferenciable en U. 6 Cálculo Diferencial e Integral Si f : E → F, g : F → G son funciones diferenciables, entonces es fácil ver que g ◦ f : E → G es una función diferenciable y que vale la regla de la cadena: D(g ◦ f)v = Dgf(v) Dfv . Observación 1.2.1. Si f : E → F es lineal y continua (es decir si f ∈ B(E, F)), entonces es fácil verificar que Df = f, es decir f es diferenciable en todo E y además Dfv (w) = f(w) para todo v, w ∈ E. Observación 1.2.2. Si f : E → F es diferenciable y T ∈ B(F, G) (con G otro espacio de Banach), entonces un caso particular de la regla de la cadena de muy fácil demostración es la siguiente identidad: D(T ◦ f) = TDf. Para poner un poco en contexto la definición (1.1), se suele decir que f es diferenciable Fréchet (por Maurice Fréchet). Hay nociones más débiles de diferenciabilidad, como por ejemplo ser diferenciable Gâteaux en v ∈ E (por René Gâteaux), que significa que para todo h ∈ E, existe el límite dx f(h) = lı́m t→0 1 {f(v + th) − f(v)} , |t| y en este caso dx f(h) no tiene por qué ser lineal en h (ni acotado). En el caso complejo el límite se toma cambiando t ∈ R por z ∈ C y haciendo z → 0. Volviendo al caso que nos interesa (1.1), si f es diferenciable entonces tiene sentido preguntarse sobre la continuidad de la función Df : E → B(E, F) dada por Df(v) = Dfv , es decir a la función que a cada vector le asigna la diferencial de f. Esta función, aunque su imagen consiste de operadores lineales, es usualmente no lineal (salvo que f sea una forma cuadrática). Cuando es continua en un abierto U ⊂ E, decimos que f es C1 en U. Como G = B(E, F) es un espacio de Banach, nos podemos preguntar si la función Df : E → G es diferenciable en U. Si lo es, diremos que su diferencial D(Df) = D2 f es la diferencial segunda de f. Observemos que D2 f : U → B(E, G) = B(E, B(E, F)) ≃ B 2 (E × E; F) = B 2 (E2 ; F), donde el último término indica los operadores bilineales de E × E en F. La identificación está dada por Φ(T )(e1 , e2 ) = (Te1 )(e2 ) para e1 , e2 ∈ E, que es de hecho un isomorfismo isométrico. Denotaremos D2 fp (v, w) := (D2 fp v)(w). 1.2. Diferenciabilidad en espacios de Banach 7 Una función es C2 si la asignación p 7→ D2 fp es continua de E en B 2 (E2 ; F). En el caso clásico E = R2 , que exista la diferencial segunda es más fuerte que decir que existen las derivadas parciales segundas, de hecho la existencia de la diferencial segunda garantiza que además de existir sean iguales las derivadas cruzadas1: ver por ejemplo el libro de T. Apostol [12], Teorema 12.12. Observación 1.2.3. Si f : U → F es una función dos veces diferenciable en p ∈ U, entonces D2 fp es un operador bilineal simétrico. Es decir, para todo v, w ∈ E se tiene D2 fp (v, w) = D2 fp (w, v). En efecto, que es bilineal surge de la propia definición. Para ver que es simétrico, sean v, w ∈ E. Consideremos, para cada ϕ ∈ F ′ , la función auxiliar g(x, y) = ϕ(f(p + xv + yw)). La función g : B → k está definida en algún entorno abierto B de (0, 0) ∈ k × k. Por hipótesis, existen Dg(0,0) , D2 g(0,0) . Entonces D2 g(0,0) es una forma bilineal simétrica. Esto nos dice que las derivadas cruzadas de g en el punto (0, 0) son iguales ∂2 g ∂2 g = = ϕ((D2 fp v)w). ϕ((D2 fp w)v) = ∂y∂x ∂x∂y Como la identidad es cierta para cualquier ϕ ∈ F ′ , se tiene la conclusión. En general, una función que tiene k diferenciales sucesivas en U ⊂ E -y la de orden k es una función continua- es una función Ck en U, y directamente anotaremos f ∈ Ck (U); como antes, consideramos a Dk f como un operador multilineal, es decir Dk fv ∈ B k (Ek ; F) para v ∈ E. Por lo recién observado, es un operador multilineal simétrico. Una función es C∞ cuando sus diferenciales de todos los órdenes existen (también es usual decir que f es suave). Observemos que si f ∈ B(E, F) entonces Df = f es constante, es decir para todo v ∈ E se tiene Dfv = f. Luego todas las derivadas de orden superior son nulas, D2 f = D3 f = · · · = 0. 1.2.1. Operadores bilineales y cuadráticos Dados E, F espacios de Banach, sea β ∈ B 2 (E2 ; F) un operador bilineal. Entonces el operador cuadrático Q asociado a β está dado por Q(v) = β(v, v) 1 Gracias a Marcos Cossarini por hacerme notar este hecho 8 Cálculo Diferencial e Integral para todo v ∈ E. Observemos que Q(tv) = t2 Q(v) para todo v ∈ E, t ∈ k. En general, dado n ∈ N, una función f : E → F tal que f(tv) = tn f(v) para todo t ∈ k, v ∈ E se dice homogénea de grado n. La definición de objeto cuadrático que usaremos es la siguiente: diremos que Q : E → F es un operador cuadrático si β(v, w) := 1/2[Q(v + w) − Q(v) − Q(w)] es bilineal. En particular Q(tv) = t2 Q(v) para todo v ∈ B, t ∈ k, pero esta condición no es suficiente. Es fácil ver que Q es continuo si y sólo si β es continuo, pues Q(v) = β(v, v) para todo v ∈ E. Observación 1.2.4. Todo operador cuadrático continuo es acotado, es decir existe una constante C ≥ 0 tal que kQ(v)k ≤ Ckvk2 para todo v ∈ E. Esto tiene una prueba directa: supongamos que Q es continua y no está acotada. Dado n ∈ N existe entonces vn ∈ E tal que kQ(vn )k > n2 kvn k2 . Como Q(0) = 0, debe ser vn 6= 0 para todo n. Luego Q( vn ) > 1 nkvn k para todo n. Como Q es continua, haciendo tender n a infinito se tiene una contradicción. La conclusión de la observación anterior también es consecuencia del siguiente resultado: Lema 1.2.5. Si β : E × E → F es bilineal y continua en cada variable por separado, entonces existe C ≥ 0 tal que, para todo v, w ∈ E se tiene kβ(v, w)k ≤ Ckvkkwk. En particular β es continua. Demostración. Supongamos que x 7→ βy (x) := β(x, y) (y ∈ E fijo) es un operador acotado, y lo mismo ocurre con y 7→ βx (y) := β(x, y), ahora con x ∈ E fijo. Consideremos la familia {βx : kxk ≤ 1}. Entonces, para cada y ∈ E, se tiene kβx (y)k = kβ(x, y)k = kβy (x)k ≤ Cy kxk ≤ Cy . Luego, por el principio de acotación uniforme (Teorema 1.1.5), el conjunto {kβx k : kxk ≤ 1} es acotado. Esto quiere decir que existe una constante C ≥ 0 tal que sup kβx (y)k = kβx k ≤ C kyk≤1 1.3. Integración 9 para todo x ∈ E tal que kxk ≤ 1. Esto nos dice que, para todo x, y tales que kxk ≤ 1 y kyk ≤ 1, se tiene kβ(x, y)k ≤ C. Usando la bilinealidad de β se tiene la conclusión. Definiciones y consideraciones análogas se tienen para formas cúbicas, cuárticas, etc. es decir para formas que provienen de operadores multilineales simétricos de orden k ∈ N. 1.3. Integración Sea I = [a, b] ⊂ R un intervalo, y f : I → E una función. Diremos que f es una función elemental si existe una partición de I en finitos intervalos disjuntos Ij ⊂ I y una colección de vectores {vj }j=1...n ⊂ E tales que f|Ij = vj , es decir, si f es constante en cada intervalo de la partición. En ese caso definimos la integral de f sobre I como Z X f= vj µ(Ij ) I j=1...n donde µ denota la medida usual en R. Diremos que una función f : I → E es reglada si f es límite uniforme de funciones elementales, es decir si existe una sucesión de funciones elementales fn : I → E tales que, dado ǫ > 0, se tiene kfn − fkI := sup kfn (t) − f(t)k < ǫ t∈I para todo n ≥ n0 (ǫ). No es difícil probar que toda función continua f : I → E es una función reglada. La integral de una función reglada se define como el límite (en E) de las integrales Z fn . I Este límite no depende de la sucesión elegida para aproximar f. Una propiedad fundamental de la integral es la siguiente: si T ∈ B(E, F) entonces Z Z T f I = I (T ◦ f). La verificación es sencilla para funciones elementales, y luego se sigue de la continuidad de T la propiedad general. Esta propiedad es particularmente útil para reducir el problema a valores reales o complejos si usamos funcionales del dual, es decir si usamos ϕ ∈ E ′ = B(E, k) donde k = R o C según el contexto. Así, por ejemplo, si Z (ϕ ◦ f) = 0 I ′ para toda ϕ ∈ E , se deduce por el teorema de Hahn-Banach que R I f = 0 ∈ E. 10 Cálculo Diferencial e Integral Observación 1.3.1. Otra propiedad útil es la siguiente. Sea f : [a, b] → E reglada y kf(t)k ≤ M, entonces Z Z k fk ≤ kf(t)kdt ≤ (b − a)M. I I En efecto, esta propiedad es simplemente la desigualdad triangular cuando la función es elemental, y se extiende a regladas tomando límite. 1.4. Aproximaciones, acotaciones Veamos algunos resultados útiles que combinan diferenciación e integración. Definición 1.4.1. Si E es un espacio vectorial, un conjunto C ⊂ E es convexo si dados v, w ∈ C, entonces el segmento t ∈ [0, 1] tv + (1 − t)w, esta íntegramente contenido en C. Proposición 1.4.2 (Teorema del valor medio). Sean E, F espacios de Banach, U ⊂ E abierto convexo y f : U → F una función C1 . Dados x, y ∈ U, pongamos M = máx kDftx+(1−t)y k. t∈[0,1] Entonces kf(x) − f(y)k ≤ Mkx − yk. Demostración. Sea g(t) = f(tx + (1 − t)y), g : [0, 1] → F. Observemos que g es en realidad C1 en un entorno abierto del intervalo [0, 1]. Entonces g ′ : [0, 1] → F es una función continua, con lo cual es fácil ver que Z1 g(1) − g(0) = g ′ (t)dt. 0 Para convencernos, se puede considerar, dada ϕ ∈ F ′ , la aplicación real t 7→ ϕ(g(t)) para la cual vale claramente la propiedad, y como ϕ es arbitraria, se tiene la propiedad enunciada para vectores de F (para más detalles ver la prueba del Teorema de Taylor a continuación). Pasando en limpio Z1 f(x) − f(y) = Dftx+(1−t)y (x − y)dt. 0 Usando la propiedad de la Observación 1.3.1 tenemos la conclusión. 1.4. Aproximaciones, acotaciones 1.4.1. 11 Fórmula de Taylor Recordemos que si f : E → F es Ck y v ∈ E, pensamos a Dk fv (k ∈ N) como una forma multilineal simétrica. Para h ∈ E, usemos la notación h(k) = (h, · · · , h) ∈ Ek . Tenemos el siguiente teorema: Teorema 1.4.3 (Fórmula de Taylor). Sean E, F espacios de Banach, U ⊂ E un abierto convexo y f : U → F una función Ck en U. Entonces dados v, v + h ∈ U se tiene f(v + h) = Pk (v, h) + Rkv (h), donde Pk (v, h) es el polinomio de Taylor de grado k centrado en v y evaluado en h dado por Pk (v, h) = f(v) + Dfv h + 1/2D2 fv h(2) + · · · + 1 Dk−1 fv h(k−1) , (k − 1)! y la fórmula del resto está dada por Rkv (h) = 1 (k − 1)! Z1 (1 − t)k−1 Dk fv+th h(k) dt. 0 Demostración. Por el teorema de Hahn-Banach, basta probar el teorema después de componer con cualquier funcional ϕ ∈ F ′ , por la propiedad mencionada en la Observación 1.2.2. En ese caso el problema se reduce al Teorema de Taylor aplicado a la función real g : [0, 1] → R dada por g(t) = ϕ (f(v + th)), es decir g(1) = g(0) + g ′ (0) + 1/2g ′′ (0) + · · · + 1 + (k − 1)! Z1 1 g(k−1) (0) (k − 1)! (1 − t)k−1 g(k) (t) dt. 0 Definición 1.4.4. Supongamos que f : U → F es una función C∞ . Entonces diremos que f es analítica en U, denotado f ∈ Cω (U) si para todo v ∈ U existe una bola abierta B ⊂ U centrada en v tal que lı́m Rkv (h) = lı́m f(v + h) − Pk (v, h) = 0 k→∞ para todo h ∈ B. k→∞ 12 Cálculo Diferencial e Integral Observación 1.4.5. Si Q : E → F es un operador cuadrático, se sigue que Q(v) = β(v, v) para algún operador bilineal simétrico. Supongamos que Q es continuo, entonces β es continuo y por lo señalado en la Observación 1.2.4, existe una constante C ≥ 0 tal que kQ(h)k = kQ(h/khk)kkhk ≤ Ckhk khk para todo h 6= 0. Entonces, como Q(x + h) − Q(x) − 2β(x, h) = Q(h) para todo x, h ∈ E, se deduce que Q es diferenciable pues kQ(h)k kQ(x + h) − Q(x) − 2β(x, h)k = →0 khk khk cuando h → 0. Observemos que la diferencial de Q es DQx = 2β(x, ·) que es en efecto un operador acotado. Como la asignación x 7→ DQx = 2β(x, ·) es un operador lineal y acotado, se deduce que Q es dos veces diferenciable con 12 D2 Qx = β, es decir D2 Q es constante, con lo cual Dn Q = 0 para todo n ≥ 3. Por último, se deduce que para todo x ∈ E la expansión de Taylor de Q es simplemente su polinomio de orden 2, es decir Q(x + h) = Q(x) + 2β(x, h) + Q(h) para todo h ∈ E, lo que prueba que Q es Cω en E. Observación 1.4.6. En general, dado un operador P ∈ B k (Ek ; F) (es decir P es multilineal, simétrico y continuo de grado k), diremos que P es un polinomio homogéneo de grado k en el espacio de Banach E. Y un polinomio en E es una suma finita de polinomios homogéneos, posiblemente de distintos grados. Entonces el Teorema de Taylor se puede pensar como un teorema de aproximación de funciones por polinomios, y una función es analítica cuando es (localmente) límite de polinomios. Lema 1.4.7. Sea f : E → F dos veces diferenciable, y homogénea de grado 2, es decir f(tv) = t2 f(v) para todo v ∈ E, t ∈ k. Entonces f es un operador cuadrático. Demostración. Sea v ∈ E. Como f(tv) = t2 f(v), diferenciando respecto de t tenemos, por la regla de la cadena, Dftv ((tv) ′ ) = 2tf(v), es decir Dftv (v) = 2tf(v). Diferenciando nuevamente respecto de t se tiene D2 ftv v (v) = 2f(v). 1.5. Funciones Inversa e Implícita 13 Evaluando en t = 0 se deduce que f(v) = 1/2(D2 f0 v)(v) lo que prueba que f proviene del operador bilineal (y simétrico) β dado por β(v, w) = 1/4 (D2 f0 v)(w) + (D2 f0 w)(v) = 1/2D2 f0 (v, w), donde la última identidad se debe a que por existir D2 f0 , es simétrico. Observación 1.4.8. Obviamente el lema se generaliza para todo k ∈ N de manera natural, luego un polinomio homogéneo continuo de grado k está dado por una función homogénea f : E → F de grado k -o sea f(tv) = tk f(v)- que es k veces diferenciable. Todas estas definiciones se pueden localizar de la siguiente manera: supongamos que f : U ⊂ E → F con U abierto y que f(tv) = tk f(v) para t ∈ R suficientemente pequeño, v ∈ U. Entonces f coincide en algún entorno de 0 ∈ E con un polinomio homogéneo continuo. 1.5. Funciones Inversa e Implícita Los teoremas que vamos a enunciar en esta sección son esencialmente versiones sin coordenadas de los teoremas clásicos, por lo tanto las pruebas las omitimos (se pueden ver en la sección [I, §5] del libro de Lang [47]). 1.5.1. Función Inversa Salvo que se aclare lo contrario, un isomorfismo T : E → F entre espacios de Banach es un operador T ∈ B(E, F) biyectivo y bicontinuo. En realidad -siempre que el dominio de T sea todo E- sólo hace falta chequear que sea acotado y biyectivo, pues el Teorema de la función abierta (Teorema 1.1.2) nos garantiza que la inversa será continua. Teorema 1.5.1 (Teorema de la función inversa). Sean E, F espacios de Banach, U ⊂ E abierto y f : U → F una función Ck , con k ≥ 1. Supongamos que para algún punto v ∈ U se tiene que Dfv : E → F es un isomorfismo de espacios de Banach. Entonces f es un isomorfismo local de clase Ck alrededor de v. Es decir, existen abiertos A ⊂ U ⊂ E y B ⊂ F entornos de v y f(v) respectivamente, tales que f|A : A → B es un difeomorfismo de clase Ck . 14 Cálculo Diferencial e Integral Observación 1.5.2. Con la notación del teorema previo, En particular, Dfx es inversible para todo x ∈ A, es más si f−1 : B → A denota la inversa de f|A , entonces por la regla de la cadena (Dfx )−1 = Df−1 f(x) para todo x ∈ A. El teorema no dice que tan grandes son los abiertos A, B pero esto en ciertos casos se puede estimar si uno conoce explícitamente Df (ver el Lema 5.4 en [I,§5] del libro de Lang [47]). 1.5.2. Función Implícita Diremos que un subespacio cerrado F1 ⊂ F de un espacio de Banach F parte a F si existe otro subespacio cerrado F2 ⊂ F tal que F = F1 ⊕ F2 . En ese caso diremos que F se parte. Teorema 1.5.3 (Teorema de la función implícita). Sean E, F espacios de Banach, U ⊂ E abierto y f : U → F de clase Ck , k ≥ 1. Supongamos que existe v ∈ U y un subespacio F1 que parte a F, tales que Dfv : E → F1 es un isomorfismo y f(v) = 0. Entonces existe un isomorfismo local g : F → F1 × F2 de clase Ck (alrededor de 0 ∈ F) y abiertos A ⊂ U, B ⊂ F1 que contienen a v y (g ◦ f)(v) respectivamente, tales que g ◦ f|A : A → B es un isomorfismo de clase Ck . Observación 1.5.4. Una hipótesis relevante del teorema es el hecho de que la imagen F1 de Dfv parte al espacio total. Esto está garantizado en dimensión finita, y también por ejemplo si F1 es un subespacio cerrado de un espacio de Hilbert. Como veremos más adelante, en muchos casos no es tan sencillo garantizar esta condición (ver también el Teorema 1.5.8). Enunciamos a continuación otras versiones útiles del teorema. Dado un producto A × B llamaremos pr1 : A × B → A a la proyección a la primera coordenada, análogamente definimos pr2 . Si Vi (i = 1, 2) son abiertos en espacios de Banach, diremos que g : V1 × V2 → F es una proyección si existe un 1.5. Funciones Inversa e Implícita 15 difeomorfismo k de V1 en un abierto de F, k : V1 → k(V1 ) ⊂ F tal que g = k◦pr1 . Esto es pr1 /V V1 × V2 v 1 v v g vv vv k v zvv F Corolario 1.5.5 (Teorema de la función implícita v2). Sea U ⊂ E abierto y v ∈ U. Supongamos que f : U → F es una función Ck (k ≥ 1) tal que Dfv es un epimorfismo y su núcleo parte a E. Entonces existen: un abierto U0 ⊂ U que contiene a v, abiertos V1 , V2 en espacios de Banach, y un difeomorfismo de clase Ck , h : V1 × V2 → U0 , tales que f ◦ h es una proyección. El teorema de la función implícita se puede reformular si ya asumimos al espacio de salida “partido” como un producto de espacios de Banach, para poder pensar (al menos localmente) a la superficie de nivel de una función f(x, y) = cte como gráfico de otra función g, es decir que {(x, y) : f(x, y) = c} = Gr(g) = {(x, g(x))} al menos localmente. Para escribir esto con precisión, necesitamos hacer algunas aclaraciones: si E, F, G son espacios de Banach y f : E × F → G es diferenciable, podemos considerar las derivadas parciales de la manera usual, es decir: Para w ∈ F fijo, consideramos la función f1 : E → G dada por f1 (x) = f(x, w). Entonces esta función es diferenciable y a su diferencial en v ∈ E la denotamos D1 f(v,w) . Para v ∈ E fijo, consideramos la función f2 : F → G dada por f2 (y) = f(v, y). Entonces esta función es diferenciable y a su diferencial en w ∈ F la denotamos D2 f(v,w) . Lema 1.5.6. Sean U ⊂ E, V ⊂ F abiertos. Entonces f : U × V → G es de clase Ck en U × V, con k ≥ 1, si y sólo si existen las dos derivadas parciales D1 f, D2 f y son de clase Ck−1 . Demostración. Cambiando f por Dk−1 f basta probar el resultado para k = 1. Si f es C1 , entonces f1 , f2 son C1 con lo cual Di f = Dfi son continuas para i = 1, 2. Recíprocamente, si Di f existen y son continuas, basta probar que f es diferenciable y que Df(p,q) (v, w) = D1 f(p,q) v + D2 f(p,q) w, (1.2) 16 Cálculo Diferencial e Integral para todo (p, q) ∈ U × V, (v, w) ∈ E × F. Esto es porque en ese caso está claro que Df es continua por ser una suma y composición de funciones continuas, es decir Df = D1 f ◦ pr1 + D2 f ◦ pr2 . Para ver que vale (1.2), tenemos el candidato a Df; escribimos la diferencia f(p + v, q + w) − f(p, q) − [D1 f(p,q) v + D2 f(p,q) w]. Separamos en dos términos, sumando y restando f(p, q + w), D1 f(p,q+w) v; por ejemplo el primer término queda, acotando ≤ kf(p + v, q + w) − f(p, q + w) − D1f(p, q + w)vk + k[D1 f(p,q+w) − D1 f(p,q) ]vk Observando que k(v, w)k = kvk + kwk ≥ kvk, el primer término tiende a cero al dividirlo por k(v, w)k por la existencia de D1 f, y el segundo por la continuidad de D1 f. La parte que queda involucra D2 f y es similar. Corolario 1.5.7 (Teorema de la función implícita v3). Sean E, F, G espacios de Banach, U ⊂ E, V ⊂ F abiertos, f : U × V → G una función Ck con k ≥ 1. Sean (v, w) ∈ U × V y z ∈ G tales que f(v, w) = z y supongamos que D2 f(v,w) : F → G es un isomorfismo de espacios de Banach. Entonces existen: un abierto U0 ⊂ U entorno de v y una (única) función g : U0 → V de clase Ck con g(v) = w tales que f(x, g(x)) = z para todo x ∈ U0 , y esta función g parametriza el conjunto {(x, y) : f(x, y) = z} ⊂ U × V en algún entorno abierto de (v, w). 1.5.2.1. Subespacios sin suplemento Mencionamos aquí un resultado reciente (2009) concerniente a teoremas de la función implícita sin suplementos, que puede encontrarse en el trabajo [3] de Jinpeng An y Karl-Hermann Neeb. Teorema 1.5.8. Sean E, F, G espacios de Banach, U ⊂ E, V ⊂ F entornos abiertos del cero. Sean f : U → V, g : V → G funciones C1 . Supongamos que 1.A. Problemas 17 f(0) = 0, g(0) = 0, g ◦ f ≡ 0, ranDf0 = ker Dg0 , ranDg0 ⊂ G es un subespacio cerrado. Entonces existe un entorno W ⊂ V, alrededor de 0 en F, tal que g−1 (0) ∩ W = f(U) ∩ W. Observación 1.5.9. El teorema no pide que el rango de Dg0 parta a F, pero si pide que sea un subespacio cerrado. Por otra parte, se deduce del teorema que f : f−1 (f(U) ∩ W) ∩ U → g−1 (0) ∩ W parametriza localmente la superficie de nivel N = g−1 (0) ⊂ V. 1.A. Problemas 1.I. Probar que si F es un espacio de Banach y E es un espacio normado, entonces B(E, F) es un espacio de Banach. 1.II. ∗ Dados p, q ∈ [1, +∞] tales que 1/p + 1/q = 1, y Tr : Mn (C) → C la traza usual, se define la norma p de matrices como p/2 1/p ) . kAkp = Tr((A∗ A) Probar la desigualdad de Hölder: |Tr(AB)| ≤ Tr|AB| ≤ kAkp kBkq donde A, B ∈ Mn (C). 1.III. Dado 1 ≤ p < ∞ probar la desigualdad de Minkowski: kA + Bkp ≤ kAkp + kBkp y concluir que las normas p son efecto normas sobre el espacio de matrices. Sugerencia: aplique la desigualdad de Hölder del ejercicio previo a la identidad p−1 kA + Bkp |A + B| = Tr |A + B|p−1 U∗ (A + B) p = Tr |A + B| = Tr |A + B|p−1 U∗ A + Tr |A + B|p−1 U∗ B donde A + B = U|A + B| es la descomposición polar de A + B. 1.IV. Desigualdades de Clarkson 18 Cálculo Diferencial e Integral Sean x, y ∈ C y p ≥ 2, probar la siguientes desigualdades (|x + y|p + |x − y|p )1/p ≤ ≤ = donde 1 p + 1 q (|x + y|2 + |x − y|2 )1/2 21/2 {2(p−2)/p ((|x|p + |y|p )2/p )}1/2 21/q (|x|p + |y|p )1/p (1.3) = 1 (considerar las desigualdades de Jensen y Hölder). Sean x, y ∈ C y 1 < p ≤ 2, la idea de este ejercicio es probar que: |x + y|q + |x − y|q ≤ 2(|x|p + |y|p )q−1 (1.4) Probar que (1.4) se reduce a |1 + c|q + |1 − c|q ≤ 2(1 + |c|p )q−1 (1.5) con |c| ≤ 1. Considerando c = ρeiθ , mostrar que es suficiente considerar θ = 0, es decir 0 ≤ c ≤ 1. Además como (1.5) es trivial para c = 0 y c = 1, sólo es necesario considerar 0 < c < 1. Mediante la transformación c = 1−z 1+z con 0 < z < 1, reducir (1.5) a S = 1/2[(1 + z)p + (1 − z)p ] − (1 + zq )p−1 ≥ 0. Expandiendo cada término de S en su serie de Taylor, probar que: S= ∞ X (2 − p)(3 − p) . . . (2k − p) 2k z f(z, k, p) (2k − 1)! k=1 donde f(z, k, p) = 1 − z(2k−p)/(p−1) 1 − z2k/(p−1) . − (2k − p)/(p − 1) 2k/(p − 1) Usando que la función (1 − zt )/t, para t > 0 y 0 < z < 1 es no decreciente como función de t, establecer la desigualdad (1.5). Probar las desigualdades de Clarkson: si x, y ∈ lp con p > 1 entonces p p−1 p kx + ykp (kxkp p + kx − ykp ≤ 2 p + kykp ), q p p q−1 kx + ykq , p + kx − ykp ≤ 2(kxkp + kykp ) si si p ≥ 2, (1.6) 1 < p ≤ 2. (1.7) Sugerencia: Utilizar (1.3), (1.4) y la desigualdad de Minkowski X X X ( Asi )1/s + ( Bsi )1/s ≤ ( (Ai + Bi )s )1/s para Ai , Bi ≥ 0 y 0 < s = p q ≤ 1. 1.A. Problemas 19 1.V. Un espacio de Banach (X, k.k) se dice uniformemente convexo si para cada ǫ > 0, existe δ(ǫ) > 0 tal que kxk = kyk = 1, kx − yk ≥ ǫ implican 1/2 kx + yk ≤ 1−δ(ǫ). Probar que lp es uniformemente convexo si p > 1 y estimar δ(ǫ) en términos de p. 1.VI.∗ Probar que (Mn (C), k · kp ) es uniformemente convexo para 1 < p < ∞. 1.VII. Probar que toda función diferenciable f : E → F entre espacios normados es continua. 1.VIII. Sean E, F, G espacios normados. Si f : E → F es diferenciable y T ∈ B(F, G), entonces DTx = T para todo x ∈ F. D(T ◦ f)p = T ◦ Dfp para todo p ∈ E. p 1.IX. Sea H un espacio de Hilbert y f : H → R dada por f(x) = kxk = hx, xi. Probar que si x 6= 0, entonces f es diferenciable en x y vale Dfx (v) = hx,vi kxk . 1.X. Consideremos B 2 (E2 ; F) con la norma kβk = sup kvk≤1,kwk≤1 kβ(v, w)k. Probar que Φ : B(E, B(E, F)) → B 2 (E2 ; F) dada por Φ(T )(v, w) = (Tv)(w) es un isomorfismo isométrico sobreyectivo. 1.XI. Probar que si g : R2 → R es dos veces diferenciable, entonces ∂2 g ∂2 g (x, y) = (x, y) ∂y∂x ∂x∂y para todo (x, y) ∈ R2 . 1.XII. Probar que si U ⊂ E es un abierto conexo y f : U → F es diferenciable con Df ≡ 0, entonces f es constante. 1.XIII. Dar una definición de operador k-homogéneo µ : Ek → F que sea consistente con la de operador 2-homogéneo (operador cuadrático). 1.XIV. Probar que si α : [a, b] → E es continua, entonces es reglada. R R 1.XV. Probar que k I f(t)dtk ≤ I kf(t)kdt para toda f : I → E reglada. 20 Cálculo Diferencial e Integral 1.XVI. Probar que si f : I → E es reglada y T ∈ B(E, F), entonces Z Z T f = (T ◦ f). I I 1.XVII. Sea f : U ⊂ E → F analítica (Definición 1.4.4). Sea p ∈ U, B = BR (0) de manera que Pk (p, v) → f(p + v) puntualmente para todo v ∈ B. Dado v ∈ B, considerando ϕ ∈ F ′ y g(z) = ϕ(f(p + zv)) probar que g es una función analítica en el sentido usual para |z| < 1 + R − kvk, y calcular la serie de g alrededor de z = 0. ∗ Probar que Pk converge uniformemente a f en p + B. 1.XVIII. Sea A ∈ Mn (C), probar que las siguientes funciones son analíticas: P Inv : U ⊂ Mn (C) → Mn (C) dada por Inv(A) = A−1 = n≥0 (1 − A)n , donde U = {A : kA − 1k < 1}. P n+1 log : U ⊂ Mn (C) → Mn (C) dada por log(A) = n≥0 (−1) /n (A − 1)n . P exp : Mn (C) → Mn (C) dada por exp(A) = eA = n≥0 1/n! An . Probar que exp ◦ log = idU , log ◦ exp = id. 1.XIX. Probar el Teorema de la función implícita v3 (Teorema 1.5.7). Capítulo Variedades Diferenciables He decidido en primer lugar, abocarme a la tarea de construir la noción de una magnitud múltiplemente extendida, a partir de nociones generales de magnitud. P Bernhard Riemann resentamos en este capítulo las nociones básicas de variedades modeladas por espacios de Banach. Haremos uso de las herramientas del cálculo diferencial e integral introducidas en el capítulo previo. También presentamos un breve repaso de grupos de Lie-Banach y sus espacios homogéneos, incluyendo algunos resultados recientes para espacios de dimensión infinita. El capítulo concluye con una rápida presentación de los grupos clásicos de matrices y sus espacios homogéneos. 2.1. Cartas y Atlas Dado un espacio de Banach fijo E y un espacio topológico M, supongamos que tenemos una colección de abiertos U ⊂ M que lo recubren, y una colección de mapas ϕ : U → E de manera que ϕ(U) ⊂ E es abierto y ϕ : U → ϕ(U) es un homeomorfismo. Los pares (U, ϕ) se denominan cartas de M, y diremos que M es una variedad topológica modelada por E si se verifica la condición de compatibilidad siguiente: si (V, φ) es cualquier otra carta de M, entonces la función de transición φ ◦ ϕ−1 : E → E es continua donde está definida, φ ◦ ϕ−1 : ϕ(U ∩ V) ⊂ E → E. Un atlas es una colección de cartas compatibles que cubre todo M. 21 2 22 Variedades Diferenciables Observación 2.1.1. Algunas veces es conveniente olvidar la topología inicial de M y dotar al espacio de una topología usando las cartas, es decir, si tenemos un cubrimiento del conjunto M por conjuntos U y funciones inyectivas ϕ tales que ϕ(U) ⊂ E es un conjunto abierto, entonces decretamos que los U son abiertos en M y esto induce una topología allí (esto tiene sentido siempre que las funciones de transición sean todas continuas). Un ejemplo sencillo de la diferencia entre las topologías que puede obtenerse es el dado por la Lemniscata ∞ en el plano R2 : con la topología de subespacio es un conjunto compacto, mientras que con la topología que se le da al identificarlo con la recta R mediante una única carta, claramente es no compacto. Definición 2.1.2. Sea (∗) alguna de las siguentes categorías: 1. diferenciable, 2. Ck , 3. C∞ o suave, 4. Cω o analítica. Diremos que la variedad M es (∗) si las funciones de transición son (∗). Si N es otra variedad modelada por un espacio de Banach F, diremos que una función f : M → N entre variedades diferenciables es (∗) si para todo par de cartas (U, ϕ), (U ′ , ξ) de M y N respectivamente, la función ξ ◦ f ◦ ϕ−1 : E → F es (∗) en el abierto ϕ(U) ⊂ E. 2.2. Espacio y Fibrado tangente En esta sección discutimos algunas maneras de presentar el fibrado tangente a una variedad diferenciable, y como las aplicaciones suaves entre variedades inducen morfismos de los fibrados. 2.2.1. Espacio tangente Dada una variedad diferenciable, el espacio tangente Tp M en p ∈ M se puede pensar de varias maneras equivalentes. Una bastante útil para nuestros propósitos es la siguiente: consideremos ternas (U, ϕ, v) donde (U, ϕ) es una carta de M alrededor de p ∈ M y v ∈ E. Dos ternas (U, ϕ, v), (V, ξ, w) son equivalentes en p ∈ M si D ξ ◦ ϕ−1 ϕ(p) v = w. 2.2. Espacio y Fibrado tangente 23 Esto define una relación de equivalencia en aquellas ternas donde el abierto contiene al punto p ∈ M, y las clases son los elementos de Tp M. Si [(U, ϕ, v)]p ∈ Tp M denota una clase, la aplicación ϕ∗ : [(U, ϕ, v)]p 7→ v es una biyección, que permite identificar Tp M con el espacio de Banach E. Dada un curva α : (−ǫ, ǫ) → M diferenciable definida en algún entorno de 0 ∈ R, tal que α(0) = p, podemos calcular su velocidad en p usando una carta cualquiera (U, ϕ) alrededor de p, es decir α̇(0) := (ϕ ◦ α) ′ (0) es la velocidad de α en p. Por supuesto que muchas curvas pueden tener la misma velocidad con lo cual tenemos que hacer una identificación, diremos que α̇(0), β̇(0) representan el mismo vector tangente v ∈ Tp M si α(0) = β(0) = p ∈ M y además (ϕ ◦ α) ′ (0) = (ϕ ◦ β) ′ (0) para alguna de carta (U, ϕ) alrededor de p ∈ M. Esto define una relación de equivalencia entre curvas que pasan por p, y de hecho la relación no depende de la carta elegida. Para convencernos, sea (V, ξ) otra carta alrededor de p ∈ M, y observemos que (ξ ◦ α) ′ (0) = (ξ ◦ ϕ−1 ◦ ϕ ◦ α) ′ (0) = D(ξ ◦ ϕ−1 )ϕ(p) (ϕ ◦ α) ′ (0). Suponiendo que α y β son equivalentes, reemplazando el último término de la derecha por (ϕ ◦ β) ′ (0) y volviendo a agrupar se tiene (ξ ◦ α) ′ (0) = (ξ ◦ β) ′ (0). El espacio tangente se puede pensar como el cociente por esta relación, pero como veremos, en los ejemplos usaremos una curva concreta. A la clase de una curva α la denotamos con [α]p . Observemos que, si ponemos β(s) = α(t + s) esta es una curva en M para s suficientemente pequeño, que verifica β(0) = α(t); la clase de β la denotamos [α]α(t) . 2.2.2. Fibrado tangente Para definir el fibrado tangente conviene introducir algunas nociones generales, comenzando por fibrados. 24 Variedades Diferenciables 2.2.2.1. Fibrados Definición 2.2.1. Un fibrado sobre una variedad diferenciable M consiste en una terna (X, M, π) dado por variedades diferenciables X, M y una función diferenciable π : X → M tal que, para cada p ∈ M, existe un entorno abierto U de p existe una variedad diferenciable Z, y un difeomorfismo h : π−1 (U) → U × Z, tales que π = pr1 ◦ h. Es decir, localmente π es una proyección (haciendo honor a su nombre): h h / / U×Z π−1 (U) U×Z X t t x tt xx t π x t π t pr1 xxpr1 yttt , o más precisamente: {xx M M 2.2.2.2. Fibrados vectoriales Con algunas especificaciones más, donde el espacio X sea localmente trivializable con un espacio de Banach fijo E, obtenemos un fibrado vectorial. Más precisamente, sea E un espacio de Banach, entonces el fibrado (X, M, π) es un fibrado vectorial, si existen {Ui }i∈I cubrimiento por abiertos de M, para cada i ∈ I hay una difeomorfismo τi : π−1 (Ui ) → Ui × E tal que π = pr1 ◦τi , y en particular para cada p ∈ M, si llamamos τip := τi |π−1(p) , entonces τip : π−1 (p) → E es un isomorfismo, para cada par i, j ∈ I, para cada p ∈ M, la función τjp ◦ τ−1 ip : E → E es un isomorfismo de espacios de Banach (es decir es lineal, continua y biyectiva), para cada par i, j ∈ I, la función es diferenciable. Ui ∩ Uj ∋ p 7→ τjp ◦ τ−1 ip ∈ B(E) 2.2. Espacio y Fibrado tangente 25 Las funciones τi se denominan trivializaciones del fibrado, y la familia {(Ui , τi )} es un cubrimiento trivializador. Las funciones τjip := τjp ◦ τ−1 ip se llaman funciones de transición del fibrado. Una sección s : M → X del fibrado es una función tal que π ◦ s = idM . 2.2.2.3. Fibrado Tangente En esta sección pegamos los espacios tangentes usando la noción de fibrado. Definición 2.2.2. Dada M una variedad diferenciable modelada por el espacio de Banach E, definimos TM como la unión disjunta de todos los espacios tangentes de M, y sea π : TM → M la proyección natural que asigna p ∈ M al vector v ∈ Tp M. Entonces (TM, M, π) es un fibrado vectorial, el fibrado tangente de M, usualmente denotado simplemente TM. Se denota TU a la restricción de este fibrado a la preimagen π−1 (U) de un abierto U ⊂ M. Más concretamente, sea TM = ⊔p∈M Tp M y sea π : TM → M la proyección canónica que a un elemento [α]p ∈ Tp M lo manda al punto p ∈ M. Consideremos (Ui , ϕi ) un cubrimiento de M por cartas, pongamos TUi = π−1 (Ui ) = ⊔p∈Ui Tp M y consideramos la función τi : π−1 (Ui ) → Ui × E dada por τi : [α]p 7→ (p, (ϕi ◦ α) ′ (0)). Observemos que τi es diferenciable puesto que Ui × E tiene una carta global ϕi × idE que identifica Ui × E ≃ ϕi (Ui ) × E ⊂ E × E, y en esta carta se tiene (ϕi × idE ) ◦ τi ([α]p ) = (ϕi (p), (ϕi ◦ α) ′ (0)). Luego si (Uj , ϕj ) es otra carta y q ∈ Ui ∩ Uj , denotemos ϕji := ϕj ◦ ϕ−1 : ϕi (Ui ∩ Uj ) → ϕj (Ui ∩ Uj ). i En la presentación con cartas de T (Ui ∩ Uj ) se tiene τji (x, v) = (ϕji (x), (Dϕji )x v) para x ∈ ϕi (Ui ∩ Uj ), v ∈ E. Como x 7→ (Dϕji )x es de clase Ck−1 (suponiendo que la variedad sea Ck con k ≥ 1), se deduce que TM es una variedad de clase Ck−1 . 26 Variedades Diferenciables 2.2.3. Diferencial de una función Dada una función diferenciable f : M → N entre variedades, denotaremos f∗ : TM → TN a la aplicación que, si (U, ϕ) y (V, ξ) son cartas de M y N respectivamente, localmente está dada, para x ∈ ϕ(U) y v ∈ E ≃ Tp M, por f∗ (x, v) = (ξ ◦ f ◦ ϕ−1 (x), D ξ ◦ f ◦ ϕ−1 x v), que nuevamente es de clase Ck−1 siempre que M, N, f sean de clase Ck (con k ≥ 1). Pensando en términos de clases de curvas, hay una manera útil de presentar f∗ que es la siguiente: si [α]p ∈ Tp M es una clase con un representante α : I → M tal que α(0) = p, entonces f ◦ α : I → N es una curva que pasa por f(p), y no es difícil ver que f∗p ([α]p ) = [f ◦ α]f(p) . Entonces en general, si nos restringimos a una carta (U, ϕ) de M, tenemos la carta de TU dada por ϕ∗ = τϕ : [α]p 7→ (ϕ(p), (ϕ ◦ α) ′ (0)), que da la identificación TU ≃ U × E ≃ ϕ(U) × E. Es habitual decir entonces que un elemento de TU es sencillamente un par ordenado (x, v) con x ∈ ϕ(U) ⊂ E y v ∈ E libre, y la proyección canónica en esta presentación es simplemente pr1 , es decir π(x, v) = x. 2.3. Curvas Si α : I → M es una curva Ck con I ⊂ R abierto, se la puede pensar como una curva entre variedades (el fibrado tangente a I se identifica naturalmente con I × R). La diferencial α∗ : TI = I × R → TM es una aplicación Ck−1 . 2.3.1. Levantadas de una curva A la diferencial de una curva dada α ⊂ M, es conveniente pensarla como otra curva, pero a valores en TM, de la siguiente manera: el fibrado π : I × R → I tiene una sección canónica i dada por i(t) = (t, 1). Entonces definimos α ′ := α∗ ◦ i : I → TM 2.4. Subvariedades 27 que es la levantada canónica de α, que verifica π ◦ α ′ = α, I ×O R i I α∗ / TM w; α ′ www w ww ww α π /M Esta es una curva Ck−1 a valores en TM. Notemos que en una carta local (U, ϕ) de M, la expresión para α ′ es α ′ (t) = ((ϕ ◦ α)(t), α̇(t)), donde α̇(t) denota el vector de E dado por (ϕ◦α) ′ (t). En general, una levantada de α : I → M es una curva β : I → TM, de clase Ck−1 tal que π ◦ β = α. 2.4. Subvariedades Supongamos que M es una variedad Ck modelada por el espacio de Banach E, y que este espacio se descompone como E = F1 ⊕F2 con Fi espacios de Banach. Sea N ⊂ M un subconjunto, y supongamos que para cada n ∈ N hay una carta (U, ϕ) de M que induce un isomorfismo de U con un producto de abiertos A1 × A2 ⊂ F1 × F2 , de manera tal que ϕ(U ∩ N) = A1 × {a2 } para algún punto a2 ∈ A2 . Llamemos ϕN = pr1 ◦ ϕ, entonces (U ∩ N, ϕN ) es por definición una carta de N, ϕN (U ∩ N) = A1 es un abierto de F1 . No es difícil ver que un cubrimiento de cartas de este tipo induce en N una estructura diferenciable. Diremos que N ⊂ M es una subvariedad regular, que tiene la topología heredada de M como subespacio. En general no es sencillo garantizar esta construcción, incluso en el caso finito dimensional (sin mencionar que en dimensión infinita puede ocurrir que un subespacio F1 no parta a E). Un ejemplo molesto ocurre en el caso de la lemniscata, donde ningún entorno de X = (0, 0) se puede identificar con R. Otro ejemplo es el grupo a un parámetro con pendiente irracional en el toro, que tiene estructura de variedad diferenciable por ser difeomorfo con R, pero no es una subvariedad regular del toro. Específicamente, identificamos el toro con 28 Variedades Diferenciables S1 × S1 y consideramos la subvariedad W parametrizada como t 7→ (eiπt , eiαπt ) para t ∈ R y α ∈ R irracional fijo. Es fácil ver que W ⊂ T es densa, con lo cual cualquier abierto de T , al cortarlo con W, nos devuelve infinitos segmentos. Dicho de otra forma, no hay manera de obtener el abierto A ⊂ W que viene del intervalo (0, 1) en R, como intersección de un abierto del toro con W. Dos criterios útiles para decidir si N ⊂ M es una subvariedad son los siguientes: Proposición 2.4.1. Sea f : M → Z una función Ck (k ≥ 1) entre variedades diferenciables. Supongamos que f es una sumersión, es decir para todo p ∈ M, se tiene que f∗p : Tp M → Tf(p) Z es un epimorfismo y el núcleo ker f∗p parte a Tp M. Entonces, si z0 ∈ Z y N = f−1 (z0 ) ⊂ M, con la topología de subespacio, se tiene que N es una subvariedad cerrada de M de clase Ck , con Tp N ≃ ker f∗p para todo p ∈ N. Demostración. Que N es cerrado es trivial, supongamos que es no vacío. Dado p ∈ N, si el espacio de Banach que modela M es E, tomamos una carta (Ũ, ϕ) de M tal que ϕ(p) = 0 ∈ E, y llamamos U = ϕ(Ũ) ⊂ E. Tomemos ahora otra carta (W, ξ) de Z tal que ξ(z0 ) = 0 ∈ F. Tenemos por hipótesis que, para cada p ∈ N, f̃ = ξ ◦ f ◦ ϕ−1 : U → F es una aplicación Ck entre espacios de Banach, cuya diferencial es sobreyectiva y el núcleo parte a E, es decir F ⊕ ker Df̃0 ≃ E. Por el Teorema de la Función Implícita v2 (Corolario 1.5.5), existe (achicando U si fuese necesario) un difeomorfismo de clase Ck , h : V1 × V2 → U con V1 abierto de F, V2 abierto del núcleo de Df̃0 , y f̃ ◦ h = pr1 . Tomemos φ = h−1 ◦ ϕ que resulta una carta de M con dominio Ũ tal que ξ◦f◦φ−1 = pr1 . Por construcción, φ(Ũ) = V1 × V2 , pero además como ξ ◦ f ◦ φ−1 (0, y) = 0, se deduce que φ(Ũ ∩ N) = 0 × V2 , lo que prueba que N es subvariedad. Por último, observemos que en esta presentación Tp N ≃ 0 × ker Df̃0 , con lo cual se termina la prueba. La utilidad de este criterio se termina cuando no podemos hallar un suplemento para el núcleo de f∗ . Sin embargo, en dimensión finita, en espacios de Hilbert, y en ejemplos puntuales de espacios de Banach, es utilizable. El próximo criterio es todavía más débil, pues aún en dimensión finita no permite probar que un subconjunto es una subvariedad regular. La prueba la omitimos, queda como ejercicio. 2.4. Subvariedades 29 Proposición 2.4.2. Sea f : X → Y una función Ck entre variedades, y supongamos que f es una inmersión, es decir f∗p : Tp X → Tf(p) Y tiene rango cerrado que se parte. Entonces para cada p ∈ X existe un abierto U ⊂ X entorno de p y un abierto V ⊂ Y entorno de f(p) tales que f(U) es una subvariedad cerrada de Y. f|U : U → f(U) es un Ck difeomorfismo. El resultado parece muy lindo pero la clave de su inutilidad está en la localización de la conclusión. Es decir, no dice que f(X) ⊂ Y es una subvariedad. Y la razón es muy simple: en general es falso aunque se verifiquen las hipótesis de la proposición. Una vez más recurrimos a la lemniscata y/o a la curva densa en el toro. Localmente, la imagen de la parametrización, en pedazos pequeños, es una subvariedad, en cualquiera de los dos casos. Pero si tomamos un abierto del espacio más grande que sea entorno del punto de intersección, y lo cortamos con la imagen de la parametrización, no conseguimos una carta de la subvariedad. Hecha esta aclaración, si uno puede probar de alguna otra forma que Z ⊂ Y es una subvariedad topológica, el teorema previo da una forma de darle estructura diferenciable compatible con la de M: hay que encontrar el espacio X y la función f : X → Y tal que f(X) = Z, que verifique las hipótesis del teorema. Volveremos a tocar el tema de estructuras diferenciables y subvariedades regulares cuando estudiemos espacios homogéneos de grupos de Lie-Banach, en la Sección 3.3. De particular interés es un criterio para estudiar cuando un espacio homogéneo G/K ⊂ X es subvariedad de X, que presentamos en el Lema 3.3.6. 2.4.1. Subvariedades no regulares Observemos que la definición de subvariedad regular es demasiado estricta para espacios de Banach. Si un subespacio E ⊂ F de un espacio de Banach no tiene suplemento topológico, entonces no será subvariedad regular. Podemos relajar esta condición para que si lo sea, y pedir únicamente (si E es el espacio de Banach que modela M y N ⊂ M es un subespacio topológico) que exista un subespacio cerrado F ⊂ E tal que para todo punto p ∈ N exista una carta 30 Variedades Diferenciables (U, ϕ) de M que contenga a p tal que ϕ(U ∩ N) sea un abierto de F. A estas variedades, que tienen la topología de subespacio, las llamaremos subvariedades embebidas. En este caso, el problema es encontrar buenos criterios que permitan probar la existencia de una estructura de subvariedad, ya que el teorema de la función inversa y sus derivados requieren -según discutimos- de la existencia de suplementos lineales para núcleos o imágenes de las diferenciales de las funciones involucradas. Un corolario no trivial del Teorema 1.5.8 de la función implícita de Ann y Neeb que se halla en el mismo trabajo [3] es el siguiente: Teorema 2.4.3. Sea f : M → Z una función Ck , k ≥ 1 entre variedades diferenciables, y dado z0 ∈ Z pongamos N = f−1 (z0 ). Supongamos que Dfp es un epimorfismo para cada p ∈ N. Existe un espacio de Banach E de manera que para todo punto p ∈ N, existe un entorno abierto Up ⊂ E del cero y una función Ck , gp : Up → N ⊂ M, de manera que gp (0) = p, (Dgp )0 es un monomorfismo y ran(Dgp )0 = ker Dfp . Entonces N tiene una estructura de variedad diferenciable modelada por E ≃ ker Dfp , que la hace una subvariedad embebida de M. 2.4.2. Subvariedades de un espacio de Banach Cuando M ⊂ F con F un espacio de Banach, podemos presentar de forma “concreta” la estructura de subvariedad, las curvas, los espacios tangentes, los campos y otros objetos que introduciremos luego. Como la inclusión i : M → F es una función de clase Ck , podemos usar las inversas de las cartas (U, ϕ) de M, que por definición son aplicaciones de clase Ck , Φ := i ◦ ϕ−1 : W → F con W ⊂ E abierto en el espacio de Banach E que modela M. Son inyectivas y con diferencial DΦx inyectiva en cada x ∈ W, cuyo rango es un subespacio cerrado de F que identificamos con TΦ(x) M de la siguiente manera [(U, ϕ, v)]p 7→ DΦx v, o equivalentemente si α(t) = Φ(tv) es una curva en M con α(0) = p, identificamos [α]p 7→ v. 2.4. Subvariedades 31 Es necesario para ser subvariedad embebida que todo punto p ∈ M tenga alguna bola abierta U ⊂ F de manera que U ∩ M esté parametrizado por alguna carta (W, Φ). En el caso más restrictivo de subvariedad, necesitamos que el rango de DΦx se parta en F. Supongamos que M se presenta como superficie de nivel de una función suave g, es decir: sean F, G espacios de Banach y sea g : F → G una función Ck (k ≥ 2), consideremos el subconjunto M = {v ∈ F : g(v) = 0}. Suponemos que para cada p ∈ M, Dgp es un epimorfismo, y el espacio tangente Tp M se identifica con el subespacio cerrado ker Dgp ⊂ F, que a su vez se identifica con el espacio de Banach E que modela M. Esto ocurre por ejemplo si Dgp es un epimorfismo con núcleo que se parte para todo p ∈ M. En esta presentación, si Φ : W ⊂ E → F es una parametrización local de M (la inversa de una carta), se tiene g ◦ Φ = 0 con lo cual DgΦ(x) DΦx = 0 para todo x ∈ W. Observación 2.4.4. Dada una curva α : I → M ⊂ F, está claro que α̇(0) ∈ Tp M cuando α(0) = p, pero en general no es cierto que α̈(0) ∈ Tp M. Un problema similar ocurre con la diferencial de una función X : M → TM, que en este caso concreto se puede pensar como una aplicación X : W ⊂ E → F tal que X(x) ∈ TΦ(x) M para todo p ∈ W; hay que pensar dónde yace X∗p v para cada v ∈ E. Estos problemas los retomaremos en la sección de derivada de Lie y luego cuando introduzcamos el segundo fibrado tangente TTM = T (TM). 2.4.2.1. La esfera de un espacio de Hilbert En este texto, denotaremos con H a un espacio de Hilbert separable, a su producto interno con h, i, y con k · k a la norma asociada. En caso de que la dimensión de H sea finita, identificaremos H = Cn . Para simplificar la discusión de esta sección, supongamos que H es real. Consideremos S ⊂ H la esfera unitaria, S = {v ∈ H : kvk2 = 1}, con lo cual S es una superficie de nivel de la función analítica H(v) = kvk2 , H : H → R, cuya diferencial está dada por DHp = 2hp, ·i 32 Variedades Diferenciables y su diferencial segunda es -constantemente- la forma bilineal simétrica D2 Hp = 2h·, ·i. Observemos que la diferencial primera DHp : H → R es un epimorfismo para cada p ∈ S, y además que ker DHp = span(p)⊥ es un hiperplano cerrado, con lo cual es un subespacio que se parte (un suplemento natural es span(p) ⊂ H). Luego S ⊂ H es una subvariedad de codimensión 1 en H, con Tp S = span(p)⊥ para todo p ∈ S. Estos subespacios se identifican todos, es decir, para p, q ∈ S se tiene E := Tp S ≃ H/span(p) ≃ Tq S ≃ H/span(q). Si el espacio de Hilbert es complejo, la funcional que se obtiene es la parte real del producto interno, es decir DHp = 2Rehp·, ·i, y se puede hacer un razonamiento análogo. 2.5. Campos Un campo vectorial en M es una función diferenciable X : M → TM que es una sección del fibrado en el sentido siguiente: X(p) ∈ Tp M. Resumiendo, si π : TM → M es la aplicación al punto base, entonces un campo verifica π ◦ X = idM . Dado un campo cualquiera X y un punto p ∈ M, tiene sentido plantearse el problema de hallar una curva α : (a, b) → M tal que ′ α (t) = X(α(t)) α(0) = p . Esta es una ecuación que se traduce usando cartas a una ecuación diferencial ordinaria en el espacio de Banach E. Suponiendo que X es Ck con k ≥ 1 (y que M es Ck+1 para que TM sea Ck y tenga sentido la definición para X), la ecuación tiene, para cada p ∈ M, una solución αp : Ip → M definida en algún intervalo maximal alrededor de 0 ∈ R. + + Si ponemos Ip = (t− = +∞ y t− = −∞, p , tp ), donde permitimos que t llamemos D(X) ⊂ R × M al dominio abierto + (t, p) tales que t− p < t < tp . Entonces el flujo del campo X es la función α : D(X) → M que para cada p ∈ M da la solución de la ecuación diferencial, es decir α(t, p) = αp (t). 2.5. Campos 33 Este flujo es una función de clase Ck (k ≥ 1) siempre que X lo sea. La prueba de esto y de que D(X) es abierto puede verse en el Teorema 2.6 de la sección [IV,§2] del libro de Lang [47]. También puede probarse que D(X) = R × M cuando M es compacta, pero no vale el resultado recíproco (ver el Corolario 2.4 y la Proposición 2.5 de [47, IV,§2]). Si denotamos αt (q) = α(t, q), observemos que α0 = idM , luego si t es suficientemente peqeño αt será un difeomorfismo con su imagen, pero con precaución porque el dominio de αt no es en general todo M. Con precisión, se tiene el siguiente resultado, cuya demostración dejamos como ejercicio. Proposición 2.5.1. Fijado p0 ∈ M, si t es suficientemente pequeño (es decir, si t ∈ Ip0 ), entonces existe un entorno abierto U ⊂ M de p0 tal que t ∈ Ip para todo p ∈ U, y además αt : p 7→ α(t, p) es un isomorfismo de U con un entorno abierto de α(t, p0 ). Además, dado t ∈ R, si ponemos Dt (X) como el conjunto de puntos de M tales que (t, p) ∈ D(X), entonces Dt (X) es un abierto de M y αt (Dt (X)) = D−t (X) y α−1 t = α−t , αt+s = αs ◦ αt donde están definidos (s, t ∈ R). 2.5.1. Corchetes de Lie Dada M variedad Ck+1 y X, Y : M → TM campos Ck , estos permiten definir un nuevo campo [X, Y], de clase Ck−1 , con las siguientes propiedades: [X, Y] = −[Y, X] [X, [Y, Z]] + [Y, [Z, X]] + [Z, [X, Y]] = 0 (identidad de Jacobi). El corchete [X, Y] tiene el sentido de derivada direccional de Y a lo largo de X -o al revés, salvo un signo-. Uno estaría tentado de definir la derivada direccional de Y a lo largo de X como p 7→ (Y∗p )(Xp ) pero observemos que Y : M → TM, entonces Y∗p : Tp M → TY(p) TM, con lo cual Y∗p (Xp ) no es un vector tangente en p ∈ M. 34 2.5.1.1. Variedades Diferenciables El corchete de Lie de campos en la esfera Este problema que parece puramente formal, se entiende mejor cuando uno piensa en subvariedades de un espacio de Banach. Empecemos con un ejemplo concreto, a saber la esfera unitaria S de un espacio de Hilbert H. Un campo S → TS lo podemos identificar claramente con una función X : S → H con la condición adicional de que Xp ∈ Tp S para todo p ∈ S, es decir hXp , pi = 0 para todo p ∈ S. Si componemos con una carta Φ : W ⊂ E → H, donde E ≃ H/R es el espacio de Hilbert que modela S, tenemos la identidad hXΦ(x) , Φ(x)i = 0 para todo x ∈ W. Supondremos sin pérdida de generalidad que 0 ∈ W, Φ(0) = p ∈ S. Tomemos una curva β ⊂ W tal que β(0) = 0 de manera de obtener una curva α = Φ ◦ β ⊂ S que pasa por p, y reemplazando x por β, derivamos en t = 0 para obtener (suponiendo que α̇(0) = v ∈ Tp S) hDXp v, pi + hXp , vi = 0. (2.1) En particular, si tomamos v = Xp ∈ Tp S, se deduce que hDXp Xp , pi = −kXp k2 . ¡Pero entonces, si suponemos que DXp Xp ∈ Tp S = span(p)⊥ , obtenemos que Xp = 0! Es decir que X∗p Xp no es en general un elemento en Tp M y por eso no tiene sentido pensarlo como derivada direccional. Para aclarar un poco más lo que acabamos de decir, volvamos a la relación (2.1), y ahora consideremos otro campo cualquiera Y : S → TS. ¿Qué tiene que ocurrir para que X∗p (Yp ) = DXp (Yp ) sea un elemento en Tp S? Reemplazando v por Yp obtenemos hXp , Yp i = −hDXp Yp , pi = 0 con lo cual Xp debe ser ortogonal a Yp que es el caso trivial que no tiene ningún interés. Es decir que en general X∗p (Yp ) no es un elemento de Tp M. Pero las cuentas que acabamos de hacer nos dan una pista: observemos la simetría de la ecuación hXp , Yp i + hDXp Yp , pi = 0. 2.5. Campos 35 Si intercambiamos Xp por Yp y restamos (ahora sólo suponemos que X, Y son campos en S), se cancelan los productos escalares y obtenemos hDYp Xp − DXp Yp , pi = 0, relación que nos dice que el vector DYp Xp − DXp Yp si es un vector tangente a la esfera en p. Esto nos permite obtener un campo [X, Y] : S → TS a partir de dos campos cualesquiera, que definiremos como [X, Y](p) := DYp Xp − DXp Yp para p ∈ S. 2.5.1.2. El corchete de Lie en superficies de nivel El hecho de que DYp Xp − DXp Yp ∈ Tp S para cada p ∈ S no es fortuito, es decir, no guarda relación con la estructura de la esfera. Por ejemplo, si M = {v ∈ F : H(v) = 0} es la superficie de nivel de una función H : F → G suficientemente regular, dijimos que Tp M se identifica con ker DHp para p ∈ M. Luego si X : M → TM es un campo, lo podemos identificar con una función X : M → F con la condición adicional de que DHp (Xp ) = 0 para todo p ∈ M. Supongamos que p ⊂ M es una curva con p0 = p y ṗ0 = v ∈ Tp M. Diferenciando esta relación obtenemos D2 Hp (v, Xp ) + DHp (DXp v) = 0. Dado otro campo cualquiera Y, como Yp ∈ Tp M podemos reemplazar para obtener D2 Hp (Yp , Xp ) + DHp (DXp Yp ) = 0 (2.2) para todo p ∈ M. Pero si suponemos que DXp Yp ∈ Tp M, entonces el segundo término se anula con lo cual debe guardarse la relación particular D2 Hp (Xp , Yp ) = 0 que como vimos en el ejemplo anterior es arbitraria, con lo cual DXp Yp no es un elemento de Tp M en general. Sin embargo, apelando nuevamente a la simetría 36 Variedades Diferenciables -y como D2 Hp es simétrica si existe-, intercambiando X con Y en la ecuación (2.2) y restando, se obtiene DHp (DYp Xp − DXp Yp ) = 0 lo que nos indica que [X, Y](p) := DYp Xp − DXp Yp ∈ Tp M. 2.5.1.3. Derivada de Lie Volviendo al caso general, la expresión recién computada nos da la definición de [X, Y]: se construye [X, Y] por medio de una carta, y en una representación local (U, ϕ), si denotamos Y(p) = Yp , X(p) = Xp , se define [X, Y](p) = DYp (Xp ) − DXp (Yp ), donde se debe entender que X, Y ahora representan los campos compuestos con la carta para pensarlos a valores en E. El corchete [X, Y] también se suele denotar LX Y, conocido como derivada de Lie de Y en la dirección de X. El nombre tiene la siguiente interpretación: si αX t denota el flujo del campo X de clase Ck , entonces observemos que fijado p ∈ M, αt : U → V es un difeomorfismo para t suficientemente pequeño y U, V abiertos de M con U entorno de p. En consecuencia (α−t )∗q : Tq M → Tα(−t,q) M es de clase Ck−1 y tiene sentido calcular g(t) = (α−t )∗ Y(αt (p)) ∈ Tp U para t suficientemente pequeño. Esto es, evaluamos Y a lo largo de las trayectorias del campo X, luego lo traemos hacia atrás para que vuelva a ser un vector de Tp U. Observemos que g(0) = Yp = Y(p), y que por construcción para t pequeño g(t) ∈ Tp M. Su derivada en t = 0 (que corresponde a pasar por el punto p con las trayectorias del campo X) será entonces un vector de Tp M, que denotaremos así: d LX Y(p) = (α−t )∗ Y(αt (p)). dt t=0 Como adelantamos, LX Y coincide con [X, Y]. Para verlo, hay que componer con una carta cualquiera, y observar que se trata de una identidad lineal del tipo g(t) = A(t)v(t) donde A(t) es un operador lineal para cada t fijo, y v(t) es un vector para cada t fijo, en el dominio de A(t). En consecuencia, se debe usar la regla del producto para derivar: (Av) ′ = A ′ v + Av ′ . 2.5. Campos 37 Ahora α(s, q) es una función de dos variables, y (α−t )∗ indica la diferencial respecto de la segunda variable. Estamos suponiendo que las funciones son (por lo menos) C2 , así que al derivar respecto de la primera variable podemos intercambiar el orden. Recordemos que d αs (q) = Xα(s,q) ds por ser el flujo de X, en particular d (α−t )(q) = −Xq . dt t=0 Luego, como A(t) = (α−t )∗αt (p) , se tiene A ′ (0) = −X∗p . Obtenemos d g = −DXp (Yp ) + DYp (Xp ) dt t=0 que es exactamente [X, Y](p). Ojo que esta notación tiene sentido sólo en una carta pues ninguno de los dos sumandos (como campos de M y sus diferenciales) es un elemento de Tp M. Observación 2.5.2. Además de representar una derivada direccional, el corchete de Lie de dos campos es una medida de conmutación, como tal vez puede apreciarse en la última presentación usando flujos. De hecho, hay varios resultados en esta dirección, mencionamos algunos. Sean X, Y campos en M; ahora α, β denotan los respectivos flujos. Si [X, Y] = 0, entonces los flujos conmutan, es decir αt ◦ βs = βs ◦ αt . Más precisamente α(t, β(s, p)) = β(s, α(t, p)) en el sentido siguiente: donde existe una expresión, existe la otra y son iguales. Si G es un grupo de Lie conexo y [X, Y] = 0 para todo X, Y campos invariantes a izquierda entonces G es un grupo conmutativo (ver el próximo capítulo sobre grupos de Lie-Banach). (Frobenius) Si E ⊂ TM es un subfibrado, entonces E es integrable -es decir, existe una subvariedad inmersa N ⊂ M tal que TN = E- si y sólo si [X, Y] ∈ E para todo par de campos X, Y ∈ E. La topología de N puede ser más fina de la de M, como puede observarse en nuestro inseparable ejemplo de la curva densa en el toro. Ver el Capítulo VI del libro de Lang [47] para una prueba del teorema. Observemos que el teorema de Frobenius es una generalización a dimensiones mayores del teorema de existencia de curvas integrales. 38 Variedades Diferenciables 2.5.1.4. Derivaciones Es correcto -y útil- pensar que todo campo X : M → TM define una derivación Ck (M) → Ck−1 (M) de la siguiente manera: si f ∈ Ck (M) -es decir, si f : M → R es Ck -, ponemos (Xf)(p) = pr2 ◦ f∗p (X(p)) ∈ R puesto que Tf(p) R = R × R y la proyección a la segunda coordenada es la diferencial usual -en una carta de M- de la función f. Es decir, pasando a una carta Xf(p) es simplemente la derivada direccional de f en el punto p en la dirección del vector Xp , (Xf)(p) = Dfp (Xp ). Que esto manda funciones Ck en Ck−1 es evidente, la linealidad y la propiedad de derivación X(fg) = X(f)g + fX(g) se deducen pasando por una carta. Una propiedad fundamental de esta acción es la siguiente: si U ⊂ M es abierto y X : U → TU es campo Ck con X 6= 0 (donde por 0 entendemos la sección nula en TM), entonces existe f ∈ Ck (U) tal que X(f) 6= 0. Para verlo, también hay que pasar por una carta y usar el teorema de Hahn-Banach. Los detalles pueden verse en [V,§1] del libro de Lang [47]. Se deduce de esta propiedad que un campo queda definido si se lo piensa como derivación. Luego definimos, dados X, Y campos, la derivación [X, Y]f = X(Y(f)) − Y(X(f)) que define en consecuencia al campo [X, Y], y esta definición coincide con la anterior. Las propiedades de derivación se pueden escribir de la siguiente manera. Supongamos que f, g : M → R son funciones y X, Y : M → TM son campos. Entonces LX f = Xf. LX (fg) = LX (f)g + fLX (g). LX (fY) = LX (f)Y + fLX (Y). LX ([Y, Z]) = LY ([X, Z]) + LZ ([Y, X]). La última es simplemente una reescritura de la identidad de Jacobi. 2.A. Problemas 2.5.2. 39 Campos f-relacionados Sean f : M → N diferenciable, X : M → TM, Y : N → TN campos. Supongamos que para cada p ∈ M, se tiene f∗p (X(p)) = Y(f(p)). En ese caso diremos que X, Y están f-relacionados y lo anotamos Y = f∗ X. Si f es un difeomorfismo y X es un campo en M, entonces podemos definir f∗ X := f∗ ◦ X ◦ f−1 que resulta un campo en N, y de hecho X, f∗ X están f-relacionados. No es difícil probar que, si X1 , X2 son campos en M, Y1 , Y2 son campos en N, y además Xi , Yi están f-relacionados (i = 1, 2), entonces [X1 , X2 ] está f-relacionado con [Y1 , Y2 ], y de hecho f∗ [X1 , X2 ] = [f∗ X1 , f∗ X2 ]. 2.A. Problemas 2.I. Probar que si α es irracional, entonces la imagen W de µ(t) = (eiπt , eiαπt ) ⊂ S1 × S1 es densa en el toro S1 × S1 . Elegir una base conveniente de la topología del toro y calcular la intersección entre W y un elemento cualquiera de la base para probar que esta intersección tiene infinitas componentes conexas. 2.II. Probar el criterio para subvariedades de la Proposición 2.4.2. 2.III. Probar que si H es un espacio de Hilbert, entonces H es difeomorfo (con un difeomorfismo de clase C∞ ) a la bola unitaria B = {v ∈ H : kvk < 1}. Sugerencia: considere g(x) = x(1 − kxk2 )− 1/2 . ¿Es esta aplicación analítica? 2.IV. Sean X, Y : M → TM campos y α, β sus respectivos flujos. Probar que si [X, Y] = 0, entonces los flujos conmutan, α(t, β(s, p)) = β(s, α(t, p)) en el siguiente sentido: donde existe una expresión existe la otra y son iguales. 2.V. Si f, g, h ∈ Ck (M) y X, Y, Z : M → TM son campos de clase C1 , probar que 40 Variedades Diferenciables X(fg) = X(f)g + fX(g) [X, fY] = X(f)Y + f[X, Y] [X, [Y, Z]] = [Y, [X, Z]] + [Z, [Y, X]]. donde X(h)(p) = pr2 ◦ h∗p (X(p)) para h ∈ Ck (M) y p ∈ M. 2.VI. Probar la Proposición 2.5.1. 2.VII. Si f : M → N es un difeomorfismo y f∗ X := f∗ ◦ X ◦ f−1 , probar que X : M → TM y f∗ X : N → TN están f-relacionados. Si Xi , Yi (i = 1, . . . , 2) están f-relacionados, con Xi : M → TM e Yi : N → TN, probar que f∗ [X1 , X2 ] = [f∗ X1 , f∗ X2 ] y concluir que [X1 , X2 ] está f-relacionado con [Y1 , Y2 ]. 2.VIII. Sea f : M → N una inmersión inyectiva. Si Y : N → TN es un campo tal que Yf(x) ∈ ran(f∗x ) para todo x ∈ M, probar que existe un único campo X : M → TM tal que f∗ X = Y. Capítulo Grupos de Lie Ojalá supiera cómo hacer que los matemáticos se interesen en los grupos de transformaciones y sus aplicaciones a las ecuaciones differenciales. Estoy seguro, absolutamente seguro, de que estas teorías serán, en algún momento futuro, reconocidas como fundamentales. Sophus Lie, en una carta dirigida a Adolf Mayer D efinimos un grupo de Lie-Banach G como una variedad diferenciable tal que las operaciones producto e inversa son diferenciables; esto se puede resumir diciendo que la función (g, h) 7→ gh−1 es diferenciable como función de G × G en G. Pidiendo que el producto sea Ck , se puede deducir que la inversión es Ck , ver el problema 3.ii de este capítulo. 3.1. Teoría general Usaremos Lg : G → G, Rg : G → G, Adg : G → G para denotar los isomorfismos Lg : h 7→ gh, Rg : h 7→ hg, Adg : h 7→ ghg−1 . A las diferenciales de estas aplicaciones las denotamos con las mismas letras, Lg , Rg , Adg : TG → TG, en general del contexto se desprende de cuál de las funciones hablamos. Observemos que por la regla de la cadena, para las diferenciales 41 3 42 Grupos de Lie se verifica Lhg = Lh Lg , 3.1.1. Rhg = Rg Rh . Campos invariantes Si e = 1 es la identidad del gupo G, y v ∈ Te G, consideremos dado (g, v) ∈ G × Te G la función (g, v) 7→ Lg v =: Xv (g) que de hecho define un campo en G. Este campo tiene la siguiente propiedad: Lh Xv (g) = Lhg Xv (e) = Xv (hg), es decir Lh Xv = Xv Lh para todo h ∈ G. Un campo con esta propiedad es un campo invariante a izquierda en G, y el conjunto de los campos invariantes a izquierda se identifica con Te G mediante la construcción recién mencionada y su inversa, la cual está dada, para cualquier campo X : G → TG invariante a izquierda, por X 7→ X(e). Proposición 3.1.1. Si X, Y : G → TG son campos invariantes a izquierda, entonces el campo [X, Y] : G → TG también es invariante a izquierda. Demostración. Simplemente hay que observar que Lg , por ser la diferencial de una aplicación de G en G que es de hecho un isomorfismo, pasa dentro del corchete de Lie (es decir X, Lg X están Lg -relacionados, y lo mismo ocurre con Y), luego Lg [X, Y] = [Lg X, Lg Y] = [X, Y]. El álgebra de Lie-Banach g del grupo de Lie-Banach G es el espacio tangente Te G en la identidad provisto de la estructura de Lie dada por los campos invariantes a izquierda, esto es, si v, w ∈ Te G ≃ E, entonces [v, w] := [Xv , Xw ](e). En general, se puede definir un álgebra de Lie-Banach g como un espacio de Banach (real o complejo), provisto de un operador denominado corchete, [ , ] : g × g → g que es bilineal, antisimétrico y verifica la identidad de Jacobi para todo x, y, z ∈ g [x, [y, z]] + [y, [z, x]] + [z, [x, y]] = 0, propiedad que se puede recordar teniendo en cuenta que un término se obtiene del anterior desplazando los elementos a la izquierda, de manera cícilica. 3.1. Teoría general 3.1.2. 43 Grupos a un parámetro y exponencial Si αv (s, g) denota el flujo del campo invariante a izquierda Xv (con v ∈ g), ponemos φv : Iv → G la función φv (t) = αv (t, e), donde Iv es el intervalo maximal donde está definida la curva αv (s, e). No es difícil ver que φv es un homomorfismo de Iv en G, es decir, si s, t, s + t ∈ Iv , entonces φv (s + t) = φv (s)φv (t) = φv (t)φv (s). Para probarlo, basta ver que, por ejemplo µt (s) = φv (s)φv (t) es solución de la ecuación diferencial d µt (s) = Xv (µt (s)), ds lo cual es sencillo usando la definición de todos los objetos (Problema 3.v). Con esto, se tiene que φv en realidad está definido en todo R, pues se puede extender al intervalo nIv (n ∈ N) poniendo φv (t) = φv (t/n)n para t/n ∈ Iv . Estas curvas son conocidas como grupos a un parámetro en G; observemos que φv (0) = e mientras que φ˙v (0) = v ∈ Te G = g. De aquí en más las denotaremos φv (t) = etv por obvios motivos. Con un razonamiento similar, cambiando e por g ∈ G, tenemos las curvas a un parámetro definidas en todo R dadas por µg,v : t 7→ gφv (t) = getv que verifican µg,v (0) = g, µ̇g,v (0) = Lg v ∈ Tg G ≃ Lg Te G. ¿Qué ocurre si tomamos campos invariantes a derecha, es decir XR v (g) := Rg v = vg para v ∈ Te G y g ∈ G? Podemos volver a considerar el problema del flujo de estos campos, y es bastante evidente que las soluciones ahora serán las curvas etv g pues verifican la ecuación correspondiente. En particular los grupos por la identidad son soluciones de la ecuación del campo invariante a izquierda y a derecha -siempre que sea el campo inducido por el mismo v ∈ Te G. 3.1.2.1. La exponencial del grupo Definimos la exponencial del grupo de Lie G como la aplicación exp : g → G que asigna v 7→ e1v . 44 Grupos de Lie Observemos que exp(tv) = etv es el grupo a un parámetro, solución de la ecuación diferencial ′ α = Xv (α) α(0) = e . También observemos que, como el flujo de los campos invariantes es suave, la función exp es diferenciable. Además, como exp∗0 (v) = (etv )˙ = Xv (e) = v, se deduce que exp∗0 es la identidad de g. Asumiendo que G es un grupo de clase de C1 por lo menos, se deduce que para algún entorno abierto V de 0 ∈ g , la restricción exp |V : V ⊂ g → exp(V) ⊂ G es un difeomorfismo y por lo tanto sirve como carta local. Luego g exp(g) es una carta local alrededor de g ∈ G, y de esta manera se arma un atlas canónico para G. 3.1.3. La representación adjunta y morfismos Dados v, w ∈ g, si tomamos Xv , Xw los correspondientes campos invariantes a izquierda y etv , etw los respectivos grupos a un parámetro por la identidad de G, podemos calcular g : t 7→ Adetv (w) = etv we−tv donde con un abuso de notación Ad denota la derivada de Ad en el grupo. Observemos que g es una función a valores en g = Te G para todo t ∈ R. Luego su derivada en t = 0 será un elemento de g, y no es difícil ver que ġ(0) = [v, w] (Ejercicio 3.vi). Dado un espacio de Banach E, denotaremos con GL(E) ⊂ B(E) a los operadores inversibles de E en E. Llamamos entonces Ad : G → GL(g) a la aplicación g 7→ Adg . Denotamos ad : g → B(g) a su derivada en g = 1. Entonces como g(t) = (Ad(φv (t))(w), derivando en t = 0 obtenemos por definición adv (w) = [v, w] = [Xv , Xw ](1) = LXv Xw (1). Entonces adv : g → g se interpreta como derivada direccional en la dirección del vector v. 3.1. Teoría general 3.1.3.1. 45 Homomorfismos y la naturalidad de exp Dados dos grupos de Lie-Banach G, K, y una aplicación diferenciable f : G → K, diremos que f es un homomorfismo si f es un morfismo de grupos. Observación 3.1.2. Supongamos que v ∈ g y que t 7→ etv es su flujo por la identidad. Entonces t 7→ f(etv ) es el flujo por la identidad del campo invariante a izquierda Xv ′ en K, donde v ′ = f∗1 (v) ∈ k = Te K. En efecto, es un homomorfismo en K con lo cual es el flujo de un campo invariante a izquierda, y verifica d tv tv f(e ) = f∗etv (Xv (e )) = v ′. dt t=0 t=0 ′ Luego f(etv ) = etv , donde ahora la exponencial es la del grupo K. Notar que si v, w ∈ g entonces f(etv esw e−tv ) = f(etv )f(esw )f(etv )−1 . (3.1) Notemos que si x es una curva en K, tal que xx−1 = e entonces derivando (en una carta) se tiene ẋx−1 + x(x−1 )˙ = 0, luego (x−1 )˙ = −x−1 ẋx−1 . En particular si x(0) = e se tiene en t = 0 que d |t=0 x−1 = −ẋ. dt Derivando primero respecto de t y luego respecto de s en s = t = 0, de (3.1) se deduce f∗1 ([v, w]) = [f∗1 v, f∗1 w]. Es decir que f∗1 : g → k es un morfismo de álgebras de Lie. Denotemos con expG , expK las respectivas exponenciales de los grupos G, K, y con g, k denotemos las respectivas álgebras de Lie-Banach. Puesto que el morfismo f manda grupos a un parámetro en grupos a un parámetro, según vimos en la Observación 3.1.2, se tiene que el siguiente diagrama f∗1 g expG G f /k expK /K 46 Grupos de Lie es conmutativo, es decir expK ◦f∗1 = f ◦ expG . Esta propiedad nos dice que la exponencial de grupos se comporta bien con los morfismos, y es entonces un mapa natural. Luego esta propiedad se conoce como la naturalidad de la exponencial en grupos de Lie. 3.2. Subgrupos de Lie-Banach Un subgrupo de Lie-Banach es un subgrupo que es también subvariedad. Nuevamente hay que considerar distintos tipos: subvariedades inmersas (el tangente es un subespacio cerrado), embebidas (tienen la topología de subespacio pero no necesariamente se parte el tangente), embebidas-partidas (regulares). Todo subgrupo de Lie (embebido) K ⊂ G es topológicamente cerrado en G, pues es localmente cerrado por ser subvariedad (Ejercicio 3.vii). Reservaremos el nombre subgrupo de Lie-Banach a aquellos subgrupos que sean subvariedades embebidas, es decir, a aquellos subgrupos que sean variedades diferenciables cuya topología coincida con la heredada. También denominaremos subgrupo analítico a aquel subgrupo que siendo variedad diferenciable, tenga una topología más fina o igual que la heredada. Una exposición detallada sobre subgrupos para el caso particular en que el grupo de Lie G es el grupo general lineal, o uno de sus subgrupos, puede hallarse en la Sección 4.2 del próximo capítulo. Exponemos brevemente a continuación los resultados que valen en el contexto más general, con referencias bibliográficas concretas para el lector, y con una recomendación: antes de ir a las pruebas generales, explorar primero la sección mencionada del próximo capítulo, ya que las ideas centrales de las pruebas que omitimos de estos resultados, están todas presentas en las pruebas que si desarrollamos para el grupo lineal. En general, si H ⊂ G es un subgrupo topológico de un grupo de Lie-Banach G, cerrado para la topología de subespacio, entonces si expG : g → G denota la exponencial de G, podemos poner h := {v ∈ g : expG (Rv) ⊂ H}. Este resulta un subespacio cerrado de g. Pero no es difícil ver que se trata de hecho de un álgebra de Lie-Banach, la demostración para el grupo lineal se halla en el Corolario 4.2.1, y la demostración general (que es esencialmente la misma) se halla en el libro de Daniel Beltiţǎ [57, Lemma IV.3.1]. Por restricción se tiene una aplicación exponencial expH : h → H. Una consecuencia del Teorema de Frobenius (ver la Observación 2.5.2) es que esta subálgebra es integrable, en el sentido siguiente: el grupo generado por las 3.2. Subgrupos de Lie-Banach 47 exponenciales de elementos de h, es decir He = hexpG (h) : h ∈ hi, tiene una estructura de grupo de Lie-Banach en la que h es su álgebra de Lie-Banach y la exponencial del grupo He está dada por la restricción de la exponencial de G según se explicó recién. La prueba de este resultado puede verse por ejemplo en [VI,§5, Teorema 5.4] del libro de Lang, [47], aunque la prueba del caso particular de un subgrupo del grupo lineal que damos en la Sección 4.2 del próximo capítulo contiene la mayor parte de las ideas de la prueba general (Teorema 4.2.2). La inclusión He ⊂ G es una subvariedad inmersa en el sentido de que la inclusion es diferenciable y la diferencial de la inclusión es inyectiva y de rango cerrado, y permite dar a H una estructura diferenciable que hace de éste un grupo de Lie-Banach de manera que He es la componente conexa de la identidad de H. En el caso finito dimensional, He es una subvariedad embebida de G y entonces la topología inducida por la estructura de variedad que se le dio a H, coincide con la topología original de éste. En el contexto de dimensión infinita, no es difícil dar un ejemplo de un subgrupo topológico cerrado H de un grupo de Lie-Banach G, cuya estructura diferenciable inducida por la construcción recién mencionada le da una topología que no coincide con la topología original de H como subespacio topológico de G (ver el Ejemplo 4.2.3 en el próximo capítulo). Si comenzamos con una subálgebra de Lie (y no con un subgrupo cerrado), la construcción recién mencionada del grupo generado por las exponenciales de elementos de la subálgebra se puede hacer sin inconvenientes, pero cabe destacar que en general He no resultará subvariedad regular (ni embebida) de G, ni siquiera en dimensión finita. Un ejemplo sencillo de esta afirmación, se obtiene considerando el ejemplo ya mentado K ⊂ T = S1 × S1 donde K es el grupo de Lie que integra la subálgebra de Lie generada por el elemento (π, πa), y a ∈ R es un número irracional a elección del lector. Este subgrupo K resulta una curva densa en el toro, y por lo tanto no puede ser subgrupo de Lie con la topología de subespacio. El que sigue es un resultado que caracteriza los subgrupos de Lie. Teorema 3.2.1. Sea H ⊂ G un subgrupo cerrado y h ⊂ g las respectivas álgebras de Lie-Banach. Supongamos que existe un entorno U abierto de 0 ∈ g suficientemente pequeño tal que exp(U ∩ h) = exp(U) ∩ H. 48 Grupos de Lie Entonces H tiene una única estructura de variedad diferenciable que lo hace subgrupo embebido de Lie-Banach de G. Demostración. Como exp∗0 = idg , existe un entorno V del 0 ∈ g de manera que exp |V : g → G es un difeomorfismo. La frase suficientemente pequeño quiere decir que U ⊂ V. La idea de la prueba es la siguiente: hay una inclusión exp(U ∩ h) ⊂ exp(U) ∩ H que es trivial. En el caso en el que se cumpla la inclusión no trivial, lo que obtuvimos es un cierto entorno abierto de e ∈ H -el conjunto exp(U ∩ h)- que se obtiene como intersección del abierto exp(U) de G con el subgrupo H. Esto permite utilizar la exponencial como carta de H en un entorno de e, para obtener una subvariedad embebida. Esta carta se traslada a todo el grupo H usando los difeomorfismos de G dados por {Lh }h∈H . Los detalles de la prueba quedan como ejercicio (Ejercicio 3.viii). 3.3. Espacios homogéneos Dado un grupo de Lie-Banach G y un espacio X, supongamos que tenemos una acción I : g → Ig de G en X, es decir, un aplicación I : G → Aut(X) que es un homomorfismo en el sentido que Ih (Ig (x)) = Ihg (x). En particular Ie = idX . Si X es una variedad diferenciable, suponemos que Ig es un difeomorfismo de X para todo g ∈ G. Denotamos al conjunto de los difeomorfismos de X con Diff(X). Supongamos que la acción de G es transitiva, es decir, si G·x = IG (x) = O(x) denota la órbita de un x ∈ X cualquiera, entonces G ·x = X. En este caso diremos que X es un espacio homogéneo de G. La isotropía de x ∈ X es el conjunto Hx = {g ∈ G : g · x = x}, esto es, la fibra de x en G por la acción. Es fácil ver que este es un subgrupo cerrado de G, puesto que puede pensarse como la fibra de la aplicación πx : G → X dada por πx (g) = g · x. Cabe plantearse si Hx es una subvariedad de G, es decir si Hx ⊂ G es un subgrupo de Lie-Banach. Ciertamente O(x) ≃ G/Hx como conjuntos, donde la proyección al cociente q : G → G/Hx se identifica con la proyección πx : G → O(x), y también Hg·x = gHx g−1 . 3.3. Espacios homogéneos 49 Otra manera de denotar una acción es la siguiente: tomamos el espacio X y una función π:G×X→X que se denota π(g, x) = g · x ∈ X. De acuerdo a nuestra notación anterior, πx = π(·, x), mientras que Ig = π(g, ·). Observemos que, como Ig ◦ πx = πx ◦ Lg para todo x ∈ X, g ∈ G, se verifica (Ig )∗x ◦ (πx )∗e = (πx )∗g ◦ Lg . (3.2) Ahora Ig es un difeomorfismo de G y como tal (Ig )∗ es un isomorfismo, luego (πx )∗g = (Ig )∗x ◦ (πx )∗e ◦ Lg−1 , lo que prueba que el comportamiento de las derivadas de πx es el mismo (independiente de g ∈ G). Observación 3.3.1. Si (πx )∗e es un epimorfismo directo, entonces lo mismo vale para (πx )∗g para todo g ∈ G, de lo que resulta que πx es una sumersión, y de allí que, como Hx = π−1 x (x), resulte Hx subvariedad de G por el teorema de la función implícita, Teorema 2.4.1. Teorema 3.3.2. Sea G un grupo de Lie-Banach y H ⊂ G un subgrupo de Lie-Banach regular (partido). Entonces existe una única estructura diferenciable en G/H que hace del mapa cociente q : G → G/H una sumersión (diferenciable, epimorfismo y con núcleo que se parte). Demostración. Ver el libro de D. Beltiţǎ [17, Teorema 4.19], o las notas de Variedades Diferenciables de Angel Larotonda [48, Proposición 5.6, pág. 83]. Un corolario del teorema de la función implícita sin suplementos debido a An y Neeb [3, Cor. 4.3] es el siguiente: Teorema 3.3.3. Sea G un grupo de Lie-Banach y H ⊂ G un subgrupo cerrado. Supongamos que G/H tiene estructura de variedad de Banach, y supongamos que el mapa cociente q : G → G/H es diferenciable y que, en algún punto g0 ∈ G, q tiene diferencial suryectiva. Entonces H es un subgrupo de Lie-Banach embebido de G. La recíproca de este enunciado es una conjetura que por ahora no está resuelta (claro que si q se parte entonces estamos en la situación del Teorema 3.3.2). Sin embargo, si H es un subgrupo normal de G, entonces sí vale la recíproca, la prueba puede verse en un trabajo de H. Glockner y K.-H. Neeb [35]. 50 3.3.1. Grupos de Lie Órbitas Otro problema relacionado con el anterior es el siguiente: supongamos que G es un grupo de Lie-Banach y que M es una variedad diferenciable y que hay una acción suave I : G → Diff(M). Si la acción no es transitiva, dado x ∈ M la órbita O(x) ⊂ M es un subconjunto propio. Cabe preguntarse si O(x) tiene estructura de variedad diferenciable y si O(x) ⊂ M es una subvariedad -inmersa, embebida- de M. Observación 3.3.4. Recordemos que un mapa cociente es una función continua y sobreyectiva q : A → B entre espacios topológicos tal que, si U ⊂ B es tal que q−1 (U) ⊂ A es abierto, entonces U era abierto. Dada f : A → B sobreyectiva y continua, una función continua s : B → A es una sección si f ◦ s = idB . En caso de existir una sección continua, f resulta un mapa cociente pues si U ⊂ B es tal que f−1 (U) ⊂ A es abierto, entonces U = s−1 f−1 (U) es abierto. Si f : A → B es continua, suryectiva y abierta (o cerrada) es fácil ver que f es un mapa cociente, pero la recíproca no es cierta. Por ejemplo si A = {(x, y) : x ≥ 0, y ∈ R} ∪ {(x, y) : x ≤ 0, y = 0} y q = π1 |A : A → R, entonces es fácil ver que q es una proyección porque tiene una sección continua dada por s(x) = (x, 0). Sin embargo q no es abierta pues si V = {(x, y) : x ≥ 0, y > 0}, entonces V ⊂ A es abierto pero q(V) = [0, ∞) ⊂ R no es abierto. Sin embargo si f : A → B es de clase Ck y tiene una sección s : B → A de clase Ck (k ≥ 1), entonces f∗ es sobreyectiva y su núcleo se parte. Luego el teorema de la función implícita (Teorema 1.5.5) nos dice que f es una proyección y en particular es abierta. Los detalles están en el siguiente teorema. Teorema 3.3.5. Sea π : G × M → M una acción suave, a ∈ M, O = O(a) ⊂ M la órbita de a por la acción. Si denotamos π = πa : g 7→ g·a, supongamos que existe un abierto U ⊂ M entorno de a y una sección suave s : U → G tal que π ◦ s = idU , s(a) = 1. Entonces O ⊂ M es una subvariedad abierta de M, ran(s∗ ) ⊂ g es un espacio de Banach tal que ran(s∗ ) ⊕ ker(π∗ ) = g, 3.3. Espacios homogéneos 51 y Ka = {g ∈ G : g · a = a} es subgrupo de Lie-Banach regular con álgebra de Lie-Banach k = ker(π∗ ). Además π : G → O es una proyección y en particular abierta. Demostración. Si existe una tal sección, entonces U = π ◦ s(U) ⊂ O ∩ U ⊂ U con lo cual U = O ∩ U es abierto. Dado x = g · a = πa (g) ∈ O, consideramos el conjunto Ux = Ig (U) = {g · p : p ∈ U} ⊂ M que es un entorno abierto de x ∈ M, y la sección sx : Ux → gVg−1 ⊂ G dada por sx (g · p) = gs(p)g−1 . Entonces sx es suave, sx (x) = sx (g · a) = gs(a)g−1 = 1 y πx ◦ sx (g · p) = gs(p)g−1 g · a = g · (s(p) · a) = g · p para todo p ∈ U, es decir πx ◦ sx = idUx . Este argumento nos dice que O es abierto en M. Ahora ran(s∗ ) ⊂ g es un subespacio cerrado pues, si vn = s∗ (yn ) → v ∈ g (con yn ∈ Ta M) entonces s∗ π∗ (v) = lı́m s∗ π∗ (vn ) = lı́m s∗ (yn ) = v lo que prueba que v ∈ ran(s∗ ). Por otra parte dado w ∈ g tomamos h = s∗ π∗ (w) ∈ ran(s∗ ) y descomponemos w = w − h + h con w − h ∈ ker(π∗ ). La suma es directa pues si w ∈ ran(s∗ ) ∩ ker(π∗ ) entonces w = s∗ z para algún z ∈ Ta M pero z = π ∗ s∗ z = π ∗ w = 0 lo que nos dice que w = 0. En consecuencia el grupo de isotropía Ka = π−1 (a) es una subvariedad regular de G por el teorema de la función implícita (Observación 3.3.1). Por último, como π∗ es sobreyectiva y su núcleo se parte, π es una proyección por el teorema de la función implícita (Teorema 1.5.5). El siguiente lema, originalmente debido a Ian Raeburn [61], es un criterio útil para ver si la órbita O(x) ⊂ M es subvariedad. Lema 3.3.6. Sea G un grupo de Lie-Banach, con una acción diferenciable π : G → B(X) en un espacio de Banach X. Fijado x ∈ X, denotamos πx : G → X la función diferenciable πx (g) = g · x := π(g)(x). Sea O(x) = {g · x : g ∈ G} ⊂ X la órbita de x con la topología heredada. Supongamos que 52 Grupos de Lie 1. πx : G → O(x) es abierta. 2. La diferencial (πx )∗e : g → X parte al espacio, tanto el núcleo como el rango. Entonces O(x) ⊂ X es una subvariedad regular (partida) de X, y la función πx : G → O(x) es una sumersión. Demostración. Sea k = ker(πx )∗e . Se tiene por hipótesis que g = m ⊕ k para algún subespacio cerrado m ⊂ g. Consideramos la aplicación Θ : (v, w) 7→ ev ew con v ∈ m, w ∈ k que transforma un entorno U de 0 ∈ g en un entorno U ′ de e ∈ G (Ejercicio 3.ix). Para z ∈ g, ahora consideramos ψ(z) = Θ(z) · x que es diferenciable, ψ : U → X y toma valores en O. Como etw · x = πx (etw ), se tiene por la ecuación (3.2) d tw e · x = (πx )∗etw ◦ Letw (w) = (Ietw )∗x ◦ (πx )∗1 (w) = 0 dt t=0 para w ∈ k, con lo cual ew · x = x para todo w ∈ k, luego ψ(v, w) = ψ(v, 0). Si llamamos J = ψ(U ∩ m) = Θ(U), se tiene x ∈ J ⊂ O y como J = πx (U ′ ) es la imagen de un entorno abierto de e ∈ G, se tiene que J es abierto en O. Esto prueba que O es un variedad diferenciable y un espacio homogéneo para G, pues trasladando con la acción a izquierda del grupo se obtiene un resultado similar para cualquier x ′ ∈ O. Si X = ran(πx )∗e ⊕ S con S ⊂ X subespacio cerrado, consideramos la aplicación Ψ : m ⊕ S → X dada por (v, s) 7→ ψ(v) + s. Se tiene Ψ∗0 (v, s) = v + s y del teorema de la función inversa deducimos que Ψ es un difeomorfismo entre un entorno V de 0 ∈ m⊕s en un entorno W de x ∈ X. Si consideramos (W, ϕ) con ϕ = Ψ−1 |W , esta es una carta de X alrededor de x y además ϕ(W ∩ O) = m ∩ V lo que prueba que O es localmente una subvariedad. Nuevamente, un simple argumento de traslación nos dice que O es en efecto una subvariedad de X. 3.4. Grupos lineales de matrices: un vistazo rápido Los ejemplos inmediatos de grupos de Lie surgen de considerar grupos lineales. Es decir, subgrupos del grupo de matrices inversibles. Fijemos un poco la notación. Sean H = Cn con el producto interno usual, Mn (C) el espacio de matrices de n × n con entradas complejas. En estos grupos lineales se tiene que 3.4. Grupos lineales de matrices: un vistazo rápido 53 las diferenciales de Lg , Rg , Adg coinciden en efecto con las funciones, pues por ejemplo si α es una curva en G, entonces (Lg )∗α(t) α̇(t) d d d (Lg ◦ α) (t) = (Lg α(t)) = (gα(t)) dt dt dt d = g α(t) = Lg α̇(t). dt = Estas cuatro grandes clases que presentaremos (grupos lineales, unitarios, ortogonales y simplécticos) y sus variantes son lo que se conoce como grupos de Lie clásicos, nombre debido a una obra de Hermann Weyl del año 1939 [68]. 3.4.1. El grupo lineal GL(n, C) Usaremos GL(n, C) para denotar el grupo de matrices inversibles en Mn (C). Este resulta ser un conjunto abierto en Mn (C), la prueba puede obtenerse considerando la función determinante. Sin embargo, hay una prueba más directa que se traslada a otros contextos que tiene que ver con la serie de Neumann: si a ∈ Mn (C) es tal que ka − 1k < 1, entonces a ∈ GL(n, C) y su inversa se calcula así: X a−1 = (1 − a)n n≥0 Aquí estamos usando k · k para denotar la norma supremo de a vista como operador lineal del espacio H = Cn en si mismo. Se sigue de la cuenta de arriba que si b es inversible y kb − ck < kb−1 k−1 , entonces c es inversible, pues kxyk ≤ kxkkyk y entonces k1 − b−1 ck = kb−1 (b − c)k ≤ kb−1 kkb − ck < 1. Como abierto de Mn (C), el conjunto GL(n, C) tiene la estructura diferenciable (de hecho analítica) dada por la carta global de la identidad del espacio de Banach E = Mn (C), restringida a GL(n, C). El álgebra de Lie de GL(n, C) consiste entonces del espacio de todas las matrices Mn (C), y no es difícil ver que el corchete de dos elementos v, w ∈ g está dado por el conmutador usual, es decir [v, w] = vw − wv. Esto se extiende de manera natural a cualquier subgrupo. Si una matriz se diagonaliza como a = gdg−1 con g ∈ GL(n, C) y d = diag(a1 , · · · , an ) 54 Grupos de Lie con ai ∈ C los autovalores de a (con multiplicidad), entonces dada una función compleja f definida en σ(a) = ∪{ai } -el espectro de a-, tiene sentido definir f(a) := g diag(f(a1 ), · · · , f(an ))g−1 = gf(d)g−1 . Para potencias f(x) = xk , con k ∈ Z, esta definición coincide con la usual, es decir ak = g diag(ak1 , · · · , akn )g−1 . Luego la definición coincide para polinomios, y se entiende cómo se calcula f(a) para una función analítica en un entorno del espectro de a. Algunas funciones, dadas por series de potencias convergentes, se pueden definir aunque la matriz a no se diagonalice. Dos funciones muy importantes son la exponencial del grupo lineal, dada por la serie de potencias exp(a) = ea = X 1 an n! n≥0 convergente para cualquier a ∈ GL(n, C), y el logaritmo, ln(b) = X (−1)n (b − 1)n+1 n+1 n≥0 convergente para kb − 1k < 1. No es difícil chequear que, si kb − 1k < 1, entonces exp(ln(b)) = b, y que si kak < ln(2) entonces log(ea ) = a. En los apéndices de este libro se estudian álgebras de Banach y álgebras de operadores, y allí mostramos como extender el logaritmo a cualquier operador a cuyo espectro no separe al cero de infinito en el plano complejo, y en general como calcular f(a) para funciones continuas en el espectro de a. 3.4.2. El grupo de matrices unitarias Un subgrupo que nos interesa es el grupo de matrices unitarias, definido de la siguiente manera: si a∗ denota la transpuesta conjugada de a ∈ Mn (C), entonces U(n, C) = U = {u ∈ GL(n, C) : u∗ u = 1}. Notar que en este contexto de dimensión finita, como det(a∗ ) = det(a), la condición u∗ u = 1 nos asegura que u es inversible y además u−1 = u∗ , luego 3.4. Grupos lineales de matrices: un vistazo rápido 55 también vale uu∗ = 1. En el caso infinito dimensional, el grupo unitario se define agregando esta última condición a la expuesta. Este es un grupo de Lie real, cuya álgebra de Lie se identifica con el conjunto de las matrices antisimétricas (antihermitianas) en Mn (C), es decir Mn (C)ah = {x ∈ Mn (C) : x∗ = −x}. Esto se prueba de la siguiente manera: si u(t) es una curva suave en U tal que u(0) = 1 y u̇(0) = x, entonces derivando en t = 0 la relación uu∗ = I se obtiene x∗ + x = 0. Por supuesto, si x ∈ Mn (C)ah , entonces ex ∈ U, pues ∗ (ex )∗ = ex = e−x = (ex )−1 . Se dice que a es autoadjunta o Hermitiana si a∗ = a, y que a es normal si a∗ a = aa∗ . Un resultado importante del álgebra lineal nos dice que si a es normal, entonces existe una matriz unitaria u tal que a = udu∗ con d la matriz diagonal de los autovalores de a. Si además a es Hermitiana, los autovalores son todos reales. Observemos que toda matriz unitaria es normal, con lo cual dada u ∈ U, existe v ∈ U tal que u = vdv∗ . No es difícil ver que en este caso, todos los autovalores están en S1 , es decir |di | = 1 para todo i = 1, · · · , n. Dada una matriz unitaria u, como σ(u) = {di }i=1,···,n ⊂ S1 , podemos elegir una determinación log del logaritmo en el plano complejo de manera que log esté definido en σ(u) y además | log(di )| ≤ π para todo i = 1 · · · n. En consecuencia, toda matriz unitaria tiene un logaritmo x = ln(u) = v ln(d)v∗ donde ln(d) es la matriz diagonal (ln(d1 ), · · · , ln(dn )). Si x = ln(u), es evidente que ex = exp(x) = u, y además kxk ≤ π. Podemos considerar entonces el grupo a un parámetro δ : [0, 1] → u dado por δ(t) = etx , que toma valores en U puesto que tx es anti-hermitiana. Como δ(0) = 1, δ(1) = u, se deduce que el grupo unitario es arcoconexo. Estas curvas jugarán un papel importante cuando estudiemos la geometría de U, las llamaremos segmentos. En contextos más generales, no siempre es posible hallar un logaritmo de un operador unitario; sin embargo, para una clase importante de álgebras veremos que siempre es posible. 56 Grupos de Lie 3.4.3. El grupo ortogonal Este es el caso real del grupo anterior; el grupo ortogonal O(n, R) es el grupo de matrices que preserva la métrica, es decir O(n, R) = {x ∈ Mn (R) : hxv, xwi = hv, wi para todo v, w ∈ Rn }. Esta condición es -por polarización- equivalente a pedir que x sea una isometría kxvk = kvk para todo v ∈ Rn , donde k · k denota en este caso la norma usual. Equivalentemente, o ∈ O(n, R) si y sólo si oT o = ooT = I. El álgebra de Lie es el subespacio de matrices antisimétricas, es decir aquellos x ∈ Mn (R) tales que x + xT = 0. Con mayor generalidad, fijado un producto escalar h, i en Rn , y q es la forma cuadrática asociada, si definimos la traspuesta de x ∈ Mn (R) como la única matriz xT tal que hxT v, wi = hv, xwi para todo v, w ∈ Rn , entonces O(n, R, q) es el grupo de matrices que preserva la forma cuadrática q. 3.4.4. El grupo simpléctico Para n = 2k par, fijamos J ∈ GL(n, R) tal que JT = −J = J−1 . Esto es lo que se conoce como una estructura compleja en el grupo lineal real GL(n, R). La estructura compleja recibe este nombre porque permite introducir, en el espacio real R2k , una acción de C que lo convierte en un espacio vectorial complejo: dado z = a + ib ∈ C, definimos para v ∈ R2k zv := av + bJ(v). Si h, i denota el producto escalar usual de Rn , J induce una forma bilineal ω(v, w) = hJv, wi conocida como forma simpléctica de la estructura compleja. La estructura compleja en R2k viene acompañada del producto escalar hv, wiJ := hv, wi − iω(v, w) 3.5. Espacios homogéneos de grupos de matrices 57 que es de hecho un producto interno sesquilineal en el sentido siguiente hz1 v, z2 wiJ = z1 z2 hv, wiJ para z1 , z2 ∈ C y la acción de C sobre R2k inducida por J. Se dice que una matriz a ∈ M2k (R) es una matriz compleja si conmuta con J, es decir, si aJ = Ja. De la misma manera, un subespacio S ⊂ R2k es un subespacio complejo si J(S) ⊂ S. Por ser J inversible, es equivalente a pedir J(S) = S. Esta condición es de hecho la condición necesaria y suficiente para que el subespacio S herede la acción de C sobre R2k introducida más arriba. Salvo un cambio de base, toda estructura compleja en R2k = Rk × Rk viene dada por una matriz 0 1 J= ∈ GL(2k, R) −1 0 donde 0, 1 ∈ GL(k, R) son matrices cuadradas de k × k. En coordenadas, si v = (η, ξ) ∈ Rk × Rk , entonces J(η, ξ) = (−ξ, η). El grupo simpléctico es el grupo SpJ ⊂ GL(n, R) de matrices inversibles g tales que g−1 = JgT J. Equivalentemente, son las matrices inversibles que preservan la forma simpléctica ω, es decir, aquellas matrices tales que ω(gv, gw) = ω(v, w) para todo v, w ∈ R2k . El álgebra de Lie de SpJ es el álgebra simpléctica spJ ⊂ Mn (2k, R) de las matrices tales que xT J = −Jx. Esta relación se deduce considerando una curva g(t) ∈ SpJ tal que g(0) = I y ġ(0) = x, y derivando la relación J = gT Jg en t = 0. 3.5. Espacios homogéneos de grupos de matrices En general un espacio homogéneo se presenta en forma abstracta; veremos sin embargo que hay casos donde se los puede pensar como subconjuntos o incluso subvariedades del grupo lineal. En general, dado a ∈ Mn (C), y G algún grupo lineal subgrupo de GL(n, C), llamaremos órbita de a al conjunto O(a) := {gag−1 : g ∈ G} ⊂ Mn (C). En el caso del grupo unitario U, se suele denominar órbita coadjunta de a. 58 Grupos de Lie 3.5.1. La variedad de Grassmann La variedad de Grassmann Grk (n) es el conjunto de subespacios de dimensión k en Rn o Cn . Como tal, admite la acción del grupo de matrices inversibles de la siguiente manera: dado S ∈ Grk (n), ponemos g · S = g(S). Observemos que por ser inversible g, se sigue que g(S) tiene la misma dimensión que S. Se puede dar una presentación de la Grassmanniana como órbita, si pensamos que un subespacio S de dimensión k se identifica con el único proyector ortogonal p ∈ Mn (C) que lo tiene como rango (es decir p∗ = p, p2 = p, ranp = S). En ese caso la acción se convierte en g · p := gpg−1 . Observemos que también podemos considerar la acción del grupo unitario U, u · p = upu∗ . Como dados dos subespacios S, S ′ de dimensión k, siempre podemos hallar una base ortonormal de la intersección y completarla a una base de S y de S ′ respectivamente, no es difícil ver que la órbita unitaria recorre también toda la Grassmaniana Grk (n). En este caso estamos identificando entonces Grk (n) ≃ U/Kp donde Kp ⊂ U es el subgrupo de isotropía del proyector p, es decir Kp = {u ∈ U : upu∗ = p}. Observemos que en este caso se trata de los unitarios que conmutan con p, que en una representación matricial se pueden expresar en forma de operadores diagonales: ⋆ 0 , (3.3) 0 ⋆ donde en la primer fila ponemos el rango de p y en la segunda el de 1 − p. Es decir, observemos que todo x se puede escribir de la siguiente manera: x = pxp + (1 − p)xp + px(1 − p) + (1 − p)x(1 − p) = a + b + c + d, y utilizamos para x la siguiente escritura por bloques: a b . c d Esta escritura se comporta bien el producto de matrices, es decir multiplicar dos representaciones matriciales equivale a multiplicar las correspondientes matrices originales. 3.A. Problemas 59 Observación 3.5.1. Por este motivo diremos que una matriz (o un operador) de la forma (3.3) es una matriz (o un operador) p-diagonal ; una cuenta elemental nos muestra que una matriz es p-diagonal si y sólo si conmuta con p. Por otra parte, diremos que una matriz (o un operador) es p-codiagonal cuando la parte diagonal de ésta sea nula, es decir cuando su escritura en bloques sea de la forma ! 0 ⋆ . ⋆ 0 Esta escritura compacta es muy útil para algunos cálculos, como veremos más adelante. Derivando la relación up = pu en una curva u = ut tal que u0 = 1 y u̇0 = v, se deduce que vp = pv, luego el álgebra de Lie de Kp son los antihermitianos que conmutan con p, que nuevamente se representan como matrices diagonales respecto de p. 3.5.2. Matrices positivas inversibles Una matriz es positiva cuando a = a∗ y además todos los autovalores de a son ≥ 0. Si ninguno es cero, diremos que a es una matriz inversible positiva y lo anotaremos a > 0. Es fácil ver que la exponencial de toda matriz Hermitiana es inversible y positiva; lo que no es tan obvio es que todas tienen logaritmo Hermitiano. Este espacio P de matrices positivas inversibles se puede presentar como un espacio homogéneo del grupo de todas las inversibles mediante la siguiente acción: dada a > 0 y g ∈ GL(n, C), ponemos g 7→ gag∗ . Evidentemente gag∗ es inversible, para ver que es positiva hay que observar que 1 1 a tiene una raíz cuadrada positiva a 2 > 0 y entonces gag∗ = bb∗ con b = ba 2 . Volveremos sobre este espacio homogéneo más adelante, para ello es necesario familiarizarse primero con los contenidos de cálculo funcional de los apéndices de este libro. 3.A. Problemas 3.I. Una función f : X → Y es Ck si y sólo si su gráfico Gr = {(x, f(x)) : x ∈ X} ⊂ X × Y es una subvariedad regular y para cada x ∈ X, se verifica T(x,f(x)) X × Y = T(x,f(x)) Gr ⊕ T(x,f(x)) {x} × Y. Sugerencia: probar primero que pr1 |Gr → X es un difeomorfismo y considerar la función pr2 ◦ (pr1 |Gr )−1 . 60 Grupos de Lie 3.II. Si G es grupo de Lie-Banach, el gráfico de g 7→ g−1 se puede pensar como la superficie de nivel m−1 (e) con e la identidad de G y m : G × G → G el producto m(x, y) = xy. La aplicación m es una sumersión (es decir su diferencial es un epimorfismo con núcleo que se parte). Concluir que si el producto es de clase Ck en el grupo G, también lo es la inversión. 3.III. Si G es un grupo de Lie-Banach, probar que [X, Y] = 0 para todo par de campos invariantes a izquierda implica que G es un grupo conmutativo. Probar la implicación recíproca. 3.IV. Sea G grupo topológico. Dado un subconjunto A ⊂ G denotamos hAi ⊂ G al subgrupo generado por los productos finitos de los elementos de A y sus inversas. Probar que la componente conexa Ge de la identidad de G es subgrupo. Probar que Ge es un subgrupo invariante (normal). Probar que Ge es un subgrupo cerrado. Supongamos que además G es un grupo de Lie-Banach de clase Ck , k ≥ 1. Probar que Ge es abierto. Probar que G/Ge es discreto. Probar que hexp(v)iv∈g = Ge . 3.V. Probar que si v ∈ g (el álgebra de Lie-Banach del grupo G) y Xv denota el único campo invariante a izquierda tal que Xv (e) = v, entonces φv (t) = αv (t, e) (αv como siempre denota el flujo de Xv ) es un homomorfismo, es decir φv (s + t) = φv (s)φ(t) = φv (t)φv (s) para s, t ∈ R en el dominio de αv (·, e). 3.VI. Sea G un grupo de Lie-Banach, g su álgebra de Lie-Banach. Sean v, w ∈ g y g : R → g la aplicación dada por t 7→ Adetv (w) = etv we−tv . Probar que ġ(0) = adv(w) = [v, w]. 3.VII. Sea G grupo de Lie-Banach, K ⊂ G subgrupo (o sea es subvariedad embebida). Probar que K es cerrado en G. 3.VIII. Escribir los detalles de la prueba del Teorema 3.2.1 sobre subgrupos cerrados. 3.IX. Sea G grupo de Lie-Banach y =p ⊕ u una descomposición de su álgebra de Lie. Probar que existen entornos U1 ⊂ p, U2 ⊂ u de los respectivos vectores 3.A. Problemas 61 nulos, y un entorno abierto V de e ∈ G de manera que (x, y) 7→ ex ey es un difeomorfismo de U1 × U2 sobre V. 3.X. Sea f : A → B una función continua y suryectiva. Probar que si f es abierta o cerrada, entonces f es un mapa cociente. 3.XI. Probar que, dado un proyector p = p2 = p∗ ∈ Mn (C) de dimensión k, si S = ran(p) ⊂ Cn , entonces hay una correspondencia entre Grk (n) = GL(n, C) · (S) donde la acción para g inversible está dada por S 7→ g · S = g(S), y la órbita de similaridad del proyector p dada por gpg−1 , g ∈ GL(n, C). Probar que dicha órbita de similaridad está también en correspondencia con la órbita coadjunta upu∗ , u ∈ U(n, C) matriz unitaria. 3.XII. Con la notación del ejercicio anterior, sea z = zp + pz una matriz pcodiagonal y Hermitiana. Probar que Para todo k ∈ N, se verifica pz2k = z2k p, (1 − p)z2k (1 − p) = z2k , (1 − p)z2k+1 = z2k+1 p, pz2k+1 = z2k+1 (−p). Si f es una función medible definida en un entorno de σ(z), y f es par, entonces pf(z) = f(z)p, mientras que si f es impar pf(z) = f(z)(1 − p). √ Si |z| = z∗ z, entonces |z| = |zp| + |pz| y además |zp||pz| = |pz||zp| = 0. p|z| = |z|p = |zp|, (1 − p)|z| = |z|(1 − p) = |pz|, p|pz| = 0 = (1 − p)|zp|. Si q = eiz peiz ∈ Grk (n) = O(p), entonces en la notación matricial que induce la descomposición Cn = ran(p) ⊕ ran(1 − p) se tiene cos2 (z) −i cos(z) sen(z) q= . i cos(z) sen(z) sen2 (z) Si q es como en el ejercicio previo, entonces √ |qp| = pqp = p cos(z) = p cos |z| = cos |zp| √ |pq| = qpq = (1 − p) cos(z) = (1 − p) cos |z| = cos |pz|, con lo cual √ √ pqp + qpq = cos(z) = cos |z|. |qp||pq| = |qp| + |pq| − 1 = |pq||qp|. 62 Grupos de Lie Sea arc cos : [0, 1] → [0, π/2] la inversa del coseno. Supongamos que kzk ≤ π/2. Probar que |z| = arc cos |z| = arc cos(|qp| + |pq|) y que |zp| = arc cos |qp|, |pz| = arc cos |pq|. Capítulo El Grupo Lineal Mi trabajo siempre intentó unir lo verdadero con lo bello, pero cuando tuve que elegir uno o lo otro, usualmente elegí lo bello. Hermann Weyl N uestra intención no es presentar con toda generalidad la teoría de grupos de Lie-Banach, para eso ya existen excelentes tratados como los Elementos de Bourbaki [19], el reciente libro de Daniel Beltiţǎ [17] de estructuras homogéneas o el libro de Harald Upmeier [67] sobre grupos analíticos. Nos concentraremos en los subgrupos del grupo lineal de un álgebra de Banach o más precisamente, en subgrupos del grupo de operadores inversibles en un espacio de Banach. En este capítulo suponemos que el lector está familiarizado con las nociones de cálculo funcional que presentamos en los apéndices. Mencionamos algunas nociones que son de interés aunque quedan fuera de nuestro enfoque. La primera es sobre grupos de Lie-Banach analíticos G: si g denota el álgebra de Lie-Banach de G, entonces la aplicación Ad : G → B(g) dada por g 7→ Adg es una representación del grupo, que resulta una aplicación entre grupos analíticos; su isotropía es el centro del grupo, que en muchos casos relevantes suele ser pequeño. En este caso la estructura local puede copiarse del grupo de inversibles de B(g), que es un álgebra de Banach. En el otro extremo, si M es una variedad diferenciable cualquiera, y Diff(M) denota el grupo de difeomorfismos de M con la composición como la operación del grupo, este espacio no admite en general una estructura de grupo de LieBanach, incluso en un caso tan “sencillo” como cuando M = S1 . 63 4 64 El Grupo Lineal 4.1. El grupo de elementos inversibles, estructura local Como dijimos, nos concentraremos en subgrupos de GA , el grupo de inversibles de un álgebra de Banach compleja y asociativa A. Es fácil ver (Observación A.2.4 en el Apéndice III), se trata de un conjunto abierto y el álgebra de LieBanach g se identifica naturalmente con A; el corchete de Lie es el conmutador usual y el grupo tiene una estructura de variedad analítica compleja. 4.1.1. Las representaciones L y R Si z ∈ A, entonces Lz : A → A es un operador lineal y acotado, con kLz k = sup kzwk ≤ kzk. kwk≤1 Denotemos con σA (z) al espectro de z relativo al álgebra A, y con σB(A) (Lz ) al espectro de Lz como operador del espacio de Banach A. La aplicación z 7→ Lz es de hecho una representación del álgebra A como operadores acotados en un espacio de Banach. Definimos L : A → B(A) como La x = ax, y denotamos L(A) = {Lz : z ∈ A} ⊂ B(A). De manera análoga se definen Ra (a ∈ A) como el producto a derecha y R(A). Lema 4.1.1. El conjunto L(A) es una subálgebra cerrada, L es una isometría y además σB(A) (Lz ) = σ(z). para todo z ∈ A. Afirmaciones análogas valen para R(A). Demostración. Que L(A) es cerrada se deduce del hecho de que L es una isometría, y esto último es porque kzk = kLz · 1k ≤ kLz k ≤ kzk. Por otra parte, si c ∈ A es la inversa de a − λ, entonces Lc es la inversa de La−λ , con lo cual σB(A) (Lz ) ⊂ σ(z). Recíprocamente, si La es inversible, entonces existe un operador inversible T ∈ B(A) tal que La Tz = TLa z = z para todo z ∈ A. Llamando b = T (1), se tiene que b es la inversa de a: en efecto ab = La T (1) = 1, y por otro lado 1 = TLa (1) = T (a) con lo cual ba = TLa (ba) = T (aba) = T (a) = 1. 4.1. El grupo de elementos inversibles, estructura local 65 Dada H : Ω ⊂ C → C una función analítica tal que σ(z) ⊂ Ω, entonces ciertamente σ(Lz ) ⊂ Ω con lo cual tiene sentido hacer el cálculo funcional en las dos álgebras. Se tiene LH(z) = H(Lz ), pues la fórmula es evidente para potencias de z y para H(z) = (z − λ)−1 , y el resultado se deduce aproximando H uniformemente con funciones racionales en σ(z) (Teorema A.2.7). Respecto de la exponencial, se trata de la exponencial usual dada por ejemplo por una serie de potencias. En particular para todo v ∈ A se tiene Lev = eLv , Rev = eRv , eadv = Adev . La última fórmula, válida en grupos de Lie-Banach arbitrarios, tiene en este contexto una prueba sencilla: los operadores Lv , Rw ∈ B(A) conmutan para todo v, w ∈ A. 4.1.2. La diferencial del mapa exponencial En esta sección presentamos fórmulas explícitas para la diferencial de la exponencial. Lema 4.1.2. Si v, w ∈ A, entonces Z1 d exp(v + tw) = e(1−t)v wetv dt exp∗v (w) = dt t=0 0 = ev F(adv)w = [G(adv)w] ev . con F, G : C → C las funciones enteras dadas por F(λ) = 1 − e−λ λ y G(λ) = eλ − 1 λ respectivamente. Demostración. Observemos que, como (eta ) ′ = eta a = aeta para todo a ∈ A, entonces d (1−t)v t(v+w) (e e ) = e(1−t)v wet(v+w) , dt luego Z1 ev+w − ev = e(1−t)v wet(v+w) dt. 0 Reemplazando w por sw se tiene 1 v+sw (e − ev ) = s Z1 0 e(1−t)v wet(v+sw) dt. 66 El Grupo Lineal Haciendo tender s → 0 se tiene la primera identidad. Para ver que vale la segunda, reescribimos Z1 (1−t)v e 0 tv v we dt = e Z1 L−tv Rtv e e v wdt = e 0 Observemos que e−tadv = Z1 e−tadv dt w. 0 X 1 (−1)n tn (adv)n . n! n≥0 Integrando término a término, se tiene la identidad con la función F. La identidad con la función G se obtiene de esta última operando formalmente con el operador eadv = Adev . De la última fórmula se deduce que la diferencial es inversible si y sólo si σ(adv) ∩ {2kπi : k ∈ Z6=0 } = ∅. En particular, si kzk < π, entonces kadzk ≤ 2kzk < 2π con lo cual r(adz) < 2π y se tiene que la diferencial es inversible. Esta observación inocente es un hecho clave en la geometría de grupos lineales y sus espacios homogéneos. Con más precisión, como σ(adv) ⊂ σ(v) − σ(v) (Lema 4.1.1 y Corolario B.3.2), la diferencial de la exponencial será inversible siempre que λ − µ 6= 2kπi (k 6= 0) para todo λ, µ ∈ σ(v). 4.1.3. Factorización de la diferencial de exp Para una función entera F : C → C, existen relaciones entre su velocidad de crecimiento y la cantidad de ceros que tiene F en regiones acotadas. Sin entrar en detalles, mencionamos las nociones mínimas para escribir la factorización de Weierstrass de una función entera F. Consideremos el máximo de F en un disco, M(r) = máx |F(λ)| = máx |F(λ)|. |λ|≤r |λ|=r El orden de crecimiento ρ de F está dado por el límite ρ = lı́m sup r→+∞ ln ln M(r) . ln r 4.1. El grupo de elementos inversibles, estructura local 67 El orden puede ser +∞. Es fácil chequear que si F, G son enteras de orden ρF , ρG respectivamente entonces ρF+G , ρFG ≤ máx{ρF , ρG }. Los detalles pueden verse en la monografía [55] de Boris Levin de acceso libre en la página de la AMS. Cualquier función F de orden finito ρ ≤ 1 tiene una expansión de Weierstrass Y λ λ j aλ F(λ) = C λ e 1− e zk . zk k∈Z Aquí {zk } ⊂ C − {0} son las raíces no nulas de F y C = F(λ)/λj |λ=0 ∈ C, donde j ∈ N es el orden de λ = 0 como raíz de F. El producto converge uniformemente sobre compactos de C a la función F. El exponente a ∈ C se puede calcular de la siguiente manera: a= d ln(F(λ)/λj ) |λ=0 . dλ En particular, como la exponencial λ 7→ eλ tiene orden ρ = 1, lo mismo se puede decir de senos y cosenos, con lo cual es fácil hallar la expresión Y λ λ 1 1 − e−λ 1− e 2kπi . = e− 2 λ F(λ) = λ 2kπi k∈Z6=0 Corolario 4.1.3. Si v, w ∈ A, entonces 1 exp∗v (w) = ev e− 2 adv 4.1.4. Y adv adv e 2kπi (w). 1− 2kπi k∈Z6=0 La serie de Baker-Campbell-Hausdorff La serie de Baker-Campbell-Hausdorff de v, w ∈ A está dada por BCH(v, w) = v ∗ w = log(ev ew ), para v, w suficientemente pequeños. Observemos que es una función analítica. Luego podemos desarrollar en serie X BCH(tv, tw) = log(etv etw ) = tk pk (v, w) k≥0 68 El Grupo Lineal con pk homogéneos de grado k en (v, w). Si uno escribe la serie de potencias del logaritmo, X (−1)n+1 log(a) = (a − 1)n n n≥1 convergente para |a − 1| < 1, se obtiene log(ev ew ) = X (−1)m+1 (ev ew − 1)m m m≥1 = l X (−1)m+1 X X 1 ( vl wl−j − 1)m . m l!(l − j)! l≥0 j=0 m≥1 Agrupando monomios tales que la suma de los grados sea igual a n, recuperamos la fórmula previa X BCH(v, w) = log(ev ew ) = pk (v, w) k≥0 con los pk homogéneos. Proposición 4.1.4. Si v, w ∈ A son suficientemente pequeños, entonces BCH(v, w) = X (−1)n+1 Z 1 n−1 etadv etadw − 1 (v + etadv w)dt. n 0 n≥1 En particular, los pk de la serie son polinomios para el producto de Lie, es decir BCH(v, w) se obtiene iterando corchetes de v y w. Demostración. Sea z = z(t) = log(etv etw ), que como discutimos es una función analítica para t suficientemente pequeño. Derivando la relación ez(t) = etv etw obtenemos, por la fórmula de la diferencial de la exponencial [G(adz)z ′ ]ez = vez + ez w, luego G(adz)z ′ = v + eadz w = v + etadv w, puesto que eadz w = etadv etadw w = etadv w. Ahora notemos que, para λ ∈ C con |λ| < log(2), se tiene λ = log(eλ ) = X (−1)n+1 (eλ − 1)n , n n≥1 4.1. El grupo de elementos inversibles, estructura local luego G(λ)−1 = eλ 69 X (−1)n+1 λ = (eλ − 1)n−1 . −1 n n≥1 Entonces, si t es suficientemente pequeño se verifica kadzk < log(2) con lo cual X (−1)n+1 adz z ′ = G(adz)−1 v + eadtv w = (e − 1)n−1 v + etadv w . n n≥1 Pero si observamos que z(0) = 0, entonces log(ev ew ) = z(1) = z(1) − z(0) = Z1 z ′ (t)dt 0 lo que nos da la fórmula del enunciado. Observación 4.1.5. Reordenando la expresión integral del lema se obtiene la fórmula Z1 BCH(v, w) = log(ev ew ) = v + g(etadv etadw )wdt, 0 con g : C → C la función entera dada por g(λ) = 1 + X (−1)n+1 (λ − 1)n . n(n + 1) n≥1 Mientras que si desarrollamos (etadv etadw − 1)n−1 en serie en la expresión del lema se obtiene una famosa fórmula debida a E.B. Dynkin de la serie de Baker para v, w: X (−1)n+1 1 [v(i1 ) , w(ji ) , · · · , v(in ) , w(jn ) ] n (i1 + j1 ) + · · · + (in + jn ) i1 !j1 ! · · · in !jn ! n≥1 donde la suma es sobre las 2n-uplas (i1 , · · · , in , j1 , · · · , jn ) tales que ik + jk ≥ n, y para r ∈ N se denota [· · · , v(r) , · · ·] := [· · · , [v, [v, [· · · [v,[· · ·]]]. | {z } r veces Los primeros términos de la serie BCH(v, w) son p0 = 0, p1 = v + w, p2 = 1/2[v, w], p3 = 1/12[v − w, [v, w]] = 1/12[v, [v, w]] + 1/12[w, [w, v]]. 70 El Grupo Lineal 4.1.4.1. Fórmulas de Lie-Trotter Con la serie de BCH, estamos en condiciones de probar que los subgrupos cerrados tienen una subálgebra de Lie-Banach natural asociada, y por ende tienen una estructura de variedad diferenciable (con una estructura tal vez más fina que la de A). Las siguientes fórmulas son conocidas como fórmulas de Lie-Trotter de la exponencial. Lema 4.1.6. Si v, w ∈ A, entonces exp(v + w) = lı́m n→∞ y exp([v, w]) = lı́m n→∞ ev/n ew/n n e−v/n e−w/n ev/n ew/n n2 . Demostración. Para n ∈ N suficientemente grande, v/n y w/n están suficientemente cerca del origen como para usar la serie de BCH. Entonces log(ev/n ew/n ) = 1/n(v + w) + 1/2 n2 [v, w] + o(1/n3 ) de donde ev/n ew/n 1/2 [v, w] + o(1/n3 )) n2 = exp(1/n(v + w) + o(1/n2 )) = exp(1/n(v + w) + (4.1) y entonces n (ev/n ew/n )n = exp(1/n(v + w) + o(1/n2 )) = exp((v + w) + o(1/n)). Tomando límite para n → ∞ se tiene la primer identidad. Iterando la ecuación (4.1), tenemos e−v/n e−w/n ev/n ew/n = exp(A(n)) exp(B(n)) donde 1/2 A(n) = 1/n(v + w) + n2 [v, w] + o(1/n3 ) y B(n) = −1/n(v + w) + 1/2 n2 [v, w] + o(1/n3 ). Aplicando nuevamente la serie de BCH, log(eA eB ) = A + B + 1/2[A, B] + X k≥3 pk (A, B) = 0 + 1 [v, w] + o(1/n3 ), n2 4.2. Subgrupos 71 luego 2 (e−v/n e−w/n ev/n ew/n )n = = n2 exp(1/n2 [v, w] + o(1/n3 )) exp([v, w] + o(1/n)), y haciendo tender n → ∞ tenemos la segunda fórmula. 4.2. Subgrupos Exploramos en esta sección los subgrupos de un grupo de Lie-Banach, en particular del grupo de inversibles de un álgebra de Banach. 4.2.1. El álgebra de Lie de un subgrupo cerrado Gracias a las fórmulas previas obtenemos la prueba de que todo subgrupo cerrado tiene un álgebra de Lie-Banach asociada. Corolario 4.2.1. Sea K ⊂ GA un subgrupo cerrado, y sea k = {v ∈ A : etv ∈ K ∀t ∈ R}. Entonces k ⊂ A es una subálgebra de Lie-Banach real. Demostración. Si vn → v en A con vn ∈ k, entonces exp(tv) = lı́m exp(tvn ) ∈ K n para todo t ∈ R, con lo cual k ⊂ A es un subconjunto cerrado. Por otra parte, si v ∈ k entonces sv ∈ k para todo s ∈ R por definición. Por último, el lema previo nos dice que la suma y el corchete de elementos en k está en k pues K es cerrado. Recordemos que reservamos la denominación subgrupo de Lie para aquel subgrupo K ⊂ G cuya topología inducida por la estructura diferenciable, coincida con la topología de subespacio del grupo G en el que están inmersos. Como ya mencionamos en el capítulo previo, no es difícil verificar que un subgrupo cerrado K es subgrupo de Lie-Banach si y sólo si existe un entorno U ⊂ g del origen, de manera que exp(U ∩ k) = exp(U) ∩ K donde k denota como es habitual el álgebra de Lie-Banach de K, y la exponencial es la función exponencial del grupo G. 72 El Grupo Lineal Teorema 4.2.2. Sea G subgrupo de Lie-Banach de GA , g su álgebra de Lie-Banach. Supongamos que k ⊂ g es una subálgebra cerrada. Entonces 1. Existe un grupo de Lie-Banach K∗ ⊂ G (subgrupo analítico) tal que el álgebra de Lie-Banach de K∗ coincide con k. 2. Si K ⊂ G es un subgrupo topológico cerrado, y k denota el álgebra de Lie-Banach de K, entonces K tiene una estructura de grupo de LieBanach de manera que la topología τ inducida es posiblemente más fina que la de G. Además K∗ = K0τ (la componenente de la identidad del grupo K munido de la topología τ), y K∗ es subgrupo de Lie-Banach normal de Kτ . 3. Si dim(G) < ∞, la topología τ de K y la de subespacio coinciden. Demostración. Tomamos el subfibrado de TG ≃ G×g dado por E = {Lg h}g∈G = {gh}g∈G . Si X, Y ∈ E, entonces existen Ag , Bg funciones suaves a valores en k tales que Xg = gAg , Yg = gBg . Calculamos d (αBα − βAβ ) [Xg , Yg ] = Yg′ (Xg ) − Xg′ (Yg ) = dt t=0 donde α es el flujo de X, es decir α̇ = Xα = αAα , α(0) = g, y β es el flujo de Y. Observemos que como Aα ⊂ k, entonces su derivada en t = 0 (que denotaremos como A0′ ) permanece en k. Lo mismo se aplica a Bβ . Se tiene [Xg , Yg ] = g[Ag , Bg ] + g[B0′ , A0′ ] ∈ gk = E luego por el Teorema de Frobenius (Observación 2.5.2) el subfibrado E es integrable. Sea K∗ la variedad integral conexa maximal de E que pasa por g0 = 1. Si v ∈ k, entonces α(t) = etv es una variedad integral del subfibrado, luego α ⊂ K∗ y en consecuencia ev ∈ K∗ es decir, exp(k) ⊂ K∗ . Por otra parte tautológicamente T1 K∗ = k. Luego si B es una bola -entorno de 0 ∈ g- donde la exponencial es un difeomorfismo, se tiene que exp : B ∩ k → exp(B ∩ k) = U = U−1 es un difeomorfismo, luego este último es abierto en K∗ . Observemos que si ev , ew ∈ U, entonces α(t) = ev etw es una curva integral de E, luego ev ew ∈ K∗ y entonces hev iv∈B∩k = hUi = K∗ por ser este abierto y cerrado en K∗ . Luego K∗ es un grupo de Lie-Banach cuya álgebra de Lie es k. Si k es el álgebra de Lie-Banach de un subgrupo topológico cerrado K ⊂ G, entonces dado v ∈ k se tiene ev ∈ K, luego U ⊂ K y entonces K∗ ⊂ K; notar también que si x ∈ K y z ∈ k entonces exp(txzx−1 ) = xetz x−1 ∈ K 4.2. Subgrupos 73 lo que nos dice que K∗ es un subgrupo normal de K. Veamos ahora cómo dotar a K de estructura diferenciable a partir de la de ∗ K . Existe por la continuidad del producto un abierto simétrico V −1 = V en K∗ tal que V 4 ⊂ U. Notemos que {xV}x∈K es un cubrimiento K; le damos a K la topología τ inducida por esta base de entornos (claramente compatible con la de K∗ ), y definimos las cartas ϕx (g) = exp−1 (x−1 g) para g ∈ xV. Dados x, y ∈ K, φ = ϕx ◦ ϕ−1 y : ϕy (xV ∩ yV) → ϕx (xV ∩ yV) se calcula notando que si h ∈ xV ∩ yV entonces existen g1 , g2 ∈ V tales que h = xg1 = yg2 , luego g0 = x−1 y ∈ V 2 y entonces g0 = es y además para z = ϕy (h) = exp−1 (g2 ) se tiene φ(z) = ϕx (h) = exp−1 (x−1 yg2 ) = exp−1 (g0 g2 ) = exp−1 (es ez ) = BCH(s, z), y entonces z 7→ φ(z) es suave, de hecho analítica. Esto prueba que {(ϕx , xV)}x∈K es un atlas analítico de K, con lo cual K tiene estructura de variedad diferenciable. Veamos que, dado x ∈ K, la función Lx (h) = xh es diferenciable como función de K en K. Computamos el mapa inducido en el entorno gV, tomando z ∈ exp−1 (V): −1 z ϕxg ◦ Lx ◦ ϕ−1 (e ) = z, g (z) = exp de donde Lx es obviamente diferenciable. Ahora veamos que Adg (h) = ghg−1 también es diferenciable, de hecho un difeomorfismo pues tiene una inversa que se computa como Adg−1 que resultará por ende diferenciable. Como Adg ◦ Lh = Lghg−1 ◦ Adg , basta probar que Adg es diferenciable en algún entorno de 1 ∈ K. Pero como exp es localmente un difeomorfismo entre el abierto exp−1 (V) ⊂ k y V, de getz g−1 = exp(tgzg−1 ) se sigue que x 7→ gxg−1 es un endorfismo de k, y como este último es suave, también lo es Adg . Si I(x) = x−1 denota la inversa del grupo y m(x, y) = xy denota el producto, estas dos funciones se pueden escribir en términos de L y Ad, por ejemplo si h = xg ∈ xV, entonces I(h) = I(xg) = g−1 x−1 = Lx−1 ◦ Adx ◦ IV ◦ Lx−1 (h), y como IV es analítica (pues se computa en la carta exponencial como z 7→ −z), entonces I resulta suave, de hecho analítica. Con un argumento similar (Ejercicio 4.v) se prueba que m es analítica. Entonces (Kτ es un grupo de Lie-Banach que tiene a K∗ como subgrupo de Lie-Banach normal, y como K∗ = hVi, debe ser K∗ = K0τ . 74 El Grupo Lineal Si dim(G) < ∞, consideramos la topología Kτ inducida por las cartas recién introducidas, y este espacio resulta localmente compacto; asimismo K con la topología original es Hausdorff, y como el entorno V ⊂ Kτ es acotado (pues la exponencial es localmente Lipschitz), entonces si i : K∗ ֒→ Kτ denota la inclusión, se sigue que i(V) es abierto en K, y por ende las topologías coinciden. Todo subgrupo de Lie de un grupo de Lie-Banach G resulta cerrado (ejercicio 3.vii), y en dimensión finita, todo subgrupo cerrado, es subvariedad regular (una prueba del caso general puede verse en el libro de Helgason [40, Teorema 2.3]). Luego se tiene la equivalencia entre subgrupos cerrados y subgrupos de Lie. Sin embargo, en dimensión infinita no es difícil dar con un contraejemplo a esta afirmación: Ejemplo 4.2.3. Consideramos G = L2 ([0, 1], R) como grupo de Lie-Banach aditivo y la topología inducida por la norma 2. Tomamos las funciones a valores en Z, es decir K = L2 ([0, 1], Z), que resulta un grupo de Lie-Banach aditivo, y subgrupo analítico de G. Es fácil ver que K es cerrado en G, pues se tiene convergencia en casi todo punto. Observemos que la exponencial de G es la identidad por ser G un grupo abeliano. Luego el álgebra de Lie de K está dada por k = {f ∈ G : tf ∈ K ∀t ∈ R}. Esto sólo es posible si f = 0, luego k = {0}, y en consecuencia (en la notación del teorema previo) K∗ = {0}, y luego Kτ tiene entonces que ser discreto. Pero por otra parte, dada f ∈ K, si consideramos la función continua F : I × K → K dada por f(x) 0 ≤ x ≤ t F(t, f)(x) = 0 t<x≤1 nos muestra que K es arco-conexo como subespacio topológico de G. Luego la topología de K como grupo de Lie-Banach no coincide con la topología de K como subespacio de G. 4.3. Subgrupos algebraicos A continuación desarrollamos un criterio útil en el contexto infinito dimensional para probar que la topología de un subgrupo K ⊂ G de un grupo proveniente de un álgebra de Banach, es la topología de subespacio. Dada un álgebra de Banach A, diremos que un subgrupo K ⊂ GA es algebraico si existe una familia {Pi }i∈I de polinomios Pi : A × A → C tales que K = {g ∈ GA : Pi (g, g−1 ) = 0 ∀i ∈ I}. 4.3. Subgrupos algebraicos 75 Resulta entonces que P es una suma de funciones homogéneas en (a, b). El grado del polinomio P se define como el máximo de los órdenes de las funciones homogéneas en las que se descompone P. Por ejemplo, P(a, b) = 3a2 b2 − 4a4 b + ab + 1 es un polinomio de grado 5 pues el monomio m(a, b) = −4a4 b es homogéneo de grado 5, es decir m(ta, tb) = −4(ta)4 (tb) = t5 m(a, b) para todo t ∈ C. El grado del subgrupo K es el máximo de los grados de los polinomios de la famila {Pi }i∈I . El siguiente teorema debido a Carlson será útil en breve, lo enunciamos sin demostración y la misma puede verse por ejemplo en el libro de B. Levin1 [55, Teorema 3, Sección 8.3]: Lema 4.3.1. Sea f : C → C una función entera de orden ρ ≤ 1 (es decir |f(z)| ≤ AeB|z| para todo z ∈ C). Si 1. f(k) = 0 para todo k ∈ Z, 2. lı́m sup 1t log |f(±it)| < π, t→∞ entonces f ≡ 0. Para un subgrupo algebraico K, si definimos k = {v ∈ A : etv ∈ K ∀t ∈ R}, el Corolario 4.2.1 nos dice que k es un álgebra de Lie-Banach, pues K es cerrado por ser intersección de cerrados. Teorema 4.3.2. Si A es un álgebra de Banach compleja y K ⊂ GA es un subgrupo algebraico de grado n < ∞, entonces K tiene una estructura de grupo de Lie-Banach dada por k y la exponencial de GA , cuya topología concuerda con la topología de subespacio de GA . Demostración. Trasladando con los difeomorfismos {Lg }g∈K , basta probar que existe un entorno U ⊂ A del origen tal que exp(U ∩ k) = exp(U) ∩ K y exp es un difeomorfismo entre U ∩ k y exp(U) ∩ K. Tomando U suficientemente pequeño, 1 Link al libro online, de acceso gratuito en la página de la AMS-American Mathematical Society (ver la página 58): http://www.ams.org/online_bks/mmono150/mmono150-ptI.pdf 76 El Grupo Lineal esta última condición está garantizada; por otra parte exp(U ∩ k) ⊂ exp(U) ∩ K siempre ocurre. Luego tenemos que probar que exp(U) ∩ K ⊂ exp(U ∩ k), y esto estará probado si vemos que, dado v ∈ U con g = ev ∈ K, entonces etv ∈ K para todo t ∈ R. Por la definición del subgrupo algebraico, esto nos lleva a tener que probar que para todo polinomio P de la familia que define K, se verifica P(etv , e−tv ) = 0 para todo t ∈ R. Para P y v fijos, consideramos la función f : C → C dada por f(z) = P(ezv , e−zv ). Esta es una función analítica pues la exponencial y los polinomios son analíticos. Probaremos que f es idénticamente nula usando el lema previo. Observemos primero que f(k) = P(ekv , e−kv ) = P(gk , g−k ) = 0 para todo k ∈ Z, puesto que K es un grupo. Además, usando que P tiene grado finito, f tiene orden ρ ≤ 1 pues basta desarrollar el polinomio como suma de monomios y luego acotar ke±zv kj ≤ ejkzvk = ej|z|kvk en cada monomio. Por otra parte, como P(x, y) = n X pk (x, y) k=0 con los pk homogéneos de grado k, entonces existen constantes ck , αjk ≥ 0 tales que n k X X |P(x, y)| ≤ ck αjk kxkj kykk−j ≤ M máx{1, kxkn , kykn }, k=0 j=0 y entonces log |P(x, y)| ≤ log M + n máx{0, log kxk, log kyk}. Usando esto, para t ∈ R tenemos log |f(±it)| = log |P(e±itv , e∓itv )| ≤ log M + n máx{0, log ke±itv k}, 4.4. El grupo de isometrías 77 lo que nos dice que lı́m sup t→∞ 1 1 log |f(±it)| ≤ n lı́m sup log ke±itv k. t t→∞ t Por el primer ítem del Teorema A.3.6, lı́m sup t→∞ 1 log ke±itv k = máx{|Im(λ)| : λ ∈ σ(v)} ≤ r(v) ≤ kvk, t es decir lı́m sup t→∞ 1 log |f(±it)| ≤ nkvk. t Como n está dado por la familia de polinomios, podemos tomar el entorno U ⊂ A suficientemente pequeño para que kvk < π/n para todo v ∈ U, con lo cual lı́m sup t→∞ 4.4. 1 log |f(±it)| < π. t El grupo de isometrías Si A es un álgebra de Banach, las isometrías de G = GA son los elementos de norma unitaria con inversa de norma unitaria, es decir U = UA = {g ∈ GA : kgk = kg−1 k = 1}. Observación 4.4.1. El nombre se debe al siguiente hecho: si pensamos que A actúa en un espacio de Banach E como operadores acotados (por ejemplo en E = A via g 7→ Lg ) entonces g ∈ U sii kgηk = kg−1 ηk = kηk para todo η ∈ E. En efecto, kgηk ≤ kηk y por otro lado kηk = kg−1 gηk ≤ kgηk lo que prueba que g es una isometría, y con un argumento análogo g−1 es una isometría. Lema 4.4.2. Si u ∈ U entonces σ(u) ⊂ S1 . Demostración. En primer lugar, si |λ| > 1 entonces x = 1 − u λ verifica kx − 1k = 1/|λ| < 1 lo que nos dice que x es inversible o equivalentemente, que λ ∈ / σ(u). −1 Supongamos ahora que |λ| < 1, entonces y = λu −1 también verifica ky−1k = |λ| < 1 luego es inversible. Multiplicando por u deducimos que uy = λ − u es inversible así que λ ∈ / σ(u). 78 El Grupo Lineal Las isometrías forman un subgrupo cerrado de G, y por ende el espacio de Banach u = uA = {v ∈ A : exp(Rv) ⊂ U} es de hecho una subálgebra de Lie-Banach de A. Se sigue que U es un grupo de Lie-Banach, con una topología tal vez más fina que la heredada de G (la topología de G coincide con la de A por ser abierto). Puede probarse que si X es un espacio de Banach complejo y A = B(X) es el álgebra de Banach de operadores acotados en X, entonces el grupo de isometrías U ⊂ GL(X) = GA tiene la topología de subespacio siempre y cuando la bola unitaria de X sea homogénea, esto es, cuando las funciones biholomorfas actuen transitivamente en la bola (ver [39, Teorema 2]). En el mismo artículo (Ejemplo 6), o en las notas del Seminario Dubreil de K. H. Hofmann [41], puede hallarse un ejemplo de un grupo de isometrías de un espacio de Banach que no es un grupo de Lie con la topología heredada. Observación 4.4.3. Se suele denominar Hermitiano a todo elemento x ∈ A tal que ix ∈ u, es decir Herm(A) = iu = {x ∈ A : exp(itx) ∈ U ∀ t ∈ R}. En el contexto de álgebras C∗ , es fácil ver que los Hermitianos de una y otra definición coinciden, es decir x ∈ Herm(A) si y sólo si x∗ = x, ver el Ejercicio 4.vi. Definición 4.4.4. Para a ∈ A, denotaremos D(a) = {ϕ ∈ A ′ : kϕk = 1, ϕ(a) = kak}, que es no vacío por el Teorema de Hahn-Banach (de hecho, es convexo y compacto si se provee a A de la topología ω∗ , que es la topología de convergencia puntual, ver el Apéndice A.3). Definimos V(a) = {ϕ(a) : ϕ ∈ D(a)} que resulta un conjunto compacto convexo de C, no vacío pues σ(a) ⊂ V(a) (ver el Lema A.3.5) en los apéndices). Proposición 4.4.5. Sea a ∈ A un álgebra de Banach. Son equivalentes: 1. a ∈ Herm(A). 2. keita k ≤ 1 para todo t ∈ R. 4.4. El grupo de isometrías 79 3. V(a) ⊂ R. 4. lı́m 1s {k1 + isak − 1} = 0 para s ∈ R. s→0 5. Para todo t ∈ R, 1 + ita es inversible y expansivo, i.e. para todo z ∈ A k(1 + ita)zk ≥ kzk. Demostración. Como para todo g ∈ GA se tiene kgkkg−1 k ≥ kgg−1 k = 1, entonces kg−1 k ≥ kgk−1 . Luego si keita k ≤ 1 para todo t ∈ R, entonces 1 ≥ keita k = k(ei(−t)a )−1 k ≥ kei(−t)a k−1 ≥ 1 lo que nos dice que 1. y 2. son equivalentes. La equivalencia entre 2. y los ítems 3. y 4. es consecuencia del cuarto ítem del Teorema A.3.6 del Apéndice. Veamos que a Hermitiano implica la condición del ítem 5. Basta probarla para t = 1. Como a es Hermitiano, V(a) ⊂ R y entonces σ(a) ⊂ R. Luego σ(1 + ia) ⊂ 1 + iσ(a) ⊂ 1 + iR lo que nos dice que 1 + ia es inversible. Para ver que es expansivo, basta probar que kz + iazk ≥ 1 para todo z ∈ A con kzk = 1. Tomemos ϕ ∈ D(z) (ver el Apéndice A.3), observemos que como a es Hermitiano entonces ϕ(az) ∈ V(a, z) ⊂ V(a) ⊂ R. Luego Reϕ(iaz) = Reiϕ(az) = 0. En consecuencia 1 = ϕ(z) = Reϕ(z) = Reϕ(z + iaz) ≤ |ϕ(z + iaz)| ≤ kz + iazk. Recíprocamente, supongamos que 1 + ita es inversible y expansivo para todo t ∈ R. Si t es suficientemente pequeño, entonces X (1 − ita)−1 = (it)n an = 1 + ita + o(t2 ). n≥0 Como k(1 − ita)−1 k ≤ 1 y k1 + itak ≥ 1, deducimos que para t suficientemente pequeño y positivo 0 ≤ ≤ k(1 − ita)−1 + o(t2 )k − 1 k1 + itak − 1 = t t −1 k(1 − ita) k − 1 + o(t) ≤ o(t) t con lo cual lı́m t→0+ k1 + itak − 1 = 0. t 80 El Grupo Lineal Como −a verifica las mismas hipótesis que a, se deduce que lı́m t→0+ k1 − itak − 1 = 0, t y cambiando t por −t se deduce que el otro límite lateral también es nulo, lo que prueba que a es Hermitiano. 4.4.1. El grupo unitario de un álgebra C∗ Para una C∗ -álgebra A, denotemos con Ah a los elementos Hermitianos del álgebra. Lema 4.4.6. Sea u ∈ A una C∗ -álgebra, que supondremos representada en un espacio de Hilbert H. Entonces son equivalentes 1. uu∗ = u∗ u = 1. 2. kuηk = ku∗ ηk = kηk para todo η ∈ H. 3. u es una isometría, es decir u es inversible y kuk = ku−1 k = 1. Demostración. Si u es unitario, es decir, si vale 1., entonces kuηk2 = huη, uηi = hu∗ uη, ηi = h1η, ηi = kηk2 y lo mismo vale para u∗ , lo que prueba 2. Si vale 2. u es inyectivo y su rango es cerrado, y lo mismo vale para u∗ , pero como ran(u)⊥ = ker(u∗ ) = {0}, se deduce que ran(u) = H y entonces u es inversible. Además kuk = ku∗ k = 1 y Rehu∗ uη, ξi = = ku∗ u(η + ξ)k2 − ku∗ uηk2 − ku∗ uξk2 1/2 kη + ξk2 − kηk2 − kξk2 = Rehη, ξi, 1/2 y lo mismo vale para uu∗ , se tiene que u∗ = u−1 , luego ku−1 k = 1 y esto prueba 3. Por último, supongamos que u es inversible y que kuk = ku−1 k = 1. Es decir, u es una isometría. Entonces hu∗ uη, ξi = = huη, uξi = 1/2 ku(η + ξ)k2 − kuηk2 − kuξk2 1/ kη + ξk2 − kηk2 − kξk2 = hη, ξi 2 con lo cual u∗ u = 1, y entonces uu∗ = uu∗ uu−1 = u1u−1 = 1 también. 4.4. El grupo de isometrías 81 Luego el grupo de isometrías en un álgebra C∗ es el grupo unitario del álgebra. Su álgebra de Lie-Banach es el espacio iAh de operadores antihermitianos, y como U = {u ∈ GA : u∗ u = uu∗ = 1}, es esperable que el Teorema 4.3.2 nos permita concluir que la topología de U dada por la carta exponencial concuerda con la topología de subespacio de GA . Es decir, todo abierto de U se consigue como unión de bolas -en norma- de A, cortadas con el grupo unitario. Los polinomios naturales a considerar son la familia indexada por ξ ∈ H dada por {Pξ (a) = kaξk2 − kξk2 } que claramente tiene grado 2 y anula al grupo unitario U. Sin embargo, una cuidadosa inspección de la sección previa nos dice que los polinomios deben ser polinomios complejos, es decir deben sacar constantes complejas, lo cual no se verifica aquí. Sin embargo, este problema se puede solucionar considerando la complexificación de los polinomios dada por una expresión estándar que puede verse por ejemplo en [52, Sección 3]. En particular, la forma bilineal real β(ξ, η) = Rehξ, ηi que induce el polinomio real p(ξ) = kξk2 , nos permite obtener la complexificación de p, descomponiendo a ξ = x + iy ∈ H en sus partes real e imaginaria y definiendo p̃(x + iy) = kxk2 − kyk2 + 2i Re hx, yi. Es fácil verificar que si λ = a + ib ∈ C entonces en efecto p̃(λ(x + iy)) = λ2 p̃(x + iy), y por otra parte p̃(uξ) = p̃(ξ) para todo u ∈ U, luego el grupo unitario es un grupo algebraico y se obtiene el resultado esperado: Corolario 4.4.7. El grupo de operadores unitarios de un espacio de Hilbert es un grupo de Lie-Banach cuya topología coincide con la de la norma uniforme de B(H), y cuya álgebra de Lie-Banach consiste en el espacio de operadores anti-Hermitianos. 4.4.1.1. Logaritmos de operadores unitarios Veremos algunas propiedades del grupo de unitarios de un álgebra C∗ . Recurrimos para ello al cálculo funcional continuo (ver el Apéndice B). Observemos que si u ∈ U, entonces ku−1k ≤ 2 y más generalmente ku−vk ≤ 2 para todo u, v ∈ U. Si ku − 1k < 1 entonces z = log(u) = X (−1)n+1 (u − 1)n . n n≥1 82 El Grupo Lineal verifica ez = u. Por otra parte, supongamos que ku − 1k < 2. Entonces como σ(u) ⊂ S1 , se tiene máx{|eit − 1| : eit ∈ σ(u)} = r(u − 1) ≤ ku − 1k < 2, lo que nos dice que −2 ∈ / σ(u − 1) o equivalentemente −1 ∈ / σ(u). Es decir, σ(u) ⊂ S1 − {−1}. Sea log : {a + ib ∈ C : a > 0 ó b 6= 0} → {x + iy : −π < y < π} la determinación usual del logaritmo en el plano complejo sin el semieje negativo de los números reales. Entonces log es una función analítica definida en un entorno de σ(u), y por lo tanto está bien definido el cálculo funcional I 1 log(w)(w − u)−1 dw z = log(u) = 2πi γ para cualquier curva simple γ, orientada de forma positiva, alrededor de σ(u). Por propiedades generales del cálculo funcional, se verifica ez = exp ◦ log(u) = id(u) = u, y además σ(z) = log(σ(u)) ⊂ {it : t ∈ (−π, π)}. Proposición 4.4.8. Si A es un álgebra C∗ entonces para todo u, v ∈ U tales que ku − vk < 2 existe un único z ∈ Ah tal que kzk < π y v = ueiz . La asignación (u, v) 7→ z es analítica en U = {(u, v) ∈ U × U : ku − vk < 2}. Demostración. Supongamos primero que v = 1 y que ku − 1k < 2. Entonces z = log(u) es un operador normal pues se obtiene como cálculo funcional de u que es normal. Como z∗ = log(u)∗ = log(u∗ ) = log(u−1 ) = − log(u) se deduce que z es antihermitiano. Además como σ(z) ⊂ i(−π, π) ⊂ iR, kzk = r(z) < π. Si tomamos x = iz, entonces x verifica todo lo requerido. Si ku−vk < 2, entonces w = u∗ v es unitario y además kw−1k = ku∗ v−1k = kv − uk < 2, con lo cual por el caso anterior existe x ∈ Ah tal que kxk < π y u∗ v = w = eix , de donde se deduce que v = ueix . Para probar la última afirmación, podemos suponer nuevamente que v = 1 y que ku − 1k < 2. Como u 7→ (u − w)−1 es analítica para todo w ∈ γ (una 4.5. El cono positivo de un álgebra C∗ 83 curva que rodee al espectro de u) admite localmente un desarrollo en serie con polinomios homogéneos en el espacio de Banach A. Integrando término a término la serie en γ, tenemos una nueva serie de potencias que nos da u 7→ log(u) localmente, lo que nos dice que esta aplicación es analítica. Proposición 4.4.9. Si A es un álgebra de von Neumann entonces para todo u, v ∈ U existe x ∈ Ah tal que kxk ≤ π y v = ueix . Demostración. Como ku − vk = k1 − u∗ vk, podemos suponer que u = 1. Si σ(u) 6= S1 , usamos el corolario previo. En caso contrario, sea log definido como el logaritmo usual en S1 − {−1}, y extendido arbitrariamente (por ejemplo, como π) en λ = −1. Esta función es Boreliana y acotada en S1 , con lo cual podemos hacer el cálculo funcional z = log(u) del elemento normal u, que verifica kzk ≤ klogk∞,σ(u) = klogk∞,S1 = π. Se verifica ez = exp ◦ log(u) = u, z∗ = −z con lo cual x = (−i)z es el elemento buscado. 4.5. El cono positivo de un álgebra C∗ Si A es un álgebra C∗ , denotemos con G+ A a los elementos positivos e inversibles, es decir ∗ G+ A = {g ∈ GA : g = g, σ(g) ⊂ (0, +∞)} ⊂ Ah . Observemos que si v, w ∈ Ah , entonces adv(w) = [v, w] ∈ iAh , mientras que ad2 v(w) = [v, [v, w]] = v2 w + wv2 − 2vwv ∈ Ah . Teorema 4.5.1. Sea A una C∗ -álgebra. Entonces + 1. exp(Ah ) = G+ A , y exp : Ah → GA es una biyección. 2. G+ A es abierto en Ah . 3. Si v, w ∈ Ah , entonces v/2 exp∗v (w) = e Y senh(adv/2) ad2 v v/2 v/2 (w)·e =e · · 1 − 2 2 (w)·ev/2 adv/2 4n π n∈N 4. exp∗v : Ah → Ah es globalmente inversible y exp : Ah → G+ A es un difeomorfismo. 84 El Grupo Lineal Demostración. Para probar 1. primero notamos que si v∗ = v, entonces ev es ∗ positivo e inversible por el teorema espectral, ya que (ev )∗ = ev = ev y además σ(ev ) = exp(σ(v)) ⊂ exp(R) ⊂ (0, +∞). Luego exp(Ah ) ⊂ G+ A , pero nuevamente invocando el teorema espectral tenemos, + para cada a ∈ GA un único logaritmo real ln(a) que es Hermitiano y verifica que exp(ln(a)) = a. Luego los conjuntos son iguales, y exp es una biyección ya que ev = ew con v, w Hermitianos implica que tienen el mismo logaritmo real y entonces v = w. Para ver el ítem 2. recordemos que exp∗0 es la identidad, y si a ∈ G+ A, podemos considerar v 7→ a1/2 exp(v)a1/2 que es un difeomorfismo local y entonces manda un entorno abierto de 0 ∈ Ah en un entorno abierto de a ∈ G+ A. Para probar el ítem 3. observamos que e−v/2 exp∗v (w)e−v/2 = ev/2 F(adv)we−v/2 = eadv/2 F(adv)w = eadv/2 − e−adv/2 (w), 2adv/2 y que la expansión en productos de Weierstrass de senh(λ)/λ es Y Y λ λ2 λ kπi 1− = 1− 2 2 . e kπi n π k∈Z6=0 n∈N Finalmente, observemos que σ(adv) ⊂ σ(Lv ) − σ(Rv ) pues estos operadores conmutan (ver el Corolario B.3.2), y por otra parte, por el Lema 4.1.1, σ(Lv ) = σ(v) ⊂ R y lo mismo se aplica para Rv . Se sigue que σ(adv) ⊂ R, con lo cual senh(λ)/λ no se anula en adv y entonces la diferencial de la exponencial es inversible globalmente, para todo v ∈ Ah . Como exp restringido a los Hermitianos era una biyección global con los positivos invertibles, tenemos que se trata de un difeomorfismo (por ser un difeomorfismo local). 4.5.1. Conos positivos Si a ≥ 0 y t ∈ R≥0 entonces obviamente ta ≥ 0. También es cierto que la suma de positivos da positivo, para probarlo usamos el radio numérico: si a, b ≥ 0 entonces a + b es autoadjunto y además para todo estado ρ se verifica ρ(a + b) = ρ(a) + ρ(b) ≥ 0 4.5. El cono positivo de un álgebra C∗ 85 lo que nos dice que a + b ≥ 0 (Corolario B.3.13). En consecuencia, el conjunto de operadores positivos forma un cono convexo, que se suele denominar cono de operadores positivos y denotado A+ . Si a, b ∈ Ah , diremos que a ≥ b si a − b ≥ 0. Corolario 4.5.2. La relación ≥ define un orden parcial en Ah , es decir 1. a ≤ a para todo a ∈ Ah . 2. a ≤ b y b ≤ a implican a = b. 3. a ≤ b y b ≤ c implican a ≤ c. Además a≥b ⇒ y a≥b ra ≥ rb para todo r ∈ R≥0 , c≥d ⇒ a + c ≥ b + d. Demostración. Ciertamente a ≤ a pues a − a = 0 ≥ 0. Si a ≤ b y b ≤ a entonces σ(a − b) = {0}, y como a − b ∈ Ah , se tiene ka − bk = r(a) = 0 luego a = b. Si a ≤ b y b ≤ c entonces b − a ≥ 0 y c − b ≥ 0; como la suma de positivos es positivo se tiene c − a = b − a + (c − b) ≥ 0 con lo cual c ≥ a. Si a ≤ b entonces obviamente ra ≥ rb; por otra parte a ≥ b y c ≥ d implican a − b + c − d ≥ 0, que es lo mismo que decir a + c ≥ b + d. Para a ∈ Ah , el número ia = mı́n{s : s ∈ σ(a)} ∈ R está bien definido por ser σ(a) un compacto en R. Lema 4.5.3. Sea a ∈ Ah . Entonces σ(a − ia ) = {t − ia : t ∈ σ(a)}, y en particular a ≥ ia 1. Demostración. Si ia = 0 no hay nada que probar. Supondremos que ia 6= 0. Entonces (ver la Observación A.2.1), se tiene −1 σ(a − ia ) = (−ia )σ(1 − i−1 a a) = (−ia ){1 − ia t : t ∈ σ(a)} = {t − ia : t ∈ σ(a)}. Como ia ∈ R, a − ia es Hermitiano y como t − ia ≥ 0 para todo t ∈ σ(a), se deduce que a − ia ≥ 0. 86 El Grupo Lineal Si a, b ≥ 0 son inversibles, entonces ia , ib > 0 con lo cual a + b ≥ ia + ib > 0 y esto nos dice que a + b no sólo es positivo, sino que también es inversible, se sigue que G+ A es un cono convexo (las combinaciones convexas caen dentro). Este admite una acción natural del grupo de inversibles GA , + π : GA × G+ A → GA (g, a) 7→ gag∗ = ga1/2 (ga1/2 )∗ . 1/2 −1/2 a verifica Esta acción es transitiva pues si a, b ∈ G+ A , entonces g = b Ig (a) = gag∗ = b. En particular podemos pensar que G+ A es O(1), la órbita de la identidad por la acción. El grupo de isotropía H1 de esta acción en a = 1 es exactamente el grupo unitario pues si g = u|g| es la descomposición polar de g con u ∈ U y |g| ∈ A+ , entonces 1 = Ig (1) = gg∗ = u|g|2 u∗ de donde se deduce que |g|2 = 1 y entonces |g| = 1. En este caso tanto G+ A = O(1) ⊂ Ah como U = H1 ⊂ GA son subvariedades embebidas. 4.5.2. Descomposición de Cartan y conmutadores El álgebra A admite una descomposición A=k⊕p donde k = iAh es un álgebra de Lie-Banach (que corresponde al grupo unitario) y p = Ah es un subespacio real cerrado que verifica ser un triple de Lie, esto es ad2 v(w) = [v, [v, w]] ∈ p siempre que v, w ∈ p. Como vw − vw ∈ iAh si v, w ∈ Ah y kv − vk ∈ Ah si k ∈ iAh , v ∈ Ah , entonces el álgebra A es de esta manera un álgebra Z2 graduada, en el sentido siguiente [k, k] ⊂ k, [k, p] ⊂ p, [p, p] ⊂ k. Definición 4.5.4. Si g es un álgebra de Lie-Banach, y k, p ⊂ g son dos subespacios tales que g = k⊕p y además [k, k] ⊂ k, [k, p] ⊂ p, [p, p] ⊂ k. se dice que k, p es una descomposición de Cartan de g. 4.6. Órbitas de similaridad y coadjuntas 87 Si z ∈ k = iAh , entonces la pregunta de si existen v, w ∈ p = Ah tales que [v, w] = z es difícil de contestar. Si z = it con t ∈ R, entonces vw − wv = it implica vw = it + wv con lo cual σ(wv) ∪ {0} = σ(vw) ∪ {0} = {it + σ(wv)} ∪ {0} y esto es absurdo salvo que t = 0. Si A = Mn (C), tomando traza en el problema vw − wv = z de incógnita z ∈ Mn (C) se obtiene también la condición necesaria 0 = tr(vw − wv) = tr(z), lo que nos dice que los conmutadores de Hermitianos caen en un subespacio propio de Mn (C), suplementario a C1. De hecho, esta condición es suficiente: toda matriz de traza cero se puede escribir como el conmutador de dos matrices. La prueba de este hecho (válido en cualquier cuerpo k) puede verse por ejemplo en el trabajo [1]. En el caso infinito-dimensional, este enunciado está lejos de ser cierto pues puede probarse que los conmutadores son densos con la topología uniforme (la de la norma). Recordemos que denotamos B(H) a los operadores lineales acotados del espacio de Hilbert H. Entonces, si A = B(H) con H infinito dimensional, entonces dado z ∈ A existen v, w ∈ A tales que z = wv − vw si y sólo si z∈ / {λ + k : C ∋ λ 6= 0, k compacto }. En particular el conjunto de conmutadores tiene interior no vacío. Todos estos resultados están en el trabajo de Brown y Percy [20]. 4.6. Órbitas de similaridad y coadjuntas En el caso de un operador a ∈ A donde A es una C∗ -álgebra, podemos considerar su órbita con la acción del grupo de inversibles O(a) = {gag∗ : g ∈ GA } ⊂ A. En general no es sencillo garantizar que la órbita es una subvariedad del espacio ambiente. 88 4.6.1. El Grupo Lineal La órbita de similaridad de un inversible autoadjunto En un trabajo de Corach-Porta y Recht [28] se estudia el caso a ∈ GA , a = a∗ . Puede verse que O(a) ⊂ Ah es una subvariedad: de hecho O(a) es abierto en GA ∩ Ah , y el grupo de isotropía Ka ⊂ GA es subgrupo de Lie-Banach regular. Esto es porque el fibrado I : GA → O(a), g 7→ πa (g) = gag∗ admite secciones suaves, en el sentido del Teorema 3.3.5. Especializando este teorema para el caso de la órbita de un operador inversible autoadjunto, tomamos M = Gh A y si B1 (1) ⊂ C denota la bola unitaria abierta alredor del 1, consideramos U = {b ∈ M : σ(ba−1 ) ⊂ B1 (1)} que es un entorno abierto de a ∈ M por la semicontinuidad del espectro (Lema A.2.3). Luego, para todo elemento b ∈ U, el producto ba−1 tiene un logaritmo analítico, y por ende una raíz cuadrada analítica. Definimos s : U → GA la 1 sección s(b) = (ba−1 ) 2 . Entonces como gh(z)g−1 = h(gzg−1 ) para todo g inversible y toda h analítica en un entorno del espectro de z, tenemos ∗ 1 1 1 1 = (ba−1 ) 2 ab−1 b(a−1 b) 2 b−1 b (ba−1 ) 2 a (ba−1 ) 2 = 1 1 (ba−1 ) 2 (ba−1 )−1 (ba−1 ) 2 b = b. Esto nos dice que s es una sección para π, y por el Teorema 3.3.5 la órbita es abierta. El grupo de isotropía en este caso es Ka = {u ∈ GA : au∗ = u−1 a}. 4.6.2. La órbita coadjunta de un operador autoadjunto En el caso de actuar con el grupo unitario U de una C∗ -álgebra A, podemos considerar la órbita de un operador autoadjunto a (no necesariamente inversible). En este caso como πa (u) = uau∗ , se tiene que el grupo de isotropía Ka = {u ∈ U : ua = au} coincide con U ∩ C∗ (a) ′ donde aquí la prima denota el conmutante del álgebra generada por a. El álgebra de Lie-Banach son los antihermitianos que conmutan con a, es decir k = {x∗ = −x : xa = ax}. No se conocen buenos criterios generales para decidir si Ka ⊂ G es subgrupo de Lie-Banach y si O ⊂ Ah es subvariedad (salvo en el caso finito dimensional). Sin 4.6. Órbitas de similaridad y coadjuntas 89 embargo, mencionamos algunos resultados en ese sentido. Diremos que A es un álgebra de von Neumann inyectiva si contiene una sucesión ascendente A1 ⊂ · · · ⊂ An ⊂ An+1 ⊂ · · · A de subálgebras de dimensión finita de manera que la unión ∪n∈N An es densa en la topología SOT. Por ejemplo B(H) es inyectiva pues la identidad es límite fuerte de proyectores de rango finito. Puede probarse (ver el Teorema 4.33 en el libro de D. Beltiţǎ [17]) que si A es de von Neumann e inyectiva, entonces el álgebra de Lie-Banach se parte, un suplemento está dado por el núcleo de un proyector E : A → W ∗ (a) ′ , donde W ∗ (a) es el álgebra de von Neumann generada por a y nuevamente la prima denota conmutante. En este caso el cociente O tiene una estructura natural de variedad diferenciable para la cual π es una sumersión (ver el Teorema 3.3.2). Respecto de la inclusión O ⊂ B(H)h , puede probarse que la óbita es cerrada (esto ocurre si y sólo si tiene la topología de subespacio) si y sólo si C∗ (a) es un álgebra de dimensión finita. La prueba de este hecho puede verse en un trabajo de Esteban Andruchow y Demetrio Stojanoff [10]. 4.6.3. La Grassmanniana como la órbita de un proyector El primer ejemplo de Grassmanniana surge de considerar un proyector p = p∗ = p2 en un álgebra C∗ , y su órbita coadjunta Gr(p) = {upu∗ : u ∈ U}. donde identificamos un subespacio S ⊂ H con el único proyector ortogonal que lo tiene como rango. Como discutimos en la sección de matrices, la acción p 7→ upu∗ es simplemente la traducción de la acción natural de “mover” el subespacio vía S 7→ u(s), es decir pu(S) = upu∗ . Veamos la prueba de esta afirmación. En primer lugar es evidente que upu∗ es un proyector, sea S ′ = ran(upu∗ ) su rango. Entonces si ξ ∈ H, ξ ∈ u(S) ⇔ u∗ ξ ∈ S ⇔ pu∗ ξ = u∗ ξ ⇔ upu∗ ξ = ξ ⇔ ξ ∈ ran(upu∗ ) = S ′ . Los contenidos de esta sección están basados en los trabajos [6, 27, 58] de Andruchow, Corach, Porta, Recht, Stojanoff et. al, pero cabe aclarar que la estructura diferenciable de la órbita de un idempotentes p2 = p en un álgebra de Banach fue estudiada en detalle con anterioridad por J. P. Holmes en [42, 43]. Asimismo, una presentación alternativa de un atlas para la Grassmanniana (en este caso vista como subespacios del espacio de Hilbert), puede encontrarse en el trabajo [23] de K. Chung. Se recomienda también ver el trabajo [49], donde 90 El Grupo Lineal se estudian las Grassmannianas generalizadas (variedades de bandera) en un álgebra C∗ . Denotemos con P(A) = {p = p∗ = p2 : p ∈ A} al conjunto de los proyectores de A. Para q ∈ P(A), sea πq : U → P(A) la acción πq (u) = uqu∗ , y Kq = {u ∈ U : uq = qu} el grupo de isotropía de πq . La inclusión P(A) ⊂ Ah es una inclusión de subvariedades, pero no necesariamente regular ni embebida. En el resto de la sección, construimos una estructura diferenciable para P(A). Fijado p ∈ P(A), descomponemos al espacio A como suma directa de operadores p-diagonales y p-codiagonales respectivamente (ver la Observación 3.5.1): A = AD ⊕ AC con AC = {z ∈ A : pzp = (1 − p)z(1 − p) = 0} y AD = {z ∈ A : pz(1 − p) = (1 − p)zp = 0}. Denotamos con Aah a los operadores anti Hermitianos, consideramos entonces el mapa dado por π Q : AC ah ∩ {z ∈ A : kzk < /2} → P(A) Q(z) = πp ◦ exp(z) = ez pe−z . Vamos a probar que esta función (claramente suave) cubre el abierto de P(A) dado por Up = {q ∈ P(A) : kq − pk < 1}, que Q es biyectiva y su inversa es suave. Necesitamos una observación sobre proyectores primero. Observación 4.6.1. Sea p ∈ P(A). Definimos ǫp = 2p − 1, entonces ǫp es una simetría, es decir ǫp = ǫ∗p = ǫ−1 p . Esto es porque ǫ2p = (2p − 1)(2p − 1) = 4p − 4p + 1 = 1. 4.6. Órbitas de similaridad y coadjuntas 91 Luego ǫp es unitario y en particular isometría; observemos que si q es otro proyector y ǫq la simetría asociada entonces kǫp ǫq − 1k = k(ǫp − ǫq )ǫq k = 2kq − pk. Además, z ∈ AC ah (respecto de p), si y sólo si ǫp anticonmuta con z, es decir ǫp z = −zǫp y entonces también ǫp ez ǫp = exp(ǫp zǫp ) = e−z , luego ǫp e−z = ez ǫp . Ahora si Q es el mapa que queremos usar como carta, vemos que kQ − pk = kez ( ǫp + 1 ǫp + 1 −z )e − ( )k = 1/2ke2z ǫp − ǫp k = 1/2ke2z − 1k. 2 2 Observación 4.6.2. Por el teorema espectral, σ(e2z − 1) = e2σ(z) − 1, y como el espectro de z es puramente imaginario, tenemos que σ(e2z − 1) = {e2it − 1 : it ∈ σ(z)} = {cos(2t) − 1 + i sen(2t) : it ∈ σ(z)}. Luego p √ ke2z − 1k = 2 máx{ 1 − cos(2t) : t ∈ σ(−iz)}. p La función t 7→ 1 − cos(2t) es creciente, y como kzk = r(z), se tiene √ p ke2z − 1k = 2 1 − cos(2kzk). Así que kQ − pk < 1 si y sólo si kzk < π 2. Por otra parte, como 2Q − 1 = ez ǫp e−z = e2z ǫp , resulta e2z = (2Q − 1)ǫp . Llamando ǫQ = 2Q − 1, tenemos k(2Q − 1)ǫp − 1k = kǫQ ǫp − 1k = 2kQ − pk < 2, lo que nos dice que Q tiene una inversa dada por la función analítica Q 7→ 1/2 log((2Q − 1)ǫp ). Es decir, Q donde está definida es suave, inyectiva, y tiene inversa suave. Nos falta ver que la imagen es todo el conjunto Up = {q ∈ P(A) : kq − pk < 1}. Para ello tenemos la siguiente proposición. 92 El Grupo Lineal Proposición 4.6.3. Sea p ∈ P(A). Dado q0 ∈ O = O(p), sea U ⊂ P(A) el abierto U = {q ∈ P(A) : kq − q0 k < 1}. Entonces existe una sección local s : U → U para πq0 que es analítica (real), tal que ks(q) − 1k < 2 y para tod q ∈ U se tiene z = log(s(q)) ∈ AC ah (respecto de q0 ). En particular O ⊂ P(A) es abierto y πp : U → O es una proyección. Demostración. Supongamos primero que q0 = p. Si kq − pk < 1, entonces w = qp + (1 − q)(1 − p) = ǫq ǫp + 1 2 es inversible pues kw − 1k = kp − qk < 1 por la observación previa. Sea w = s|w| la descomposición polar a izquierda de w. Como w es inversible s es unitario y |w| es inversible, además s = w(w∗ w)−1/2 = w|w|−1 es una función analítica real. Luego s = s(q) es una función analítica real en U. Veamos que es una sección para π = πp (obviamente s(p) = 1 pues si q = p entonces w = 1). Como wp = qw, se tiene pw∗ = w∗ q, luego pw∗ w = (pw∗ )w = (w∗ q)w = w∗ (qw) = w∗ wp y entonces w∗ w conmuta con p y por ende |w| conmuta con p. De wp = qw, adjuntando deducimos que q = (w∗ )−1 pw∗ y entonces πp ◦ s(q) = sps∗ = w|w|−1 p|w|−1 w∗ = w|w|−2 pw∗ = w(w∗ w)−1 pw∗ = (w∗ )−1 pw∗ = q. Dado q0 = upu∗ ∈ O arbitrario, tomamos el abierto correspondiente U0 = {q ′ ∈ P(A) : kq ′ − q0 k < 1} = u{q ∈ O : kq − pk < 1}u∗ y la sección s0 : U0 → U dada por s0 (uqu∗ ) = us(q). Entonces πq0 ◦ s0 (uqu∗ ) = us(q)ps(q)∗ u∗ = uqu∗ lo que prueba que s0 es una sección para πq0 . 4.6. Órbitas de similaridad y coadjuntas 93 En lo que sigue, ǫ = ǫp y u = ǫq ǫ para no cargar la notación. Observemos que, como w = u+1 2 , con u unitario, entonces w es normal y además |w|2 = w∗ w = 1/4(1 + u + u∗ + 1) = 1/2 (1 + Re(u)) . Luego 1 1 1 1 s = w|w|−1 = √ (u + 1)(1 + Re(u))− 2 = √ (1 + Re(u))− 2 (u + 1), 2 2 y 1 1 s∗ = √ (u∗ + 1)(1 + Re(u))− 2 2 ∗ Entonces como ǫu = ǫq , tenemos al multiplicar la última expresión por ǫ √ 1 1 2ǫs∗ = ǫ(ǫq ǫ + 1)ǫǫ(1 + Re(u))− 2 ǫǫ = (u + 1)(1 + Re(ǫuǫ))− 2 ǫ √ 1 = (u + 1)(1 + Re(u∗ ))− 2 ǫ = 2sǫ. Es decir ǫs∗ = sǫ. Luego ks2 − 1k = ks2 ǫ − ǫk = ksǫs∗ − ǫk = 2ksps∗ − pk = 2kq − pk < 2 Con lo cual si z = 12 log(s2 ) = log(s), se tiene que kzk < ks2 − 1k. Ciertamente z es antihermitiano, pues π 2 porque ke2z − 1k = z∗ = log(s∗ ) = log(s−1 ) = − log(s) = −z. Falta ver que es p-codiagonal: ez = s = ǫs∗ ǫ = ǫe−z ǫ = exp(−ǫzǫ) y tomando logaritmos se tiene que z anticonmuta con ǫ. Corolario 4.6.4. Si p ∈ P(A), entonces el mapa dado por Q(z) = πp ◦ exp(z) = ez pe−z , con π Q : AC ah ∩ {kzk < /2} → P(A) ∩ {kq − pk < 1} = Gr(p) ∩ {kq − pk < 1}, es un difeomorfismo (analítico real), con inversa h i 1 Z(q) = log 1/√2(u + 1)(Re(u) + 1)− /2 , donde u = ǫp ǫq ∈ U. 94 El Grupo Lineal Luego P(A) es una variedad diferenciable, las componentes conexas son las órbitas Gr(pi ) de ciertos pi ∈ P(A), que resultan abiertas por la existencia de las secciones locales construidas en la proposición previa. Veamos cual es el rango de Q∗0 para saber quién es el espacio tangente en un p ∈ P(A). Como exp∗0 = id, sólo hay que estudiar el mapa πp . Observemos que πp : U → P(A) ⊂ Ah . Además, si z∗ = −z entonces d d tz π (e ) = etz pe−tz = zp − pz. p dt t=0 dt t=0 Es decir, π∗ = (πp )∗1 toma valores en operadores p-codiagonales. Pero no es difícil ver que el rango de π∗ coincide con los operadores p-codiagonales de Ah : por ejemplo, si v ∈ Ah es p-codiagonal, podemos tomar z = vp − pv ∈ Aah y entonces π∗ (z) = (vp − pv)p − p(vp − pv) = vp − 0 − 0 + pv = v pues pvp = 0 y (1 − p)v(1 − p) = 0. Es decir Tp P(A) = ran(π∗ ) = AC h = {v ∈ Ah : pv(1 − p) = 0}, que tiene un suplemento natural dado por los hermitianos diagonales AD h = {v ∈ Ah : (1 − p)v(1 − p) = pvp = 0}. Por otra parte, ker(π∗ ) = AD ah = {z ∈ Aah : zp = pz}, tiene también un suplemento natural, que son los elementos antihermitianos p-codiagonales, es decir AC ah = {z ∈ Aah : (1 − p)zp = 0}. Entonces el Teorema de la Función Implícita (Teorema 1.5.5) nos dice que Kp ⊂ U es una subvariedad regular. Por otra parte (Teorema 2.4.2) existe un abierto V ⊂ U tal que el pedazo de la órbita O = Gr(p) dado por πp (V) ⊂ Ah es subvariedad regular. Si tenemos en cuenta la proposición previa sobre las secciones suaves para O, este abierto V es simplemente √ π 2, ǫu∗ = uǫ}. V = exp AC ah ∩ {kzk < /2} = {u ∈ U : ku − 1k < Sin embargo, con las cuentas que ya hicimos podemos probar el siguiente teorema que es más fuerte. 4.A. Problemas 95 Teorema 4.6.5. Sea P(A) ⊂ Ah con la topología de subespacio. Entonces la estructura diferenciable que introdujimos usando Q induce una topología en P(A) que coincide con la heredada. Demostración. La existencia de secciones suaves s : P(A) → U prueba que πp : U → P(A) es abierta. Y según observamos π∗ se parte tanto en rango como en núcleo, usando la descomposición en operadores p-diagonales y p-codiagonales respectivamente. Entonces el criterio de Raeburn (Lema 3.3.6) nos asegura que P(A) ⊂ Ah es una subvariedad regular que hace de π una sumersión. 4.A. Problemas 4.I. Si A es un álgebra de Banach, probar que para todo v, w ∈ A se verifica Z1 1 − e−adv w. e−tadv dtw = adv 0 4.II. Si F, G son funciones enteras y ρF , ρG denotan los respectivos órdenes, probar que ρF+G , ρFG ≤ máx{ρF , ρG }. Probar que sen(z), cos(z), sen(z) z , tan(z) 1−ez z , z 4.III. Probar que log(ev ew ) = v + función entera dada por g(λ) = 1 + R1 0 tienen orden menor o igual a uno. g(etadv etadw )wdt, con g : C → C la X (−1)n+1 (λ − 1)n . n(n + 1) n≥1 4.IV. Desarrollando (etadv etadw − 1)n−1 en serie, probar la fórmula de Dynkin para BCH(v, w) dada por X (−1)n+1 1 [v(i1 ) , w(ji ) , · · · , v(in ) , w(jn ) ] n (i1 + j1 ) + · · · + (in + jn ) i1 !j1 ! · · · in !jn ! n≥1 donde la suma es sobre las 2n-uplas (i1 , · · · , in , j1 , · · · , jn ) tales que ik + jk ≥ n. 4.V. Si G es un grupo topológico, m : G × G → G denota el producto y V es un entorno abierto de e ∈ G, tomamos W ⊂ V abierto tal que Ady−1 (W) ⊂ V. Probar que si h, h ∈ xW, yW respectivamente entonces m(h, h) = Lxy ◦ mV×V ◦ (Ady−1 × id) ◦ (Lx−1 × Ly−1 )(h, h). 4.VI. Sea A una C∗ -álgebra. 96 El Grupo Lineal Probar que si a ∈ A es normal y σ(a) es un punto, entonces a es un múltiplo de la identidad. Si u ∈ A, probar que u es unitario si y sólo si u es normal y σ(u) ⊂ S1 . Probar que x∗ = x si y sólo si x es normal y σ(x) ⊂ R. Probar que x ∈ Herm(A) si y sólo si x∗ = x. Capítulo El Fibrado TTM Que las teorias de gauge no abelianas sean conceptualmente idénticas a las ideas en la teoría de fibrados vectoriales, desarrollada por matemáticos y sin referencia alguna al mundo físico, me maravillaba. En 1975 discutí esta impresión con Chern, y le dije “es a la vez emocionante y sorprendente, dado que ustedes los matemáticos soñaron estos conceptos de la nada“. El inmediatamente protestó: “No, no. Estos conceptos no han sido soñados. Eran naturales y bien reales.”. C.N. Yang R etomamos en este capítulo nociones generales de geometría que nos permitirán introducir, en el próximo capítulo, las ideas de conexión y geodésica. Dada una variedad diferenciable M, el fibrado TTM = T (TM) es simplemente el fibrado tangente de la variedad diferenciable TM. Si M es de clase Ck , con k ≥ 2, TTM es una variedad de clase Ck−2 . Presenta, por ser un espacio fibrado que se obtiene a partir de otro, ciertas características especiales. 97 5 98 El Fibrado TTM 5.1. Expresiones locales para TTM y sus proyecciones Siguiendo la convención introducida en la Sección 2.2.2, con una carta (U, ϕ) de M armamos una carta inducida (TU, τϕ ) de TM. Con esta carta armamos una ϕ carta (TTU, ττ ) de TTM = T (TM) copiando el procedimiento anterior. En estas coordenadas se tiene entonces U ≃ ϕ(U) ⊂ E, TU ≃ τϕ (TU) ≃ V = ϕ(U) × E ⊂ E2 , y por último ϕ TTU ≃ ττ (TTU) ≃ W = V × (E × E) = (ϕ(U) × E) × (E × E) ⊂ E4 . Es decir, si x = ϕ(p) ∈ ϕ(U), un punto genérico en TU se describe como (x, v) con v ∈ E, y un punto genérico en TTU se describe como (x, v; u, w) con x ∈ M, v ∈ Tx M, (u, w) ∈ T(x,v) TM. Con esta elección de coordenadas, el vector (u, w) es el vector tangente al punto (x, v) ∈ TU, es decir (u, w) ∈ T(x,v) TU. Aquí omitimos las identificaciones, es decir, en realidad TU es τϕ (TU). 5.1.1. Proyecciones de TTM en TM La proyección canónica πM : TM → M es (p, v) 7→ p, mientras que la proyección canónica de TTM, π = πTM : TTM → TM es en estas coordenadas el mapa (p, v; u, w) 7→ (p, v). Pero atentos, que hay otra proyección natural, que es π∗ = (πM )∗ : TTM → TM, que se obtiene diferenciando πM . Afirmamos que πTM 6= π∗ . Tomamos una curva β : I → TM, que en coordenadas locales es β(t) = (xt , vt ) ∈ U × E con x0 = x ∈ ϕ(U), v0 = v ∈ E. De acuerdo a nuestra convención, β ′ : I → T (TM) d (xt , vt )). Luego es en coordenadas locales la curva β ′ (t) = ((xt , vt ); dt β ′ (0) = (x, v; ẋ0 , v̇0 ). Observemos que xt , debe pensarse como una curva en el espacio vectorial E por ser ϕ(U) ⊂ E, con lo cual ẋ0 ∈ E, pero por otro lado si pensamos a xt como una curva en la variedad N = ϕ(U), se tiene xt′ = (xt , ẋt ) de acuerdo a nuestra convención. Diferenciando la relación π ◦ β(t) = xt en t = 0 y componiendo con la inclusión canónica obtenemos π∗(x,v) ◦ β ′ (0) = (x, ẋ0 ), que es lo mismo que decir que π∗(x,v) (x, v; ẋ0 , v̇0 ) = (x, ẋ0 ). Esto es, esencialmente π∗ (x, v; u, w) = (x, u) 5.1. Expresiones locales para TTM y sus proyecciones 99 mientras que para la proyección canónica al punto base πTM : TTM → TM se tiene como dijimos π(x, v; u, w) = (x, v). Como TTM es un fibrado vectorial sobre TM con respecto a dos proyecciones distintas, hay que tener presente a cuál fibrado nos referimos para, por ejemplo considerar la suma y el producto por escalares en el fibrado. Sin embargo, dada la presencia del isomorfismo (llamado flip canónico) que discutiremos en la Sección 5.3, esta ambigüedad no presenta mayores inconvenientes. 5.1.1.1. Fibrados verticales Hay dos fibrados verticales a considerar, el primero VTM∗ ⊂ TTM es el subfibrado vectorial que en cartas se describe como VTM∗ = (x, v; 0, w), donde se sobreentiende que este debe ser un elemento de TTM; observemos que VTM∗ = ker π∗ . Asimismo, se define VTM ⊂ TTM como ker πTM , que en coordenadas locales se expresa como cuaterna del tipo (x, 0; u, w) ∈ TTM. Observación 5.1.1. Razonamos sobre la figura de la derecha: identifiquemos q ∈ M con x = ϕ(q) ∈ ϕ(U), y observemos las fibras de q en la figura. Fijado q ∈ M, la fibra sobre q es el espacio Tq M, que se representa verticalmente, pues son los V ∈ TM tales que π(V) = q. Entonces W ∈ TTM está en el fibrado vertical si y sólo si W es tangente a π−1 q = Tq M. Tv Tq M VTM∗ TM Tq M πM M q En efecto, basta considerar, en la curva β de arriba, la condición β ⊂ Tq M que se traduce como xt = cte = x, con lo cual W = β ′ (0) = (x, v; 0, v̇0 ) ∈ VTM. En esta última expresión se puede ver que, para que (x, v; 0, w) ∈ VTM∗ debe ser v y también w ∈ Tx M. Esto es, fijado x ∈ M, sobre él se hallan dos copias (independientes) de Tx M. Este fibrado vectorial es de hecho isomorfo a la suma de Whitney o producto fibrado del fibrado (TM, π, M) consigo mismo: TM ⊕ TM = {(V, W) ∈ TM × TM : π(V) = π(W)}, 100 El Fibrado TTM es decir TM ⊕ TM = {((x, v), (x, w)) : x ∈ M, v, w ∈ Tx M}. El isomorfismo está implementado por el levantado vertical V : TM ⊕ TM → VTM∗ dado por V((x; v), (x, w)) = (x, v; 0, w). Observación 5.1.2. Hay un endomorfismo canónico J : TTM → VTM∗ ⊂ TTM, dado en coordenadas locales por J(x, v; u, w) = (x, v; 0, u). Observemos que si π ⊕ π∗ : TTM → (TM ⊕ TM) está dado por (π ⊕ π∗ )(x, v; u, w) = ((x, v); (x, u)), entonces J = V ◦ (π, π∗ ). Hay un campo canónico en TM a valores en VTM dado por V : TM → VTM∗ ⊂ TTM en coordenadas locales como V(x, v) = (x, v; 0, v). 5.2. Subvariedades de un espacio lineal Las construcciones de la sección previa parecen esotéricas, veamos como se presentan en subvariedades M ⊂ F de un espacio de Banach F. 5.2.1. La esfera de un espacio de Hilbert Comencemos como en otras ocasiones con la esfera unitaria S de un espacio de Hilbert real H. Recordemos que para cada p ∈ S, Tp M se identifica naturalmente con el conjunto de vectores v ∈ H tales que hv, pi = 0. Pensemos ahora en una curva β : I → TM como en la sección anterior, que nos permitió presentar el fibrado TTM. En este caso concreto la podemos pensar como una curva de pares ordenados β(t) = (pt , vt ) donde pt ∈ S, vt ∈ Tpt S ⊂ H, es decir hpt , vt i = 0 (5.1) para todo t. Siguiendo con la idea de la sección anterior, calculamos β ′ : I → TTS, y evaluando en t = 0 tenemos β ′ (0) = (p0 , v0 ; ṗ0 , v̇0 ) = (p, v; u, w) ∈ TTS 5.2. Subvariedades de un espacio lineal 101 donde (p, v) ∈ TS y (u, w) ∈ T(p,v) TS. Observemos que por construcción u = ṗ0 ∈ Tp0 S pues pt es una curva en S. Es decir, está claro como se mueven p, v, u. ¿Pero que hay de w? ¿Dónde se mueve? Derivando en t = 0 en la ecuación (5.1) obtenemos hu, vi + hp, wi = 0. (5.2) que es una condición necesaria para que (p, v; u, w) ∈ TTM. Fijados p, v, u apropiados, siempre podemos elegir algún w ∈ H de manera que se verifique la ecuación de arriba: en efecto, la ecuación ξp (w) = λ con λ = −hu, vi ∈ R y ξp : H → R la funcional lineal y continua ξp = hp, ·i tiene siempre solución para algún w ∈ H por ser ξp : H → R un epimorfismo. De hecho, el espacio de soluciones consiste del espacio afín λp ⊕ Tp S ⊂ H que tiene codimensión 1, puesto que ξp (p) = 1. Esto es razonable pues TTS se trivializa localmente como Tp S ⊕ Tp S ⊕ Tp S ⊕ Tp S = span(p)⊥ ⊕ span(p)⊥ ⊕ span(p)⊥ ⊕ span(p)⊥ . Recíprocamente, si (p, v; u, w) verifican la ecuación (5.2) y además kpk = 1, u, v ∈ Tp S, entonces la 4-upla en cuestión representa un vector en TTM en coordenadas locales. Para verlo basta construir una curva en TM cuya derivada en t = 0 coincida con este vector. Tomemos una carta Φ : W ⊂ E → H donde E es el espacio de Hilbert que modela S, de manera que Φ(0) = p ∈ S. Como u, v ∈ Tp M, existen u0 , v0 ∈ E tales que DΦ0 v0 = v, DΦ0 u0 = u. Observemos que si w ∈ H verifica la ecuación (5.2), entonces D2 Φ0 (u0 , v0 ) − w ∈ Tp S. En efecto, derivando primero respecto de s y luego respecto de t la relación siguiente hΦ(su0 + tv0 ), Φ(su0 + tv0 )i = 1 y evaluando en s = t = 0 se obtiene hD2 Φ0 (u0 , v0 ), pi + hDΦ0 u0 , DΦ0 v0 i = 0; si ahora reemplazamos hu, vi por −hp, wi se deduce que hp, D2 Φ0 (u0 , v0 ) − wi = 0 102 El Fibrado TTM que es lo que queríamos probar. En consecuencia, existe h0 ∈ E tal que DΦ0 (h0 ) = w − D2 Φ0 (u0 , v0 ). Consideremos la curva β(t) = (pt , vt ) dada por pt = Φ(tu0 ), vt = DΦtu0 (v0 + th0 ). Por construcción, se verifica pt ∈ S, vt ∈ Tpt S. Es decir, β es una curva en TS. Si la derivamos en t = 0 obtenemos β ′ (0) = (p, v; u, D2 Φ0 (u0 , v0 ) + DΦ0 (h0 )). El último término coincide con w, luego hemos probado que con las condiciones dadas, la 4-upla es en efecto un elemento en TTS. 5.2.2. Superficies de nivel Generalizando el ejemplo anterior, supongamos que la subvariedad M ⊂ F modelada por E está dada como superficie de nivel de una función g : F → G, donde E, F, G son espacios de Banach. Es decir M = {p ∈ F : g(p) = 0}, con g suficientemente regular como para asegurar que se trata en efecto de una subvariedad. Nuevamente presentamos cartas Φ : W ⊂ E → F que parametrizan localmente M, y como mencionamos anteriormente DΦx (E) = TΦ(x) M = ker DgΦ(x) . Construyamos una curva β en TM. Ponemos nuevamente β(t) = (pt , vt ) con pt ∈ M y vt ∈ Tpt M. Ahora estas condiciones se escriben así: g(pt ) = 0 y Dgpt (vt ) = 0. Nuevamente, llamando p0 = p ∈ M, v̇0 = w ∈ F, como pt ∈ M, se verifica u := ṗ0 ∈ Tp M. Diferenciando la relación de arriba en t = 0 se tiene D2 gp (u, v) + Dgp (w) = 0 (5.3) Esta condición necesaria es también suficiente, con un argumento similar al de la esfera. En efecto, la clave de la construcción de la curva con derivada prescrita está, en el caso de la esfera, en el hecho D2 Φ0 (u0 , v0 ) − w ∈ Tp M, 5.2. Subvariedades de un espacio lineal 103 siempre que p ∈ M, u = DΦ0 v0 , v = DΦ0 w0 ∈ Tp M, y suponiendo que w verifica la ecuación (5.3). En el caso general, derivando primero respecto de s y luego respecto de t la relación g ◦ Φ(su0 + tv0 ) = 0 y evaluando en s = t = 0 se obtiene Dg2p (v, u) + Dgp D2 Φ0 (u0 , v0 ) = 0; si ahora reemplazamos Dg2p (v, u) por −Dgp w, se deduce que Dgp D2 Φ0 (u0 , v0 ) − w = 0 que es lo que queríamos probar. En consecuencia, existe h0 ∈ E tal que DΦ0 (h0 ) = w − D2 Φ0 (u0 , v0 ). Consideremos la curva β(t) = (pt , vt ) dada por pt = Φ(tu0 ), vt = DΦtu0 (v0 + th0 ). Por construcción, se verifica pt ∈ M, vt ∈ Tpt M. Es decir, β es una curva en TS. Si la derivamos en t = 0 obtenemos β ′ (0) = (p, v; u, D2 Φ0 (u0 , v0 ) + DΦ0 (h0 )). El último término coincide con w, luego hemos probado que con las condiciones dadas, la 4-upla es en efecto un elemento en TTS. Observación 5.2.1. Luego (p, v; u, w) ∈ TTM si y sólo si p∈M u, v ∈ Tp M = ker Dgp w ∈ F verifica Dgp (w) = −D2 gp (u, v). Una relación -casi trivial- que usamos por el camino es la siguiente: Dg2p (u, v) + Dgp D2 Φ0 (u0 , v0 ) = 0 siempre que Φ(0) = p sea una parametrización local de M y u = DΦ0 v0 , v = DΦ0 w0 estén en Tp M. En particular, fijados u, v ∈ Tp M, w vive en una variedad lineal afín de F que se obtiene trasladando Tp M al punto k(u, v) = D2 Φ0 (u0 , v0 ). Observemos que u, v son completamente intercambiables en toda la construcción. Esto nos permite definir un isomorfismo involutivo que los intercambia. Lo haremos con total generalidad en la Sección 5.3. 104 El Fibrado TTM 5.2.2.1. Fibrados verticales en subvariedades Demos un vistazo al fibrado vertical VTM∗ ⊂ TTM que recordamos se consigue como ker π∗ , o equivalentemente como clases de curvas β : I → TM con la condición de que π ◦ β sea constante. En coordenadas eran los (x, v; u, w) ∈ TTM tales que u = 0. En la presentación de superficies de nivel, la condición u = 0 fuerza que D2 gp (0, v) = 0, luego Dgp (w) = 0. Como observamos antes esto es equivalente a que w ∈ Tp M, lo que nos dice que VTM∗ se representa en cada p ∈ M como dos copias del mismo subespacio, una por el origen (Tp M) y otra en algún sentido paralela que pasa por un punto que determinan u, v ∈ Tp M. 5.3. El flip canónico Según lo discutido en la sección anterior, (p, v; u, w) ∈ TTM si y sólo si p ∈ M, u, v ∈ Tp M y además w verifica ciertas relaciones. En el caso de superficies de nivel, estas condiciones son simétricas. Veremos que este es un hecho general que no depende de la presentación de la variedad M como superficie de nivel. Lema 5.3.1. Sea M una variedad diferenciable de orden k, con k ≥ 2. Entonces, dado p ∈ M, u, v ∈ Tp M, en coordenadas locales se tiene que (p, v; u, w) ∈ TTM ⇔ (p, u; v, w) ∈ TTM. Demostración. Alcanza con probar -trivializando con una carta- que si p ∈ M y u, v ∈ Tp M, entonces (u, w) ∈ T(p,v) TM implica que (v, w) ∈ T(p,u) TM. Para verlo, tomemos una carta (U, φ) alrededor de p y observemos que si (u, w) ∈ T(p,v) TM es porque existe una curva β(t) = (pt , vt ) con pt ∈ M, vt ∈ Tp M tal que p0 = p, v0 = v, d (ϕ ◦ pt )(0) = u, dt y además localmente la curva vt se representa como d φ(mt (s)), vt = ds s=0 donde mt es una curva en M para cada t, de manera que mt (0) = pt . De aquí se deduce que d2 w = v̇0 = (ϕ ◦ mt (s))(0, 0). dtds Construiremos una curva α(t) = (qt , wt ) ∈ TM con α(0) = (p, u) de manera que (q̇0 , ẇ0 ) = (v, w). 5.3. El flip canónico 105 Esto concluirá la prueba. Para ello, consideramos, para t pequeño, la curva qt ∈ M dada por t 7→ φ−1 (φ(pt ) + t(v − u)) que verifica q0 = p, y además d (φ ◦ qt )(0) = u + v − u = v. dt Por otra parte, podemos considerar la familia de curvas en M dadas por m̃t (s) = φ−1 [φ(mt (s)) + (t − s)(v − u)]. Observemos que m̃t (0) = qt , con lo cual su derivada en s = 0 será un vector en Tqt M para todo t, es decir d φ(m̃t (s)) ∈ Tqt M. wt := ds s=0 Luego (qt , wt ) ∈ TM, es más d wt = φ(mt (s)) − (v − u) = vt + u − v, ds s=0 con lo cual w0 = v + u − v = u. Por último, calculamos ẇ0 = d2 (ϕ ◦ m̃t (s))(0, 0) = v̇0 = w. dtds Entonces TTM tiene dos estructuras de fibrado vectorial, la primera es: (x, v; αu, βw) +π (x, v; α ′ u ′ , β ′ w ′ ) = (x, v; αu + α ′ u ′ , βw + β ′ w ′ ). es decir, pensando al punto base (x, v) ∈ TM fijo y usando la estructura de espacio vectorial de T(x,v) TM. La segunda es (x, αv; u, βw) +π∗ (x, α ′ v ′ ; u, β ′ w ′ ) = (x, αv + α ′ v ′ ; u, βw + β ′ w ′ ), donde estamos fijando el punto (x, ·; u, ·) y usando la estructura vectorial en las otras coordenadas. Análogamente se definen el producto por escalares ·1 y ·2 . El flip canónico en TTM es el isomorfismo j : TTM → TTM que intercambia estas estructuras; concretamente, en coordenadas j(x, v; u, w) = (x, u; v, w). Es un difeomorfismo involutivo es decir j2 = 1. 106 El Fibrado TTM Observación 5.3.2. Consideremos, para t ∈ R y V = (x, v) ∈ TM, la aplicación fV : R → TM dada por fV (t) = (x, tv) conocida como homotecia escalar. Diferenciando, obtenemos una aplicación (fV )∗ : R × R → TTM. Evaluando en (1, 1) conseguimos, para cada V ∈ TM, un elemento VV := (fV )∗ (1, 1) ∈ TV TM, que en en coordenadas locales es sencillamente V(x, v) = (x, v; 0, v), el campo vectorial canónico V : TM → TTM. Observemos que es un campo para las dos estructuras de TTM. También se lo conoce como campo vectorial de Liouville o campo vectorial de Euler. 5.4. Aceleraciones y 2-jets Observemos que, en términos de curvas, TM se identifica con las clases de curvas en la variedad M, donde la identificación de dos curvas que pasan por un punto dado es cuando también son iguales a primer orden, es decir, cuando tienen la misma velocidad. Podríamos decir entonces que TM es por construcción el espacio de las velocidades α ′ , donde α es una curva en M. Si observamos la construcción de TTM, lo podemos pensar como T (TM), y de acuerdo al razonamiento anterior, se trata de las clases de curvas en TM, identificadas a primer orden. Pero si pensamos que TM está dado por velocidades α ′ , entonces podemos imaginar a TTM como el espacio de las aceleraciones α ′′ , donde α es una curva en M. Más rigurosamente, identificamos dos curvas α, β en M siempre que α(0) = β(0) = p ∈ M. α ′ (0) = β ′ (0) = (p, ṗ) ∈ TM α ′′ (0) = β ′′ (0) = (p, ṗ; ṗ, p̈) ∈ TTM. La clase de equivalencia de α en p la denotamos [α ′′ ]p . Es ciertamente un elemento de TTM. Pero atención, que no todo elemento de TTM se puede representar por una curva así: si α es una curva en M, en coordenadas locales tendremos α ′ (t) = (α(t), α̇(t)) mientras que α ′′ (t) = (α ′ ) ′ (t) = (α ′ (t), α̇ ′ (t)) = (α(t), α̇(t); α̇(t), α̈(t)). 5.4. Aceleraciones y 2-jets 107 Es decir que las aceleraciones caen en el espacio de elementos que en coordenadas locales se representa como (x, v; v, w) ∈ TTM. Este es un subfibrado de TTM (pero no tiene una estructura natural de fibrado vectorial), y es el fibrado de puntos fijos del flip canónico. En presencia de una conexión ∇ en M, se le puede dar una estructura de fibrado vectorial al fibrado de aceleraciones: ver la Sección 6.3. Observemos que si f : M → N es C2 , podemos indicar con T 2 f : TTM → TTN a la diferencial segunda de f, que en coordenadas locales no es otra cosa que (p, v; u, w) 7→ (f(p), Dfp v; Dfp u, D2 fp (u, v) + Dfp (w)). Si nos restringimos al subfibrado de las aceleraciones, T 2 f las preserva: para aquellos elementos de TTM que se representan como [α ′′ ]p para alguna curva α en M, entonces T 2 f está dada simplemente por [α ′′ ]p 7→ [(f ◦ α) ′′ ]f(p) . Esto es (p, v; v, w) 7→ (f(p), Dfp v; Dfp v, D2 fp (v, v) + Dfp (w)). Esta aplicación es no lineal en el vector tangente (v, w) (Ejercicio 5.ii), lo que nos da una idea de por qué el fibrado de aceleraciones no tiene una estructura natural de fibrado vectorial. 5.4.1. 2-jets ¿Se puede pensar al fibrado TTM como clases de curvas? La respuesta es si, pero hay que considerar “curvas” de dos variables, es decir funciones dos veces diferenciables ν:I×J→ M donde I × J es algún producto de intervalos abiertos alrededor de (0, 0) ∈ R2 . Si ν = ν(s, t) verifica ν(0, 0) = p ∈ M, componiendo con una carta (U, ϕ) de M denotamos excepcionalmente ν′ = d ϕ ◦ ν, ds ν̇ = d ϕ ◦ ν. dt Entonces localmente las derivadas de ν nos dan en (s, t) = (0, 0) las cuatro combinaciones posibles: (p, ν ′ ; ν ′ , ν ′′ ) (p, ν ′ ; ν̇, ν̇ ′ ) (p, ν̇; ν̇, ν̈) (p, ν̇; ν ′ , ν̇ ′ ) 108 El Fibrado TTM Dadas dos curvas ν, τ, las identificaremos en p ∈ M siempre que los polinomios de Taylor de orden 2 de ϕ ◦ ν y de ϕ ◦ τ coinciden en p, exceptuando el término de las derivadas segundas sucesivas. Esto define clases de equivalencia [ν]p que se denominan 2-jets en M, y de hecho se identifica TTM con las clases de 2-jets mediante la aplicación dada en coordenadas como [ν]p 7→= (ν, ν ′ ; (ν, ν ′ )˙) = (p, ν ′ ; ν̇, ν̇ ′ ) en ese orden en particular. El flip canónico de TTM en esta presentación está dado por intercambiar las variables s y t en los jets (Ejercicio 5.iii). Si M ⊂ F es una subvariedad de un espacio de Banach, entonces tomamos una parametrización local Φ = iϕ−1 : W → F alrededor de p ∈ M, con W ⊂ E abierto en el espacio de Banach que modela M, y ϕ(p) = 0. Entonces podemos considerar el 2-jet en p ∈ M dado por ν(s, t) = Φ(sv0 + tu0 + stw0 + o(s2 ) + o(t2 )) ∈ M, para v0 , u0 , w0 ∈ E y s, t suficientemente pequeños. Así [ν]p 7→ (p, DΦ0 v0 ; DΦ0 u0 , DΦ0 (w0 ) + D2 Φ0 (u0 , v0 )). Comparar con la Observación 5.2.1 para el caso particular de una superficie de nivel. Observemos que en esta presentación de 2-jets surge naturalmente la noción de variación: si δ(t) = ν0 (t) = ν(0, t) es una curva en M con δ(0) = p, entonces la familia νs de curvas es una variación de δ con un extremo fijo (el punto p ∈ M). 5.A. Problemas 5.I. Dar un atlas y una estructura de fibrado vectorial para el producto fibrado TM ⊕ TM y para los fibrados verticales VTM y VTM∗ . 5.II. Probar, mediante un ejemplo concreto, que si f : M → N es dos veces diferenciable, entonces T 2 f no es una aplicación lineal. 5.III. Probar que, dada α : I × J → M dos veces diferenciable, la aplicación Ω : α(s, t) 7→ α(t, s) induce el flip canónico en TTM cuando se presenta a este fibrado como clases de equivalencia de 2-jets. Capítulo Conexiones y Sprays El cálculo tensorial es la depravación de los índices. Henri Cartan I ntroducidas las nociones elementales de variedades, sabemos cómo hacer cálculo en una variedad diferenciable M: esencialmente hay que usar cartas para pasar al contexto del espacio de Banach E que modela M, y luego usar las herramientas del cálculo -como diferenciación e integración- que estén a nuestra disposición en E. Pero todavía no sabemos cómo hacer geometría en M. ¿Qué queremos decir con esto? Dados dos puntos x, y ∈ M no tenemos definido como se moverán las cosas desde x hasta y, ni siquiera en el caso más simple cuando x, y se pueden trasladar al espacio E con la misma carta. La riqueza de la estructura de TTM nos permite presentar de forma intrínseca los conceptos necesarios. Queremos intentar contestar la siguiente serie de preguntas más o menos naturales: ¿De todas las curvas que unen dos puntos x, y ∈ M, hay alguna -o una familia- distinguida, alguna dirección natural en la cual moverse de un punto a otro? ¿Cómo trasladar un vector tangente en x a otro vector tangente en y? ¿Cómo mover una curva, superficie, etc. que pasa por x a otra figura “congruente” que pase por y? ¿Cómo medir si x e y están lejos o cerca? 109 6 110 Conexiones y Sprays ¿Cómo medir si dos vectores tangentes en x apuntan en direcciones muy disímiles? Las primeras tres preguntas, como veremos, están relacionadas con la noción de conexión en M, spray en M o derivada covariante en M, todas nociones equivalentes. La cuarta pregunta tiene que ver con la noción de métrica en M. La última pregunta está relacionada con la noción de producto escalar o métrica Riemanniana en M. Estas herramientas en principio independientes, pueden relacionarse imponiendo ciertas restricciones. Comenzamos por la noción de spray. Elegimos esta presentación porque es la más natural en el contexto infinito dimensional, y porque creemos que nos hará más fácil encarar nuestro objetivo último de esta parte, que es el teorema de Cartan-Hadamard. Dada una variedad diferenciable M, un spray en M es una manera (impuesta por nosotros, es decir, no viene dada por los datos de las cartas de M) de trasladar rígidamente vectores de un punto a otro de la variedad. Para ello, una vez fijado el spray -como dijo el peluqueroprimero se obtienen las geodésicas del spray, que es una clase distinguida de curvas sobre las cuales moverse de un punto a otro de M. Si nos dan dos puntos x, y ∈ M y una curva α que los une -es decir α : [0, 1] → M es suave, α(0) = x. α(1) = y-, veremos que el spray nos permite trasladar un vector v ∈ Tx M a lo largo de la curva para obtener un vector Pv ∈ TyM. Los puntos extremos no juegan ningún papel distinguido a lo largo de la trayectoria α, así que en realidad lo que obtendremos será un vector ξ(t) = Pt v ∈ Tα(t) M para todo t ∈ [0, 1]. No requerimos unicidad en las curvas, ni que curvas distintas nos den el mismo vector, es decir, si β es otra curva que une x con y en M, puede ocurrir -suele ocurrir- que el trasladado de v a largo de α no coincida con el trasladado de v a lo largo de β -como vectores en el espacio tangente Ty M, que es el único lugar donde tiene sentido compararlos ya que α, β podrían tocarse únicamente en x e y-. Esta noción, una vez definida apropiadamente, es lo que se conoce como transporte paralelo. Es decir, es una manera distinguida de mover vectores tangentes de un punto a otro de M a lo largo de geodésicas o curvas cualesquiera en M. El nombre proviene del siguiente ejemplo: si tomamos como M = Rn con el spray trivial, el transporte paralelo de un vector a lo largo de una recta consiste exactamente en mover el vector v ∈ Tx M hasta el vector v ′ ∈ Ty M de forma paralela, es decir sin rotarlo ni estirarlo (es esencialmente el mismo vector). 6.1. Sprays Queremos saber cuáles son las direcciones y caminos privilegiados de movimiento en la variedad M. Estas curvas son las que se conocen como geodésicas 6.1. Sprays 111 de M y como veremos, no están determinadas por la estructura diferenciable de M -las cartas- sino que hace falta un dato más para determinarlas -una conexión o spray-. Por ejemplo, en el espacio vectorial E, es lógico considerar que la trayectoria más sencilla para ir de v ∈ E hasta w ∈ E es el segmento γ : [0, 1] → E dado por γ(t) = v(1 − t) + tw = v + t(w − v). Observación 6.1.1. Una característica importante de los espacios normados E es que los segmentos son caminos cortos entre dos puntos: en efecto, si v, w ∈ E y Γ ⊂ E une v con w, entonces si S(t) = tv + (1 − t)w, Z1 Z1 L(S) = kv − wkE = kΓ (0) − Γ (1)kE = k Γ̇ dtkE ≤ kΓ̇ kE dt = L(Γ ). 0 0 Esto no quita que pueda haber otros caminos cortos, ver el ejemplo a continuación. Uno está orientado a pensar entonces que este segmento es el mejor camino porque, como vimos, es el camino más corto entre v y w. Pero en principio, en nuestra variedad no tenemos definida una métrica ni una distancia, así que vamos a postergar esas consideraciones. Además, hay otras complicaciones técnicas porque, por ejemplo, dependiendo de cómo sea la norma de E, puede haber otras curvas que no sean un segmento, con la misma longitud. Veamos un ejemplo. Ejemplo 6.1.2. Sea E = R2 , con la norma k(x, y)k1 = |x| + |y|. Sean x = (0, 0), y = (1, 1). Entonces d(x, y) = k(1, 1) − (0, 0)k1 = 1 + 1 = 2. El segmento que los une es γ(t) = (t, t), cuya velocidad (derivada) es γ̇(t) = (1, 1). Luego kγ̇k1 = 2, y obviamente Z1 L1 (γ) = kγ̇kdt = 2 = d(x, y). 0 Pero podemos tomar también la curva suave a trozos dada por (2t, 0) t ∈ [0, 1/2] β(t) = (1, 0) + (0, 2t − 1) t ∈ [1/2, 1] que une x con y en E. Su longitud es también Z 1/2 Z1 L1 (β) = k(2, 0)k1 + k(0, 2)k1 = 1 + 1 = 2. 0 1/2 112 Conexiones y Sprays Un ejemplo similar se puede armar si consideramos R2 con la norma supremo k(x, y)k∞ = máx{|x|, |y|}. En este caso se considera x = (−1, 0), y = (0, 1) y los dos caminos con la misma longitud (= 2) son: El segmento que los une. Una poligonal pasando por el punto (0, 1). Ejemplo 6.1.3. Sea E = M2 (C) (matrices 2 × 2 con coeficientes complejos), y la norma de E es la norma supremo usual, entonces se pueden armar ejemplos como los de antes usando matrices diagonales. Idem con la norma de la traza, kak1 = Tr|a|. Volviendo al caso general, también puede pensarse que un segmento γ ⊂ E en un espacio normado es el mejor camino porque la curva γ “no se dobla”. Esto es porque γ̈ = 0. En este caso la ecuación diferencial α̈(t) = 0 α(0) = v α̇(0) = w − v tiene por el teorema usual una única solución αv,w , que es el segmento γ. Esta es la noción que queremos extender a la variedad diferenciable M. Si pensamos en una superficie S ⊂ R3 , por ejemplo la esfera unitaria, queremos que la curva no se doble en un sentido más específico, pues lo que queremos distinguir son estas dos curvas, y quedarnos con la más “recta”: S q p Cuando uno intenta expresar esta idea con total generalidad, se encuentra con una dificultad: está claro que si γ es una curva en M, entonces γ ′ es una 6.1. Sprays 113 curva en TM. Pero no está claro que quiere decir en general γ ′′ = 0. Consideremos la variedad unidimensional M = S1 . Dada una curva α : I → S1 , si la reparametrizamos será esencialmente α(t) = (cos t, sen t). Observemos que, como α ′ (t) = (− sen t, cos t) y α ′′ (t) = (− cos t, − sen t) entonces α ′′ = 0 no tiene sentido pues es nunca nula. Exceptuando por supuesto el caso en el que α fuera inicialmente una curva constante, que no es muy interesante. Sin mencionar que no verifica ninguna condición inicial no trivial del tipo α ′ (0) = v ∈ Tp S. Observemos sin embargo que se verifica α ′ ⊥ α ′′ , que puede pensarse como una condición sobre la métrica (el producto escalar de R2 ), pero también puede pensarse como que α ′′ no tiene componenente tangente. Traslademos este ejemplo a la esfera unitaria S2 ⊂ R3 . Tomemos una curva de las que imaginamos “privilegiadas”, por ejemplo α(t) = (cos t, sen t, 0), que es el ecuador de la esfera. Observemos que, como antes α ′ (t) = (− sen t, cos t, 0) y α ′′ (t) = (− cos t, − sen t, 0), y nuevamente α ′′ no tiene componente tangente. En general, dada una subvariedad S ⊂ Rn , uno podría pensar que las geodésicas son aquellas curvas (de velocidad constante) en S tales que α ′′ no tiene componente tangencial a S en Rn . Esta definición es correcta y muy natural, pero tiene algunos defectos: En algunos casos es conveniente pensar que las geodésicas responden a un principio de mínima acción, es decir, minimizan alguna funcional de energía en la variedad que no es necesariamente la norma Euclídea. Como caso particular de lo anterior, podemos buscar las curvas que minimizan (al menos localmente) la distancia para alguna norma que no coincida con la norma Euclídea. No queda claro que pasa si presentamos a S como subvariedad de otra forma, es decir, pareciera que las geodésicas dependen de la inclusión concreta S ⊂ Rn , y no son algo intrínseco de la variedad S. En el caso S ⊂ E, donde ahora E es un espacio de Banach, no siempre está disponible un suplemento lineal en E para el espacio tangente Tp S -para cada p ∈ S- con lo cual la noción de “componente tangente” no está definida. 114 Conexiones y Sprays Aquí aparece la maquinaria algebraica. Lo que haremos será dar un mapa F : TM → TTM -llamado spray- para poder comparar a α ′ y α ′′ dentro del mismo espacio, y diremos que las geodésicas son las curvas que verifican F(α ′ ) = α ′′ . En el caso trivial M = E un espacio vectorial, tendremos F = 0 si queremos obtener los segmentos usuales en E. En este mapa, lo único importante es lo que hace F con la velocidad de α ′ , en el siguiente sentido: queremos que F sea una sección del fibrado (π∗ , TTM, TM) donde π∗ : TTM → TM es la proyección dada por la diferencial de la proyección canónica π : TM → M. Observación 6.1.4. ¿Cómo se ve esto en coordenadas? Recordemos que en una carta local (U, ϕ) de M, se tiene TU ≃ U × E y T (TM) ≃ (U × E) × (E × E), y si π : TU → U es π(p, v) = p, cuando movemos (p, v) ∈ TM la proyección sólo se entera del movimiento del punto base, con lo cual para la diferencial de π las variables son p y su trivialización; es decir, si escribimos un punto genérico en TTM como (p, v; u, w), donde (p, v) ∈ U × E ≃ TM y (u, w) es la correspondiente trivialización, entonces π∗ (p, v; u, w) = (p, u), Si F : TM → TTM lo describimos en estas coordenadas, se tiene en principio F(p, v) = (p, v; f1 (p, v), f2 (p, v)). Para que se verifique π∗ F = idTM debe ser f1 (p, v) = v, con lo cual F(p, v) = (p, v; v, f2 (p, v)). Observemos que F(p, v) vive en el fibrado de las aceleraciones α ′′ , que es el fibrado invariante por el flip canónico. Esta condición es indispensable para que pueda verificarse α ′′ = F(α ′ ). Lo único que importa es la última coordenada, que es la que “opera” sobre la velocidad v y la lleva al lugar donde vive la aceleración. Hay un requerimiento adicional para que F : TM → TTM sea un spray: si M es una variedad Ck , entonces TM es una variedad Ck−1 y TTM = T (TM) es una variedad Ck−2 , con lo cual M debe ser de clase Ck con k ≥ 2, y si queremos que haya -localmente al menos- única solución del problema F(α ′ ) = α ′′ , pediremos que F sea C1 . Diremos que un spray es homogéneo de grado m ≥ 0 si, en coordenadas locales, se tiene f2 (p, sv) = sm f2 (p, v) 6.1. Sprays 115 para todo (p, v) ∈ TU y s ∈ R. Si F es homogéneo de grado 2, diremos que F es un spray cuadrático o afín. En ese caso, pongamos Qp (v) := f2 (p, v), Qp : E → E, que es una forma cuadrática en v. Formalmente, dado s ∈ R, si s : E → E denota la multiplicación en cada fibra de un fibrado vectorial s : (x, v) 7→ (x, sv), denotamos con s∗ : TE → TE a su derivada y entonces un campo F : TM → TTM es un spray cuadrático si para V ∈ TM se tiene F(sV) = s∗ sF(V). Una vez fijado un spray F en la variedad M -no repito el chiste- tenemos lo que se llama una variedad diferenciable con spray (M, F). Introducida a principios del siglo 20 -aunque sin ese nombre-, la noción de spray tuvos dos épocas de gran desarrollo, la primera en los años 30 debida al trabajo de Élie Cartan, y luego en la década del ’60 donde se terminaron de establecer las bases de la teoría, por ejemplo Warren Ambrose, Richard Palais e Isadore Singer en el trabajo [2], establecen la equivalencia de la noción de spray con la de conexión afín. 6.1.1. Geodésicas Una curva α : I → M de clase C2 es una geodésica de (M, F) si α ′′ = F(α ′ ). Por el teorema de existencia y unicidad de ODEs aplicado al problema β ′ = F(β) -con β : I → TM una curva en el fibrado tangente-, esta ecuación tiene localmente solución única β : I → TM; si llamamos α = π ◦ β : I → M, entonces α es la geodésica del spray que estamos buscando (aquí π denota la proyección canónica π : TM → M), lo cual se puede verificar de la siguiente manera: observemos primero que α ′ = β, puesto que α∗ = π∗β ◦ β∗ , y componiendo con la sección canónica i(t) = (t, 1), i : I → I × R se obtiene α ′ = π∗β ◦ β ′ = (π∗β ◦ F)(β) = β que es la observación (que no es otra cosa que decir que β es la levantada canónica de α). Ahora, para ver que α es una geodésica diferenciamos (α ′ )∗ = β∗ y volvemos a componer con la sección canónica para obtener α ′′ = β ′ = F(β) = F(α ′ ) que es lo que queríamos probar. En realidad lo que estamos diciendo es que el problema original se reduce a resolver el problema de orden uno dado por A ′ = H(A) 116 Conexiones y Sprays donde A = (α, β) ∈ U × TU y H : U × TU → TU × TTU está dada por H(u, v) = (v, F(u, v)). Observemos que una condición inicial para el problema es un par p ∈ M, v ∈ Tp M, pues la curva β = α ′ toma valores en TM. Es decir, que una vez fijado el spray, para cada punto p ∈ M y cada dirección v ∈ Tp M tenemos una geodésica que pasa por p y tiene velocidad inicial v. 6.1.2. Exponencial Dado V = (p, v) ∈ TM, denotamos αV : IV ⊂ R → M a la única geodésica del spray tal que αV (0) = p, α˙V (0) = v, con IV un intervalo abierto que contiene al 0 ∈ R. Definimos el dominio de la exponencial del spray D ⊂ TM como el conjunto D = {V = (p, v) ∈ TM : 1 ∈ IV }. No es difícil probar que este conjunto es un abierto en TM que contiene a la sección nula (Ejercicio 6.iii). Definimos la exponencial del spray exp : D → M como la función diferenciable exp(p, v) = αV (1). Observemos que exp(p, 0) = p para todo p ∈ M. Pongamos Dp = {v ∈ Tp M : (p, v) ∈ D}, y denotemos expp : Dp ⊂ Tp M → M a la aplicación expp (v) = exp(p, v). Esta resulta una aplicación diferenciable que asigna 0 7→ p. Definición 6.1.5. Diremos que M es geodésicamente completa en p ∈ M si Dp = Tp M. Es decir, si las geodésicas que pasan por p se pueden prolongar para todo t ∈ R. Diremos que M es geodésicamente completa si es geodésicamente completa en p para todo p ∈ M. Por ejemplo, si M = R2 con el spray nulo F = 0, las geodésicas son las rectas y resulta completa. Sin embargo, si removemos un punto, por ejemplo p = (1, 0) ∈ R2 , entonces M = R2 − {p} no es geodésicamente completa en ningún q ∈ M, pues la recta (geodésica del spray F = 0) que comienza en q, en la dirección de p, sólo está definida para t < d(q, p). 6.2. Sprays cuadráticos o afines No vamos a lidiar con los sprays en toda generalidad, para lo que queremos hacer nos alcanza con restringirnos a aquellos que son cuadráticos. Los distingue una cualidad: las geodésicas de sprays cuadráticos son curvas de velocidad constante. Con más precisión: 6.2. Sprays cuadráticos o afines 117 Lema 6.2.1. Sea F : TM → TTM un spray cuadrático, V = (p, v) ∈ TM. Entonces 1. Si s, t ∈ R, entonces st ∈ IV si y sólo si s ∈ ItV , y además αV (st) = αtV (s). 2. Las curvas ǫ(t) = expp (tv) son las únicas geodésicas del spray. Demostración. Supongamos que st ∈ IV , esto es αV está definida en un intervalo que contiene al producto st. Sea β(x) = αV (sx), definida en [0, t] por lo menos. Derivando, tenemos (en coordenadas locales para no cargar la notación) β̇(x) = α̇V (sx)s, reemplazando x = 0 se deduce que β ′ (0) = (p, sv). Si denotamos Q = Qp = f2 (p, ·), derivando de nuevo respecto de x, se tiene β̈(x) = α̈V (sx)s2 = s2 Q(α˙V (sx)) = Q(sα˙V (sx)) = Q(β̇(x)) con lo cual β es una geodésica del spray, lo que prueba de un saque que t ∈ IsV y la identidad. Para probar la segunda afirmación, observemos que por lo que recién probamos, ǫ(t) := expp (tv) = exp(p, tv) = αp,tv (1) = αtV (1) = αV (t) de donde se deduce que ǫ es la única geodésica del spray con ǫ ′ (0) = (p, v) = V. Recíprocamente, si vale la condición del primer ítem para un spray dado y arbitrario, entonces derivando dos veces respecto de s y evaluando en s = 0 obtenemos que ′ ′′ F(tV) = F(αtV (0)) = αtV (0) = t2 αV′′ (0) = t2 F(αV′ (0)) = t2 F(V). Luego vale la recíproca del primer ítem, lo que caracteriza a los sprays cuadráticos. Observación 6.2.2. Se tiene (expp )∗0 (v) = ǫ ′ (0) = (p, v). Luego la diferencial de la exponencial en el origen es la identidad, y por ello expp es un difeomorfismo local entre abiertos alrededor de 0 ∈ Tp M y p ∈ M respectivamente. 118 6.2.1. Conexiones y Sprays Entornos normales Usando la exponencial en todo el fibrado tangente, podemos construir entornos normales W en la variedad M que nos permiten asegurar que para todo punto p ∈ W, la exponencial en p está definida en una cierta bola de radio r alrededor del origen de Tp M, y este r > 0 es el mismo para todo p ∈ W. Fijemos la norma de E, el espacio de Banach que modela M, y denotemos k · k = k · kE a la misma. Sea Br (0) la bola abierta de radio r > 0 alrededor de 0 ∈ Tp M ≃ E. Sea D ⊂ M el dominio de la exponencial de (M, F), y definamos G : D → M × M el mapa dado por G(p, v) = (p, expp (v)). Entonces en una carta, la diferencial de G en (p, 0) ∈ TM está dada por la matriz 1 0 DG(p,0) = . ⋆ 1 En particular DG(p,0) es inversible y el teorema de la función inversa nos dice que G es un isomorfismo local de un entorno de la sección nula 0TM en un entorno de la diagonal ∆M = {(p, p) : p ∈ M}. Observemos que los entornos abiertos de la sección nula en TM (en una carta) son de la pinta V ≃ U × BR (0) con U ⊂ M abierto. Teorema 6.2.3. Sea p ∈ M, y sea V ≃ U × BR (0) entorno abierto de (p, 0) ∈ TM de manera que G|V es un difeomorfismo con su imagen y U = π(V) ⊂ M es abierto. Sea W ⊂ M entorno abierto de M tal que W × W ⊂ G(V). Entonces 1. Dados x, y ∈ W, existe una única geodésica γx,y de M que los conecta con γ ⊂ U. La dependencia de γ respecto de x, y es suave. 2. Para cada x ∈ W la exponencial expx está definida por lo menos en BR (0) ⊂ Tx M y es un difeomorfismo de Br (0) en el abierto Ur (x) = expx (Br (0)) para todo r ≤ R. Además γx,y ⊂ UR (x) y en particular W ⊂ UR (x). Demostración. La existencia de la geodésica está dada por el mapa G|V , es decir consideramos G−1 (x, y) = (x, v) ∈ V y entonces (x, y) = G(x, v) = (x, expx (v)) luego y = expx (v). La unicidad es consecuencia de que G es biyectiva, y la dependencia suave de x, y es consecuencia de la suavidad de G. 6.3. Conexiones 119 Que la exponencial está definida por lo menos en BR (0) y es un difeomorfismo es nuevamente consecuencia del hecho de que G da las geodésicas y es un difeomorfismo. Por último, como γ(t) = expx (tv) con v ∈ BR (0), obviamente γ ⊂ UR (x). 6.3. Conexiones Una noción relacionada íntimamente con la de spray es la de conexión en M. Diremos que C : TM ⊕ TM → TTM es una conexión afín si C es bilineal y natural para las dos estructuras de TTM como fibrado vectorial sobre M. Más precisamente, recordemos que TM ⊕ TM representa el producto fibrado de TM con TM sobre M, mientras que pr1 , pr2 son las proyecciones naturales en cada coordenada. Entonces C debe verificar que π∗ ◦ C = pr1 y πTM ◦ C = pr2 , es decir deben conmutar los diagramas C / TTM r r r r pr1 rrrπ yrrr ∗ TM TM ⊕ TM C / TTM r r r r pr2 rrrπ yrrr TM TM ⊕ TM En coordenadas locales, se deduce que C tiene que tener la pinta ((x, v); (x, u)) 7→ (x, u; v, ΓxC (v, u)) con Γx lineal en v, u por separado. Es decir, Γ C es un operador bilineal. Evidentemente, toda conexión afín induce un spray de forma natural tomando Qp (v) = ΓpC (v, v). Es decir si ∆ : TM → TM ⊕ TM indica la inclusión diagonal ∆(x, v) = ((x, v); (x, v)), entonces F := C ◦ ∆ : TM → TTM es un spray cuadrático en M. Recíprocamente, dado un spray cuadrático F : TM → TTM en M, podemos considerar la conexión afín inducida por la forma bilineal Γ del spray, de la siguiente manera. Si Qp es la forma cuadrática asociada al spray F (con p ∈ M), recordemos que toda forma cuadrática de un espacio vectorial en otro (en este caso el mismo) define una forma bilineal Γp : E × E → E de la siguiente manera: Γp (v, u) = 1/2 [Qp (v + u) − Qp (v) − Qp (u)] . 120 Conexiones y Sprays Sean V = (p, v), W = (p, w) vectores en TM. Formalmente, C : TM⊕TM → TTM está dado por X = C(V, W) ∈ TTM donde X es la única solución de la ecuación lineal (F(V) +π∗ X) +π (F(W) +π∗ jX) = F(V + W), donde j es el flip canónico de TTM. En coordenadas locales es simplemente C((x, v); (x, w)) = (p, v; u, Qp (v + u) − Qp (v) − Qp (u)) = (p, v; u, 2Γp (v, u)). Observemos que C ◦ ∆ = 2F, pero el factor 2 es irrelevante ya que F y 2F tienen √ las mismas geodésicas; podría haberse obtenido Γ introduciendo un factor 2 en la definición de la conexión C. La presentación como sprays es la más directa para obtener las geodésicas, de hecho un spray es como un set de ecuaciones diferenciables compatibles en M. Sin embargo, tal vez la forma más honestamente geométrica de presentar el spray es vía su conexión afín asociada. Para ello veamos qué información nos da una conexión afín C : TM ⊕ TM → TTM genérica. Definimos HC = Im(C) = {C(V, W) : (V, W) ∈ TM ⊕ TM} ⊂ TTM que resulta una distribución de subespacios en TTM, es decir un subfibrado que se denomina fibrado horizontal inducido por la conexión C. De hecho se trata de una distribución vectorial para las dos estructuras vectoriales de TTM, ya que (p, v; w, Γ C (v, w)) +π (p, v; w ′ , Γ C (v, w ′ )) = (p, v; w + w ′ , Γ C (v, w + w ′ )) y (p, v; w, Γ C (v, w)) +π∗ (p, v ′ ; w, Γ C (v ′ , w)) = (p, v + v ′ ; w, Γ C (v + v ′ , w)) por ser Γ C bilineal. Un hecho fundamental de este fibrado horizontal es el siguiente: es un suplemento para el fibrado vertical en TTM. Lema 6.3.1. Sea C una conexión en M y VTM ⊂ TTM el fibrado vertical. Entonces HC ⊕ VTM = TTM y HC ⊕∗ VTM∗ = TTM como suma de Whitney sobre TM. En coordenadas, si Z = (x, v; u, w) ∈ TTM, entonces tomando ZV = (x, v; 0, w − Γ C (v, u)) ∈ VTM∗ y ZH = (x, v; u, Γ C (v, u)) ∈ HC se tiene Z = ZV +π∗ ZH y una descomposición similar se tiene para la otra estructura de fibrado sobre TM. 6.3. Conexiones 121 Demostración. Definimos ZV = Z −π∗ ZH = Z −π∗ C(V, U), con V = (x, v), U = (x, u) en TM. Que ZV ∈ VTM∗ se desprende de la Observación 5.1.1. Para ver que la suma es directa, si Z = (x, v; 0, w) = (x, v; u, Γ C (v, u)), entonces u = 0 con lo cual Γ C (v, u) = 0 por la bilinealidad, y esto nos dice que w = 0. Es decir Z = 0(x,v) que es lo que queríamos probar. Recíprocamente (Ejercicio 6.iv), es fácil ver que dada una distribución H de subfibrados de TTM que suplementen VTM, esta descomposición induce una conexión afín (y por ende un spray cuadrático) en M. Observación 6.3.2. En presencia de una conexión CM en M, es posible dotar al fibrado de aceleraciones en M de una estructura de fibrado vectorial que lo hace isomorfo a TM ⊕ TM, vía la identificación es decir en coordenadas α ′′ ↔ (α ′ , pr2 (αV′′ )), (α, α̇; α̇, α̈) ↔ ((α, α̇); (α, α̈ − Γ C (α̇, α̇)). Si N es otra variedad diferenciable, que tiene una conexión CN , entonces se puede repetir el procedimiento. Una condición suficiente para que, dada f : M → N de clase suave, la aplicación T 2 f : TTM → TTN, restringida al fibrado de aceleraciones con sus correspondientes estructuras de fibrado vectorial, sea una aplicación lineal, está dada por ∇N ◦ T 2 f = Tf ◦ ∇M con ∇ las correspondientese derivadas covariantes inducidas (ver la próxima sección). En este caso se dice que las conexiones están f-relacionadas. Es decir, con esta condición, si α es una curva en M, entonces la aplicación [α ′′ ]p 7→ [(f ◦ α) ′′ ]f(p) es una aplicación lineal para las estructuras inducidas por las conexiones. Los detalles pueden verse en un trabajo [31] de Dodson et. al. 122 6.4. Conexiones y Sprays Conexión de Koszul Toda conexión afín induce naturalmente una derivada covariante. Recordemos brevemente la definición de derivada covariante (también conocida como conexión de Koszul : es una forma R-bilineal de campos en campos, ∇ : χ(M) × χ(X) → χ(M) que verifica ∇fX (Y) = f∇X Y, ∇X (fY) = X(f)Y + f∇X Y para todo par X, Y ∈ χ(M), y toda f ∈ C1 (M). También vamos a pedir que ∇X Y − ∇Y X = [Y, X], aunque alguna definición más general no lo pone como requisito, y de hecho T (X, Y) = ∇X Y − ∇Y X − [Y, X] es la torsión de la derivada covariante. Es decir, nos restringimos a derivadas covariantes sin torsión. Observación 6.4.1. Si T es la torsión, entonces es fácil ver usando las propiedades de ∇ y del corchete de Lie que T (fX, Y) = fT (X, Y) = T (X, fY) para toda función suave f. Si definimos ∇X Y = ∇X Y − 1/2T (X, Y) = 1/2 (∇X Y + ∇Y X + [Y, X]) (6.1) podemos probar usando la propiedad mencionada que ∇ es una derivada covariante, y que T = 0, es decir que podemos obtener siempre una derivada covariante con torsión nula a partir de una dada. Dejamos como ejercicio para el lector probar que esta nueva conexión tiene las mismas geodésicas que la original. Si tenemos una conexión afín Γ , definimos localmente ∇X Y = DY(X) − Γ (X, Y). Es decir, en coordenadas, ∇X Y(p) = DYp (Xp ) − Γp (Xp , Yp ). La definición intrínseca es como sigue: dado que Y, X : M → TM son campos, consideramos Y∗ X = Y∗ ◦ X : M → TTM y X ⊕ Y : M → TM ⊕ TM. Es fácil ver que, para cada p ∈ M, Y∗ X −π Γ (X ⊕ Y)|p ∈ VTM = ker π∗ pues π∗ ◦ Y∗ = idTM y π∗ ◦ Γ = pr1 . Entonces si V : TM ⊕ TM → VTM indica el isomorfimo vertical, se tiene ∇X Y(p) = pr2 ◦ V −1 (Y∗ X −π Γ (X ⊕ Y))(p) ∈ Tp M. 6.5. Sprays canónicos 123 No es difícil ver que ∇ es una derivada covariante: ciertamente es lineal para funciones en la primer variable, y en la segunda ∇X (fY) = = D(fY)(X) − fΓ (X, Y) = Df(X)Y + fDY(X) − fΓ (X, Y) X(f)Y + f∇X Y. Recíprocamente, dada una derivada covariante en M, podemos definir localmente Γ ∇ (X, Y) = Y ′ X − ∇X Y, y es más o menos evidente que si ∇ era la derivada inducida por un spray F, entonces Γ ∇ (X, X) = F(X), es decir se recupera el spray. Pero atención: queremos definir Γ ∇ para vectores tangentes, no sólo para campos. Es necesario ver que el valor de Γ ∇ (X, Y) sólo depende del valor de los campos Y, X en el punto p ∈ M, y para ello es necesaria cierta condición de pegado que por ejemplo, se satisface si E es un Hilbert o si E tiene dimensión finita. Los detalles de esta construcción están en [47, pág. 197]. Esencialmente se requiere que la variedad M admita particiones de la unidad de clase C2 y para ello, en el caso particular en que M sea paracompacta, alcanza con que el espacio de Banach E que modela M sea separable y C2 -normal, es decir, que para todo abierto U ⊂ E exista una función ψ : E → [0, 1] de clase C2 de manera que U = {v ∈ E : ψ(v) > 0}. En particular si E es separable y su norma es de clase C2 en E − {0}, entonces E es C2 -normal. Los detalles y pruebas de estas afirmaciones pueden verse en [48, III.§6]. 6.5. Sprays canónicos En general, el nombre canónico aplicado a sprays es vago y depende mucho del contexto. En líneas generales, podemos decir que son sprays que se construyen con la estructura dada de la variedad, sin agregar elementos novedosos o elecciones particulares. Por ejemplo, a partir de diferenciales de campos. Seamos precisos, pero primero hagamos una observación. Observación 6.5.1. Si X(p) = (p, Xp ), Y(p) = (p, Yp ) son campos en M, calculamos Y∗ : TM → TTM en coordenadas: denotemos con [α] ∈ TM la clase de las curvas con α(0) = p ∈ M, α̇(0) = v ∈ Tp M, entonces Y∗ ([α]) = [Y ◦ α], es decir, poniendo Y ◦ α = (α, Yα ) y derivando Yα(t) en t = 0 obtenemos Y∗p (v) = Y∗ (p, v) = (p, Yp ; v, DYp v) ∈ TY(p) TM. 124 Conexiones y Sprays Obviamente, π∗ ◦ Y∗ = idTM por construcción (aquí π : TM → M denota la proyección canónica como antes), derivando π ◦ Y = idM . Entonces Y ′ (X)(p) = Y∗ (p, Xp ) = (p, Yp ; Xp , DYp Xp ) Dado X : M → TM un campo, tenemos X∗ : TM → TTM en coordenadas: X∗p (v) = X∗ (p, v) = (p, Xp ; v, DXp v) ∈ TX(p) TM. Para v = Xp , X∗p (Xp ) = X∗ (p, Xp ) = (p, Xp ; Xp , DXp (Xp )) ∈ TX(p) TM, lo que nos dice lo siguiente: es razonable suponer que hay algún spray en M de manera que la forma cuadrática asociada sea Qp (Xp ) = DXp (Xp ) para cualquier campo X : M → TM de clase Ck con k ≥ 1. La forma bilineal asociada en este caso sería 2Γp (Xp , Yp ) = DXp (Yp ) + DYp (Xp ), para cualquier par de campos X, Y : M → TM. La derivada covariante asociada en este caso sería ∇X Y = Y ′ X − Γ (X, Y) = Y ′ X − 1/2X ′ Y − 1/2Y ′ X = 1/2(Y ′ X − X ′ Y) = 1/2[X, Y], El problema es que no está claro si la definición que dimos es buena en el sentido de que sólo razonamos sobre campos, pero tenemos que decir como actúa el spray en cualquier V ∈ TM. Sin embargo si M = G es un grupo de Lie-Banach, se puede definir correctamente F. No lo haremos con esta generalidad, nos vamos a contentar con hacerlo para el grupo de inversibles de un álgebra de Banach, en la Sección 6.9 (Ejemplo 6.9.3). 6.6. La derivada covariante: derivar y proyectar Veamos el sentido geométrico de la idea de conexión, que era el propósito del Lema 6.3.1. Si M ⊂ F es una subvariedad de un espacio de Banach F, ya discutimos que VTM es en realidad una manera abstracta (intrínseca) de presentar los espacios tangentes a M como subespacios de un espacio más gordo. En presencia de un fibrado horizontal, lo que tenemos es, para cada punto Z = (p, z) ∈ TM, un subespacio HZ ⊂ F que suplementa VZ TM, es decir TZ TM = VZ TM ⊕ HZ , y la asignación V 7→ HV es suave. Esta noción deriva de la siguiente idea geométrica: supongamos que para cada p ∈ M ⊂ F existe un suplemento Hp ⊂ F que varía en forma suave con p. Es decir, que para todo p ∈ M, F = Tp M ⊕ Hp . 6.6. La derivada covariante: derivar y proyectar 125 Sea Ep ∈ B(F) el proyector asociado tal que ran(Ep ) = Tp M, ker(Ep ) = ran(1− Ep ) = Hp . Estamos suponiendo que p 7→ Ep es un mapa suave E : M → P(F) de M en los idempotentes de F. Notemos que, como E∗ : TM → T B(F) = B(F), entonces para p ∈ M, v ∈ Tp M, E∗p,v es un operador lineal de F en F, que depende también linealmente de v ∈ Tp M. Esta familia nos permite introducir un spray en M de la siguiente manera. Teorema 6.6.1. Dado (p, v) ∈ TM, sea F(p, v) = (p, v; v, E∗p,v v). Entonces F es un spray cuadrático en M cuyas geodésicas son las curvas de aceleración normal Eα (α ′′ ) = 0. La conexión asociada Γ : TM ⊕ TM → TTM está dada por la forma bilineal Γp (v, w) = E∗p,v w = E∗p,w v. Demostración. Para α ⊂ M con α ′ (0) = (p, v) ∈ TM, sea Et = Eα(t) . A partir de Eα̇ = α̇ deducimos, derivando en t = 0 que Ėα̇ + Eα̈ = α̈. Luego E∗p,v v = Ė0 α̇(0) = (1 − Ep )α̈(0). Veamos usando esta última expresión que F(p, v) ∈ TTM. Sea β(t) = (α(t), α̇ − tEt (α̈)) ∈ TM. Entonces β(0) = (p, v), y por otra parte β ′ (0) = (p, v; v, α̈(0) − Ep α̈(0) − 0) = F(V). Evidentemente, F es un spray cuadrático, y como F(α, α̇) = (α, α̇; α̇, (1 − E)α̈) las geodésicas de este spray son las curvas con aceleración normal. Respecto de Γ , lo que el teorema afirma es que para v, w ∈ Tp M, E∗p (v)w = E∗p (w)v. Para probarlo, consideramos cualquier curva α(s, t) ∈ M dos veces diferenciable como aplicación de R2 en M, tal que α(0, 0) = p, α ′ (0, 0) = v, α̇(0, 0) = w donde ′ denota d/ds y ˙ denota d/dt. Entonces de Eα α ′ = α ′ , derivando respecto de t conseguimos d ′ d ′ α = α. E∗α,α̇ α ′ + Eα dt dt Evaluando en s = t = 0 obtenemos E∗p,w v = (1 − Ep )α̇ ′ (0, 0), 2 2 d d y como α̇ ′ = dtds α = dsdt α, se sigue que v, w son intercambiables si uno repite el argumento comenzando con la relación Eα α̇ = α̇. 126 Conexiones y Sprays Observación 6.6.2. En general, el operador bilineal Γp : Tp M × F → F dado por Γp (v, w) = E∗p,v w es simétrico sólo cuando w ∈ Tp M (ver los ejemplos). Observación 6.6.3. Si ∇ es la derivada covariante asociada al spray F, entonces para cualquier par de campos X, Y : M → TM recordemos que ∇X Y = Y ′ X − Γ (X, Y) es como se obtiene ∇ a partir del spray. Entonces, si α ⊂ M es cualquier curva suave tal que α(0) = p, α̇(0) = Xp , derivando en t = 0 la relación Et (Yα ) = Yα (donde Et = Eα(t) como antes), deducimos que E∗p,Xp Yp + Ep (DYp Xp ) = DYp Xp , lo que nos dice que ∇X Y(p) = DYp Xp − Γp (Xp , Yp ) = DYp Xp − E∗p,Xp Yp = Ep (Y ′ X(p)), es decir ∇X Y = E(Y ′ X), luego la derivada covariante es simplemente derivar en el ambiente y proyectar al espacio tangente. Observación 6.6.4. En el caso de una subvariedad de Rm , si consideramos los suplementos dados por el producto interno, se tiene la conexión de Levi-Civita. Si la subvariedad tiene dimensión n, podemos tomar una base {ei }i=1...n ortonormal en cada espacio tangente. Denotemos con Xi a los campos definidos localmente por estos vectores: se tiene que ∇Xi Xj es nuevamente un elemento en el espacio tangente y por ende lo podemos escribir como combinación lineal de los elementos de la base: Xi′ Xj − Γ (Xi , Xj ) = ∇Xi Xj = n X k −Γij Xk , k=1 k −Γij números reales. Si α ⊂ M es una geodésica, entonces escribimos α̇ en con la base de los Xk : n X α̇ = α̇k Xk k=1 y como ∇γ̇ γ̇ = Dα α̇ = 0, tenemos α̈k = X k Γij α̇i α̇j . i,j Estos coeficientes son conocidos como símbolos de Christoffel de la conexión. 6.7. Derivada covariante y transporte paralelo 6.7. 127 Derivada covariante y transporte paralelo En general, se puede definir la derivada covariante de una curva cualquiera γ ⊂ M de la siguiente manera: se engorda la curva a un campo definido en un entorno abierto U de γ en M, que llamaremos γ̇ : U → TU, que verifique γ̇(γ(t)) = γ̇(t). Se define Dγ(t) := ∇γ̇ γ̇(γ(t)), donde ∇ es la derivada covariante del spray. No es difícil probar que esta definición es buena pues depende solamente de los valores del campo a lo largo de γ. Explícitamente, en términos del spray, se tiene Dγ = γ̈ − Γ (γ̇, γ̇). Entonces las geodésicas son las curvas que tienen derivada covariante nula. La ecuación Dγ = γ̈ − Γ (γ̇, γ̇) = 0 se conoce como ecuación de Euler del spray. 6.7.1. Derivada covariante de levantadas Una manera más concreta usando Γ de definir la derivada covariante es la siguiente: dada α : J → M una curva de clase Ck con k ≥ 2, definimos Lev(α) como el espacio de todas las levantadas de α de clase C1 , es decir curvas β ⊂ TM tales que πβ = α, donde π : TM → M es la proyección al punto base. Este conjunto es no vacío ya que (por lo menos) β = α ′ ∈ Lev(α). Además Lev(α) es un espacio lineal y un módulo sobre las funciones f : J → R con las operaciones usuales del fibrado, (α, µ) + (α, τ) = (α, µ + τ), f(α, µ) = (α, fµ). Lema 6.7.1. Si β = (α, µ) ∈ Lev(α), la aplicación Dα ′ : Lev(α) → Lev(α) dada en una carta por Dα ′ β = (α, µ̇ − Γα (α̇, µ)) (6.2) es lineal, verifica Dfα ′ β = fDα ′ β para toda función suave f (donde fα ′ está dado en una carta por (α, fα̇), y además es una derivación en el sentido siguiente: Dα ′ (fβ) = f ′ β + fDα ′ β para toda f : J → R. Además si Y : M → TM es un campo tal que Y(α(t)) = β(t) para todo t ∈ J, y X : M → TM es otro campo tal que α ′ (c) = X(α(c)) para algún c ∈ J, entonces Dα ′ β(c) = ∇X Y(α(c)). 128 Conexiones y Sprays Demostración. La prueba de que la definición no depende de la carta queda como ejercicio; que es lineal y una derivación es obvio. La última afirmación es consecuencia de la relación ∇X Y = Y ′ X − Γ (X, Y) y de µ̇ = d Yα(t) = DYα α ′ = Y ′ X. dt Diremos que β ∈ Lev(α) es α-paralelo si Dα ′ β ≡ 0, es decir si µ̇ = Γα (α̇, µ). (6.3) Al conjunto de levantadas α-paralelas lo denotamos con Par(α). Observemos que si β = α ′ = (α, α̇), se tiene Dα ′ α ′ = (α, α̈ − Γα (α̇, α̇)). Luego α ′ es α-paralela si y sólo solo si α es una geodésica del spray, es decir si verifica la ecuación de Euler. Por eso se suele decir que las geodésicas son las únicas curvas auto-paralelas. Observación 6.7.2. Es habitual denotar la derivada covariante a lo largo de α como Dt a secas, cuando se desprende del contexto cuál es la curva a lo largo de la cual se deriva. Así, por ejemplo, un geodésica se caracteriza con la ecuación Dt α ′ = 0. 6.7.2. Transporte paralelo El siguiente teorema contiene los ingredientes necesarios para definir el transporte paralelo en M. Suponemos como antes que α : J → M es por lo menos C2 . Teorema 6.7.3. Sea a ∈ J. Dado v ∈ Tα(a) M existe una única βv = (α, µv ) ∈ Par(α) tal que µv (a) = v. Si b ∈ J y P = Pab (α) : Tα(a) M → Tα(b) M denota la aplicación v 7→ µv (b), entonces P es un isomorfismo de espacios de Banach, que denominamos transporte paralelo a lo largo de α. Además, para todo c ∈ J, Pcb ◦ Pac = Pab . Demostración. Consideramos la ecuación (6.3), que es esencialmente una ecuación del tipo µ̇(t) = A(t)µ(t) con el operador A(t) = Γα(t) (α̇(t), ·) 6.7. Derivada covariante y transporte paralelo 129 lineal para cada t ∈ J fijo. Por el teorema de existencia y unicidad de ecuaciones ordinarias, la curva solución µv con µv (a) = v es única y nos da la curva βv requerida, que está definida en todo J porque la ecuación es lineal, con lo cual es globalmente Lipschitz. Considerando que el flujo de la ecuación diferencial está definido en J, entonces Pab = Pcb ◦ Pac para todo a, b, c ∈ J por propiedades generales del flujo. En particular, la aplicación Pab (α) es biyectiva entre los tangentes porque tiene una inversa que se construye de manera análoga (intercambiando a con b). Las relaciones P(λv) = λP(v), P(v + w) = P(v) + P(w) se deducen de la unicidad de la solución reemplazando en la ecuación diferencial lineal. Observación 6.7.4. Si α(t) = expp (tv), entonces es fácil ver que el transporte paralelo a lo largo de α del vector v ∈ Tp M está dado sencillamente por α̇(t), pues esta levantada verifica la ecuación diferencial del transporte con la condición inicial requerida. Observación 6.7.5. Si X, Y son campos en M y usamos α para denotar el flujo de X, entonces el transporte paralelo a lo largo de α nos permite calcular de manera natural la derivada covariante, de la siguiente manera: d P0 (α)(Yα(t) ) ∇X Y(p) = dt t=0 t donde α(0) = p ∈ M. La verificación de esta fórmula queda a cargo del lector. Observación 6.7.6. En el caso de una subvariedad M ⊂ F y una familia de suplementos Hp ⊕ Tp M = F dada por proyectores Ep , la ecuación µ̇ − Γα (α̇, µ) se traduce en µ̇ − E∗α,α̇ µ donde se sobreentiende que µ ∈ Tα M = ran(Eα ). Luego β = (α, µ) es α-paralela si y sólo si µ̇ = E∗α,α̇ µ y la ecuación de transporte paralelo desde α(0) hasta α(t) es, para v ∈ Tα(0) M, µ̇ = E∗α,α̇ µ . µ(0) = v (6.4) 130 6.8. Conexiones y Sprays El tensor de curvatura y campos de Jacobi Sea M una variedad con spray cuadrático. Introducimos la curvatura R de la variedad, junto con algunas nociones vinculadas, y dejamos para más adelante (en la sección de estructuras métricas) las interpretaciones geométricas más precisas de R. Sean X, Y, Z : M → TM campos de clase Ck , con k ≥ 2. Si ∇ es la derivada covariante inducida por el spray, definimos el tensor de curvatura R(X, Y, Z) = ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y] Z, donde [X, Y] = LX Y denota la derivada de Lie de Y en la dirección de X. Observemos que la expresión R(X, Y, Z) es un campo en M. La transformación de curvatura R(X, Y) : X (M) → X (M) está dada por R(X, Y)Z = R(X, Y, Z). Se tiene R(X, Y) = −R(Y, X). R(X, Y, Z) + R(Y, Z, X) + R(Z, X, Y) = 0. Esta última es conocida como identidad algebraica de Bianchi. Un cálculo en coordenadas muy fastidioso que dejamos como ejercicio (Ejercicio 6.ix) nos devuelve R(X, Y, Z)(p) = Γp (Xp , Γp (Yp , Zp )) − Γp (Yp , Γp (Xp , Zp )) −Γ∗p,Xp (Yp , Zp ) + Γ∗p,Yp (Xp , Zp ), donde los últimos términos involucran la derivada de la forma Γ respecto del punto base. Esta expresión nos dice que R sólo depende del valor de los campos en el punto p. Luego se puede pensar a R como una aplicación trilineal en TM × TM × TM. Es decir, dados x, y, z ∈ Tp M, definimos Rp (x, y, z) = Rp (x, y)z = Γp (x, Γp (y, z)) − Γp (y, Γp (x, z)) −Γ∗p,x (y, z) + Γ∗p,y (x, z), (6.5) Aunque está dada en coordenadas locales, la definición intrínseca es tomar tres campos X, Y, Z en M tales que Xp = x, Yp = y, Zp = z y entonces Rp (x, y, z) = R(X, Y, Z)(p) ∈ Tp M. También podemos pensar, para x, y ∈ Tp M, en el operador lineal Rp (x, y) ∈ B(Tp M). 6.8. El tensor de curvatura y campos de Jacobi 6.8.1. 131 Subvariedades de un espacio de Banach Hay que tener algún cuidado porque en principio Γ sólo está definida en Tp M × Tp M, pero en la expresión en coordenadas al distribuir quedaron expresiones del tipo Γ (v, z) con v ∈ Tp M pero z ∈ / Tp M. Para el caso de subvariedades, la Observación 6.6.2 salva esta ambigüedad: hay que usar la extensión para que el cálculo tenga sentido. Observación 6.8.1. En este caso de subvariedades con la conexión inducida por los proyectores, los términos que involucran la derivada de Γ respecto del punto base se cancelan, es decir −Γ∗p,x (y, z) + Γ∗p,y (x, y) = 0. En efecto, si Ep (p ∈ M ⊂ F) es la familia de proyectores con rango Tp M, como Γp (y, z) = E∗p,y z, tomando p = pt tal que p0 = p y ṗ0 = x, se deduce que Γ∗p,x (y, z) = D2 Ep (x, y)z y con un argumento similar, Γ∗p,y (x, z) = D2 Ep (y, x)z. Asumiendo que todas las aplicaciones son dos veces diferenciables, se tiene la conclusión. Entonces las fórmulas de la curvatura para subvariedades de un espacio de Banach son: Rp (x, y, z) = = 6.8.2. Γp (x, Γp (y, z)) − Γp (y, Γp (x, z)) [E∗p,x E∗p,y − E∗p,y E∗p,x ] z. (6.6) Campos de Jacobi Dada α ⊂ M una geodésica, diremos que γ ∈ Lev(α) es una levantada de Jacobi o campo de Jacobi si verifica la ecuación diferencial D2α ′ γ = R(α ′ , γ)α ′ . Esta es una ecuación de segundo orden lineal, luego para cada V = (p, v), W = (p, w) con v, w ∈ Tp M existe una única levantada de Jacobi γ = γV,W tal que γv,w (0) = V, Dα ′ γv,w (0) = W. En coordenadas, llamando γ = (α, η), iterando (6.2) y comparando con la ecuación de R en (6.5) obtenemos η̈ = d Γα (α̇, η) + Γα (α̇, η̇) − Γα (Γα (α̇, α̇), η), dt 132 Conexiones y Sprays usando la identidad α̈ = Γα (α̇, α̇), obtenemos η̈ = d Γα (α̇, η) + Γα (α̇, η̇) − Γα (α̈, η), dt (6.7) que es una genuina ecuación diferencial lineal de segundo orden en η. Denotemos p = α(0), z = α̇(0). Luego para cada para v, w ∈ Tp M, existe una única solución ηv,w tal que ηv,w (0) = v, Dη(0) = η̇v,w (0) − Γp (v, z) = w. Observación 6.8.2. En el caso particular en el que v = 0, denotaremos ηw = η0,w . Entonces las condiciones iniciales se reescriben así ηw (0) = 0, η̇w (0) = w. Mayormente usaremos estos campos de Jacobi con v = 0. Si además w = α̇(0), entonces es fácil ver usando (6.7) que ηw (t) = tα̇(t). Dada α : [a, b] → M una curva dos veces derivable, una variación de α es una función ν : J × [a, b] → M dos veces diferenciable con 0 ∈ J ⊂ R, de manera que ν(0, t) = α(t) para todo t ∈ [a, b]. Es usual denotar αs (t) = ν(s, t) para pensar en la familia de curvas {αs }s∈J definidas en [a, b] con α0 = α. Si αs son geodésicas para todo s ∈ J, diremos que ν es una variación por geodésicas. Si αs (a) = α(a) y αs (b) = α(b) para todo s ∈ J, diremos que ν es una variación de extremos fijos. La relevancia de los campos de Jacobi es evidente a partir del próximo teorema, que establece que todo campo de Jacobi se obtiene derivando una variación por geodésicas y viceversa. Teorema 6.8.3. Sea α : [a, b] → M una geodésica. 1. Si ν : J × [a, b] → M es una variación por geodésicas de α en M, entonces η : [a, b] → TM dada por d d η(t) = αs (t) ν(0, t) = ds ds s=0 es un campo de Jacobi a lo largo de α. 2. Si α está parametrizada por longitud de arco y η es un campo de Jacobi a lo largo de α, entonces existe ǫ > 0 y una variación de α por geodésicas ν : (−ǫ, ǫ) × [a, b] → M tal que η(t) = d ν(0, t). ds 6.8. El tensor de curvatura y campos de Jacobi 133 Demostración. Supongamos que ν = ν(s, t) es una variación de geodésicas, y como siempre denotemos con ′ a la derivación d/ds, y con ˙ a la derivación d/dt. Pongamos η = ν ′ . Luego η̇ = ν̇ ′ , con lo cual Dν̇ η = ν̇ ′ − Γ (ν̇, ν ′ ) = Dν ′ η, mientras que η̈ = ν̈ ′ = d ′ Γ (ν̇, ν̇) = Γα,η (α̇, α̇) + 2Γα (η̇, α̇), ds pues para cada s fijo, ν(s, t) es una geodésica. Computando D2 η y usando estas relaciones, se deduce directamente de la expresión local para R -fórmula (6.5)que η es un campo de Jacobi. Recíprocamente, si η es un campo de Jacobi a lo largo de la geodésica α, ponemos p = α(0), v = α̇(0), w = Dα ′ η(0). Sea β = β(s) la única geodésica del spray con β(0) = p, β ′ (0) = η(0). Tomamos ξ(s) = P0s (β)(v + sw). Luego ξ(0) = v y w = Dβ ′ ξ = ξ ′ − Γβ (β ′ , ξ). Como ξ(s) ∈ Tβ(s) M, entonces αs (t) = ν(s, t) = expβ(s) (tξ(s)) es una variación de geodésicas, y además α0 (t) = expp (tv) = α(t), luego αs es una variación de α. Por el ítem previo, d µ(t) = αs (t) ds s=0 es un campo de Jacobi a lo largo de α. Resta ver que coincide con η, y por unicidad alcanza ver que verifica las mismas condiciones iniciales. Claramente µ(0) = β ′ (0) = η(0). Por otra parte como α˙s (0) = (expβ(s) )∗0 (ξ(s)) = ξ(s), entonces Dα ′ µ(0) = µ̇(0) − Γp (η(0), v) = ξ ′ (0) − Γp (η(0), v) = w = Dα ′ η(0). 134 Conexiones y Sprays 6.8.2.1. Campos de Jacobi versus exponencial La relación entre campos de Jacobi y la exponencial se hace explícita en el siguiente teorema: Teorema 6.8.4. Sean p ∈ M, w ∈ Tp M y α(t) = expp (tv). Sea ηw el único campo de Jacobi a lo largo de α tal que η(0) = 0, η̇(0) = Dα ′ η(0) = w. Entonces para todo t > 0 en el dominio de α, se tiene 1/t η(t) = (expp )∗tv w. En particular, w ∈ ker(expp )∗tv si y sólo si η(t) = 0. Demostración. Consideramos la variación de α por geodésicas dada por ν(s, t) = expp (t(v + sw)), y µ = α0′ el campo de Jacobi inducido; afirmamos que µ = η. Nuevamente por unicidad sólo hay que chequear las condiciones iniciales: se tiene µ(t) = (expp )∗tv (tw), fórmula que prueba todas las afirmaciones pues µ(0) = 0 y además µ̇(0) = lı́m+ µ(t)/t = w. t→0 6.9. Ejemplos de sprays En esta sección estudiamos algunos ejemplos relevantes de grupos y espacios homogéneos de grupos lineales. En cada uno de ellos introducimos un spray y calculamos todos los invariantes vinculados. 6.9.1. Espacios lineales Si M = E es un espacio de Banach, entonces TTE = E4 y podemos poner el spray trivial F = 0 (es decir, en la notación de la Observación 6.1.4, estamos eligiendo f2 = 0). Como mencionamos antes, fijados v ∈ E = M, z ∈ Tv E = E, tenemos una única solución al problema α ′′ (t) = 0, α(0) = v, α̇(0) = z, que es el segmento α(t) = v + tz. 6.9. Ejemplos de sprays 135 Observemos que está definido en todo R. La derivada covariante es simplemente ∇X Y = Y ′ X. La conexión asociada es la conexión nula, y el transporte paralelo a lo largo de una curva α ⊂ E se obtiene de la ecuación (6.3), µ̇ = 0 de donde se desprende que para v ∈ Tα(a) E = E, se tiene Pab (α)v = v. Es decir que Pv se obtiene de v moviéndolo en forma paralela a su estado inicial a lo largo de la curva α. Para algunos, esto explica el nombre. Los formas de curvatura R, R son idénticamente nulas. 6.9.2. La esfera de un espacio de Hilbert Si M = S, con S = {x ∈ H : kxk2 = hx, xi = 1}, la esfera unitaria de un espacio de Hilbert H, podemos tomar, para p ∈ S, v ∈ Tp S = span(p)⊥ el spray Fp (v) = F(p, v) = −kvk2 p. Esta es una forma cuadrática que proviene de la forma bilineal simétrica Γp (v, w) = −hv, wip. Afirmamos que este spray es el que se obtiene al derivar y proyectar (Teorema 6.6.1) usando los suplementos naturales de Tp S dados por el producto interno de H, es decir la descomposición H = Tp S ⊕ span(p). Para verlo, notemos que para p ∈ S, Ep ∈ B(H) dado por Ep (w) = w − hw, pip es el proyector ortogonal sobre Tp S. Tomando pt ∈ S y derivando en t = 0 obtenemos Γp (v, w) = E∗p,v w = −hw, vip − hw, piv (6.8) que para v = w ∈ Tp S = span(p)⊥ coincide con el spray que introdujimos. Las soluciones son las geodésicas usuales de la esfera, es decir, círculos máximos. Con mayor precisión, sea p ∈ S y tomemos cualquier q ∈ S tal que q ⊥ p. Para k ∈ R, consideremos γ(t) = cos(kt)p + sen(kt)q, (6.9) que es una curva suave en S con γ(0) = p. Entonces γ̇(t) = [− sen(kt)p + cos(kt)q]k, con lo cual kγ̇(t)k = cte = |k|, y por otra parte γ̈(t) = [cos(kt)p + sen(kt)q](−k2 ) = −k2 γ(t), 136 Conexiones y Sprays con lo cual γ verifica Fγ (γ̇) = γ̈. Si v ∈ Tp S = span(p)⊥ , poniendo q = v/kvk y k = kvk, la exponencial de la variedad expp : Tp S → S está dada entonces por γ(1), es decir sen(k) v expp (v) = cos(k)p + k La derivada covariante de este spray es ∇X Y(p) = Y ′ X(p) + hXp , Yp ip, es decir en curvas β ∈ Lev(α), Dα ′ β = β̇ + hβ, α̇iα. La conexión afín asociada está dada por la forma bilineal Γ , y su rango es span(p) que en efecto es un suplemento para Tp S. El transporte paralelo a lo largo de α ⊂ S se construye con la ecuación µ̇ = −hα̇, µiα, µ(0) = v ∈ Tα(0) S. (6.10) En general no es fácil dar una expresión explícita del transporte paralelo. Sin embargo, si γ ⊂ S es una geodésica, dada por (6.9), entonces hay una manera geométrica de presentarlo: el transporte a lo largo de γ está dado por una rotación del plano Π = span(p, q) que fija el resto del espacio. Veamos los detalles: descomponemos el espacio de Hilbert como H = span(p) ⊕ span(q) ⊕ (span(p) ⊕ span(q))⊥ . (6.11) Para v, w ∈ H, denotamos v ⊗ w ∈ B(H) al tensor elemental dado por v ⊗ w(z) = hw, ziv para z ∈ H, que resulta un operador de rango uno. Observemos que (v ⊗ w)(w ⊗ z) = kwk2 v ⊗ z para todo v, w, z ∈ H. Sea P ∈ P(B(H)) el proyector al subespacio (span(p) ⊕ span(q))⊥ . Entonces P = (p ⊗ p + q ⊗ q)⊥ y p ⊗ p + q ⊗ q + P = 1, con cada proyector P, p ⊗ p, q ⊗ q disjunto respecto del otro (es decir que los productos son nulos). Sea Ut = cos(kt)(p ⊗ p + q ⊗ q) + sen(kt)(q ⊗ p − p ⊗ q) + P. 6.9. Ejemplos de sprays 137 Entonces es fácil ver que Ut ∈ U(H), de hecho, en la representación matricial correspondiente a la descomposición (6.11), se escribe así: cos(kt) − sen(kt) 0 Ut = sen(kt) cos(kt) 0 0 0 1 y es en efecto una rotación del plano Π = span(p, q) que fija el ortogonal. Si v ∈ Tp S = Tγ(0) S, entonces P0t (γ)v = Ut v = hv, qi(− sen(kt)p + cos(kt)q) + Pv verifica la ecuación diferencial (6.10). De acuerdo a la ecuación del proyector (6.8) y la ecuación general de la curvatura para subvariedades (6.6), obtenemos Rp (x, y)z = hy, zix − hx, ziy. para p ∈ S, x, y, z ∈ Tp S = span(p)⊥ . Para simplificar las cuentas, supongamos que la geodésica α está parametrizada por longitud de arco. Entonces es fácil ver que el único campo de Jacobi η = ηv,w a lo largo de α y tal que η(0) = v, Dα′ η(0) = η̇(0) + hα̇(0), η(0)ip = w con v, w ∈ Tp S, está dado por η(t) = v cos(t) + (w − hv, qip) sen(t). 6.9.2.1. Un spray no cuadrático en la esfera Por la descripción que dimos de TTS para una esfera, sabemos que un punto (p, v; u, w) ∈ TTS si y sólo si v, u ∈ Tp S = span(p)⊥ , y w verifica w ∈ −hu, vip ⊕ span(p)⊥ . Luego es válido considerar sprays del tipo Fp (v) = −kvk2 p + vp con vp ∈ Tp S. En particular, podemos considerar Fp (v) = −kvk2 p + v, que en este caso no es homogéneo y no proviene de una forma bilineal. Los círculos máximo no son solución de α ′′ = −kα ′ k2 α + α ′ . ¿Quienes son las geodésicas de este spray? 138 6.9.3. Conexiones y Sprays El grupo de inversibles de un álgebra de Banach Si B es un álgebra de Banach (real o compleja), y G = GB es el grupo de elementos inversibles de B, con su estructura de variedad como abierto en B, podemos considerar el spray canónico F(gv) = gv2 para g ∈ GB , v ∈ B, gv ∈ Tg G. Las geodésicas del spray son los grupos a un parámetro γ(t) = getv . Si llamamos w = gv ∈ Tg G, entonces v = g−1 w y este spray se describe como F(w) = wg−1 w. Observemos que engañosa que es la notación en coordenadas. Si elegimos la carta local alrededor de g ∈ G dada por φ(h) = exp−1 (g−1 h) -definida en un entorno conveniente de g-, entonces φ◦γ(t) = tv. Luego en coordenadas γ ′ (t) = (tv, v) y con esto γ ′′ (t) = (tv, v; v, 0). Con lo cual el spray canónico en estas coordenadas es F(x, v) = (x, v; v, 0). La conexión afín está dada por Γg (v, w) = 1/2(vg−1 w + wg−1 v) para g ∈ G, v, w ∈ Tg G = gB. En particular Γ1 (v, w) = 1/2(vw + wv). La derivada covariante del spray está dada por ∇X Y(g) = Y ′ X(g) − 1/2(Xg g−1 Yg + Yg g−1 Xg ). (6.12) Para geodésicas α(t) = getv , se tiene Dα ′ β = β̇ − 1/2[βv + gvg−1 β]. Si X, Y son los campos invariantes a izquierda X(g) = gv, Y(g) = gw para g ∈ G, v, w ∈ g = B, entonces derivando Y(getv ) = getv w en t = 0 obtenemos Y ′ X(g) = Y∗g (X(g)) = Y∗g (gv) = gvw. Luego ∇X Y(g) = gvw − 1/2(gvw + gwv) = 1/2g[v, w] = 1/2[X, Y](g). 6.9. Ejemplos de sprays 139 El transporte paralelo a lo largo de α ⊂ GB está dado por la ecuación µ̇ = 1/2[µα−1 α̇ + α̇α−1 µ], y si α(t) = getv es una geodésica del spray, entonces si R, L denotan los operadores multiplicar a derecha e izquierda respectivamente, µ̇ = 1/2[µv + gvg−1 µ] = 1/2[Rv + Lgvg−1 ]µ = Aµ. Luego µ(t) = etA µ0 , y como L, R conmutan entonces µ(t) = eRtv/2 eLgtvg−1/2 µ0 = egtvg tv /2 µ0 e /2 . −1 Operando con gg−1 en µ0 , obtenemos v/2 −1 v/2 g ze v Pgge (α)z = ge (6.13) ∈ Tgev G para z ∈ Tg G = gB. En particular, para g = 1, v v/2 v/2 ze P1e (α)z = e ∈ Tev G para z ∈ g = B. Si x, y, z ∈ Tg G, entonces el tensor de curvatura se calcula directamente usando la forma bilineal Γ y su expresión local (6.5), obteniéndose g−1 Rg (x, y, z) = −1/4[[g−1 x, g−1 y], g−1 z]. llamando x = gx0 , etc. para x0 , y0 , z0 ∈ g = B, se tiene g−1 Rg (x, y, z) = −1/4[[x0 , y0 ], z0 ]. (6.14) −1 Ahora tomemos la geodésica α(t) = geg tv = expg (tv). Dados z, w ∈ Tg G, −1 tomamos β(s) = gesg z = expg (sz) y consideramos el transporte paralelo s ξ(s) = P0s (β)(v + sw) = ge 2 g −1 z −1 g s (v + sw)e 2 g −1 z . De acuerdo a la construcción del Teorema 6.8.3, a partir de la variación de α dada por αs (t) = expβ(s) (tξ(s)) construimos el único campo de Jacobi η a lo largo de α tal que η(0) = z, d α (t), dado por Dα ′ η(0) = w. Este es η(t) = ds s=0 s η(t) = zetg −1 v + tg exp∗tg−1 v g−1 w + 1/2[g−1 vg−1 z − g−1 zg−1 v] . 140 Conexiones y Sprays Si llamamos V = g−1 v, W = g−1 w, Z = g−1 z, se tiene g−1 η(t) = ZetV + t exp∗tV (W + 1/2[V, Z]) tV = Ze (6.15) + t exp∗tV (W) + 1/2 exp∗tV ad tV(Z). Si recordamos la fórmula de la diferencial de la exponencial (Lema 4.1.2), como F(λ)λ = 1−e−λ , se simplifican los términos ZetV . Llamando µ = α−1 η se obtiene la expresión µ(t) = 1/2[Z + e−tV ZetV ] + F(ad tV)(tW). 6.9.4. El grupo de operadores unitarios Si A es un álgebra C∗ , consideremos M = U el grupo de Lie-Banach real de operadores unitarios en A, cuya álgebra de Lie-Banach es el espacio de operadores antihermitianos Aah . Este puede pensarse como la superficie de nivel (del punto (0, 0) ∈ Ah × Ah ) de la función g : A → Ah × Ah dada por g(v) = (v∗ v − 1, vv∗ − 1). Entonces, para u ∈ U, y ∈ A, Dgu (y) = 2(Re(u∗ y), uRe(u∗ y)u∗ ). Por supuesto que Tu U = uT1 U = uAah , pero derivando nuevamente esta expresión obtenemos D2 gu (x, y) = 2(Re(x∗ y), Re(xy∗ )). Comparando con la Observación 5.2.1, se deduce que, para u ∈ U, x, y ∈ Tu U, entonces (u, x; y, w) ∈ TTM ⇔ Re(u∗ w) = −Re(y∗ x). poniendo x = ux0 , y = uy0 con x0 , y0 ∈ Aah , debe ser Re(u∗ w) = Re(y0 x0 ). El spray canónico se reduce al subgrupo U ⊂ GA , pues podemos poner, para z ∈ Tu U = uAah , Fu (z) = −uz∗ z = zu∗ z = zu−1 z, pues z = uz0 , con lo cual Fu (uz0 ) = uz20 . Por supuesto que las geodésicas del spray canónico son los grupos a un parámetro γ(t) = uetv con v∗ = −v. La derivada covariante, el transporte paralelo y el tensor de curvatura tienen entonces la misma pinta que en el ejemplo anterior (y de hecho, es la pinta en cualquier grupo de Lie-Banach con este spray canónico que hace de los grupos a un parámetro las geodésicas). Observemos que para cada u ∈ U, Tu U = uAah tiene un suplemento natural en A que es uAh . El único idempotente Eu : A → A tal que ran(Eu ) = uAah = Tu U, ker(Eu ) = uAh 6.9. Ejemplos de sprays 141 está dado por Eu (w) = 21 u[u∗ w − w∗ u]. Reemplazando u por u(t) = uetu derivando en t = 0 obtenemos ∗ v y E∗u,v w = −1/2[vw∗ u + uw∗ v]. Si w = v = uz0 ∈ Tu U, con z∗0 = −z0 , entonces E∗u,uz0 uz0 = uz20 , y entonces el Teorema 6.6.1 nos dice que el spray canónico coincide con el spray dado por los suplementos naturales. 6.9.5. Operadores positivos e inversibles ∗ Sea M = G+ A , el espacio de elementos positivos invertibles de un álgebra C . 6.9.5.1. El spray trivial + Podemos tomar para a ∈ G+ A , v ∈ Ah = T GA el spray trivial F = 0. Como G+ A ⊂ Ah es un abierto convexo, las geodésicas son los segmentos usuales γ(t) = a + tv, que en este caso no están definidas para todo t ∈ R. En efecto, si a ∈ G+ A y v ∈ Ah entonces a + tv ∈ Ah , pero además como los elementos inversibles forman un abierto, γ ⊂ G+ A para t ∈ (−t1 , t2 ), con t1 , t2 > 0 suficientemente pequeños. 6.9.5.2. El spray canónico + + También si M = G+ A , podemos tomar para a ∈ GA , v ∈ Ah = TGA el spray Fa (v) = va−1 v, lo que nos dice algo sobre la inclusión G+ A ⊂ GL(A). La conexión afín está dada por Γa (v, w) = 1/2(va−1 w + wa−1 v). Sabemos que las geodésicas del spray son las curvas a un parámetro aetz , pero este tiene que ser un elemento positivo, y en general no es cierto que producto de positivos sea positivo. Sin embargo, reescribiendo adecuadamente los grupos a un parámetro descubrimos que no hay contradicción: sean a, b ∈ G+ A , entonces , luego tiene un único logaritmo analítico autoadjunto, a−1/2 ba−1/2 ∈ G+ A v = ln(a−1/2 ba−1/2 ) ∈ Ah . Por otra parte, por el Lema A.2.2 σ(a−1 b) = σ(a−1/2 a−1/2 b) = σ(a−1/2 ba−1/2 ) ⊂ (0, +∞) 142 Conexiones y Sprays pues ambos son inversibles. Entonces a−1 b tambien tiene un logaritmo analítico (con el mismo cálculo funcional), sólo que en este caso no resulta autoadjunto. Consideremos el grupo a un parámetro γa,b (t) = aet ln(a −1 b) , entonces γa,b es una curva de inversibles que une a con b. Pero por otra parte, 1 1 1 1 1 1 γa,b (t) = a 2 a 2 exp[t ln(a−1 b)]a− 2 a 2 = a 2 exp(tv)a 2 , + luego γa,b ⊂ G+ A es la geodésica del spray que une a con b en GA . En particular: Las geodésicas que comienzan en a = 1 son los grupos a un parámetro γ(t) = etv con v ∈ Ah . Dados a, b ∈ G+ A existe una única geodésica del spray que los une, que es la curva γa,b . La exponencial expa : Ah → G+ A está dada por 1 1 1 1 expa (v) = a 2 exp(a− 2 va− 2 )a 2 . La derivada covariante del spray está dada por la expresión (6.12), para g = a ∈ G+ A . El transporte paralelo a lo largo de γa,b se calcula usando (6.13) y la reescritura de b = gev , obteniéndose 1 1 1 1 1 1 1 1 1 1 Pab (γa,b )Z = a 2 (a− 2 ba− 2 ) 2 a− 2 Za− 2 (a− 2 ba− 2 ) 2 a 2 , para Z∗ = Z; en particular 1 1 P1a (γa,b )Z = a 2 Za 2 . El tensor de curvatura se reduce del grupo de inversibles, usando (6.14), que es un operador Hermitiano siempre que x0 , y0 , z0 lo sean. Lo mismo se aplica a los campos de Jacobi η ∈ Lev(γa,b ), que con una reescritura adecuada son los mismos que los del grupo lineal. Explícitamente, a partir de la ecuación (6.15), usando la expresión de la diferencial de la exponencial en el espacio de operadores positivos (Teorema 4.5.1) se tiene que el único campo de Jacobi a lo largo de γa,b con η(0) = v, Dt η(0) = w es −1 −1 2 2 γa,b η γa,b = cosh(ad tV)Z + 1 1 1 senh(ad tV/2) tW, ad tV/2 1 1 1 donde en este caso Z = a− 2 ba− 2 , V = a− 2 va− 2 , W = a− 2 wa− 2 . 6.9. Ejemplos de sprays 6.9.6. 143 La Grassmanniana Tomemos M = Gr(p) ⊂ Ah , la Grassmanniana de un proyector p ∈ P(A), en una C∗ -álgebra A. Consideramos g : Ah → Ah dada por g(q) = q2 − q, para pensar a P(A) como superficie de nivel de g = 0. Tomando α(t) = p + tx con p ∈ P(A) y x ∈ Ah , descubrimos que Dgp (x) = px + xp − x, lo que nos dice que Tp P(A) = {x = xp + px : x∗ = x} = AC h . Tomando β(t) = p + ty con y∗ = y descubrimos derivando en t = 0 la expresión Dgβ (x), que D2 gp (x, y) = xy + yx. Comparando con la Observación 5.2.1 en la Sección 5.2, si w ∈ Ah entonces (p, x; y, w) ∈ TTM ⇔ x, y ∈ AC h, pw + wp − w = −(xy + yx). Si escribimos w = pwp + p⊥ wp⊥ + p⊥ wp + pwp⊥ , tenemos pw + wp − w = pwp − p⊥ wp⊥ y entonces pwp = −p(xy + yx)p, p⊥ wp⊥ = p⊥ (xy + yx)p⊥ . 2 Observemos que x ∈ AC h es equivalente a x = xp + px, y entonces x = 2 2 2 2 xpx + px p y también x p = px = px p con lo cual podemos considerar el spray Fp (x) = −2ǫp x2 = −2px2 p + 2xpx = −2px2 p + 2p⊥ x2 p⊥ , que corresponde a tomar x = y en la construcción del w de arriba y suponer que w es p-diagonal. La forma bilineal asociada es Γp (x, y) = −ǫp [xy + yx] para x, y ∈ Tp P(A) = AC h . Observemos que este es el spray natural proveniente del suplemento que tiene AC h en los operadores Hermitianos, que es el espacio D Ah . En efecto, si ponemos, para w ∈ Ah , Ep (w) = wp + pw − 2pwp entonces es fácil verificar que Ep es el único idempotente Ep : Ah → Ah con D ran(Ep ) = AC h = Tp P(A) y ker(Ep ) = Ah . Entonces, de acuerdo a la construcción del Teorema 6.6.1, calculamos d E∗p,v w = Eα(t) (w) = wv + vw − 2vwp − 2pwv dt t=0 = −[ǫp wv + vwǫp ] (6.16) 144 Conexiones y Sprays donde α(t) ⊂ Gr(p). En el caso en el que también w ∈ Tp P(A) = AC h , se obtiene E∗p,v w = −ǫp [wv + vw], luego nuestro spray coincide con E∗p,v v, por lo tanto es el spray canónico dado por el suplemento natural de los tangentes, y como veremos en la Sección 9.1.1.1, se trata del spray métrico de la Grassmanniana cuando a la misma le damos la métrica de subespacio inducida por la norma 1 Frobenius de los operadores, dada por kxk2 = Tr(x∗ x) /2 . Las geodésicas del spray deben verificar la ecuación α̈ = −2ǫα α̇2 , y es fácil ver que son las curvas γ(t) = etz pe−tz = πp ◦ exp(tz) = Q(tz) (6.17) C para z ∈ AC ah . Recordando que todo x = xp + px ∈ Ah = Tp P(A) se levanta C a un z ∈ Aah como z = xp − px, la exponencial de la variedad está dada por expp : AC h → P(A) con la expresión expp (x) = e(xp−px) pe−(xp−px) . la derivada covariante se deduce directamente de la expresión que dedujimos para Γ , obteniéndose Dα̇ µ = µ̇ + ǫα (α̇µ + µα̇). (6.18) para µ ∈ Lev(α) y α ⊂ P(A) de clase C2 . En consecuencia, el transporte paralelo a lo largo de α ⊂ P(A) está dado por la ecuación µ̇ = −ǫα (α̇µ + µα̇). En particular, para una geodésica γ como en (6.17), y un vector x ∈ Tp P(A), se tiene µt = P0t x = etz xe−tz . La verificación es sencilla y requiere primero comprobar que ǫα α̇ = −z y ǫα µ = −µǫα , lo que nos dice que µ ∈ Tα P(A), y además permite calcular fácilmente µ̇ = zµ − µz = −ǫα (α̇µ + µα̇). El tensor de curvatura se obtiene iterando (6.16), usando la expresión local Rp (x, y, z) = Γ (x, Γ (y, z)) − Γ (y, Γ (x, z)) y para x, y, z ∈ Tp P(A) se tiene Rp (x, y, z) = [[x, y], z]. Los campos de Jacobi a lo largo de geodésicas se pueden calcular a partir de variaciones usando el Teorema 6.8.3, como en el ejemplo del grupo lineal, y lo dejamos como ejercicio. 6.A. Problemas 145 Observación 6.9.1. La variedad de involuciones ǫ2 = 1 en un espacio de Banach complejo X fue estudiada por Z. Kovarik en [46]; los autores equipan a esta variedad de una conexión afín como en 6.18 y caracterizan las geodésicas. Luego estudian el caso particular en el que X es un espacio de Hilbert, restringiéndose a la parte autoadjunta de la variedad de involuciones, es decir a la variedad de simetrías ǫ = ǫ∗ = ǫ1 . Recordando que la asignación p 7→ 2p − 1 es un isomorfismo entre las simetrías y la Grassmanniana de B(H), eso nos remite al ejemplo recién estudiado. 6.A. Problemas 6.I. Sea M una variedad diferenciable de clase Ck , con k ≥ 2. Si F : M → TM es un spray (jF = F), probar que las siguientes condiciones son equivalentes: F es un spray cuadrático en M. Si V : TM → TTM es el campo vectorial canónico (Observación 5.3.2), entonces [V, F] = F. 6.II. Sea J : TTM → TTM el endomorfismo canónico (Observación 5.1.2), sean X, Y : TM → TTM campos. Probar que ker(J) = ran(J) = VTM∗ [V, J] = −J J[X, Y] = J[JX, Y] + J[X, JY]. 6.III. Sea (M, F) una variedad con spray. Probar que el dominio de la exponencial es un abierto en TM que contiene a la sección nula. 6.IV. Probar que dada una distribución H de subfibrados de TTM que suplementen VTM, esta descomposición induce una conexión afín (y por ende un spray cuadrático) en M. 6.V. Probar que dada una conexión ∇ en M, la torsión T definida en la Observación 6.4.1 es C∞ (M)-lineal. Probar asimismo que la fórmula de ∇ dada en (6.1) define una conexión, que esta conexión tiene torsión nula, y que las geodésicas de ∇ coinciden con las de ∇. 6.VI. * ¿El transporte paralelo de las dos conexiones del ejercicio anterior, es el mismo? ¿Y la curvatura? 146 Conexiones y Sprays 6.VII. Si α : J → M es una geodésica, probar que el transporte paralelo de α̇(0) a lo largo de α coincide con α̇(t). 6.VIII. Probar que dados X, Y campos en M y α el flujo de X con α(0) = p, se tiene d P0 (α)(Yα(t) ). ∇X Y(p) = dt t=0 t 6.IX. Probar que, en coordenadas locales, se tiene la fórmula R(X, Y, Z)(p) = Γp (Xp , Γp (Yp , Zp )) − Γp (Yp , Γp (Xp , Zp )) −Γ∗p,Xp (Yp , Zp ) + Γ∗p,Yp (Xp , Zp ), para todo X, Y, Z : M → TM y todo p ∈ M. 6.X. Sea p ∈ M = P(A), α(t) = etz pe−tz una geodésica en M con z∗ = −z que es p-codiagonal. Si v, w ∈ Tp P(A), hallar el único campo de Jacobi η a lo largo de α tal que η(0) = v, Dα ′ η(0) = w. Parte II Estructuras Métricas E n esta segunda parte del texto, estudiaremos las variedades diferenciables provistas de una métrica dada en los tangentes que permita medir curvas. Esto, es introduciremos una norma en cada espacio tangente de manera continua, y en los casos que la variedad tenga spray, intentaremos hacerlo de manera que el transporte paralelo a lo largo de geodésicas sea un isometría. Como la mayoría de los ejemplos que estudiaremos provienen de álgebras de operadores, es bueno conocer los fundamentos de la teoría de normas simétricas en álgebras de operadores, que optamos por incluir sobre el final del apéndice de álgebras de operadores de este texto. En el caso Riemanniano, dada una métrica en una variedad M, siempre es posible hallar un spray (conocido como spray métrico) compatible con la métrica, únicamente determinado por cierta condición adicional de compatibilidad, su derivada covariante asociada se conoce como derivada de Levi-Civita. En el extremo opuesto, ya que estudiaremos problemas de minimalidad de curvas, decidimos conveniente comenzar con el estudio del problema de curvas continuas y rectificables que resulten cortas o minimizantes en un espacio métrico (X, d) dado, ya que muchas de estas ideas son más claras sin la introducción de objetos adicionales como los dados por la estructura diferenciable. 147 Capítulo Espacios de Métrica Interior Una geometría no puede ser más cierta que otra; sólo puede ser más conveniente. L Henri Poincare as nociones elementales de espacios de métrica interior nos permitirán en este capítulo probar el Teorema de Hopf-Rinow en este contexto: dados dos puntos, existe una curva continua y rectificable de longitud igual a la distancia entre los puntos, siempre que el espacio sea localmente compacto. Seguimos la exposición del libro de M. Gromov [36] con algunos pequeños desvíos. 7.1. La distancia rectificable Sea (X, d) un espacio métrico. Dada una curva continua γ : [a, b] → X, y una partición π : {a = t0 ≤ t1 ≤ · · · ≤ tn+1 = b} del intervalo, definimos ℓ(γ, π) = n X d(γ(ti ), γ(ti+1 )), i=0 y a partir de allí ℓ(γ) = sup{ℓ(γ, π) : π partición finita}. Diremos que γ es rectificable si γ es continua y ℓ(γ) < +∞. Algunas propiedades relevantes: 1. Al refinar la partición, las sumas aumentan por la desigualdad triangular. 149 7 150 Espacios de Métrica Interior 2. ℓ(γ) ≥ 0 y ℓ(γ) = 0 si y sólo si γ es constante. 3. Si γ se obtiene mediante α seguida de β, entonces ℓ(γ) = ℓ(α) + ℓ(β). Observación 7.1.1. Si f : [c, d] → [a, b] es un homeomorfismo que preserva la orientación, debe ser estrictamente monótona y entonces ℓ(γ ◦ f) = ℓ(γ), es decir la longitud es invariante por reparametrizaciones. Y en realidad, la funcional ℓ está definida en las clases de equivalencia de curvas. Denotemos con C([a, b], X) al conjunto de todas las curvas continuas definidas en [a, b] a valores en X. La distancia uniforme entre dos curvas está dada de manera usual por dist(α, β) = máx d(α(t), β(t)). t∈[a,b] Es decir que le damos a C([a, b], X) la topología compacto abierta. Denotaremos con R([a, b], X) al subconjunto de las curvas rectificables. Denotaremos R = R([0, 1], X). Observación 7.1.2. La distancia uniforme no detecta reparametrizaciones, es decir, si α es una reparametrización continua de β, diremos que α ≡ β. Se le puede dar al espacio de clases (que son las que llamamos curvas) la distancia distR (α, β) = ı́nf{dist(f, g) : f ≡ α, g ≡ β, f, g ∈ R}. De esta manera se obtiene un espacio métrico donde funciones con la misma imagen se identifican a la misma curva. Proposición 7.1.3. Sean γk , γ ∈ C([0, 1], X) tales que γk → γ. Si γk ∈ R y además ℓ(γk ) ≤ M para todo k ∈ N, entonces γ ∈ R y ℓ(γ) ≤ lı́m inf ℓ(γk ), k→∞ es decir ℓ es semi-continua inferiormente. Demostración. Primero supongamos que ℓ(γ) = +∞. Dado R > 0 sea π = {0 = t0 , . . . , tn+1 = 1} una partición del [0, 1] tal que ℓ(γ, π) ≥ R. Si la partición tiene (n + 1) puntos, R y tomemos k0 (R) tal que k ≥ k0 implique d(γk , γ) < δ. Entonces, sea δ = 4(n+1) para cada i = 0..n, y cada k ≥ k0 , d(γ(ti ), γ(ti+1 )) ≤ d(γ(ti ), γk (ti )) + d(γk (ti ), γk (ti+1 )) +d(γk (ti+1 ), γ(ti+1 )) < d(γk (ti ), γk (ti+1 )) + 2δ. 7.1. La distancia rectificable 151 Sumando sobre i se tiene R ≤ ℓ(γ, π) < ℓ(γk , π) + 2(n + 1)δ ≤ ℓ(γk ) + R/2 ≤ M + R/2. Luego M ≥ R/2 para todo R > 0, lo que es absurdo y prueba que γ ∈ R. Repitiendo el argumento anterior pero ahora tomando una partición π tal que ℓ(γ, π) > ℓ(γ) − ǫ/2, ǫ y δ = 4(n+1) , se obtiene, para k ≥ k0 (ǫ), ℓ(γ) < ℓ(γk ) + ǫ, lo que prueba que ℓ es semi-continua inferiormente. Lema 7.1.4. Sean [a, b] ⊂ R y γ ∈ R([a, b], X). Entonces 1. La aplicación x : [a, b] → [0, ℓ(γ)] dada por x(t) = ℓ(γ|[a,t]) es continua y creciente. Si γ es localmente inyectiva, entonces x es estrictamente creciente. 2. Para cada x ∈ [0, ℓ(γ)] existe t ∈ [a, b] con ℓ(γ|[0,t] ) = x. El conjunto de tales t es un intervalo cerrado de [a, b], y γ es constante allí. Demostración. Veamos 1. Para a ≤ s < t ≤ b, tenemos x(t) − x(s) = ℓ(γ|[a,t]) − ℓ(γ|[a,s] ) = ℓ(γ|[s,t] ), entonces x es creciente y si γ es localmente inyectiva, no puede ser x(t) = x(s), pues acercando t a s y usando la partición trivial de [s, t] se tiene d(γ(s), γ(t)) ≤ ℓ(γ|[s,t] ) = x(t) − x(s) = 0, una contradicción. Resta ver que x es continua, sea t ∈ [a, b] y ǫ > 0. Existe, por la continuidad uniforme de γ, un δ > 0 tal que |x − y| < δ ⇒ d(γ(x), γ(y)) < ǫ/2. Como γ es rectificable, existe un número positivo (que supondremos igual a δ tomando el mínimo) de manera que si una partición π tiene todos sus puntos a distancia menor que δ, entonces ℓ(γ) < ℓ(γ, π) + ǫ/2. Sea s ∈ [a, b] tal que 0 ≤ t − s < δ. Entonces, tomando una partición π = {t0 = a, t1 , . . . , s, t, . . . , tn+1 = b} 152 Espacios de Métrica Interior de manera que todos los ti disten menos que δ, se tiene x(t) − x(s) = < ℓ(γ|[s,t]) = ℓ(γ) − ℓ(γ|[a,s]) − ℓ(γ|[t,b]) ℓ(γ, π) + ǫ/2 − ℓ(γ|[a,s] ) − ℓ(γ|[t,b]). Observando que ℓ(γ|[a,s]) ≥ ℓ(γ|[a,s], π) y lo mismo vale en el intervalo [t, b], se tiene 0 ≤ x(t) − x(s) ≤ ℓ(γ, π) + ǫ/2 − ℓ(γ|[a,s], π) − ℓ(γ|[t,b], π) = ℓ(γ|[s,t] , π) + ǫ/2 = d(γ(s), γ(t)) + ǫ/2 < ǫ/2 + ǫ/2 = ǫ. Ahora veamos 2. Como la aplicación x del ítem previo es continua, x(a) = 0, x(b) = ℓ(γ), por el teorema del valor intermedio existe el punto t tal que x(t) = ℓ(γ|[0,t] ) = x; nuevamente por la continuidad de x, el conjunto de tales t es cerrado en [a, b]. Supongamos ahora que s, t verifican x(s) = x(t), con s ≤ t. Entonces 0 = x(t) − x(s) = ℓ(γ|[s,t] ) luego γ|[s,t] es constante lo que prueba que estos puntos forman un intervalo. Observación 7.1.5. Gracias al lema previo, es posible reparametrizar las curvas rectificables por longitud de arco. Esto es, la función x : [a, b] → [0, ℓ(γ)] es una función continua. Definimos γ̃ : [0, ℓ(γ)] → X como γ̃(x) = γ(t) para cada x = x(t) ∈ [0, ℓ(γ)] con t ∈ [a, b]. Observemos que esta definición no depende del valor de t tal que x(t) = x, pues γ es constante en tales t. Se tiene ℓ(γ) = ℓ(γ̃) y además ℓ(γ̃|[x(t),x(s)]) = ℓ(γ|[t,s]) = |x(t) − x(s)|, es decir ℓ(γ̃|[x,y]) = |x − y| para todo x, y ∈ [0, ℓ(γ)]. En este caso diremos que γ̃ está parametrizada por longitud de arco. Observemos que con esta parametrización, la aplicación λ 7→ ℓ(γ̃|[0,λ] ) es estrictamente creciente. Más útil aún es una reparametrización normal, es decir con un cambio de variable lineal transformamos [0, ℓ(γ)] en el intervalo [0, 1] y podemos suponer que γ ∈ R y además ℓ(γ̃|[s,t]) = (t − s)ℓ(γ). Tomando la partición trivial de cualquier intervalo [s, t] ⊂ [0, 1] se tiene el siguiente corolario. 7.1. La distancia rectificable 153 Corolario 7.1.6. Si γ ∈ R es normal, entonces γ es Lipschitz con constante ℓ(γ), es decir d(γ(t), γ(s)) ≤ ℓ(γ)|t − s|. La pseudo-métrica asociada a la funcional ℓ está dada por dℓ (x, y) = ı́nf{ℓ(γ) : γ rectificable que une x con y}. Como siempre podemos suponer que las curvas están parametrizadas por longitud de arco, usaremos que dℓ (x, y) = ı́nf{ℓ(γ) : γ ∈ R, γ(0) = x, γ(1) = y}. Observación 7.1.7. Esta métrica dℓ induce una topología en X que puede diferir de la original, sin embargo tomando la partición trivial se ve que siempre se tiene ℓ(γ) ≥ d(x, y) para todo γ que una x con y, luego siempre vale dℓ ≥ d. Esto nos dice que, fijado ǫ > 0, Bℓǫ (x) ⊂ Bǫ (x) donde la segunda bola es con la métrica d. Luego si A es abierto en d, resulta abierto en dℓ . Luego la topología de (X, dℓ ) es más fina (tiene más abiertos) que la de (X, d). Lema 7.1.8. Las topologías de (X, d), (X, dℓ ) coinciden si y sólo si para cada x ∈ X y cada ǫ > 0 existe un d-abierto V alrededor de x de manera que todo punto allí se puede unir con x con un arco rectificable de longitud menor que ǫ. Demostración. Supongamos primero que las topologías coinciden, la afirmación es trivial pues V = Bℓǫ (x) es abierto en ambas topologías y este sirve como dabierto que verifica las hipótesis. Recíprocamente, sea C ⊂ X un dℓ -cerrado, y sea {xn } ⊂ C una sucesión que tiende a x ∈ X en la topología inducida por d. Fijado ǫ > 0, la condición nos dice que hay un entorno d-abierto V de x tal que todo punto allí dista en dℓ menos que ǫ. Luego si n ≥ n0 , xn ∈ V y por lo tanto dℓ (xn , x) < ǫ. Esto prueba que x está en C pues C es dℓ -cerrado, luego C es d-cerrado. 7.1.1. Espacios de métrica interior Una relación aún más fuerte entre las métricas es que d = dℓ , es decir que la distancia d entre dos puntos cualesquiera de X se realiza como ínfimo de curvas continuas que los unen. En ese caso diremos que (X, d) es un espacio de métrica interior. 154 Espacios de Métrica Interior Lema 7.1.9. Sea f : X → Y una función entre espacios métricos que es Lipschitz, i.e. existe C > 0 tal que d(f(x), f(y)) ≤ Cd(x, y) para todo x, y ∈ X. Entonces f se extiende de manera única a las completaciones de X, Y a una función que es Lipschitz con la misma constante. Demostración. Sean x0 en la completación de X, {xn } ∈ X tal que xn → x0 , entonces f(xn ) es de Cauchy en Y luego tiene un límite y0 en la completación de Y. Definimos f(x0 ) = y0 , veamos que no depende de la sucesión xn . Si pn → x0 es otra sucesión, se tiene d(f(pn ), f(xn )) ≤ Cd(pn , xn ) → 0 luego {f(pn )}, {f(xn )} están en la misma clase de equivalencia, y definen el mismo elemento y0 ∈ Y. De hecho d(f(xn ), f(x0 )) = lı́m d(f(xn ), f(xk )) ≤ lı́m Cd(xn , xk ) = Cd(xn , x0 ) k k si xk → x0 lo que prueba que f es continua. Por otra parte, si x0 , x1 están en la completación de X, tomemos xn → x0 , pn → x1 con xn , pn ∈ X y se tiene d(f(x0 ), f(x1 )) ≤ ≤ d(f(x0 ), f(xn )) + d(f(xn ), f(pn )) + d(f(pn ), f(x1 )) Cd(x0 , xn ) + Cd(xn , pn ) + Cd(pn , x1 ) → Cd(x0 , x1 ) lo que prueba que la extensión de f es Lipschitz con la misma constante. Para x ∈ (X, d) espacio métrico, denotaremos con Br (x) a la bola abierta de radio r alrededor de x, y con Br (x) a la bola cerrada. Para A, B ⊂ X, denotamos con d(A, B) al ínfimo de las distancias entre A y B, es decir d(A, B) = ı́nf a∈A,b∈B d(a, b) = d(B, A). Lema 7.1.10. Sea (X, d) un espacio métrico. Si X es de métrica interior, entonces dados x, y ∈ X, r1 , r2 > 0 con r1 + r2 ≤ d(x, y), se tiene d(Br1 (x), Br2 (y)) ≤ d(x, y) − r1 − r2 . Recíprocamente, si vale la condición y (X, d) es completo, entonces es de métrica interior. 7.1. La distancia rectificable 155 Demostración. Para la primera implicación, tomamos un arco continuo γ : [0, 1] → X que une x con y de longitud ℓ(γ) < d(x, y) + ǫ. Sea t1 ∈ [0, 1] el primer instante en el que γ(t1 ) ∈ Sr1 = ∂Br1 (x), sea t2 ∈ [0, 1] el primer instante, contando hacia atrás desde t = 1, en el que γ(t2 ) ∈ Sr2 = ∂Br2 (y). Entonces considerando la partición t0 = 0, t1 , t2 , t3 = 1, se tiene d(Br1 (x), Br2 (y)) ≤ = d(γ(t1 ), γ(t2 )) 2 X d(γ(ti ), γ(ti+1 )) − d(x, γ(t1 )) − d(y, γ(t2 )) i=0 ≤ ℓ(γ) − r1 − r2 < d(x, y) − r1 − r2 + ǫ. Como ǫ > 0 era arbitrario, se tiene la propiedad. Supongamos ahora que (X, d) es un espacio métrico que verifica la propiedad. Entonces no es difícil ver que (Ejercicio 7.iii), dados x, y ∈ X y ǫ > 0, existe z ∈ X tal que máx{d(x, z), d(z, y)} ≤ 1/2d(x, y) + ǫ. Sean x, y ∈ X, δ = d(x, y). Buscamos curvas continuas que unan x con y tales que ℓ(γ) ≤ δ + ǫ. Dada una sucesión {ǫk } de números positivos, existe un punto z1/2 tal que máx{d(x, z1/2 ), d(z1/2 , y)} ≤ δ/2 + ǫ1 δ/2 = δ/2(1 + ǫ1 ), y puntos z 1 , z 3 tales que máx{d(x, z 1 ), d(z 1 , z1/2 ), d(z1/2 , z 3 ), d(z 3 , y)} es me4 4 4 4 4 4 nor o igual que 1/2(δ/2 + ǫ1 δ/2) + ǫ2/2(δ/2 + ǫ1 δ/2) = δ/4(1 + ǫ1 )(1 + ǫ2 ), y así sucesivamente. Esto define una curva en los racionales diádicos, que verifica d (γ(j/2n ), γ((j + 1)/2n )) ≤ ∞ δ Y (1 + ǫk ) 2n k=1 para j = 0, . . . , 2n −1, con γ(0) = x, γ(1) = y. Elegimos la sucesión ǫk de manera que ∞ Y (1 + ǫk ) < 1 + ǫ/δ. k=1 De esta manera d (γ(j/2n ), γ((j + 1)/2n )) ≤ ∞ δ Y (1 + ǫk ) < δ/2n (1 + ǫ/δ) = 1/2n (δ + ǫ). 2n k=1 156 Espacios de Métrica Interior Si t0 = r/2n , t1 = k/2n+p son diádicos, escribiendo t0 = desigualdad triangular 2p k − r veces, se deduce que d (γ(t0 ), γ(t1 )) ≤ r2p/2n+p y aplicando la |2p k − r| (δ + ǫ) = |t0 − t1 |(δ + ǫ). 2n+p Esto prueba que γ es Lipschitz en los racionales diádicos, y por el lema previo se extiende a la completación (que es el intervalo [0, 1]) a una función continua γ a valores en X (que estamos suponiendo que es completo) con la misma constante Lipschitz. Entonces, dada cualquier partición π del intervalo [0, 1], se tiene X X ℓ(γ, π) = d (γ(ti ), γ(ti+1 )) ≤ |ti − ti+1 |(δ + ǫ) = δ + ǫ. i i Luego, ℓ(γ) ≤ δ + ǫ. 7.1.2. Geodésicas Definición 7.1.11. Diremos que una curva continua γ : [0, 1] → X en un espacio de métrica interior (X, d) es una geodésica corta si d(γ(t), γ(s)) = |t − s|ℓ(γ) para todo t, s ∈ [0, 1]. Una geodésica es una curva que es localmente una geodésica corta. Diremos que un espacio (X, d) es geodésico si es de métrica interior y para todo par de puntos existe una geodésica corta que los une. Observación 7.1.12. El típico ejemplo de geodésica es una circunferencia máxima en la esfera S2 ⊂ R3 , sólo es minimizante para puntos en ella que disten menos que π. Observación 7.1.13. Si γ une dos puntos x, y de un espacio métrico y es corta, entonces también es corta restringida a cualquier subintervalo, por la siguiente razón. De no ser así (suponiendo que no es corta entre p = γ(s) y q = γ(t)), se tendría d(x, y) = > lo que es absurdo. ℓ(γ) = ℓ(γ|[0,s] ) + ℓ(γ|[s,t]) + ℓ(γ|[t,1] ) d(x, p) + d(p, q) + d(q, y) ≥ d(x, y) 7.2. El teorema de Hopf-Rinow métrico 7.2. 157 El teorema de Hopf-Rinow métrico Pasemos a estudiar los espacios geodésicos. Primero demos algunas definiciones y resultados útiles sobre funciones continuas que aplicaremos a nuestras curvas. Definición 7.2.1. Una familia F de funciones continuas f : K → X con K compacto métrico y X métrico se dice equicontinua si dados t ∈ K y ǫ > 0, existe un entorno abierto Ut ⊂ K tal que d(f(t), f(s)) < ǫ para todo s ∈ Ut , para toda f ∈ F. La familia F se dice puntualmente precompacta si para todo t ∈ K, el conjunto {f(t) : f ∈ F} ⊂ X es precompacto. Un espacio métrico (X, d) es localmente compacto si bolas cerradas suficientemente pequeñas son compactas. Por ejemplo R2 − {0} es localmente compacto pero las bolas cerradas cercanas a (pero no centradas en) x = 0 no pueden ser compactas si tienen radio grande. 7.2.1. El teorema de Ascoli Recordemos el teorema de Ascoli para familias de funciones continuas. La demostración puede verse en el libro Topología [53, Teorema 47.1], de J. Munkres. Teorema 7.2.2 (Ascoli). Sean X un espacio métrico compacto, Y un espacio métrico. Entonces un subconjunto F ⊂ C(X, Y) es precompacto en la topología compacto abierta si y sólo si es una familia equicontinua y puntualmente precompacta. 7.2.2. El teorema de Hopf-Rinow métrico Estamos en condiciones de probar el Teorema de Hopf-Rinow con toda generalidad, este da un criterio para la existencia de curvas cortas. Aunque no formulado con este nivel de generalidad, este resultado se suele atribuir a CohnVossen, ya que aborda el problema en un trabajo del año 1935 [24]. El resultado para superficies, es ligeramente anterior (1931) y se debe a Hopf y Rinow [44] de ahí que se haya generalizado el uso de la denominación Hopf-Rinow para este tipo de teoremas de existencia de curvas cortas. 158 Espacios de Métrica Interior Teorema 7.2.3 (Hopf-Rinow). Sea (X, d) un espacio de métrica interior, x ∈ X. Entonces 1. Si X es completo, y Br (x) es compacta para todo 0 < r < ρ, entonces Bρ (x) es compacta. 2. Si además X es localmente compacto, entonces toda bola cerrada en X es compacta, y X es geodésico. Demostración. Dado x ∈ X, primero probaremos que si Br (x) es compacta para todo r ∈ [0, ρ), entonces Bρ (x) es compacta. Sea xn una sucesión de puntos en Bρ (x), extraeremos una subsucesión convergente. Podemos suponer, pasando a una subsucesión, que d(xn , x) ր ρ pues sino usamos la compacidad de las bolas más chicas. Dada cualquier sucesión de números positivos ǫk que tiende a cero, para cada k ∈ N existe n(k) ∈ N tal que d(x, xn ) > ρ − ǫk para todo n ≥ n(k). Considerando el par x, y = xn en la propiedad del Lema 7.1.10, y tomando r1 = ρ − ǫk > 0, r2 = d(x, xn ) − ρ + ǫk > 0 para n ≥ n(k), se verifica r1 + r2 = d(x, y) con lo cual la distancia entre las bolas del citado lema es nula. Luego existen, fijado n ≥ n(k) y tomando δn = ρ − d(x, xn ) > 0, elementos yn (k) ∈ Bρ−ǫk (x), z ∈ Br2 (xn ) tales que d(yn (k), z) < δn . De aquí se deduce que d(yn (k), xn ) < δn + d(z, xn ) ≤ δn + r2 = ǫk . Consideremos el conjunto compacto Y C= Bρ−ǫk (x), k∈N y allí consideramos ({yn (k)}n≥n(k) )k∈N ⊂ C. Podemos extraer una subsucesión ynj (k) convergente para todo k por la compacidad de C, esto es una subsucesión que converge en cada una de las coordenadas k ∈ N. A partir de d(ynj (k), xnj ) ≤ ǫk , haciendo tender k → ∞, descubrimos que la sucesión {xnj }j∈N es límite de ynj (k). Luego d(xnj , xnr ) ≤ d(xnj , ynj (k)) + d(ynj (k), ynr (k)) + d(ynr (k), xnr ) nos dice que {xnj }j∈N es una sucesión de Cauchy en X, convergente por la hipótesis de completitud. Ahora veamos que si X es localmente compacto, las bolas 7.2. El teorema de Hopf-Rinow métrico 159 cerradas de cualquier radio son compactas. Dado x ∈ X, si el supremo ρ para el cual Bρ (x) es compacta fuera finito, consideramos el conjunto compacto Sρ = ∂Bρ (x) y lo cubrimos con bolas abiertas de clausura compacta. Por compacidad, extraemos un subcubrimiento finito Bi y consideramos Bρ (x) ∪i Bi que es un conjunto compacto, que contiene una bola cerrada centrada en x de radio ρ ′ > ρ, que resulta compacta por ser cerrada en un compacto lo cual es una contradicción. Ahora veamos que X es geodésico. Tomemos x, y ∈ X y sea δ = d(x, y). Para cada n ∈ N existe una curva γn → X que une x con y tal que ℓ(γn ) ≤ δ + 1/n. Como podemos suponer que las γn están todas parametrizadas por longitud de arco, reparametrizando el [0, ℓ(γn )] podemos suponer que todas las curvas están parametrizadas en el intervalo [0, 1], es decir es una familia de funciones {γn } ⊂ C([0, 1], X) que verifica ℓ(γn |[s,t]) = |s − t|ℓ(γn ). No es difícil ver que gracias a esta condición la familia {γn } ⊂ C([0, 1], X) es una familia equicontinua de funciones: d(γn (t), γn (s)) ≤ ℓ(γn |[s,t]) = |s − t|ℓ(γn ) ≤ |s − t|(δ + 1). Tomando s suficientemente cercano a t, se deduce que γn (t) está a menos de ǫ de γn (s) para todo n ∈ N. Por otra parte, podemos suponer que todas las curvas están contenidas en la bola cerrada Bδ+1 (x) puesto que en caso contrario ℓ(γn ) ≥ δ + 1, luego para t ∈ [0, 1] {γn (t) : n ∈ N} ⊂ Bδ+1 (x) que es compacto por el ítem previo. Es decir la familia {γn } ⊂ C([0, 1], X) es puntualmente precompacta. Por el Teorema de Ascoli, existe una subsucesión γnk uniformemente convergente a una curva continua γ : [0, 1] → X. Como la longitud es semicontinua inferiormente, δ ≤ ℓ(γ) ≤ lı́m ı́nf ℓ(γnk ) = δ k→∞ lo que prueba que γ es una geodésica corta que une x con y. 160 Espacios de Métrica Interior Observación 7.2.4. Si (X, d) es un espacio métrico tal que toda bola cerrada es compacta, entonces es completo. En efecto, si {xn } ⊂ X es de Cauchy, el conjunto {xn } es acotado y por ende vive en una bola compacta, luego tiene una subsucesión convergente a un punto x ∈ X, y es fácil ver que xn → x. Sin embargo, aún asumiendo que (X, d) es localmente compacto, es falso que ser geodésico implique ser completo. Un ejemplo sencillo se obtiene a partir del intervalo (0, 1) ⊂ R. Este espacio es localmente compacto y geodésico, pero no es completo1. 7.A. Problemas 7.I. Si γ : [a, b] → X es continua, probar que ℓ(γ) = 0 implica que γ es constante. 7.II. Probar que ℓ es invariante por reparametrizaciones. 7.III. Sea (X, d) un espacio métrico tal que, para todo x, y ∈ X, r1 , r2 > 0 con r1 + r2 ≤ d(x, y), se tiene d(Br1 (x), Br2 (y)) ≤ d(x, y) − r1 − r2 , Probar que para todo x, y ∈ X y ǫ > 0, existe z ∈ X tal que máx{d(x, z), d(z, y)} ≤ 1/2d(x, y) + ǫ. 7.IV. ∗ Probar que vale el enunciado recíproco del ejercicio previo. 1 Debo esta aclaración a Marcos Cossarini. Capítulo Variedades de Finsler La geometría de Finsler es simplemente geometría Riemanniana sin la restricción cuadrática. Shiing-Shen Chern C ombinaremos en este capítulo la noción de variedad diferenciable con la de espacio métrico, dando en cada espacio tangente una norma que varíe de manera continua con el punto base. Luego estudiaremos variedades con spray donde las normas sean compatibles con el transporte paralelo, en el sentido que este sea una isometría de la variedad. 8.1. Métricas de Finsler Dada una variedad M modelada por un espacio de Banach E, consideramos una norma en cada espacio tangente Tp M, p ∈ M, mediante una función continua b : TM → [0, +∞) con las propiedades usuales de una norma, es decir, denotando V = (p, v) ∈ TM y b(V) = kvkp , se tiene para v, w ∈ Tp M y t ∈ R, 1. b(tV) = |t|b(V), 2. b(V + W) ≤ b(V) + b(W), 3. b(V) ≥ 0 y b(V) = 0 sii V = 0. La norma se suele denominar métrica de Finsler en la variedad M. 161 8 162 8.1.1. Variedades de Finsler Funcionales longitud y energía Una métrica de Finsler nos permite introducir la funcional longitud de curvas α : [a, b] → M dada por Lb (α) = Zb b(α ′ (t))dt = a Zb a kα̇(t)kα(t) dt, donde estamos suponiendo que α es continua y C1 a trozos. Observemos que esta cantidad no depende, por el teorema de cambio de variable en R y la propiedad b(α ′ (t(s)) dt dt )= b(α ′ (t(s))) ds ds de la parametrización de α, sólo de su imagen. Claramente Lb (α) = 0 si y sólo si α es constante, además si α♯β denota la curva α : [a, b] → M seguida de la curva β : [c, d] → M, donde suponemos que α(b) = β(c), entonces Lb (α♯β) = Lb (α) + Lb (β). (8.1) También se suele definir la funcional energía como Eb (α) = 1/2 Zb a kα̇(t)k2α(t) dt. Definimos db : M × M → [0, +∞) como db (x, y) = ı́nf{Lb (γ) : γ ⊂ M es C1 a trozos, γ(0) = x, γ(1) = y}. Supondremos que M es arcoconexa con lo cual db es finita. Tomando γ ≡ x la curva constante, se deduce que db (x, x) = 0 para todo x ∈ M. Reemplazando γ por γ̃(t) = γ(1 − t) para cada curva γ que une x con y, se deduce que db (x, y) = db (y, x). La igualdad (8.1) nos dice que db (x, y) ≤ db (x, z) + db (z, y) para todo x, y, z ∈ M. Es decir db es una pseudo-distancia en M. En ciertos casos es evidente pero en otros hay que verificar que db (x, y) = 0 implica x = y. Observación 8.1.1. Por los mismos motivos que en el caso de arcos continuos y rectificables, en general podemos suponer que γ es inyectiva y en particular γ̇ 6= 0 salvo tal vez finitos puntos o un conjunto de medida nula en el intervalo. De esta manera podemos pensar a las curvas C1 a trozos parametrizadas con velocidad constante en el intervalo [0, 1] (ver la Observación 7.1.5). En ese caso diremos que γ está adaptada a M y se tiene kγ̇kγ = cte = Lb (γ). 8.1. Métricas de Finsler 8.1.1.1. 163 Las variedades de Finsler Proposición 8.1.2. Para toda curva C1 a trozos vale ℓ(γ) ≤ Lb (γ) y el espacio (pseudo)-métrico (M, db ) es un espacio de métrica interior. Demostración. La desigualdad dℓ ≥ db vale siempre tomando la partición trivial (Observación 7.1.7). Por otra parte, si γ es una curva C1 a trozos que une x, y ∈ M, entonces dℓ (x, y) ≤ ℓ(γ) = sup ℓ(γ, π). π Pero para cada partición π del intervalo [a, b], se tiene db (γ(ti ), γ(ti+1 )) ≤ Lb (γ|[ti ,ti+1 ] ) luego ℓ(γ, π) ≤ es decir X Lb (γ|[ti ,ti+1 ] ) = Lb (γ), dℓ (x, y) ≤ ℓ(γ) ≤ Lb (γ), y tomando ínfimo sobre las curvas γ que son C1 a trozos que unen x con y se tiene la otra desigualdad dℓ ≤ db . 8.1.2. Normas acotadas y compatibles Recordemos que, fijada la norma k·kE del espacio de Banach E, consideramos, para cada p ∈ M, al espacio vectorial Tp M como un espacio de Banach con la misma norma via la identificación natural Tp M ≃ E. Definición 8.1.3. Dada una norma de Finsler b : TM → R+ sobre M variedad diferenciable modelada por el espacio de Banach E, diremos que b es acotada superiormente si para cada punto p ∈ M existe una carta (U, ϕ) alrededor de p y una constante mp > 0 de manera que mp kvkx ≤ kϕ∗x vkE para todo x ∈ U, para todo v ∈ Tx M. Diremos que b es acotada inferiormente si para cada punto p ∈ M existe una carta (U, ϕ) alrededor de p y una constante Mp > 0 de manera que kϕ∗x vkE ≤ Mp kvkx 164 Variedades de Finsler para todo x ∈ U, para todo v ∈ Tx U. Diremos que b es acotada, si es acotada superiormente e inferiormente, es decir para cada p ∈ M existe una carta (U, ϕ) alrededor de p de manera que mp kvkx ≤ kϕ∗x vkE ≤ Mp kvkx para todo x ∈ U, para todo v ∈ Tx U. Observación 8.1.4. Si bien la terminología recién introducida es clara y en algún sentido clásica, en trabajos recientes se ha impuesto la siguiente denominación alternativa, por la que optaremos en lo que sigue. Si b : TM → R+ es una métrica de Finsler, diremos que M es una variedad de Finsler, mientras que si b es acotada superiormente diremos que M es una variedad de Finsler débil, y si b es acotada diremos que M es una variedad de Finsler fuerte. Teorema 8.1.5. Si M es una variedad diferenciable de dimensión finita y b : TM → R+ es una métrica de Finsler, entonces M es una variedad de Finsler fuerte, es decir b es acotada. Demostración. Dado p ∈ M, tomemos una carta (U, ϕ) alrededor de p, con ϕ(p) = 0 ∈ E. Achicando U podemos suponer que existe r > 0 tal que Br (0) ⊂ ϕ(U). Sea Tϕ = (ϕ, ϕ∗ ) la carta que trivializa TU ≃ ϕ(U) × E. Si S = {x ∈ E : kxkE = 1} es la esfera unitaria, consideremos el conjunto compacto C = Tϕ−1 Br (0) × S ⊂ TM. La función b : C → R alcanza máximo y mínimo por ser continua, es decir existen puntos x, y ∈ ϕ−1 Br (0) ⊂ U y vectores v ∈ Tx M, w ∈ Ty M tales que kϕ∗x vkE = 1, kϕ∗y wkE = 1 y b(x, v) ≤ b(q, z) ≤ b(y, w) para todo (q, z) ∈ C. Como v, w son enviados a la esfera, son no nulos. Ponemos m = b(x, v) = kvkx > 0, M = b(y, w) = kwky > 0 y entonces si z 6= 0, m≤k z kq ≤ M kϕ∗q zkE con lo cual m kϕ∗q zkE ≤ kzkq ≤ M kϕ∗q zkE para todo q ∈ U = ϕ−1 Br (0) y todo z ∈ Tq M. 8.1. Métricas de Finsler 165 Estudiemos qué implican estas condiciones de acotación. En primer lugar, hay que tener en cuenta que si vale la condición para alguna carta, entonces vale para cualquier otra (en el mismo entorno), pues los mapas de transición son difeomorfismos y por ende acotados en un entorno de p. Achicando y trasladando, supondremos que ϕ(p) = 0 ∈ E y que ϕ(U) = Br (0) ⊂ E. Sean x, y ∈ U, y sea α : [a, b] → M una curva suave a trozos que los une, α ⊂ U. Sea Γ = ϕ ◦ α : [a, b] → ϕ(U) ⊂ E la levantada a la bola en E. Entonces las tres condiciones de acotación quieren decir respectivamente, integrando en [a, b], que mLb (α) ≤ L(Γ ), L(Γ ) ≤ MLb (α), (8.2) mLb (α) ≤ L(Γ ) ≤ MLb (α), donde L(Γ ) denota la longitud usual de Γ en el espacio de Banach E dada por L(Γ ) = Zb a kΓ̇ kE dt. Recordemos que en un espacio normado, el segmento es una curva corta que une los extremos (ver la Observación 6.1.1), aunque eso no impide que pueda haber otros caminos cortos. Si consideramos el segmento Γ (t) = ϕ(x) + t(ϕ(y) − ϕ(x)) ∈ Br (0), se deduce en el primer caso que, como db (x, y) ≤ Lb (α) para cada α ⊂ U que une x con y, se tiene mdb (x, y) ≤ kϕ(x) − ϕ(y)kE . (8.3) Mientras que en el segundo caso como kϕ(x) − ϕ(y)kE ≤ L(Γ ) para toda Γ también se tiene kϕ(x) − ϕ(y)kE ≤ MLb (α). (8.4) Finalmente, si b es acotada juntando las dos condiciones de arriba obtenemos. mdb (x, y) ≤ kϕ(x) − ϕ(y)kE ≤ MLb (α), (8.5) En el primer caso diremos que la métrica db está acotada superiormente, o que M es una variedad de Finsler débil. Una condición suficiente para ello es la siguiente. Lema 8.1.6. Supongamos que b : TM → R es localmente Lipschitz. Entonces la métrica db está acotada superiormente. 166 Variedades de Finsler Demostración. La condición nos dice que, dados V = (p, v) ∈ TM, W = (q, w) ∈ TM suficientemente cerca, entonces existe una constante K > 0 que depende del entorno de V tal que, en una carta (U, ϕ) allí, se tiene |b(W) − b(V)| ≤ Kkϕ(q) − ϕ(p)kE + Kkϕ∗q w − ϕ∗p vkE . Achicando, suponemos que ϕ(U) es una bola centrada en el origen de E. Sean x, y ∈ U, sea S(t) = ϕ(x) + t(ϕ(x) − ϕ(y)) el segmento que los une en la bola, t ∈ [0, 1]. Pongamos x = p, q = α(t) = ϕ−1 S(t) que es una curva suave en U que une x con y. Tomemos w = α̇ ∈ Tq M, v = 0 ∈ Tx M. Entonces nos queda ϕ∗q w = Ṡ, luego | kα̇kα − 0| ≤ Ktkϕ(x) − ϕ(y)kE + Kkϕ(x) − ϕ(y)kE . Integrando respecto de t en [0, 1] se obtiene Lb (α) ≤ 3/2Kkϕ(y) − ϕ(x)kE , lo que 2 . prueba (8.3) con m = 3K Volviendo a las otras condiciones (b acotada inferiormente y b acotada), uno estaría tentado de tomar ínfimo sobre las curvas α a la derecha de (8.4) y de (8.5) para obtener allí también db (x, y). Pero las curvas α que estamos considerando son especiales en el sentido que α ⊂ U es una restricción. Observación 8.1.7. Denotemos con Sr = ∂Br (0) la esfera de radio r en E. Afirmamos que d = dist(Sr , Sr/2 ) = r/2. Supongamos que d < r/2, entonces existen x ∈ Sr/2 , y ∈ Sr tales que kx − yk < r/2. Pero r/2 = r − r/2 = kyk − kxk ≤ ky − xk < r/2 es una contradicción, luego d ≥ r/2. La otra desigualdad es trivial. El siguiente resultado está adaptado del libro de H. Upmeier [67]. Lema 8.1.8. Si b es acotada inferiormente (8.4), entonces todo abierto de M es un abierto de (M, d). Además para x, y suficientemente cerca existe una carta (U, ϕ) tal que kϕ(x) − ϕ(y)kE ≤ Mdb (x, y). En particular db es una distancia en M, es decir db (x, y) = 0 implica x = y. Demostración. Tomamos una carta (U, ϕ) alrededor de x donde b es acotada inferiormente, y de manera que ϕ(U) = Br (0) ⊂ E. Achicando U podemos suponer que ϕ esté definida en un entorno un poco más grande de U. Sean 8.1. Métricas de Finsler 167 α : [0, 1] → M una curva suave a trozos tal que α(0) = x, J ⊂ [0, 1] la componente conexa de α−1 (U) que contiene a t = 0. Entonces si b es acotada inferiormente (8.4), sup kϕ(x) − ϕ(α(t))kE ≤ MLb (α|J ) ≤ MLb (α). (8.6) t∈J Afirmamos que si t0 ≤ 1/Mdist(ϕ(x), Sr ) (la distancia en el espacio de Banach E), entonces Bt0 (x) ⊂ U. Tomemos z ∈ Bt0 (x), supongamos que z ∈ / U, entonces tomando una curva α que une x con z, se tiene sup kϕ(x) − ϕ(α(t))kE ≥ dist(ϕ(x), Sr ) t∈J pues ϕ ◦ α se sale de Br (0) en E. Si db (z, x) < t0 , existe una curva α ⊂ M que une x con z tal que Lb (α) < t0 = 1/Mdist(ϕ(x), Sr ). Juntando estas desigualdades se tiene la contradicción dist(ϕ(x), Sr ) ≤ sup kϕ(x) − ϕ(α(t))kE ≤ MLb (α) < dist(ϕ(x), Sr ). t∈J Estamos suponiendo que U = ϕ−1 Br (0). Tomemos V = ϕ−1 Br/2 (0) y la restricción de ϕ al abierto V ⊂ M. Afirmamos que kϕ(x) − ϕ(y)kE ≤ Mdb (x, y). para x, y ∈ V. Supongamos que no es así, entonces existen x, y ∈ V tales que kϕ(x) − ϕ(y)kE > Mdb (x, y), luego existe una curva γ ⊂ M suave a trozos con γ(0) = x, γ(1) = y y además MLb (γ) < kϕ(x) − ϕ(y)kE ≤ r. Luego, por (8.6), se tiene sup kϕ(x) − ϕ(γ(t))kE < kϕ(x) − ϕ(y)kE . t∈J Si fuera γ ⊂ U, entonces se tendría J = [0, 1] lo que nos lleva a la contradicción kϕ(x) − ϕ(y)kE ≤ sup kϕ(x) − ϕ(α(t))kE < kϕ(x) − ϕ(y)kE . t∈J Luego γ se sale de U, o equivalentemente ϕ ◦ γ se sale de Br (0), es decir (ϕ ◦ γ) ∩ Sr 6= ∅. Entonces también ϕ ◦ γ toca Sr/2 al menos dos veces (una vez al ir y otra al volver). Luego L(ϕ ◦ γ) ≥ r/2 + r/2 = r, 168 Variedades de Finsler con lo cual MLb (γ) ≥ L(ϕ ◦ γ) ≥ r, y esto es una contradicción. Por último, veamos que db es una métrica. Sean x, y ∈ M con db (x, y) = 0, (U, ϕ) carta de M alrededor de x, con ϕ(x) = 0 donde vale la desigualdad del enunciado, kϕ(y)k ≤ Mdb (x, y). Si y ∈ / U, existe r > 0 tal que y ∈ / Br (x) luego db (x, y) ≥ r lo cual es absurdo. Luego y ∈ U, y entonces 0 = db (x, y) implica ϕ(y) = 0, luego x = y. Corolario 8.1.9. Si vale (8.5), es decir si b es acotada, para x, y ∈ U se tiene mdb (x, y) ≤ kϕ(x) − ϕ(y)kE ≤ Mdb (x, y), y las topologías de M como variedad sobre E y de (M, d) como espacio métrico son equivalentes. Es decir, las variedades de Finsler fuertes son extensiones buenas de las variedades de Finsler de dimensión finita. 8.1.2.1. Hopf-Rinow en variedades de Finsler De acuerdo a la terminología de espacios de métrica interior, diremos que una curva continua γ : [a, b] → (M, db ) es una geodésica corta si su longitud coincide con la distancia entre los puntos que une. Es conveniente comparar el siguiente resultado con los resultados y ejemplos de la Sección 9.4 del contexto Riemanniano. Corolario 8.1.10 (Hopf-Rinow). Si el espacio de Banach que modela M es de dimensión finita y (M, db ) es completo, entonces dados x, y en M existe una geodésica corta (continua) que los une. Demostración. El espacio métrico (M, db ) es localmente compacto pues E lo es, y al ser (M, db ) de métrica interior, se tiene el corolario por el Teorema 7.2.3. Observación 8.1.11. Si localmente se puede reemplazar curvas cortas γ por curvas µi de clase C1 , que resulten cortas, entonces todo par de puntos x, y ∈ M se puede unir con una curva C1 a trozos tal que Lb (β) = db (x, y). Esto es porque si π es una partición del intervalo [0, 1] de manera que, en la curva corta continua γ del corolario previo, los puntos γ(ti ), γ(ti+1 ) están suficientemente cerca, entonces reemplazando γ en ese intervalo por µi y definiendo β = µ1 ♯ . . . ♯ µn 8.2. Variedades de Finsler con spray 169 como la concatenación de las curvas µi , se tiene X X X Lb (β) = Lb (βi ) = d(γ(ti ), γ(ti+1 )) = ℓ(γ|[ti ,ti+1 ] ) = ℓ(γ) = db (x, y). i 8.2. i i Variedades de Finsler con spray Una variedad M sobre un espacio de Banach E, provista de una norma b : TM → [0, +∞) como en la sección anterior, que defina una pseudo-distancia db : M × M → [0, +∞), la denominaremos una variedad de Banach-Finsler o directamente una variedad Finsleriana y denotaremos con (M, db ) al espacio métrico inducido. Diremos que M es métricamente completa para b si (M, db ) resulta un espacio métrico completo. Si b es acotada superiormente, diremos que M es una variedad de Finsler débil, mientras que si b es acotada, diremos que M es una variedad de Finsler fuerte. En el caso de que M tenga un spray dado F : TM → TTM, diremos que M es una variedad Finsleriana con spray si M es Finsleriana y la métrica b es invariante por el transporte paralelo del spray a lo largo de geodésicas. Es decir si para toda geodésica del spray α ⊂ M, y para todo z ∈ Tα(s) M, para todo s, t ∈ Dom(α), se verifica kPst (α)zkα(t) = kzkα(s) . Como el transporte paralelo de α̇(s) es simplemente α̇(t), se tiene kα̇(t)kα(t) = cte = kvkp si α(t) = expp (tv). Es decir, las geodésicas tienen velocidad constante. El siguiente resultado se relaciona con el Teorema de Hopf-Rinow del contexto Riemanniano (Teorema 9.4.3). Proposición 8.2.1. Si M es una variedad de Finsler fuerte con spray, entonces cada una de las siguientes afirmaciones implica la que le sigue: 1. El espacio (M, db ) es completo. 2. Todas las geodésicas de M están definidas en todo R. 3. M es geodésicamente completa, es decir D(exp) = TM. 4. Existe p ∈ M tal que Dom(expp ) = Tp M. 170 Variedades de Finsler Demostración. La única afirmación que hay que probar es 1 ⇒ 2, las demás son triviales. Para verlo, sea α = expp (tv) una geodésica, supongamos que Dom(α) = (a, b) con 0 < b < ∞. Sea {tn } ⊂ (a, b) una sucesión que crece hasta b. Entonces es una sucesión de Cauchy, pero para m > n se tiene Z tm kα̇(t)kα(t) dt = (tm − tn )kvkp , db (α(tn ), α(tm )) ≤ Lb (α|[tn ,tm ] ) = tn lo que nos dice que {α(tn )} ⊂ M es de Cauchy y por hipótesis converge a un punto q ∈ M. Tomemos un entorno normal W de q ∈ M como en el Teorema 6.2.3, con la exponencial definida en Br (0) para todo y ∈ W. Como la métrica es acotada, podemos tomar k0 ∈ N tal que α(tk ) ∈ W y tk > b − r para todo k ≥ k0 . Consideremos µ(s) = expα(tk ) (sα̇(tk )) definida por lo menos en (−r, r). Esta resulta una geodésica del spray, que coincide con α(tk ) en s = 0 y tiene la misma velocidad inicial allí. Luego por unicidad µ coincide con α, es decir α(s+tk ) = µ(s). Pero s+tk > b si s está suficientemente cerca de r, lo que contradice que α estaba definida sólo en (a, b). 8.3. Métricas de Finsler vía operadores acotados Supongamos que en una carta (U, ϕ) de M fijamos una norma en E, no necesariamente compatible con la topología de E. Supongamos que tenemos una sección continua p 7→ Ap con Ap ∈ GL(E) para todo p ∈ U. Esto nos permite introducir una norma en cada espacio tangente de la siguiente manera kvkp = kAp ϕ∗p vk, para todo v ∈ Tp M, para todo p ∈ U. Con nuestra identificación habitual de Tp M con E, podemos denotar esto como kvkp = kAp vk sin posibilidad de confusión. Esto nos define una métrica de Finsler b : TU → R de manera obvia, b(V) = b(p, v) = kvkp . Observemos que kvkp ≤ kAp kkvk y kvk ≤ kA−1 p kkvkp , luego usando la continuidad de p 7→ Ap , las normas k · k y k · kp son localmente equivalentes y en particular si k · k daba la topología de E, entonces b : TU → R es una norma acotada. Si podemos hacer esto en un cubrimiento por cartas de M, de manera que en las intersecciones las secciones A coincidan (por ejemplo si M admite particiones de la unidad), entonces podemos definir así una métrica de Finsler b : TM → R 8.4. Métricas invariantes 171 en M. La condición de compatibilidad que se debe cumplir en la intersección U ∩ V para obtener allí la misma norma es la siguiente: si (V, ψ) es otra carta con una asignación q 7→ Bq ∈ GL(E), necesitamos que kAp ϕ∗p vk = kBp ψ∗p vk para todo p ∈ U ∩ V, para todo v ∈ Tp M. Observación 8.3.1. En particular, si M tiene dimensión finita, toda norma así definida es acotada y por ende (M, db ) es una variedad de Finsler fuerte. Observación 8.3.2. Si k · k es alguna norma en E (no necesariamente equivalente a la norma original del espacio de Banach E) entonces una construcción similar a la recién introducida nos permite definir una métrica de Finsler en M que no es necesariamente acotada. Y es evidente que esta métrica será acotada superiormente si la norma introducida es continua, es decir si existe C > 0 de manera que kvk ≤ CkvkE para todo v ∈ E, donde k · kE denota aquí la norma de E que lo hace espacio de Banach. 8.4. Métricas invariantes Un caso particular de la discusión de la sección previa es el siguiente. Sea G un grupo de Lie-Banach, g = T1 G su álgebra de Lie-Banach. Como Tg G = Lg T1 G y TG ≃ G × g via los difeomorfismos Lg : v 7→ gv, dada una norma fija k · kg en g, podemos definir, para w ∈ Tg G, kwkg := kLg−1 wkg . En este caso se obtiene una norma b : TG → R+ que es acotada puesto que, para g ∈ G, si consideramos la carta alrededor de g dada por ϕ−1 = Lg exp : B ⊂ g → G con B entorno de cero suficientemente pequeño como para que exp sea un difeomorfismo con su imagen, si h = ϕ(x) ∈ U = ϕ−1 (B) y v ∈ Th U, entonces −1 ϕ∗h v = (Lg exp)−1 Lg−1 v, ∗h v = (exp∗x ) luego Lh−1 v = Lh−1 g (exp∗x )ϕ∗h v = Ah v, con Ah = Lh−1 g (exp∗x )ϕ∗h que es claramente un operador lineal inversible que depende suavemente de h ∈ U. Esta métrica se denomina métrica invariante a izquierda en G, pues verifica kLh wkhg = kwkg para todo h, g ∈ G, para todo w ∈ Tg G. De hecho, es fácil ver que toda métrica invariante a izquierda en G se construye de esta manera. 172 8.4.1. Variedades de Finsler Métricas invariantes y el spray canónico Recordemos que el spray canónonico F : TG → TTG está dado por F(w) = wg−1 w para g ∈ G y w ∈ Tg G, y que el nombre se debe a que las geodésicas del spray canónico son las curvas a un parámetro α(t) = getv donde ex denota la exponencial del grupo como grupo de Lie-Banach, en el caso concreto del grupo de inversibles de un álgebra de Banach, está dada por la serie de potencias usual. Recordemos (Ejemplo 6.9.3 en la Sección 6.9) que el transporte paralelo a lo largo de las geodésicas está dado por 1 1 P(α)10 z = ge 2 v g−1 ze 2 v para z ∈ Tg G. Veamos en qué casos esta métrica invariante a izquierda es compatible con el spray. Debería ocurrir que 1 1 1 1 ke− 2 v g−1 ze 2 v kg = kge 2 v g−1 ze 2 v kgev = kzkg = kg−1 zkg , es decir, llamando w = g−1 v ∈ g, que 1 1 ke− 2 v we 2 v kg = kwkg para todo v, w ∈ g. Equivalentemente, eadv = Adev : g → g debe ser una isometría para la norma dada, para todo v ∈ g. En general, esto es falso por supuesto. Pero en el caso del grupo de isometrías de un álgebra de Banach, es evidentemente cierto si la norma es la original del álgebra (en particular para el grupo de unitarios de un álgebra C∗ con la norma uniforme). También dada cualquier norma k · kI unitariamente invariante en el álgebra A, se observa que la métrica es compatible con el spray canónico. 8.4.2. Espacios homogéneos y métricas cocientes Dado un espacio homogéneo O = G · x0 = G/K de un grupo de Lie-Banach G, si el grupo tiene una métrica de Finsler b : TG → R+ bi-invariante, podemos considerar el espacio (pseudo)-métrico (G, db ). Si el subgrupo K es cerrado para esta métrica, es relativemente sencillo probar que ḋ(gK, hK) = ı́nf k1 ,k2 ∈K db (gk1 , gk2 ) es una distancia en el cociente O. Esto es, se toma la distancia entre las fibras gK, hK ⊂ G que son conjuntos cerrados disjuntos, y esto define una distancia entre clases en el cociente. Por otra parte, podemos considerar en O que es una variedad diferenciable bajo ciertas hipótesis de regularidad del mapa cociente, la métrica cociente 8.4. Métricas invariantes 173 bO : O → R+ . Esta se define de la siguiente manera: si k es el álgebra de Lie-Banach del grupo de isotropía K, y π = πx0 : G → O es la proyección π(h) = h · x0 , entonces para x = g · x0 ∈ O y [w] = π∗ w ∈ Tx O ponemos k[w]kx := ı́nf kw − gkkg . k∈k Esta definición no depende del w ∈ Tg G que define la clase [w] ∈ Tg·x0 O, y tampoco del g ∈ G tal que g · x0 = x. Definimos dO como la distancia inducida por la métrica de Finsler cociente en O. Sean g, h ∈ G, k1 , k2 ∈ K, sea Γ ⊂ G que une gk1 con gk2 . Entonces si γ = π ◦ Γ ⊂ O se tiene que γ une g · x0 con h · x0 . Además kγ̇kγ := ı́nf kΓ̇ − ΓkkΓ ≤ kΓ̇ kΓ , k∈k luego LO (γ) ≤ Lb (Γ ). Entonces dO (g · x0 , h · x0 ) ≤ Lb (Γ ), y tomando ínfimo sobre todas las curvas Γ de estas características se tiene dO (g · x0 , h · x0 ) ≤ db (gk1 , hk2 ). Tomando ahora ínfimo sobre k1 , k2 ∈ K, descubrimos que siempre vale la desigualdad dO ≤ ḋ. Respecto de la otra desigualdad, en general para obtenerla es necesario tener suplementos en G que provean de curvas cortas en el cociente, o al menos aproximaciones de las mismas. Ejemplos de esto en espacios homogéneos del grupo unitario de un álgebra de operadores pueden hallarse en los trabajos [5, 8, 32, 33] de Andruchow, Durán, Chiumiento, Larotonda, Mata-Lorenzo y Recht. 8.4.3. Operadores positivos con métricas simétricas Dada una C∗ -álgebra A, recordemos que denotamos con G+ A al cono de operadores positivos e inversibles de A. Según vimos (Ejemplo 6.9.5.2), se puede reducir el spray canónico del grupo total de inversibles a este cono, para obtener las geodésicas t 1 1 1 1 γa,b (t) = a exp(t log(a−1 b)) = a /2 a− /2 ba− /2 a /2 que une a, b ∈ G+ A . El transporte paralelo a lo largo de γa,b está dado por P(γ)z = a 1/2 −1/2 1 1 1 1 1 1 1 1 (a ba− /2 ) /2 a− /2 za− /2 (a− /2 ba− /2 ) /2 a /2 174 Variedades de Finsler para z = z∗ ∈ Ta G+ A = Ah . Sea k · kI una norma simétrica en A (Apéndice D.2), entonces definimos 1 1 kvka := ka− /2 va− /2 kI para a ∈ I, v ∈ Ih . El espacio + G+ A = {a ∈ GA : a − 1 ∈ I} es un espacio homogéneo del grupo de inversibles GA = {g ∈ GA : g − 1 ∈ GA } por la acción a 7→ gag∗ . Esta acción es transitiva y su grupo de isotropía en a = 1 es el grupo de operadores unitarios UI = {u ∈ U : u − 1 ∈ I} Esta métrica tiene la siguiente propiedad: es invariante por la acción mencionada. La prueba es elemental, kgvg∗ kgag∗ = = k(gag∗ )− 1/2 1 gvg∗ (gag∗ )− /2 k ∗ −1/2 k(gag ) Llamando u = (gag∗ )− 1/2 1 ga /2 kgvg∗ kgag∗ = kua− 1 ga /2 ·a −1/2 va I −1/2 ·a 1/2 ∗ 1 g (gag∗ )− /2 k I. se tiene que u ∈ U y entonces 1/2 1 va− /2 u∗ k 1 I = ka− /2 va− 1/2 k I = kvka . (8.7) En particular, el transporte paralelo a lo largo de geodésicas es una isometría (basta inspeccionar la expresión arriba mencionada de P) y entonces la métrica es compatible con el spray. A partir de esta propiedad es fácil ver que LI (γa,b ) = k ln(a− 1/2 1 ba− /2 )k I (Ejercicio 8.iii). Esta métrica tiene una propiedad adicional, que enunciamos como un lema a continuación. Esta propiedad está fuertemente vinculada al teorema de Cartan que abordamos en la próxima sección. Recordemos que la expresión de la exponencial de este spray está dada por expa (z) = a 1/2 exp(a− 1/2 1 1 za− /2 )a /2 . Se trata de un difeomorfismo global, por lo observado en el Teorema 4.5.1. Lema 8.4.1. Para todo a ∈ G+ I , v, w ∈ Ih y toda norma unitariamente invariante k · kI en A se verifica k(expa )∗v wkexpa (v) ≥ kwka . 8.4. Métricas invariantes 175 1 1 1 1 Demostración. Llamemos x = a− /2 va− /2 , y = a− /2 wa− /2 . A partir de la + expresión de la exponencial en a ∈ G+ A , considerando una curva z = z(t) ⊂ GA tal que z(0) = v, ż(0) = w, obtenemos (expa )∗v w = a 1/2 [exp∗x y] a 1/2 , donde ahora exp denota la exponencial usual del álgebra y exp∗x denota la 1 1 diferencial de la exponencial en x ∈ A. Por otra parte expa (v) = a /2 ex a /2 , luego 1 1 k(expa )∗v wkexpa (v) = ka /2 [exp∗x y] a /2 k 1/2 x 1/2 . a e a 1 a /2 , Tomando g = b = ex , v = exp∗x y, y usando que la métrica es invariante por la acción b 7→ gbg∗ , se tiene x x k(expa )∗v wkexpa (v) = k exp∗x ykex = ke− 2 [exp∗x y] e− 2 kI . Invocamos la fórmula de la diferencial de la exponencial (Teorema 4.5.1) Y Y adx ad2 x −x −x 2 2 (y). 1−i e exp∗x (y)e = 1 − 2 2 (y) = 4n π 2kπ n∈N k6=0 Ahora bien, consideremos el espacio de Banach I que se obtiene al completar A con la norma k · kI . Consideremos a su vez el álgebra de Banach B = B(I) de x todos los operadores acotados en I. Sea c = 2kπ ∈ A, k ∈ Z 6= 0. Como c∗ = c, ±ic se tiene que e ∈ U, y entonces para todo z ∈ A, y todo t ∈ R, keitadc zkI = keitc ze−itc kI = kzkI pues la norma es unitariamente invariante. Por densidad, se deduce que el elemento eiadc ∈ B = B(I) es una isometría, luego adc ∈ Herm(B) es decir adc es elemento Hermitiano del álgebra (ver la Sección 4.4). Luego, por la Proposición 4.4.5, se tiene k(1 − i adx )(y)kI = k(1 − iadc)ykI ≥ kykI . 2kπ Entonces se tiene la desigualdad k Y adx 1 1 )(y)kI ≥ kykI = ka− /2 wa− /2 kI = kwka (1 − i 2kπ para cualquier producto finito, y tomando límite se tiene la desigualdad deseada k(expa )∗v wkexpa (v) ≥ kwka . 176 Variedades de Finsler Observación 8.4.2. Recordemos que una norma de un espacio normado E se dice estrictamente convexa o rotunda si la esfera de E no contiene segmentos, o equivalentemente kx + yk < kxk + kyk excepto en el caso particular en el que x, y están alineados. No es difícil ver que en un espacio normado con norma estrictamente convexa, la única curva corta que une dos vectores v, w ∈ E es el segmento usual (Ejercicio 8.iv). Como consecuencia de las observaciones previas, se tiene el siguiente teorema que caracteriza las curvas minimales. Teorema 8.4.3. Con las hipótesis del lema previo, γa,b es una geodésica corta que une a, b ∈ G+ I , que resulta única si la norma k·kI es estrictamente convexa. En particular, 1 1 dI (a, b) = LI (γa,b ) = k ln(a− /2 ba− /2 )kI . Demostración. Sea α ⊂ G+ I suave a trozos, sea Γ = ln γ el único logaritmo autoadjunto de γ, que también es suave a trozos pues ln es una función analítica. Afirmamos que LI (α) ≥ L(Γ ), (8.8) donde la última longitud es la longitud de arco usual en el espacio lineal I dada R por L(Γ ) = kΓ̇ kI . Y de aquí se sigue que dI (γ(1), γ(0)) ≥ kΓ (1) − Γ (0)kI (8.9) Para probar (8.8), observemos que como γ = exp(Γ ), entonces γ̇ = exp∗Γ Γ̇ con lo cual 1 1 kγ̇kγ = kγ− /2 exp∗Γ Γ̇ γ− /2 kI y este último término es por el lema previo mayor o igual que kΓ̇ kI . Integrando se obtiene la afirmación. Supongamos ahora que α ⊂ G+ I es una curva suave 1 1 a trozos tal que α(0) = a, α(1) = b, y consideremos β = a− /2 αa− /2 . Por la 1 invariancia de la métrica (tomando g = a− /2 en la ecuación (8.7)), se obtiene Z Z Z 1 1 LI (β) = kβ̇kβ = ka− /2 α̇a− /2 k −1/2 −1/2 = kα̇kα = LI (α), a αa 1 1 y por otra parte, como β(0) = 1, β(1) = a− /2 ba /2 = ev , se tiene, invocando (8.9) que LI (β) ≥ dI (1, ev ) ≥ kv − 0kI = LI (γa,b ). 8.5. El teorema de Cartan 177 Es decir LI (α) ≥ LI (γa,b ), y tomando ínfimo sobre todas las curvas α se obtiene la tesis. Supongamos ahora que la norma del ideal I es estrictamente convexa, si se llegara a tener que α es corta entonces L(ln(β)) ≤ LI (β) = LI (α) = LI (γa,b ) = kvkI esto querría decir que ln β es una curva corta que une 0 con v y por la unicidad debiera ser ln β(t) = tv, luego β(t) = etv con lo cual α(t) = a 1/2 tv 1/2 e a = γa,b (t). Antecedentes de este resultado para la norma uniforme de un álgebra de operadores pueden hallarse en los trabajos [25, 26] de A. Maestripieri, G. Corach y D. Stojanoff. 8.5. El teorema de Cartan En esta sección probamos el teorema de Cartan para variedades de Finsler con spray que verifican una condición denominada como curvatura semi-negativa. La versión para superficies del teorema se debe a J. Hadamard [37] y se remonta al año 1896. Posteriormente (1946) Elié Cartan demostró el teorema para variedades Riemannianas abstractas [22]. En el año 1965, J. McAlpin extiende en su tesis doctoral [50] este resultado a variedades de Riemann-Hilbert, y recientemente, en 2002, K.-H. Neeb extiende el resultado a variedades de Finsler con spray [56], esta última es la versión que presentamos aquí. Definición 8.5.1. Sea f : M → N una aplicación C1 entre variedades diferenciables. Diremos que 1. f tiene la propiedad de levantadas únicas de curvas si para todo y = f(p) ∈ N y toda curva γ ⊂ N que sea C1 a trozos y comience en y, existe una única curva Γ ⊂ M que es C1 a trozos que comienza en p y es una levantada de γ, es decir γ = f ◦ Γ . 2. f es un revestimiento si f es sobreyectiva y para todo y ∈ N existe un entorno abierto Uy ⊂ N de manera que f−1 (Uy ) es una unión disjunta ∪i∈I Vi de abiertos en M, y f|Vi : Vi → Uy es un difeomorfismo para todo i ∈ I. 178 Variedades de Finsler Teorema 8.5.2. Sean (M, bM ) una variedad de Finsler fuerte completa y (N, bN , FN ) una variedad de Finsler fuerte, con spray y conexa. Sea f : M → N dos veces diferenciable y un difeomorfismo local tal que existe C > 0 de manera que kf∗ VkbN ≥ CkVkbM para todo V ∈ TM. Entonces f tiene la propiedad de levantadas únicas de curvas, es un revestimiento y (N, d) es completa. Demostración. Sean y = f(p) ∈ N, z ∈ N. Como N es conexa, existe una curva γ : [0, 1] → N adaptada a N de manera que γ(0) = y, γ(1) = z. Sea L = {t ∈ [0, 1] : γ|[0,t] tiene una levantada única Γ ⊂ M con Γ (0) = p}. El conjunto L es no vacío pues 0 ∈ L, y además es abierto pues f es un difeomorfismo local de clase C1 . Está claro que si t0 ∈ L entonces [0, t0 ] ∈ L pues se toma la restricción de la levantada para cada s ∈ [0, t0 ]. Es decir, L es un intervalo de la pinta [0, s) con s ≤ 1. Sea Γ : [0, s) → M una levantada de γ|[0,s) . Tomemos tn ր s, entonces CdM (Γ (tn ), Γ (tm )) ≤ CLbM (Γ |[tn ,tm ] ) ≤ LbN (γ|[tn ,tm ) ) = |tn − tm |LbN (γ), lo que prueba que Γ (tn ) es de Cauchy en M y por ende converge a un punto q. Por la continuidad de f debe ser γ(tn ) → f(q) luego f(q) = γ(s). Entonces CdM (Γ (t), q) ≤ LbN (γ|[t,s]) = |t − s|LbN (γ) lo que prueba que lı́m− Γ (t) = q. Si s = 1, ya terminamos. Si no es así, usando t→s que f es un difeomorfismo local, podemos extender Γ más allá de s levantando γ, lo cual es absurdo. Esto prueba que f tiene la propiedad de levantadas únicas y además que f es sobreyectiva. Ahora vamos a reducir el problema al caso en el que f es una isometría local, es decir que kf∗ Vk = kVk para todo V ∈ TM. Para ello, consideramos la métrica b∗M en M dada por kVkb∗M = kf∗ VkbN para V ∈ TM. Como f es un difeomorfismo local, esta métrica es acotada, es decir induce una métrica dM∗ localmente equivalente con la original de M y por ende con la misma topología. Es más, se tiene kVkb∗M = kf∗ VkbN ≥ CkVkbM 8.5. El teorema de Cartan 179 globalmente luego db∗M ≥ C dbM lo que nos dice que (M, dM∗ ) es un espacio métrico completo pues si {xn } es de Cauchy, entonces es de Cauchy en (M, dM ) luego converge a un punto x ∈ M y como la métrica es compatible, la convergencia también ocurre en (M, dM∗ ). Como f es un difeomorfismo local, existen abiertos U ⊂ M, V ⊂ N tales que f∗ : TU → TV es un difeomorfismo. Luego la diferencial de f∗ , que denotaremos T 2 fV : TV TM → Tf∗ V TN, es una aplicación inversible en cada V ∈ TM. Ahora llevamos el spray de N para atrás, definiendo F : TM → TTM como F(V) = (T 2 f)−1 FN (f∗ V). En una carta, se tiene T 2 f ΓM (V, W) = ΓN (f∗ V, f∗ W) (8.10) para V, W ∈ TM. Afirmamos que (M, bM∗ , F) es una variedad de Finsler con spray, es decir que la métrica es invariante por transporte paralelo del spray. Sea α ⊂ M una geodésica tomemos β = f ◦ α ⊂ N. Se tiene FN (β ′ ) = FN (f∗ α ′ ) = T 2 fFM (α ′ ) = T 2 fα ′′ = β ′′ luego β es una geodésica de N. En particular expN ◦f∗ = f ◦ expM . (8.11) Para z ∈ Tα(0) M y ξ = ξz el transporte paralelo a lo largo de α determinado en forma única por la ecuación diferencial ξ̇ = ΓM (ξ, α̇) ξ(0) = z . Sea η ∈ TN, η ∈ Lev(f ◦ α) dada por η = f∗ ◦ ξ. Entonces η(0) = f∗ z y por (8.10) η̇ = T 2 fξ̇ = T 2 fΓM (ξ, α̇) = ΓN (f∗ ξ, f∗ α̇) = ΓN (η, (f ◦ α)˙). Esto prueba que f∗ PM = PN , es decir f∗ transforma el tranporte paralelo en M en el transporte paralelo en N. Luego kPM (α)VkbM∗ = kf∗ PM (α)VkbN = kPN (f ◦ α)f∗ VkbN = kf∗ VkbN = kVkbM∗ Luego el spray FM es compatible con la métrica bM∗ . 180 Variedades de Finsler Ahora por la Proposición 8.2.1, la exponencial de M está definida en todo TM, y por (8.11), se tiene D(expN ) ⊃ f∗ TM = TN pues f es sobreyectiva y un difeomorfismo local, luego (N, FN ) también es geodésicamente completa. Ahora veamos que (N, dN ) es métricamente completa, sea {yn } de Cauchy en N, pasando a una subsucesión podemos suponer que dN (yn , yn+1 ) < 1/2n . Por la propiedad de levantada única, podemos hallar una sucesión {xn } de Cauchy en M tal que f(xn ) = yn pero además dM∗ (xn , xn+1 ) < 1/2n : dados y1 , y2 , tomamos una curva γ ⊂ N que los une tal que LN (γ) < 1/2, la levantamos y usamos que f es una isometría para definir x1 , x2 con la propiedad deseada. Ahora tomamos una curva en N del longitud < 1/22 que une y2 con y3 , la levantamos a M y usando que f es una isometría obtenemos x3 tal que d(x3 , x2 ) < 1/22 , y así sucesivamente. Como (M, dM∗ ) es completo, existe x ∈ M tal que xn → x. Si y = f(x), se tiene dN (yn , y) = dM∗ (xn , x) → 0 luego yn → y. Por último, dado y ∈ N, tomamos una bola abierta B centrada en el origen de Ty N de manera que expy |B : B → V = expy (B) ⊂ N sea un difeomorfismo. Vamos a probar que f es un revestimiento sobre V. Para cada x ∈ f−1 (y), definimos Bx = f−1 Vx = expx (Bx ) ⊂ M. ∗x (B) ⊂ Tx M, Observemos que f(Vx ) = f(expx (Bx )) = expy (f∗x Bx ) = expy (B) = V por (8.11). Es más, como f|Vx ◦expx |Bx : Bx → V coincide con expy |B ◦f∗x , entonces expx |Bx es inyectiva, pero además expx |Bx = f|−1 Vx ◦ expy |B ◦ f∗x luego expx |Bx → Vx es un difeomorfismo y en particular Vx ⊂ M es abierto. Afirmamos que f−1 (V) = ∪x/f(x)=y Vx y que los Vx son disjuntos, lo que probaría que f es un revestimiento. Como f(Vx ) = V para todo x tal que f(x) = y, hay que probar la otra inclusión. Sea z ∈ f−1 (V), luego f(z) = expy (v) para algún v ∈ B, y la geodésica β(t) = expy ((1 − t)v) se levanta en forma única a una geodésica α ∈ M tal que f ◦ α = β y además α(0) = z. Sea x = α(1) ∈ M, entonces f(x) = f ◦ α(1) = β(1) = y. Como v ∈ B, de la relación f∗x α̇(1) = β̇(1) = −v se deduce que w = −α̇(1) = f−1 ∗x (v) ∈ Bx , y además z = expx (w) ∈ Vx pues z es el otro extremo de la geodésica α. 8.5. El teorema de Cartan 181 Ahora sean p 6= q ∈ f−1 (y), veamos que Vp ∩ Vq = ∅. Consideremos z ∈ Vp ∩ Vq dado por z = expp (v) = expq (w) con v ∈ Bp , w ∈ Bq . Aplicando f y usando (8.11) se obtiene expy (f∗p v) = expy (f∗q w), usando que expy |B es inyectiva tenemos que f∗p v = f∗q w. Las dos geodésicas α1 (t) = expp (tv), α2 (t) = expq (tw) terminan en z, componiendo con f y usando nuevamente (8.11) se deduce que las dos son levantadas de β(t) = expy (tf∗p v) = expy (tf∗q w). Por la unicidad de las levantadas, debe ser p = α1 (0) = α2 (0) = q. Definición 8.5.3. Sea (M, b, F) una variedad de Finsler con spray. Diremos que M tiene curvatura semi-negativa si para cada punto p ∈ M, y para v ∈ Dom(expp ), el operador (expp )∗v : Tp M → Texpp (v) M es expansivo e invertible. Es decir, si es invertible y para todo w ∈ Tp M se verifica k(expp )∗v wkexpp (v) ≥ kwkp . La razón del nombre se debe a que en el contexto Riemanniano (ver Sección 9.6), esta condición es equivalente a que M tenga curvatura seccional seminegativa (≤ 0) para todo p ∈ M (Teorema 9.7.4). Teorema 8.5.4 (Cartan-Hadamard-Grossmann-McAlpin-Neeb). Sea (M, b, F) variedad de Finsler fuerte con spray, conexa, de curvatura semi-negativa y geodésicamente completa. Entonces para cada p ∈ M la exponencial expp : Tp M → M es un revestimiento y (M, d) es completa. Demostración. Aplicamos el teorema anterior a la aplicación expp : Tp M → M, donde le damos a Tp M la estructura de variedad de Finsler usual como espacio de Banach. Corolario 8.5.5. Sea (M, b, F) una variedad de Finsler fuerte con spray conexa, completa y de curvatura semi-negativa. Sea p ∈ M, entonces 182 Variedades de Finsler 1. M tiene la propiedad EMI local (exponential metric increasing): para todo v, w ∈ Tp M suficientemente pequeños, dM (expp (v), expp (w)) ≥ kv − wkp . 2. Dados x, y ∈ M suficientemente cercanos, existe una geodésica del spray que es corta y los une. 3. Si M es simplemente conexa, entonces expp : Tp M → M es un difeomorfismo, hay una única geodésica corta para cada par de puntos en M y M tiene la propiedad EMI global. Demostración. Sea Br (0) ⊂ Tp M un entorno del origen donde expp es un difeomorfismo, sea γ ⊂ M una curva adaptada a M que une x = expp (v) con y = expp (w). Levantamos γ a una curva Γ ∈ Tp M tal que Γ (0) = v. Sea w ′ = Γ (1); como γ(1) = expp (w ′ ) = expp (w) y expp es un revestimiento, si r es suficientemente pequeño debe ser kv − wk ≤ kv − w ′ k. Como γ = expp ◦Γ , se tiene kγ̇kγ = k(expx )∗Γ Γ̇ kγ ≥ kΓ̇ kp Luego kv − wkp ≤ kΓ (1) − Γ (0)kp = k Z1 0 Γ̇ dtkp ≤ Z1 0 kΓ̇ kp dt ≤ L(γ). Tomando ínfimo sobre las curvas γ que unen x con y se tiene la EMI. Si y ∈ M está suficientemente cerca de x, escribiendo y = expx (v) como en el argumento previo, y considerando γ(t) = expx (tv), se tiene kv − 0kx ≤ d(expx (v), expx (0)) = d(y, x) ≤ L(γ) = kvkx , luego L(α) = d(x, y). Si M es simplemente conexa, entonces expp tiene que ser inyectiva, porque en caso contrario, dados v, w ∈ Tp M con x = expp (v) = expp (w), el segmento S ⊂ Tp M que une v con w va a parar a un lazo ℓ ⊂ M con ℓ(0) = ℓ(1) = x que no se puede retraer. Explícitamente, sabemos que expp es localmente inyectiva por ser un revestimiento. Luego v, w deben estar en secciones disjuntas de exp−1 p (x), es decir tomando un entorno V de x donde las fibras son abiertos disjuntos, v, w deben estar en dos de estos abiertos Uv , Uw de Tp M distintos. Pero como el lazo ℓ ⊂ M se puede retraer, a partir de un momento tendremos un lazo que cae en el entorno V de x, y este se levanta de forma única a una curva Γ ⊂ Uv que 8.A. Problemas 183 comienza en v. Pero expp |Uv es inyectiva lo que contradice que expp ◦Γ es un lazo cerrado en x. Dados x, y ∈ M, sea v ∈ Tx M el único tal que expx (v) = y. Sea α(t) = expx (tv), entonces kv − 0kx ≤ d(expx (v), x) = d(y, x) ≤ L(α) = kvkx , Luego L(α) = d(x, y). La unicidad de las geodésicas cortas y la globalidad de la EMI se siguen trivialmente de la inyectividad de expp . Las variedades de curvatura semi-negativa completas, conexas y simplemente conexas se denominan variedades de Cartan-Hadamard. En particular, de acuerdo al ejemplo trabajado en la sección anterior, el cono positivo de un álgebra C∗ con una norma unitariamente invariante que hace de I un espacio de Banach, es una variedad de Cartan-Hadamard, y se recupera el Teorema 8.4.3, siempre y cuando la norma sea equivalente con la norma uniforme. Sin embargo, en el caso en el que el ideal no es completo, la prueba ad-hoc de la sección previa funciona pero la prueba general del teorema de Cartan de esta sección se desmorona ya que para probar la existencia y unicidad de levantadas se utiliza la completitud. En el caso en el que (M, bM ) no es completa se obtiene (copiando la prueba del Teorema 8.4.3) el siguiente resultado cuya demostración dejamos como ejercicio (Ejercicio 8.v). Teorema 8.5.6. Sea (N, bN , FN ) variedad de Finsler con spray conexa de curvatura semi-negativa, donde no se asume que los tangentes de N son completos con la norma b. Supongamos que existe x ∈ N tal que expx es inyectiva. Entonces dado y = expx (v) ∈ N, la geodésica γ(t) = expx (tv) es una curva corta que une x con y. 8.A. Problemas 8.I. Si O = G/K con K ⊂ G subgrupo del grupo métrico (G, d), probar que en caso de que d sea bi-invariante, ḋ(gK, hK) = ı́nf k1 ,k2 ∈K d(gk1 , hk2 ) define una pseudo-distancia en O, y que esta es una distancia cuando K es cerrado en (G, d). 8.II. Si G, K son grupos de Lie-Banach y O tiene una estructura diferenciable, sea b : TG → R+ una métrica de Finsler. Probar que, para x = g · x0 ∈ O y [w] ∈ Tx O = π∗g w, k[w]kx = ı́nf kw − gkkg k∈k 184 Variedades de Finsler no depende de w ∈ Tg G ni de g ∈ G. 8.III. Sea A un álgebra C∗ y sea k · kI una norma unitariamente invariante en A. Probar que si t 1 1 1 1 γa,b (t) = a /2 a− /2 ba− /2 a /2 , 1 1 entonces ℓI (γa,b ) = k ln a− /2 ba− /2 kI . 8.IV. Sea (E, k · k) un espacio normado con una norma estrictamente convexa. Probar, dados v, w ∈ E, el segmento s(t) = tw + (1 − t)v es la única curva suave a trozos en E cuya longitud coincide con d(v, w) = kv − wk. 8.V. Probar el Teorema 8.5.6 imitando la prueba del Teorema 8.4.3. Capítulo Variedades Riemannianas y pseudo-Riemannianas Las ecuaciones son la parte aburrida de la matemática. Yo intento ver las cosas en términos de la geometría. Stephen Hawking S upongamos que E, el espacio de Banach que modela M, admite una forma bilineal simétrica y continua h , i : E × E → C tal que hz, zi ∈ R para todo z ∈ E. Supongamos además que E = E+ ⊕ E− y que la forma es estrictamente definida positiva en E+ y estrictamente definida negativa en E− , y estos subespacios resultan ortogonales para la forma bilineal. Fijada una carta (U, ϕ) de M, si tenemos una sección continua A : U → GL(E+ ⊕ E− ) (en el sentido que el operador Ap tiene como subespacios invariantes a E+ , E− ) definimos hv, wip = hAp ϕ∗p v, Ap ϕ∗p wi para p ∈ U y v, w ∈ Tp U. Una vez más identificamos Tp U con E y denotamos esta expresión como hv, wip = hAp v, Ap wi. Diremos que esta es una métrica Riemanniana cuando E− = 0, es decir si hz, zi ≥ 0 para todo z ∈ E, lo que implica por supuesto que hv, vip = hAp v, Ap vi ≥ 0 185 9 186 Variedades Riemannianas y pseudo-Riemannianas para todo p ∈ U, para todo v ∈ Tp M. En este caso, definimos una métrica de Finsler-Riemann como q kvkp = hv, vip . Llamemos H a la completación de E con la forma bilineal h , i. Entonces la extensión de Ap a H (que seguiremos llamando Ap ) es un operador inversible en B(H) y por ende gp = g(p) = A∗p Ap ∈ B(H) es positivo e inversible. Entonces hv, wip = hAp v, Ap wi = hg(p)v, wi = hv, g(p)wi. Bajo ciertas condiciones de pegado al cambiar de carta para tener compatibilidad sobre las que no discurriremos, este producto escalar y su métrica asociada se extienden a todo M. Se tiene entonces una sección g : M 7→ Bil(TM) que se denomina métrica Riemanniana en M de manera tal que g(p)(v, w) = hv, wip = hv, gp wi = hgp v, wi para todo v, w ∈ Tp M. También es habitual denotar hv, wig cuando el punto base está claro del contexto, y diremos que (M, g) es una variedad Riemanniana. En caso de que el espacio de Banach E fuese un espacio de Hilbert y h , i su producto interno (o uno equivalente a este), es fácil ver que la métrica que introdujimos es compatible con la original (en el sentido de que la métrica b dada por b(p, v)2 = hv, vip es acotada, ver la Sección 8.1.2). En el caso pseudo-Riemanniano se procede en forma análoga, pero teniendo presente que el operador g(p) = A∗p Ap es autoadjunto, tiene espectro real y no nulo, y se puede descomponer en dos operadores positivos e inversibles g+ : E+ → E+ , g− : E− → E− de manera que g(p) = g+ (p) − g− (p). Como g : U 7→ GL(E), su diferencial g∗p en cada p ∈ U es un operador de E en B(E), es decir g∗p : E 7→ B(E). Luego fijado z ∈ E, se verifica g∗p,z : E 7→ E es lineal y acotado, y denotaremos g∗p,z w a la acción de este sobre w ∈ E. De la simetría hv, gp wi = hgp v, wi, si p = pt es una curva en U con p0 = p y ṗ0 = z, se tiene hv, g∗p,z wi = hg∗p,z v, wi. 9.1. La derivada de Levi-Civita En general, dada una variedad con spray (M, F), puede haber muchas métricas en M que hagan de esta una variedad de Finsler con spray, en el sentido 9.1. La derivada de Levi-Civita 187 que el transporte paralelo sea isométrico. El problema recíproco es aún más difícil, es decir, no es sencillo hallar, para una variedad de Finsler, un spray que sea compatible con la métrica. Sin embargo, en el caso Riemanniano y pseudoRiemanniano, gracias a la linealidad o suavidad de las métricas involucradas este problema tiene solución única en un sentido que precisamos a continuación. Salvo que se indique lo contrario, no necesitamos suponer que la norma de Finsler inducida por la métrica g es acotada. Teorema 9.1.1. Sea (M, g) una variedad pseudo-Riemanniana. Entonces existe un spray F en M compatible con la métrica que verifica hP0t (α)v, P0t (α)wig = hv, wig para toda curva α ⊂ M de clase C2 y todo v, w ∈ Tα(0) M. El spray F es único en los siguientes sentidos equivalentes: 1. Dados tres campos X, Y, Z en M, si ∇ denota la derivada covariante del spray, se verifica X(hY, Zig ) = h∇X Y, Zig + hY, ∇X Zig . (9.1) 2. Si α : J → M es una curva de clase C2 , Dt denota la derivada covariante respecto de α y las curvas η, µ ∈ Lev(α), entonces d hη, µig = hDt η, µig + hη, Dt µig . dt (9.2) Este spray se denomina spray canónico o spray métrico y la derivada covariante se denomina derivada métrica o derivada de Levi-Civita. En una carta, el spray está dado por hFp (v), g(p)zi = −hg∗p,v v, zi + 1/2hg∗p,z v, vi. (9.3) Demostración. La existencia está dada localmente por la última expresión. La forma bilineal inducida se recupera polarizando, 2hΓp (v, w), g(p)zi = hg∗p,z w, vi − hg∗p,w z, vi − hg∗p,v z, wi, (9.4) y de aquí se obtienen las expresiones para campos y derivadas covariantes. Veamos que el spray es compatible con la métrica: si µv , µw son los transportes paralelos de v, w ∈ Tα(0) M a lo largo de una curva α ∈ M, entonces de la propiedad de la derivada covariante, derivando g(t) = hP0t (α)v, P0t (α)wig 188 Variedades Riemannianas y pseudo-Riemannianas respecto de t se deduce que la derivada es nula, luego esta expresión es constante y debe coincidir con su valor en t = 0 que es justamente hv, wig . Poniendo v = w se deduce que el spray es compatible con la métrica. La unicidad del spray y la prueba de que se extiende adecuadamente a todo M pegando las expresiones locales puede verse en el libro de Lang, [47, Capítulo VIII, §4, Teorema 4.1]. De aquí en más toda variedad (M, g) pseudo-Riemanniana la pensaremos con su spray canónico. 9.1.1. La derivada de Levi-Civita de una subvariedad Un caso elemental que nos permite aplicar los resultados del teorema previo, es cuando M ⊂ H es una subvariedad de un espacio de Banach provisto de un producto interno (H, h·, ·i). En ese caso, dados p ∈ M, v, w ∈ Tp M, identificando Tp M con un subespacio de H, podemos darle a Tp M el producto interno hv, wip = hv, wi. Diremos que (M, g) tiene la métrica inducida o la métrica de subespacio. En esta sección supondremos que la métrica es acotada superiormente, lo cual equivale a decir que la forma bilineal β(v, w) = hv, wig es continua, y en particular es lícito usar la regla de derivación del producto. Es decir, estamos en el contexto de variedades Riemannianas débiles. Sea Ep ∈ B(H) el único proyector ortogonal (Ep = E2p = E∗p ) con rango Tp M. Afirmamos que el spray métrico de M coincide con el spray dado por derivar y proyectar al tangente, de acuerdo a los resultados de la Sección 6.6. Es decir, Lema 9.1.2. Sea M ⊂ H con la métrica inducida y el spray métrico. Dada α ⊂ M y µ ∈ Lev(α), se tiene Dt µ = Eα µ̇ y en particular dado η ∈ Lev(α) d hη, µi = hη̇, µi + hη, µ̇i. dt Demostración. Sabemos que esta fórmula define, por el Teorema 6.6.1, un spray en la variedad M, para probar que es el spray métrico, por la unicidad del mismo, basta probar la condición de compatibilidad (9.2). Pero hDt η, µi = hEα η̇, µi = hη̇, Eα µi = hη̇, µi, 9.1. La derivada de Levi-Civita 189 pues Eα es un operador autoadjunto y similarmente hη, Dt µi = hη, µ̇i, y como vale la regla d hη, µi = hη̇, µi + hη, µ̇i dt puesto que la métrica es acotada superiormente, se tiene la condición de compatibilidad. 9.1.1.1. La Grassmanniana dentro de los autoadjuntos Para la Grassmanniana de un álgebra de operadores (Ejemplo 6.9.6), dado un proyector p = p∗ = p2 se tenía el spray Fp (x) = −2ǫp x2 , con ǫp = 2p − 1 la simetría asociada a p y x = xp + px ∈ AC h = Tp P(A). Equivalentemente, ǫp x = −xǫp . Definimos la métrica Riemanniana kxkp := kxk2 , con kxk22 = Tr(x∗ x), y Tr denota la traza del álgebra. Afirmamos que el spray antes introducido es el spray métrico de esta métrica. En particular la métrica Riemanniana no es otra que la de la Grassmanniana como subvariedad del espacio de Hilbert Ah con la norma Frobenius (Lema 9.1.2). Proposición 9.1.3. Sea p ∈ P(A), x, y ∈ AC h = Tp P(A) y consideremos a la Grassmanniana con la métrica Riemanniana hx, yig = Tr(xy). Entonces el spray métrico de (P(A), g) está dado por Fp (v) = −2ǫp v2 . En particular si α ⊂ P(A) es de clase C2 y η ∈ Lev(α) se tiene que Dt η = η̇ + ǫα (ηα̇ + α̇η) es la derivada de Levi-Civita de la variedad. Demostración. Basta chequear la condición de compatibilidad a lo largo de una curva α ⊂ M, d hη, µig = hDt η, µig + hη, Dt µig dt para η, µ ∈ Lev(α). El lado izquierdo es simplemente Tr(η̇µ) + Tr(ηµ̇), (9.5) 190 Variedades Riemannianas y pseudo-Riemannianas mientras que hDt η, µig = Tr(µ[η̇ + ǫα (ηα̇ + α̇η)]) = Tr(µη̇) + Tr(µǫα ηα̇) + Tr(µǫα α̇η) y hη, Dt µig = Tr(η[µ̇ + ǫα (µα̇ + α̇µ)]) = Tr(ηµ̇) + Tr(ηǫα µα̇) + Tr(ηǫα α̇µ). Pero ǫα η = −ηǫα y lo mismo se aplica a µ, puesto que µ, η ∈ Tα P(A), y casi todos los términos se cancelan usando la propiedad cíclica de la traza, salvo el concerniente a la ecuación (9.5), probando así la compatibilidad. 9.1.2. Sprays métricos en espacios homogéneos En esta sección, H es un espacio de Hilbert complejo y separable, B(H) denota los operadores acotados en H mientras que B(H)0 , K(H) denotan respectivamente los operadores de rango finito y los compactos. Seguimos la notación del Apéndice D de normas simétricas en sucesiones e ideales de operadores compactos. Consideremos a los operadores de Hilbert-Schmidt B2 (H) con el producto interno ha, bi = ReTr(ab∗ ), P donde ahora Tr denota la traza infinita dada por Tr(x) = n≥0 hxen , en i y {en }n≥1 es cualquier base ortornormal del espacio de Hilbert H (ver el la Sección D.1.3 para más detalles), y le agregamos unidad de manera natural, considerando A = B2 (H) ⊕ C y la norma p kk + λk2 := kkk2 + |λ|2 . Si se prefiere, se puede considerar al álgebra de matrices A = Mn (C) con la norma Frobenius 1 kak2 = Tr(|a|2 ) /2 . Observemos que estas son normas simétricas, por ende unitariamente invariante. Introducimos la métrica invariante a izquierda en los operadores inversibles, de acuerdo a lo discutido en la Sección 8.4 kvkg := kg−1 vk2 . Esta proviene del producto interno hv, wig := hg−1 v, g−1 wi = Re Tr(g−1 vw∗ (g∗ )−1 ) = Re Tr((gg∗ )−1 vw∗ ) para v, w cualesquiera y g inversible. 9.1. La derivada de Levi-Civita 9.1.2.1. 191 El spray métrico del grupo de inversibles Procedemos a calcular el spray métrico para nuestros ejemplos de grupos inversibles y sus espacios homogéneos. Esta cuenta es especialmente relevante ya que, como vimos en la Sección 8.4, esta métrica invariante a izquierda no es compatible con el spray canónico del grupo de inversibles. A partir de la expresión de la métrica se deduce que gp v = (pp∗ )−1 v. Considerando una curva de inversibles x(t) tal que x(0) = p, ẋ(0) = z, obtenemos la expresión g∗p,z v = −(pp∗ )−1 (zp∗ + pz∗ )(pp∗ )−1 v = −gp (zp∗ + pz∗ )gp v. Luego, de la expresión local del spray canónico (9.3) deducimos que (multiplicando por 2 para trabajar con el doble de la parte real de la traza) 2hgp Fp (v), zi = ReTr(gp Fp (v)z∗ + Fp (v)∗ gp z). Por otro lado, el término de la derecha en (9.3), después de ciertas manipulaciones usando la ciclicidad de la traza, es igual a ReTr([gp vv∗ gp p − gp vp∗ gp v − gp pv∗ gp v]z∗ + +[p∗ gp vv∗ gp − v∗ gp vp∗ gp − v∗ gp pv∗ gp ]z). Como esto tiene que valer para todo z, se deduce (usando que p∗ gp = p−1 ) que Fp (v) = vp−1 v + pv∗ gp v − vv∗ (p∗ )−1 . (9.6) Si tomamos w = p−1 v, es decir llevamos la velocidad v al origen del grupo, se obtiene p−1 Fp (pw) = w2 + w∗ w − ww∗ . 9.1.2.2. Geodésicas La ecuación de las geodésicas se calcula como es usual a partir de α ′′ = F(α ′ ), obteniéndose α̈ = α̇α−1 α̇ + αα̇∗ (αα∗ )−1 α̇ − α̇α̇∗ (α∗ )−1 , esto es α−1 α̈ = (α−1 α̇)2 + (α−1 α̇)∗ α−1 α̇ − α−1 α̇(α−1 α̇)∗ . Llamando β = α−1 α̇, la ecuación de Euler se convierte en β̇ = [β∗ , β]. (9.7) 192 Variedades Riemannianas y pseudo-Riemannianas Después de algunas experimentaciones, surge que la única geodésica del spray con α(0) = g ∈ GA y α̇(0) = gv = g(x + iy) (donde x, y ∈ Ah son la parte real e imaginaria de v respectivamente), es la curva α(t) = get(x−iy) e2tiy . (9.8) Una manera de probar que α verifica la ecuación del spray es llamando w = e−2tiy xe2tiy . Entonces α̇ = α(w − iy) + α2iy = α(w + iy), con lo cual α−1 α̇ = w + iy, y el lado derecho de la ecuación (9.7) se convierte en (w + iy)2 + (w − iy)(w + iy) − (w + iy)(w − iy) = w2 − y2 + i(3wy − yw). Por otro lado, como α̈ = α̇(w + iy) + αẇ, y ẇ = 2i(wy − yw), entonces también se verifica α−1 α̈ = (w + iy)2 + 2i(wy − yw) = w2 − y2 + i(3wy − yw). Notemos que estas curvas pueden reescribirse como ∗ ∗ α(t) = getv et(v−v ) . (9.9) Observación 9.1.4. La métrica invariante a izquierda del grupo general lineal, se presenta de manera natural al estudiar el problema del cuerpo rígido generalizado desde el punto de vista de la mecánica clásica. Recomendamos al lector interesado el excelente Apéndice 2 del libro de mecánica de V. I. Arnol’d [13]. El estudio del grupo lineal con esta conexión, pero reemplazando la norma 2 por las normas p dadas por la traza, puede encontrarse en el trabajo [9] del año 2011, y es para destacar que el caso no Riemanniano es mucho más complejo y se desconoce una fórmula general para las geodésicas. Observación 9.1.5. Restringiendo el spray al grupo unitario, si consideramos p = u ∈ U, v = uv0 ∈ Tu U, con v∗0 = −v0 ∈ Aah , la ecuación del spray se reduce de la siguiente manera Fu (v) = = Fu (uv0 ) = vu∗ v + uv∗ v − vv∗ u = uv20 − uv20 + uv20 uv20 = vu∗ v = vu−1 v, 9.2. Cálculo de variaciones 193 que no es otra cosa que el spray canónico del grupo. En particular la derivada de Levi-Civita en campos invariantes a izquierda es ∇X Y = 1/2[X, Y]. No es casual entonces que las geodésicas (9.8) se reduzcan a los grupos a un parámetro cuando la velocidad inicial es anti Hermitiana (x = 0), es decir α(t) = get(0−iy) e2tiy = getiy es un grupo a un parámetro. Volviendo al caso general, a partir de la ecuación del spray (9.6), polarizando obtenemos la expresión de la forma bilineal Γ , que es, para g ∈ G y v = gx, w = gy ∈ Tg G, 2g−1 Γg (gx, gy) = xy + yx + x∗ y + y∗ x − xy∗ − yx∗ . Sean Xg = gV, Yg = gW campos invariantes a izquierda, con V, W ∈ A. Definimos los campos adjuntos como X∗g = gV ∗ , Yg∗ = gW ∗ . Entonces un simple cálculo, usando que la conexión del spray está dada por ∇X Y = Y ′ X − Γ (X, Y), nos devuelve la conexión de Levi-Civita del grupo de inversibles con la métrica invariante a izquierda dada por la norma Frobenius ∇X Y = 1/2 {[X, Y] + [X, Y ∗ ] + [Y, X∗ ]} , (9.10) donde [X, Y] = LX Y denota como siempre el corchete de Lie de los campos dado por [X, Y]g = g[V, W], etc. Atención que esta expresión sólo es válida para campos invariantes a izquierda; en el caso finito dimensional se extiende por linealidad a todos los campos de manera usual usando que los campos en las direcciones de una base del tangente, forman una base del espacio de todos los campos como módulo sobre C∞ (M). La derivada covariante del spray es Dt µ = µ̇ − Γ (µ, α̇). Para α ⊂ M y η ∈ Lev(α), ponemos β = α−1 α̇, µ = α−1 η. Entonces un simple cálculo nos devuelve la siguiente fórmula concreta para la derivada covariante: α−1 Dt η = µ̇ + 1/2 {[β, µ] + [β, µ∗ ] + [µ, β∗ ]} . 9.2. (9.11) Cálculo de variaciones Estudiaremos en esta sección la geometría clásica de variedades Riemannianas y pseudo Riemannianas con sus herramientas distintivas: el cálculo de 194 Variedades Riemannianas y pseudo-Riemannianas variaciones, las coordenadas polares, el Lema de Gauss, la curvatura seccional. En esta parte estudiamos la relación entre curvas cortas y geodésicas del spray mediante el cálculo de variaciones. Nuevamente supondremos en esta sección que la métrica es acotada superiormente, es decir que (M, g) es una variedad Riemanniana débil. Diremos que una curva γ : [0, 1] → M es admisible si es C1 y con derivada no nula a trozos, es decir existe π = {0 = t0 ≤ · · · ≤ tn+1 = 1} de manera que γ|(ti ,ti+1 ) es C1 y con derivada no nula, y además existen los límites lı́m γ̇(t) = γ̇(t+ i ), t→t+ i lı́m γ̇(t) = γ̇(t− i ) t→t− i para todo i = 1, .., n. Observación 9.2.1. Sea η : [0, 1] → TM una curva C1 y con velocidad no nula. Si (M, g) es Riemanniana, entonces 2kη̇k d d kη̇k = kη̇k2 = 2hη̇, Dη̇ η̇ig dt dt por (9.2). Luego d 1 kη̇k = hη̇, Dη̇ η̇ig . dt kη̇k Dada una curva admisible γ : [0, 1] → M, si J = (−ǫ, ǫ) es un intervalo, definimos una variación como una función continua ν : J × [0, 1] de manera que ν(0, t) = γ(t), νs es admisible para cada s fijo y la restricción de ν a los rectángulos (−ǫ, ǫ) × (ti , ti+1 ) es dos veces diferenciable. Diremos que la variación es con un extremo fijo si νs (0) = γ(0) para todo s ∈ (−ǫ, ǫ), y diremos que la variación es propia si tiene los dos extremos fijos. Denotaremos con ′ a la derivada de ν respecto de s y con ˙ a la derivada de ν respecto de t. Denotaremos con Ds a la derivada covariante a lo largo de νt (con t fijo) y con Dt a la derivada covariante a lo largo νs (con s fijo). Lema 9.2.2. Sea (M, g) pseudo-Riemanniana. Entonces 1. Si ν es una variación de γ, entonces Ds ν̇ = Dt ν ′ , es decir Dνt′ ν̇(s, t) = Dν˙s ν ′ (s, t) para (s, t) ∈ J × [0, 1]. 2. Sea γ ⊂ M admisible con velocidad constante, sea µ ∈ Lev(γ) suave a trozos. Existe ǫ > 0 tal que si J = (−ǫ, ǫ) y ν : J × [0, 1] → M está dada por ν(s, t) = expγ(t) (sµ(t)), 9.2. Cálculo de variaciones 195 entonces ν es una variación de γ con ν ′ (0, t) = µ(t). La variación ν es propia si y sólo si µ(0) = µ(1) = 0. Demostración. La prueba del primer ítem es trivial: los dos lados son iguales a ν̇ ′ − Γν (ν̇, ν ′ ), puesto que Γ es simétrica y (ν ′ )˙ = ν̇ ′ . Respecto del segundo ítem, podemos suponer, refinando la partición, que los intervalos donde γ y µ son suaves, son los mismos. Tomando s suficientemente pequeño como para que sµ(t) ∈ Tγ(t) M esté en el entorno del origen donde expγ(t) es un difeomorfismo con su imagen, se sigue que ν es suave en los rectángulos donde γ lo era y además cada νs es admisible puesto que νs : t 7→ expγ(t) (sµ(t)). Como ν0 (t) = expγ(t) (0µ(t)) = γ(t), se trata de una variación de γ. Por otra parte, d ′ ν = (expγ(t) )∗sµ(t) µ(t) = µ(t). ν (0, t) = ds (0,t) s=0 Por último, como νs (0) = expγ(0) (sµ(0)) y νs (1) = expγ(1) (sµ(1)), para todo s ∈ J, se deduce que ν es propia si y sólo si µ(0) = µ(1) = 0. 9.2.1. Fórmulas variacionales Teorema 9.2.3. Sean (M, g) Riemanniana, γ ⊂ M admisible con velocidad constante, µ ∈ Lev(γ) suave a trozos. Tomemos ν(s, t) = expγ(t) (sµ(t)), la variación propia de γ del lema previo. Entonces Z1 n X d + L(γ) L(νs ) = − hDt γ̇, µig dt + hµ(ti ), γ̇(t− i ) − γ̇(ti )ig ds s=0 0 i=1 +hµ(1), γ̇(1− )ig − hµ(0), γ̇(0+ )ig . Demostración. En primer lugar, como el integrando es continuo está justificado derivar debajo del signo integral. Ahora calculamos, usando la Observación 9.2.1 y el primer ítem del lema previo d 1 1 kν̇kν = hν̇, Ds ν̇i = hν̇, Dt ν ′ i ds kν̇k kν̇k 196 Variedades Riemannianas y pseudo-Riemannianas con t ∈ (ti , ti+1 ) fijo pues allí ν̇ 6= 0. Evaluando en s = 0, como v0 (t) = γ(t) y v0′ (t) = µ(t), obtenemos d 1 hγ̇, Dt µi. kν̇kν = ds s=0 kγ̇k Por otra parte, d hγ̇, µi = hDt γ̇, µi + hγ̇, Dt µi. dt Reemplazando esta expresión en la inmediata anterior, recordando que kγ̇k = k = cte, obtenemos d d hγ̇, µi − hDt γ̇, µi. kν̇kν = k ds s=0 dt Integrando respecto de t en [ti , ti+1 ], se tiene Z ti+1 Z ti+1 d ti+1 k hDt γ̇, µidt. kν̇kν = hγ̇, µi|ti − ds s=0 ti ti Sumando sobre i = 0, . . . , n tenemos la fórmula del enunciado agrupando convenientemente. Corolario 9.2.4. Sean (M, g) Riemanniana débil y γ : [0, 1] → M. 1. Si γ es una geodésica del spray, entonces es un punto crítico de L para toda variación propia. 2. Si γ es C1 y punto crítico de L (en particular minimal), entonces es una geodésica del spray. 3. Si γ es adaptada y punto crítico de L (en particular minimal), entonces γ es una reparametrización de una geodésica del spray, en particular suave en [0, 1]. Demostración. Si γ es una geodésica, es suave y el término de la suma en el teorema previo no está presente. Además la integral es nula pues el integrando lo es. Si γ es C1 , el término de la suma no está presente en el teorema previo. Si γ es minimal, en particular es un extremo de la funcional L para cualquier variación, en particular µ = Dt γ̇, y entonces debe ser Dt γ̇ = 0, es decir γ es una geodésica del spray. 9.2. Cálculo de variaciones 197 Si γ es suave a trozos y minimal, en particular es minimal en cada tramo donde es suave (Observación 7.1.13), luego es una geodésica allí. Luego n X d + 0 = L(γ) L(νs ) = hµ(ti ), γ(t− i ) − γ(ti )ig . ds s=0 i=0 Para cada i = 1, .., n, elegimos f : [0, 1] → [0, 1] suave de manera que f = 0 excepto en (ti − ǫ, ti + ǫ) y f(ti ) = 1. Definimos µ = 0 en [0, 1] exceptuando en (ti − ǫ, ti + ǫ) donde lo definimos como el transporte paralelo de + vi = γ̇(t− i ) − γ̇(ti ) a un lado y al otro de ti (que está bien definido pues a cada lado γ es suave), multiplicado por la función f. Entonces µ ∈ Lev(γ) es suave y todos los términos de la suma se desvanecen salvo el i-ésimo, donde se obtiene + − + 2 0 = hµ(ti ), γ̇(t− i ) − γ̇(ti )ig = kγ̇(ti ) − γ̇(ti )k . Se deduce que cada salto de γ no es tal, y como γ resulta suave por la unicidad debe ser una geodésica del spray. 9.2.1.1. La variación de la energía Recordemos que la funcional energía se calcula, para curvas admisibles γ : [0, 1] → M, como Z1 1 E(γ) = /2 kγ̇k2γ dt. 0 Esta no es invariante por reparametrizaciones, dejamos los teoremas análogos a los de la funcional longitud como ejercicio para el lector (Ejercicio 9.vi). Teorema 9.2.5. Sean (M, g) Riemanniana débil, γ ⊂ M admisible, µ ∈ Lev(γ) y ν la variación del teorema previo. Entonces si µ(0) = µ(1) = 0, se tiene Z1 n X d + hµ(ti ), γ̇(t− E(ν ) = − hD γ̇, µi dt + s t g i ) − γ̇(ti )ig . ds s=0 0 i=1 Corolario 9.2.6. Sean (M, g) Riemanniana y γ : [0, 1] → M. 1. Si γ es una geodésica del spray, entonces es un punto crítico de E para toda variación propia. 198 Variedades Riemannianas y pseudo-Riemannianas 2. Si γ es C1 y minimal para la energía, entonces es una geodésica del spray. 3. Si γ es una suave a trozos (adaptada) y minimal para la energía entonces γ es una geodésica del spray, en particular suave en [0, 1]. 9.3. Las geodésicas son localmente minimizantes En esta sección probamos resultados en algún sentido recíprocos de los de la sección anterior: allí vimos que toda curva minimal debe ser una geodésica (pero no sabemos si dados dos puntos hay una curva minimal que los une), y que todas las geodésicas son extremales (pero no necesariamente minimales). Comenzamos con un lema técnico sobre el tensor de curvatura. Lema 9.3.1. Sean (M, g) pseudo-Riemanniana, p ∈ M, x, y, z ∈ Tp M. Entonces 1. hRp (x, y)z, zig = 0, 2. hRp (x, y)x, zig = hRp (x, z)x, yig . Demostración. Para la primera identidad, probaremos que hR(X, Y)Z, Zig = 0 para toda terna de campos X, Y, Z en M, de donde se deduce la propiedad pues R sólo depende del valor de los campos en el punto p. A partir de la propiedad (9.1), se deduce que XhZ, Zi = 2h∇X Z, Zi. Luego Y(XhZ, Zi) = 2h∇Y ∇X Z, Zi + 2h∇X Z, ∇Y Zi. Intercambiando X con Y y restando se deduce que [Y, X]hZ, Zi = 2h(∇Y ∇X − ∇X ∇Y )Z, Zi. Pero aplicando nuevamente la propiedad (9.1) al lado izquierdo se deduce que [Y, X]hZ, Zi = 2h∇[Y,X] Z, Zi. Comparando los lados derechos de las últimas ecuaciones, se tiene la propiedad al revisar la definición de R. Respecto de la segunda identidad, tiene una prueba análoga que omitimos. 9.3. Las geodésicas son localmente minimizantes 9.3.1. 199 El lema de Gauss Teorema 9.3.2 (Lema de Gauss). Sea (M, g) pseudo-Riemanniana débil. Consideramos γ : J → M, γ(t) = expp (tz) una geodésica de M, con z ∈ Tp M. 1. Dados v, w ∈ Tp M sea η ∈ Lev(γ) el único campo de Jacobi con η(0) = v, Dt η(0) = w. Entonces hγ̇(t), η(t)ig = hz, v + twip . 2. Para todo w ∈ Tp M y todo t ∈ J se tiene h(expp )∗tz z, (expp )∗tz wig = hz, wip . 3. Si v = 0 y w ⊥ z, entonces γ̇ ⊥ η para todo t ∈ J. Demostración. Sea f(t) = hγ̇(t), η(t)ig . Se tiene 0. Derivando nuevamente respecto de t se tiene d dt f(t) = hγ̇, Dt ηi pues Dt γ̇ = d2 f(t) = hγ̇, D2t ηi = hγ̇, R(γ̇, η)γ̇i = 0 dt2 para todo t ∈ J por el lema previo. Luego f(t) = f(0) + tf ′ (0), lo que prueba el primer item. La segunda fórmula es un caso particular (v = 0) combinado con la expresión η(t) = (expp )∗tz tw del Teorema 6.8.4, la tercera fórmula es evidente a partir de la segunda. 9.3.2. Coordenadas polares Observación 9.3.3. Sean p ∈ M, R > 0 de manera que expp : BR (0p ) ⊂ Tp M → UR (p) = expp (BR (0p )) es un difeomorfismo. Si α : [a, b] → UR (p) − {p} es admisible, consideremos Γ = exp−1 p ◦α : [a, b] → Tp M. Sea r : [a, b] → (0, R) dada por r(t) = kΓ (t)kp . Como Γ 6= 0, se deduce que r es suave a trozos y no nula. Sea u : [0, 1] → S = {v : kvkp = 1} ⊂ Tp M dada por u(t) = 1 Γ (t). r(t) Entonces u también es suave a trozos, y además Γ = ru. Como se verifica que α(t) = expp (r(t)u(t)), diremos que estas son las coordenadas polares de γ. 200 9.3.3. Variedades Riemannianas y pseudo-Riemannianas Minimalidad de las geodésicas Probamos primero una versión clásica del teorema de minimalidad, asumiendo que la métrica Riemanniana es acotada, es decir que la distancia inducida da la topología de la variedad M. Teorema 9.3.4 (Minimalidad local de las geodésicas, (M, g) Riemanniana fuerte). Sean p ∈ M y R > 0 como en la observación previa. Dado q ∈ UR (p), sea γp,q la geodésica del spray que une p, q, γp,q (t) = expp (tv) con v ∈ BR (0p ) ⊂ Tp M. Entonces 1. Sea 0 < c ≤ R. Entonces L(α) ≥ c para toda curva α : [0, 1] → M admisible que comienza en p, y se salga de Uc (p) = expp (Bc (0)). 2. L(α) ≥ L(γp,q ) para toda curva α : [0, 1] → M admisible que una p con q, y en particular d(p, q) = L(γp,q ) = kvkp . 3. Vale la igualdad si y sólo si α es una reparametrización de γp,q . Demostración. Sabemos que γp,q (t) = expp (tv) para algún v ∈ Tp M con kvkp = L(γp,q ) < R. Sea I ⊂ [0, 1] la componente conexa del cero de α−1 Uc (p), entonces I = [0, s) si α se sale de Uc (p), con r(s) := lı́m− r(t) = c o bien I = [0, 1] t→s si α ⊂ Uc (p). En cualquier caso, para 0 < δ < s sea αδ la restricción de α al intervalo I ∩ {t ≥ δ}. Como podemos suponer que α no vuelve a pasar por p (estamos acotando inferiormente su longitud) podemos escribir αδ (t) = expp (Γ (t)) y con la descomposición polar de Γ obtenemos αδ (t) = expp (r(t)u(t)). Luego α̇δ (t) = (expp )∗ru (ṙu + ru̇) = ṙ(expp )∗ru u + r(expp )∗ru u̇. Ahora bien, kuk2 = 1 luego derivando se tiene u ⊥ u̇ para todo t. Por el segundo item del Lema de Gauss, se deduce que h(expp )∗ru u, (expp )∗ru u̇ig = hu, u̇ip = 0. Entonces kα˙δ (t)k2 = kṙ(expp )∗ru uk2 + kr(expp )∗ru u̇k2 ≥ ṙ2 k(expp )∗ru uk2 , es decir kα˙δ (t)k ≥ |ṙ|k(expp )∗ru uk = |ṙ|, (9.12) 9.3. Las geodésicas son localmente minimizantes 201 d expp (ru) (con r, u variables independientes), y el puesto que (expp )∗ru u = dr transporte paralelo es isométrico. Supongamos primero que α se sale de Uc (p). Integrando en [δ, s], obtenemos Zs Zs |c − r(0)| = |r(s) − r(0)| ≤ |ṙ| ≤ kα˙δ (t)k ≤ L(αδ ) ≤ L(α). 0 0 Como r(0) = rδ (0), haciendo tender δ → 0+ se tiene L(α) ≥ c. Supongamos ahora que α : [0, 1] → M une p con q. Como L(γp,q ) = kvkp < R, tomando c = R en el ítem previo, se sigue que si α se sale de UR (p) entonces L(α) ≥ R > L(γp,q ). Supongamos ahora que α no se sale de UR (p), entonces α(1) = y = expp (1v) luego Γ (1) = v, con lo cual r(1) = kΓ (1)kp = kvkp y entonces |kvkp − rδ (0)| ≤ L(αδ ) y haciendo tender δ → 0+ nuevamente obtenemos L(α) ≥ kvkp . Esto prueba que γp,q es minimal, y entonces d(p, q) = kvkp = L(γp,q ). Si L(α) = L(γp,q ) = d(p, q), entonces α ⊂ UR (p). Como α también es minimal, es una geodésica del spray por el tercer ítem del Corolario 9.2.4, y como α ⊂ UR (p), debe ser una reparametrización de γp,q . Alternativamente, se puede argumentar que si vale la igualdad, de (9.12) se deduce que debe ser r k(expp )∗ru u̇k = 0 para todo t, como r 6= 0 (salvo para t = 0) se deduce que (expp )∗ru u̇ = 0. La exponencial es un difeomorfimo, luego debe ser u̇ = 0 o equivalentemente u(t) = cte = u, y esto nos dice que α(t) = expp (r(t)u), luego α es una reparametrización de expp (tv) = γp,q (t). Se tiene la siguiente consecuencia del resultado local de minimalidad de las geodésicas. Proposición 9.3.5. Sean (M, g) Riemanniana fuerte y p ∈ M. Existe cp > 0 tal que para todo 0 < r < cp se tiene expp (Br (0p )) = Br (p), expp (Sr (0p )) = Sr (p). Además expp es un difeomorfismo entre variedades en ambos casos. El Lema de Gauss (Teorema 9.3.2) nos dice que los rayos geodésicos que emanan de p son ortogonales a las esferas Sr (p). 202 Variedades Riemannianas y pseudo-Riemannianas Demostración. Tomando cp para que la exponencial esté definida y sea un difeomorfismo en Bcp (0p ), se tiene que Br (0), Sr (0) son subvariedades de Tp M, y expp |Br (0p ) , expp |Sr (0p ) son difeomorfismos con su imagen, siempre que 0 < r < cp . Si vemos que expp es una biyección en cada caso, resultará difeomorfismo. Si kvkp < r < cp , entonces tomando γ(t) = expp (tv), q = expp (v) se verifica que γ es minimizante por el Teorema de minimalidad local (Teorema 9.3.4) y d(q, p) = L(γ) = kvkp < r, luego expp (Br (0p )) ⊂ Br (p). Recíprocamente, si d(p, q) < r entonces q ∈ Ur (p) porque cualquier curva que se sale de Ur (p) tiene longitud ≥ r por el teorema de minimalidad local. Existe entonces una única geodésica γ ⊂ Ur (p) con velocidad inicial en Br (0p ) tal que q = expp (v), y kvkp = d(p, q) < r, luego vale la otra inclusión. La segunda afirmación para Sr (p) tiene una prueba idéntica. Respecto del Lema de Gauss, sean γ(t) = expp (tv) y q = expp (v), con d(p, q) = r y w ∈ Tq Sr (p). Tomemos β ⊂ Sr (p) tal que β̇(0) = w, entonces se tiene f(s) = dg (β(s), p)2 = r2 en un entorno de cero, y tomando para cada s el vector v(s) = exp−1 p β(s), se verifica kv(s)kp = r, v(0) = v. Derivando f en s = 0 se obtiene 0 = 2hv, v ′ (0)ip . Pero β(s) = expp v(s), luego w = β ′ (0) = (expp )∗v v ′ (0), y por el segundo ítem del Lema de Gauss, hγ̇(1), wi = h(expp )∗v v, (expp )∗v v ′ (0)i = hv, v ′ (0)i = 0. 9.3.3.1. Variedades Riemannianas débiles Si consideramos una métrica Riemanniana en la variedad M que sólo sea acotada superiormente, perdemos la minimalidad de las geodésicas. Observación 9.3.6. Usamos k · k para denotar la norma del espacio de Banach E que modela M, y en este caso denotamos BR (0p ) = {v ∈ Tp M : kvk < R} a la bola abierta con la topología de E, con R suficientemente pequeño como para que UR (p) = expp (BR (0p )) sea un entorno normal de p en M. Consideramos las coordenadas polares de α como en la Observación 9.3.3, donde r = kΓ kp denota ahora la norma de Γ con la métrica Riemanniana de M. 9.3. Las geodésicas son localmente minimizantes 203 Se tiene el siguiente resultado de minimalidad respecto de curvas que no salen del entorno normal. Teorema 9.3.7 (Minimalidad local de las geodésicas, (M, g) Riemanniana débil). Sean p ∈ M, R > 0 como en la observación previa, γp,q la geodésica del spray que une p, q. Entonces 1. L(α) ≥ L(γp,q ) para toda curva α : [0, 1] → UR (p) admisible que una p con q. 2. Vale la igualdad en el ítem previo si y sólo si α es una reparametrización de γp,q . Demostración. Sea Γ = exp−1 p α, entonces Γ (1) = v, con lo cual r(1) = kvkp . Razonando como en el Teorema 9.3.4, se tiene L(γp,q ) = kvkp = |r(1) − r(0)| ≤ L(α). Si L(α) = L(γp,q ) = d(p, q), como α también es minimal, es una geodésica del spray por el tercer ítem del Corolario 9.2.4, y como α ⊂ UR (p), debe ser una reparametrización de γp,q . Alternativamente, se puede argumentar que si vale la igualdad, de (9.12) se deduce que debe ser r k(expp )∗ru u̇k = 0 para todo t, como r 6= 0 (salvo para t = 0) se deduce que (expp )∗ru u̇ = 0. La exponencial es un difeomorfimo, luego debe ser u̇ = 0 o equivalentemente u(t) = cte = u, y esto nos dice que α(t) = expp (r(t)u), luego α es una reparametrización de expp (tv) = γp,q (t). 9.3.4. Las curvas continuas minimales En general, sabemos que una curva suave a trozos que es minimal debe ser una geodésica. Pero este resultado se puede extender a curvas rectificables, lo cual resulta útil para comparar estos resultados con el Teorema de Hopf-Rinow métrico (Teorema 7.2.3). Proposición 9.3.8. Sea (M, g) Riemanniana fuerte. Supongamos que γ : [0, 1] → M es una curva continua rectificable tal que ℓ(γ) es minimal, es decir, realiza la distancia Riemanniana entre los extremos. Entonces γ es una reparametrización de una geodésica corta del spray. 204 Variedades Riemannianas y pseudo-Riemannianas Demostración. Como todo punto pt = γ(t) tiene un entorno normal de manera que en un entorno de él la exponencial está definida por lo menos en la bola Brt del tangente, tomando un cubrimiento de la imagen de γ por entornos normales y extrayendo un subcubrimiento finito, resulta que existe R > 0 de manera que, para todo t ∈ [0, 1], expγ(t) está definida en BR (0) ⊂ Tpt M. Tomamos una partición π = {ti } del [0, 1] de manera que d(γ(ti ), γ(ti+1 )) < R. Basta probar que γ es una reparametrización de una geodésica minimal en el intervalo [ti , ti+1 ], ya que en ese caso se obtiene una geodésica a trozos que es minimal, y por el tercer ítem del Corolario 9.2.4, γ es una geodésica del spray. Sean p = γ(ti ), q = γ(ti+1 ) y notemos que γ restringida a este intervalo sigue siendo minimal. Como d(p, q) < R, existe β geodésica minimal que los une. Supongamos que existe x ∈ γ entre p, q tal que x ∈ / β. Como d(p, x) = ℓ(γp,x ) ≤ ℓ(γp,q ) < R, existe una geodésica corta µ1 que comienza en p y termina en x. Análogamente, como d(x, q) = ℓ(γx,q ) ≤ ℓ(γp,q ) < R, existe una geodésica corta que comienza en q y termina en r, llamaremos µ2 a esta geodésica pero revertida, es decir, a la geodésica corta que comienza en x y termina en q. Sea µ = µ2 ♯ µ1 que es una curva admisible que une p con q. Entonces L(µ) = L(µ1 ) + L(µ2 ) = d(p, x) + d(x, q) = ℓ(γ|p,x ) + ℓ(γ|x,q ) = ℓ(γ|p,q ) = d(p, q), lo que prueba que µ es corta. Entonces es una reparametrización de β, luego x ∈ β, y esto es absurdo. 9.3.5. La esfera, grupos unitarios y la Grassmanniana En algunos casos es posible estimar directamente el radio R de minimalidad del Teorema 9.3.4. 9.3.5.1. La esfera de un espacio de Hilbert Ejemplo 9.3.9. Un ejemplo importante donde se pueden calcular los radios de inyectividad de la exponencial, es la esfera S de un espacio de Hilbert H. Dado p ∈ S, sea p ′ ∈ M su opuesto. Afirmamos que BR (p) = S − {p ′ } es un entorno normal de p con las propiedades deseadas, para R = π. En primer lugar, la exponencial está definida en todo el tangente Tp M, para todo p ∈ S. En segundo lugar, a partir de la expresión explícita de la exponencial que obtuvimos en la Sección 6.9, sen(k) v expp (v) = cos(k)p + k 9.3. Las geodésicas son localmente minimizantes 205 para v ∈ Tp S = span(p)⊥ y k = kvk, no es difícil ver que esta es inyectiva para k < π, pues p, v son linealmente independientes, de hecho ortogonales. k cos(k)−sen(k) , un cálculo sencillo nos dice que Denotando g(k) = sen(k) k , h(k) = k3 ⊥ su diferencial en w ∈ Tp M = span(p) es (expp )∗v w = −g(k)hv, wip + h(k)hv, wiv + g(k)w. Este es un operador acotado, entre los espacios de Hilbert de la misma dimensión H0 = span(p)⊥ y H1 = span(expp (v))⊥ . Si fuera (expp )∗v w = 0, haciendo el producto escalar contra p se obtendría −g(k)hv, wi = 0. Como g(k) 6= 0, se deduce que w = 0. Por otra parte, dado z ∈ Texpp (v) S = 1 {cos(k)p+g(k)v}⊥ , entonces tomando r = cos(k) hv, zi -que está bien determinado siempre que k < π- aseveramos que w= 1 (z + g(k)rp − h(k)rv) g(k) verifica w ∈ Tp S y exp∗v w = z (Ejercicio 9.ix). Esto prueba que esta aplicación diferencial es un epimorfismo, y en consecuencia, un isomorfismo. Ahora, dado q ∈ S − {p ′ }, existe una única geodésica γ del spray que une p, q, y esta geodésica verifica γ ⊂ S − {p ′ }. Se deduce de aquí que si q ∈ S − {p ′ }, la única geodésica del spray γp,q (t) = expp (tw) = cos(kwkt)p + sen(kwkt) w kwk que une p con q (que es un círculo máximo que pasa por p, q) es la única curva minimal que une p con q y en particular d(p, q) = L(γp,q ) = kwk < π. Por otra parte, a partir del hecho de que γp,q (1) = q, un simple despeje nos muestra que d(p, q) = kwk = arc cos(hp, qi). Como S se obtiene como la clausura de S − {p ′ }, se deduce que d(p, p ′ ) = π, y por otra parte cualquier círculo máximo que una p con q tiene longitud π, lo que muestra que hay infinitas geodésicas minimales que unen p, p ′ en S (exceptuando el caso dimH = 2, donde sólo hay dos de ellas). 206 9.3.5.2. Variedades Riemannianas y pseudo-Riemannianas El grupo de operadores unitarios Recordemos que para la métrica invariante a izquierda dada por la norma Frobenius en el grupo unitario, el spray métrico es exactamente el spray canónico, luego las geodésicas son grupos a un parámetro. Recordemos también que dados u, v ∈ U, si ku − vk < 2 existe un único z ∈ g = Aah con kzk < π y v = uez (aquí y en este ejemplo k · k denota la norma uniforme del álgebra). Por último, recordemos que si A es un álgebra de von Neumann (por ejemplo si A = Mn (C)), entonces incluso cuando ku − vk = 2 existe z ∈ Aah de manera que kzk = π y v = uez . En todo caso el conjunto de los v a los que se puede llegar con los grupos a un parámetro que parten de v y tienen como exponente elementos de norma uniforme menor que π, forman un abierto denso en U. De acuerdo a la caracterización de la diferencial de la exponencial (Lema 4.1.2), si v, w ∈ A se tiene Z1 d exp∗v (w) = exp(v + tw) = e(1−t)v wetv dt dt t=0 0 = ev F(adv)w = [G(adv)w] ev con F, G : C → C las funciones enteras dadas por F(λ) = 1 − e−λ , λ G(λ) = eλ − 1 . λ De la última fórmula se deduce que la diferencial es inversible si y sólo si σ(adv) ∩ {2kπi : k ∈ Z6=0 } = ∅. En particular, si kzk < π, entonces kadzk ≤ 2kzk < 2π con lo cual r(adz) < 2π y se tiene que la diferencial es inversible. Luego en el abierto denso {ku − vk < 2} ⊂ U la exponencial en u dada por expu (z) = uez es un difeomorfismo y podemos aplicar el teorema Riemanniano de minimalidad local. Sea δ(t) = uetz con u, v, z como antes (kzk ≤ π). Notemos que, como δ̇ = δ z, entonces L2 (δ) = kzk2 , mientras que que para la métrica de Finsler b = k · k (dada por la norma uniforme del álgebra) se tiene Lb (δ) = kzk. Observemos que para x ∈ Mn (C), se verifica q 1 kxk = máx λi ≤ λ21 + · · · + λ2n = (Tr x∗ x) 2 = kxk2 √ con λi los autovalores de |x| = x∗ x. En el caso de traza infinita, si A = B2 (H) denota los operadores de Hilbert-Schmidt (ver el Apéndice D.1.3), consideramos el grupo unitario clásico de Lie-Banach dado por UHS = {u ∈ U : u − 1 ∈ B2 (H)}. 9.3. Las geodésicas son localmente minimizantes 207 cuyo espacio tangente en la identidad se identifica con los operadores de HilbertSchmidt antihermitianos. Se recomienda ver el libro de Pierre de La Harpe [38] donde se estudian análogos en B(H) (con H infinito dimensional) de los grupos de Lie clásicos introducidos en la Sección 3.4. Evidentemente, también se tiene kxk = máx ≤ λ∈σ(|x|) ∞ X λ2i i=1 !1/2 1 = Tr(x∗ x) /2 = kxk2 donde λi es el espectro (discreto) de |x|, que se acumula únicamente en el cero por ser todo operador de Hilbert-Schmidt un operador compacto en B(H). Luego supondremos asimilado el caso de matrices como caso particular de los operadores de Hilbert-Schmidt, aunque haya otros aspectos fundamentales de la teoría donde hay notables diferencias, para los propósitos del próximo teorema será correcto razonar de esta forma. La propiedad esencial en ambos casos es que la métrica Riemanniana introducida es acotada. Por otra parte, para un álgebra C∗ infinito dimensional pero con traza finita τ (ver el Apéndice D.2.1), supondremos que la misma está normalizada, es decir que τ(1) = 1. Como una traza es en particular un estado del álgebra, se verifica kτk = τ(1) = 1, con lo cual se tiene en este caso la desigualdad inversa 1 1 kxk2 = τ(x∗ x) 2 ≤ kx∗ xk 2 = kxk. Observemos que en este caso la métrica es sólo acotada superiormente. El siguiente teorema reúne los resultados concernientes a geodésicas minimales en este contexto, conocido como álgebras de operadores con traza. Estos resultados están adaptados de los trabajos [4, 7] de E. Andruchow y G. Larotonda. Teorema 9.3.10. Sea U el grupo unitario de un álgebra de operadores con traza con la métrica invariante a izquierda g2 dada por hv, wig2 = hu∗ v, u∗ wi2 = Tr(u∗ v(u∗ w)∗ ) = −Tr(v0 w0 ) para v = uv0 , w = uw0 ∈ uAah = Tu U (o bien τ en lugar de Tr en el caso de un álgebra C∗ con traza finita). Entonces 1. El spray canónico Fu (v) = vu∗ v coincide con el spray métrico. 2. Si u, v ∈ U y ku − vk < 2, existe un único z = log(u∗ v) ∈ Aah tal que v = uez , y el grupo a un parámetro δ(t) = uetz es la única geodésica minimal del spray que une v, u. En particular d2 (u, v) = kzk2 = k log(u∗ v)k2 . 208 Variedades Riemannianas y pseudo-Riemannianas 3. Si el álgebra es de von Neumann finita y ku − vk = 2, existe z ∈ Aah tal que kzk = π de manera que la curva a un parámetro con velocidad z es una geodésica corta que une u, v. Esta geodésica no es única. 4. Si el álgebra es finita, entonces el diámetro geodésico de la variedad Riemanniana (U, g2 ) es exactamente π. 5. Si A = B2 (H) (los operadores de Hilbert-Schmidt) entonces el diámetro geodésico de (UHS , g2 ) es infinito, y si ku − vk = 2 siempre existe alguna geodésica corta que los une. Esta geodésica corta no es única: la cantidad nu,v de exponentes z que se pueden hallar que conecten u, v depende de la multiplicidad de −2 como valor espectral de u − v, siendo nu,v = 2 cuando la multiplicidad es 1, y nu,v = ∞ cuando la multiplicidad es > 1. Demostración. Que el spray canónico coincide con el spray métrico es la Observación 9.1.5. Si ku−vk < 2, u∗ v tiene un único logaritmo analítico antihermitiano z, y como −1 ∈ σ(u − v), se tiene kzk < π. La curva δ(t) = uetz es una geodésica del spray que une u con v = uez , y expu (z) = uez es un difeomorfismo para kzk < π. La prueba de que δ es corta (y en particular kzk2 = d2 (u, v) es cierto) puede hallarse para operadores de Hilbert-Schmidt en el trabajo [7] de E. Andruchow y G. Larotonda, mientras que la prueba para álgebras finitas puede hallarse en el trabajo [4] de Andruchow. Si el álgebra es de von Neumann, u∗ v tiene logaritmos Borelianos z (ciertamente no únicos), y si ku − vk = 2 se pueden elegir de norma kzk = π (ver la Sección 4.4.1.1). Como d2 (u, v) = kzk2 ≤ kzk ≤ π para todo u, v, se sigue que el diámetro geodésico es exactamente π si consideramos u = 1, v = −1, con z = πi, 1 pues kzk2 = Tr(z∗ z) 2 = π. Si U = UHS , dado M > 0 consideramos cualquier sucesión de números reales P {xn } ⊂ ℓ2 que verifique sup |xn | ≤ π y |xn |2 = M2 . Fijada una b.o.n. {en } del espacio de Hilbert separable H, sea u = 1, X z= ixn hen , ·iek . Entonces z es un operador compacto antihermitiano que verifica kzk ≤ π. Pero pP |xn |2 = M, en particular z es un operador de Hilbertademás kzk2 = z Schmidt. Sea v = e ∈ UHS . Entonces d(1, v) = kzk2 = M lo que prueba que el diámetro del grupo es infinito. Si u, v ∈ UHS verifican ku − vk = 2, podemos suponer que u = 1 por la invariancia de la métrica. Sea x operador de Hilbert-Schmidt tal que v = 1 + x. 9.3. Las geodésicas son localmente minimizantes 209 Entonces v − u = v − 1 = x es un operador de Hilbert-Schmidt con kxk = 2. Como kv − 1k = 2 es equivalente a −1 ∈ σ(v), esto a su vez es equivalente a −2 ∈ σ(v − 1) = σ(x) (y 2eit ∈ / σ(x) para t 6= π pues σ(v) ⊂ S1 ). Como el espectro de x sólo se puede acumular en cero, −2 es un punto aislado de σ(x) (de hecho, un autovalor con multiplicidad geométrica finita). Sea p0 el proyector asociado al autoespacio del autovalor −2, este debe ser un proyector de rango finito. Entonces, como 1 + x = v es unitario, y x es compacto, debe ser X x = −2p0 + (eiθk − 1)pk k≥1 donde pk son proyectores disjuntos asociados a los autoespacios de autovalor eiθk (|θk | < π) del operador v, y además {pj }j≥0 son disjuntos y suman la identidad, P es decir j pj ξ = ξ para todo ξ ∈ H. También se tiene v = = x + 1 = 1 − 2p0 + −2p0 + X X (eiθk − 1)pk k≥1 iθk (e k≥1 − 1)pk + X pj = −p0 + j X eiθk pk . k≥1 Como x es Hilbert-Schmidt, debe ser X X ∞> |eiθk − 1|2 = 2(1 − cos(θk )). k k Definimos z = z0 + zi = πip0 + X iθk pk . k Entonces z es un operador compacto y autoadjunto, con ez = v, de hecho kzk = π, mientras que X kzk22 = |θk |2 + π2 . Como θk → 0 (pues el espectro de x se acumula en cero) entonces existe una constante C > 0 tal que 1 − cos(θk ) ≥ C|θk |2 para k ≥ k0 , probando que kzk2 < ∞, es decir que z es un operador de Hilbert-Schmidt. Luego δ(t) = etz es una geodésica corta de UHS . La multiplicidad de los posibles z tales que ez = v se sigue del siguiente hecho: elegimos una base {ei }i=1...n del rango de p0 , y escribimos n n X X p0 = ei ⊗ ei = hei , ·iei . i=1 i=1 210 Variedades Riemannianas y pseudo-Riemannianas Entonces la componente z0 = πip0 de z puede cambiarse por z0′ = πi n X i=1 (−1)αi ei ⊗ ei ′ donde αi = ±1. Como e±πiei ⊗ei = −ei ⊗ ei , se tiene ez0 = −p0 para cualquier base del rango de p0 , para cualquier elección de los αi , lo que nos dice que hay infinitas elecciones de z posibles, luego hay infinitas curvas cortas que unen 1 con v en UHS . La única excepción es cuando n = 1, en ese caso hay sólo dos posibles elecciones de z0′ que son ±e1 ⊗ e1 , luego hay sólo dos posibles elecciones de z. Observación 9.3.11. Hay un detalle importante para remarcar del teorema previo. En el caso de métricas acotadas (matrices y operadores Hilbert-Schmidt), el teorema de minimalidad local (Teorema 9.3.4) nos dice que en el entorno de la identidad dado por B = {ev : v∗ = −v, kvk2 < π} las curvas cortas que unen u ∈ B con la identidad son geodésicas (grupos a un parámetro de la exponencial), puesto que kvk < kvk2 < π garantiza que la exponencial es un difeomorfismo; además este entorno es óptimo desde el punto de vista del Teorema 9.3.4, pues si admitimos que kvk2 = π, podemos hallar v tal que exp∗v no es inversible (basta tomar v = π e ⊗ e con e ∈ H de norma unitaria). Sin embargo el teorema previo asegura el resultado para el abierto denso W = {ew : w∗ = −w, kwk < π} = {u ∈ U : ku − 1k < 2}, y cabe notar que la inclusión B ⊂ W es estricta. 9.3.5.3. El grupo de unitarios con la norma uniforme Ahora estamos interesados en la curvas cortas del grupo unitario pero para la métrica de Finsler b inducida por la norma uniforme, que no es una métrica Riemanniana. Afirmamos que se trata nuevamente de los grupos a un parámetro. Aquí U denota el grupo unitario de un espacio de Hilbert de dimensión finita o infinita. Teorema 9.3.12. Si δ(t) = uetz con kzk ≤ π y u, v ∈ U, entonces Lb (δ) = kzk ≤ Lb (α) = Z1 0 kα̇kdt 9.3. Las geodésicas son localmente minimizantes 211 para toda curva α ⊂ U admisible que una u con v, y en particular db (u, v) = kzk. Demostración. Observemos en primer lugar que −z2 ≥ 0 por ser z∗ = −z. En el caso finito dimensional, tomamos el autovector de −z2 correspondiente al autovalor kz2 k = kzk2 , y lo normalizamos para obtener ξ ∈ H unitario tal que −z2 ξ = kzk2 ξ. En el caso infinito dimensional, se puede hallar un autovector normizante y unitario de la siguiente manera: tomando un estado ρ ∈ S(A) tal que ρ(−z2 ) = kz2 k = kzk2 , construimos la representación GNS del álgebra inducida por ρ y consideramos ξ = [1] ∈ H. Como muestra el Lema B.3.17 del Apéndice, se verifica también −z2 · ξ = kzk2 ξ. Sea γ = δ · ξ, entonces como δ(t) es unitario para todo t, se tiene γ ⊂ S, la esfera del espacio de Hilbert H. Observemos que γ̇(t) = uzetz · ξ, luego si usamos k · kH para denotar la norma del espacio de Hilbert kγ̇(t)k2H = −hz2 etz · ξ, etz · ξi = −hz2 · ξ, ξi = kzk2 kξk2H = kzk2 , con lo cual LS (γ) = kzk ≤ π. Derivando nuevamente γ se tiene γ̈(t) = uetz z2 · ξ = −kzk2 γ = −LS (γ)2 γ, luego γ es una geodésica de la esfera con longitud menor o igual a π y por ende minimal. Si α era cualquier otra curva uniendo u, v ∈ U, y consideramos β(t) = α · ξ, se tiene que β debe ser por lo menos tan larga como γ, y entonces kzk = Lb (δ) = LS (δ · ξ) ≤ LS (α · ξ) = Z1 0 kα̇ · ξkH ≤ Z1 0 kα̇k = Lb (α). Este resultado se debe a C. J. Atkin [14, 15], donde el autor prueba el mismo junto con otros resultados similares para el grupo ortogonal y los grupos unitario y ortogonal simplécticos, usando técnicas introducidas por Putnam y Wintner en [59, 60] sobre logaritmos de operadores ortogonales en B(H). Cabe mencionar que la prueba que presentamos es una variación de la de Atkin, introducida por Porta y Recht en el contexto de la Grassmanniana [58]; en ese contexto, en forma independiente, N. Salinas obtiene el mismo resultado y da una estimación de la relación entre la distancia geodésica y la distancia lineal [65]. 212 9.3.5.4. Variedades Riemannianas y pseudo-Riemannianas El grupo de unitarios con una norma simétrica Un caso que contiene al de la sección previa y al de los operadores de HilbertSchmidt, es el siguiente. Dada una norma simétrica k·kI en B(H) (seguimos aquí la notación del Apéndice D.1.2) podemos considerar la métrica en el álgebra de Lie del grupo de operadores unitarios dada por kvku = ku∗ vkI = kvkI para v ∈ Tu U. Se considera en el caso infinito dimensional el grupo unitario UI = {u ∈ U : u − 1 ∈ I} y este resulta grupo de Lie-Banach cuya álgebra de Lie-Banach son los operadores antihermitianos de I. Al igual que en los casos anteriores, es clave considerar la bola de radio π en la norma uniforme, puesto que allí la exponencial es un difeomorfismo. Por ser la norma unitariamente invariante, el spray canónico del grupo Fu (v) = vu∗ v es compatible con la métrica y las geodésicas son nuevamente los grupos a un parámetro. Se tiene el siguiente teorema, cuya prueba puede hallarse en un trabajo de J. Antezana, G. Larotonda y A. Varela [11]. Teorema 9.3.13. Si u, v = uez ∈ U con z ∈ I, consideramos la geodésica δ(t) = uetz . Entonces 1. Si kzk ≤ π, la geodésica es minimal entre sus extremos. 2. Dados u, v ∈ UI existe z ∈ I tal que kzk ≤ π y v = uez . 3. Si la norma simétrica es estrictamente convexa (Observación 8.4.2), para kzk < π (equivalentemente, para ku − vk < 2) esta geodésica es única. 4. La multiplicidad de geodésicas uniendo u, v con ku−vk = 2 se computa como en el último ítem del Teorema 9.3.10. Este resultado es excepcional porque según veremos en la Sección 9.4, es usual que en dimensión infinita no existan geodésicas minimales que unan puntos suficientemente lejanos. 9.3.5.5. La Grassmanniana Dado un proyector autoadjunto, y un ideal simétricamente normado I ⊂ B(H) podemos considerar la Grassmanniana dada por la órbita OI (p) = {upu∗ : u ∈ UI }. 9.4. Existencia global de geodésicas cortas 213 En el caso en que I son los operadores de Hilbert-Schmidt, esta se conoce como Grassmanniana de Sato o Grassmanniana reducida. En ese caso, la variedad fue estudiada por Z. Kovarik en [46], y los autores prueban allí que si kupu∗ − vpv∗ k < 2, entonces la única geodésica que une estos puntos (ver 6.9.6) es minimal para la norma de Hilbert-Schmidt. En un trabajo reciente, Andruchow y Larotonda [7] extienden este resultado a toda la Grassmanniana de Sato, probando que si la distancia uniforme lineal es exactamente 2, existen infinitas geodésicas cortas que unen upu∗ con vpv∗ (comparar con el Teorema 9.3.10). Se prueba también en [7] un resultado análogo para las normas p de Schatten, con p ≥ 2. A partir del resultado enunciado en el Teorema 9.3.13, no es difícil deducir un resultado análogo para la Grassmanniana, el cual dejamos como ejercicio (9.iv). Teorema 9.3.14. Sea z∗ = −z ∈ I, p un proyector autoadjunto de B(H), δ(t) = etz pe−tz . Entonces 1. Si kzk ≤ π, la geodésica es minimal entre sus extremos cuando se la mide con la norma k · kI . 2. Dados u ∈ UI , existe z ∈ I tal que kzk ≤ π y u = ez , y por ende dados dos puntos p, q en OI (p) existe siempre una geodésica corta que los une. Esta es única si kq − pk < 1 y la norma simétrica es rotunda. 3. La multiplicidad de geodésicas uniendo p, q con kp−qk = 1 se computa como en el último ítem del Teorema 9.3.10. 9.4. Existencia global de geodésicas cortas En esta sección probamos que, en dimensión finita, existen geodésicas cortas siempre que la variedad sea completa, reforzando así el teorema de Hopf-Rinow métrico. El primer resultado en esa dirección es el siguiente teorema, de interés independiente, con una prueba adaptada del libro de Lang [47]. Teorema 9.4.1. Sea (M, g) Riemanniana, conexa y de dimensión finita. Supongamos que existe p ∈ M tal que D(expp ) = Tp M. Entonces para todo q ∈ M existe una geodésica del spray corta que une q con p. Demostración. Tomamos c suficientemente pequeño como para garantizar las condiciones de la Proposición 9.3.5. Sea q ∈ M, si q ∈ Bc (p) el resultado queda probado por esa proposición. Supongamos entonces que q ∈ / Bc (p), es decir 214 Variedades Riemannianas y pseudo-Riemannianas d(q, p) > c. Como M tiene dimensión finita y expp (Sc (0p )) = Sc (p), este último es compacto y por ende existe al menos un punto r ∈ Sc (p) tal que d(q, r) = d(q, Sc (p)), es decir un punto que minimiza la distancia de q a la esfera Sc (p). Sea v ∈ Tp M, kvkp = 1 tal que expp (cv) = r. Afirmamos que γ(t) = exp(tv) es una geodésica corta que una p con q, para t0 = d(p, q). Es decir, estamos usando la estrategia de apuntar en la dirección correcta y luego probar que la flecha alcanza su objetivo. En primer lugar observemos que, para cualquier curva α que una p con q, esta debe atravesar Sc (p) al menos una vez, digamos en un instante t1 , luego L(γ) = L(γ[0,t1 ] ) + L(γ[t1 ,1] ) ≥ c + d(Sc (p), q) = d(p, r) + d(r, q). Entonces d(p, q) ≥ d(p, r) + d(r, q), y como la otra desigualdad siempre vale, se tiene d(p, q) = d(p, r) + d(r, q). Sea J ⊂ [0, d(p, q)] el conjunto de los t tales que d(p, q) = t + d(γ(t), q). (9.13) Como 0 ∈ J y d es continua, J es cerrado y no vacío. Sea m = máx J, si vemos que m = d(p, q) = t0 entonces el resultado estaría probado pues d(γ(t0 ), q) = 0 implica γ(t0 ) = q. Supongamos que no es así, es decir 0 < m < d(p, q). Sea x = γ(m) y tomemos δ > 0 pequeño para que Sδ (x) sea difeomorfa con la esfera del tangente en x, y tal que q ∈ / Bδ (x). Veremos que m + δ ∈ J lo cual es absurdo y prueba que m = d(p, q) concluyendo así la prueba del teorema. Para ver que m + δ ∈ J, repetimos el argumendo precedente. Existe y ∈ Sδ (x) tal que d(x, q) = d(x, y) + d(y, q) = δ + d(y, q). Reemplazando m en la ecuación (9.13), tenemos que d(p, q) = m + d(x, q) = m + δ + d(y, q) Afirmamos que y = γ(m + δ), y usando la última ecuación esto probaría que (9.13) vale para m + δ. Se tiene d(p, y) ≥ d(p, q) − d(y, q) = m + δ, mientras que si consideramos los segmentos geodésicos del spray que unen p con x y x con y tienen longitud m y δ respectivamente, luego este camino dado 9.4. Existencia global de geodésicas cortas 215 por dos geodésicas una a continuación de la otra da la distancia entre p e y, y por el tercer item del Corolario 9.2.4 se trata de una geodésica del spray. Como coincide en el primer tramo con γ, debe tratarse de γ todo a lo largo de [0, m+δ], probando que y = γ(m + δ). Antes de proseguir presentamos un ejemplo para ilustrar cómo puede fallar el resultado previo en dimensión infinita, extraído de la Tesis Doctoral de J. McAlpin [50]. Ejemplo 9.4.2. Sea H un espacio de Hilbert de dimensión infinita, {en }n≥0 una base ortonormal de H. Sea A ∈ B(H) el operador autoadjunto dado por X X A( xn en ) = an xn en n≥0 donde a0 = 1 y an = 1 + 21n para n ∈ N. Entonces es fácil ver que A es inversible, de hecho kvk ≤ kAvk para todo v ∈ H, y además kAvk = kvk si y sólo si v ∈ span(e0 ). Sea S ⊂ H la esfera unitaria y sea M = A(S). Entonces M ⊂ H es subvariedad regular, a la que le damos la métrica Riemanniana como subespacio de H. Observemos que A fija e0 , −e0 ∈ S, es decir e0 , −e0 ∈ M. Afirmamos que no existe curva corta que una estos puntos en M. Sea β ⊂ M que une estos puntos, sea α = A−1 β que es una curva en S que une e0 , −e0 . Entonces β̇ = Aα̇ y si reparametrizamos α para que tenga velociadad constante se tiene kβ̇(t)k = kAα̇(t)k ≥ kα̇(t)k = L(α) ≥ π, con lo cual dM (e0 , −e0 ) ≥ π. Por otra parte, se tiene la igualdad L(β) = π únicamente si kAα̇(t)k = kα̇(t)k para todo t ∈ [0, 1], puesto que de ser estrictamente mayor en un t0 el término de la izquierda, por continuidad sería mayor en un intervalo y entonces L(β) > π. Pero la igualdad sólo es posible si α(t) = λ(t)e0 con λ : [0, 1] → R una función C1 a trozos, con lo cual β = Aα no podría unir e0 , −e0 en M. En resumen, cualquier curva en M que una estos puntos tiene longitud estrictamente mayor que π. Veamos que dM (e0 , −e0 ) = π para concluir que no hay ninguna curva corta que los una. Ya tenemos una desigualdad, probemos la otra. Sea αn (t) = cos(πt)e0 + sen(πt)en que es una geodésica corta que une e0 , −e0 en S. Tomemos βn = Aαn . Entonces βn une e0 , −e0 en M y además 1 kβ˙n (t)k2 = π2 sen2 (πt) + cos2 (πt)(1 + n )2 . 2 216 Variedades Riemannianas y pseudo-Riemannianas Luego L(βn ) → π, y se deduce que dM (e0 , −e0 ) ≤ π, luego dM (e0 , −e0 ) = π. En dimensión finita, sin embargo, se tiene el siguiente resultado que se deduce del Teorema de Hopf-Rinow métrico y el Teorema previo. Corolario 9.4.3 (Hopf-Rinow en variedades Riemannianas). Sea (M, g) Riemanniana, conexa y de dimensión finita. Son equivalentes: 1. (M, dg ) es un espacio métrico completo. 2. M es geodésicamente completa. 3. Existe p ∈ M tal que D(expp ) = Tp M. 4. Todo conjunto cerrado y acotado de (M, dg ) es compacto. En cualquiera de estos casos, para todo x, y ∈ M existe una geodésica corta del spray que los une. Demostración. Las implicaciones 1 ⇒ 2 ⇒ 3 las probamos en la Proposición 8.2.1, para variedades de Finsler sin restricciones de dimensión. Supongamos que vale 3. para algún p ∈ M, sea C ⊂ M un conjunto cerrado y acotado. Existe r > 0 tal que C ⊂ Br (p). Por el Teorema 9.4.1, para cada punto x ∈ C hay una geodésica corta γx (t) = expp (tvx ) que comienza en p y termina en x, es decir r > d(x, p) = L(γx ) = kvx kp . Entonces C ⊂ expp (Br (0p )) y como M tiene dimensión finita Br (0p ) ⊂ Tp M es compacto con lo cual C es un cerrado dentro de un compacto y en consecuencia compacto. Ahora supongamos que vale 4. y sea {xn } ⊂ M de Cauchy. Entonces está en un conjunto acotado y cerrado de M, digamos en Br (xn0 ). Luego la sucesión {xn } tiene un punto de acumulación, que puede verse fácilmente que es el límite de la sucesión. Esto concluye la prueba de las equivalencias. Si vale cualquiera de las hipótesis equivalentes, en particular (M, dg ) es de métrica interior, localmente compacto y completo. Por el Teorema de HopfRinow métrico 7.2.3, sabemos que existe una curva γ continua que une x con y, que es corta para la métrica db , es decir ℓ(γ) = db (x, y). Por la Proposición 9.3.8, una simple reparametrización de γ nos da la geodésica del spray corta que une x con y. También se puede argumentar notando que como M es geodésicamente completa, se puede aplicar el Teorema 9.4.1. 9.5. Convexidad local 9.5. 217 Convexidad local En esta sección refinamos el resultado de los entornos normales, para probar que dado p ∈ M, para c suficientemente pequeño, en una variedad Riemanniana (M, g), la bola Bc (p) es convexa. Las pruebas que daremos de estos resultados se remiten a la Tesis de McAlpin del año 1965 [50], aunque los resultados son anteriores. Tomamos como siempre un entorno normal de p ∈ M de la forma (U, W) de manera que G(U × BR (0)) ⊃ W × W con lo cual W ⊂ U, W ⊂ UR (p) para todo p ∈ W. Seguimos mayormente la exposición del libro de Lang [47, VIII, §5]. En un espacio de Hilbert (de hecho, en un espacio normado estrictamente convexo), las rectas tangentes a una esfera permanecen del lado externo de esta esfera. Este resultado tiene su análogo en variedades Riemannianas, en la siguiente proposición. Supondremos en esta sección que la métrica g es acotada. Proposición 9.5.1. Sea p ∈ (M, g) Riemanniana fuerte. Existe c0 > 0 tal que si 0 < r ≤ c0 , y γ es una geodésica tangente a Sr (p) en t = t0 , entonces γ permanece fuera de Sr (p) para t en un entorno de t0 . Demostración. Elegimos c como en la Proposición 9.3.5 para que la exponencial en p sea un difeomorfismo expp : Br (0) → Br (p) para 0 < r < c. Reparametrizando asumiremos que t0 = 0, y podemos escribir γq,u (s) = expq (su) con q ∈ Sr (p), u 6= 0 ∈ Tq M. Para s cerca de cero, γ está dentro de Bc (p) luego podemos calcular wq,u (s) = exp−1 p (γq,u (s)) ∈ Tp M. Sea fq,u (s) = kwq,u (s)k2p , entonces f(0) = r2 y afirmamos que es mayor que r para s cerca de cero, si r es suficientemente pequeño. Calculamos 1/2f ′ q,u (s) 1/2f ′′ (s) q,u ′ = hwq,u (s), wq,u (s)ip , ′ ′′ = kwq,u (s)k2p + hwq,u (s), wq,u (s)ip . ′′ Sea h(q, u) = 1/2fq,u (0), definida en TU para U entorno de p suficientemente pequeño, y resulta una función continua (usando que la variedad es por lo menos de clase C2 ). Tomando r = 0, es decir q = p, la curva γ comienza en p luego wp,u (s) = su, con lo cual fp,u (s) = s2 kuk2p lo que nos dice que h(p, u) = kuk2p > 0 así que hp = h(p, ·) es definida positiva en Tp M. Por la continuidad de h en TM, existe un entorno de {p} × Tp M donde hq es definida positiva, es decir h(q, u) > 0 si u 6= 0 ∈ Tq M. Tomemos c0 > 0 tal que Bc0 (p) esté dentro de ese entorno. 218 Variedades Riemannianas y pseudo-Riemannianas Fijado r ≤ c0 y q ∈ Sr (p) = expp (Sr (0p )), llamemos ws = wq,u (s) y como γ es tangente a Sr (p) en q, se tiene que w es tangente a Sr (0p ) en w0 . Luego 1/2f ′ (0) = hw0 , w0′ ip = 0. Como 1/2f ′′ (0) = h(q, u) > 0, se tiene que d(p, γ(s))2 = f(s) > f(0) = r2 para s suficientemente pequeño. Como corolario, se obtiene la convexidad de las bolas para radios suficientemente chicos. Teorema 9.5.2. Sean p ∈ (M, g) y (U, W) entorno normal de p. Sea r > 0 tal que Br (p) ⊂ U. Existe c1 > 0 tal que si 0 < r ≤ c1 y β ⊂ U es la geodésica corta que une q, q ′ ∈ Br (p), entonces β ⊂ Br (p) y en particular Br (p) ⊂ M es convexa. Demostración. Sea β ⊂ U, que une q, q ′ ∈ Br (p), β(t) = expq (tz) y kzkq = d(q, q ′ ). Tomemos c pequeño tal que expp (Bc (0p )) = Bc (p) como en la Proposición 9.3.5, sea c1 = c/2. Afirmamos que si 0 < r ≤ c1 , entonces β ⊂ Uc (p) = Bc (p). De no ser así, existe t0 ∈ (0, 1) tal que d(β(t0 ), p) ≥ c. Sean γq , γq ′ geodésicas cortas que emanan de p tales que L(γq ) = d(q, p) < r, L(γq ′ ) = d(q ′ , p) < r. Si β∗ denota la curva β revertida, es decir β∗ (t) = β(1 − t), sean γ1 = β|[0,t0 ] ♯ γq , γ2 = β∗ |[0,1−t0 ] ♯ γq ′ , que resultan dos curvas admisibles que emanan de p y salen de Bc (p). Por el teorema de minimalidad local (9.3.4), L(γi ) ≥ c. Entonces c ≤ L(β|[0,t0 ] ) + L(γq ) < L(β|[0,t0 ] ) + r y también c ≤ L(β|[1,t0 ] ) + L(γq ′ ) < L(β|[1,t0 ] ) + r. Sumando estas dos desigualdades se tiene que 2c ≤ L(β) + 2r < L(β) + 2c1 = L(β) + c, 9.6. Curvatura seccional 219 es decir c < L(β). Pero esto es absurdo pues L(β) = d(q, q ′ ) ≤ d(q, p) + d(p, q ′ ) < 2r ≤ 2c1 = c. Como β ⊂ Bc (p), podemos considerar w : [0, 1] → Tp M dada por la expresión ws = exp−1 p β(s). Observemos que para cada s, Uc (p) ∋ β(s) = expp (1ws ) y kws k < c < R, luego γs (t) = expp (tws ) es la única geodésica corta que une p con β(s), con lo cual f(s) = d(p, β(s))2 = L(γs )2 = kγ˙s (t)k2γs (t) = kws k2p . Afirmamos que f(s) < r2 para todo s ∈ [0, 1], lo que concluiría la prueba del teorema. De no ser así, existe s0 ∈ (0, 1) donde f alcanza su máximo absoluto, f(s0 ) = δ ≥ r2 . Debe ser entonces f ′ (s0 ) = 0, y derivando la última ecuación en s = s0 deducimos que hws0 , ẇs0 i = 0, es decir β es tangente a la esfera Sδ (p) en s = s0 . Por la proposición previa, β está estrictamente fuera de Sδ (p) para s cerca de s0 , contradiciendo la maximalidad de s0 . 9.6. Curvatura seccional En esta sección estudiamos la relación entre el tensor de curvatura y la métrica, que nos define la curvatura seccional de la variedad. Veremos como esta controla la diferencial de la exponencial y los campos de Jacobi. Dada (M, g) Riemanniana, p ∈ M y un plano bi-dimensional π ⊂ Tp M, queremos definir una cantidad que sólo depende del plano, que puede pensarse, ya que la exponencial en p es un difemorfismo local expp : B → Up , como la curvatura seccional de la superficie bi-dimensional Mπ = expp (B ∩ π) ⊂ M. Si v, w ∈ π, el área del paralelogramo generado por v, w está dada por q A(v, w) = kvk2 kwk2 − hv, wi2p . Esta cantidad es positiva y no nula si v, w son linealmente independientes por la desigualdad de Cauchy-Schwarz. Definimos Rp : {π ⊂ Tp M con π un 2-plano} → R de la siguiente manera. Sean v, w ∈ π linealmente independientes. Entonces Rp (π) = − hRp (v, w)v, wip . A(v, w)2 220 Variedades Riemannianas y pseudo-Riemannianas Lema 9.6.1. La cantidad Rp (π) no depende de la base de π que elijamos. En particular podemos suponer que v, w son ortonormales y en ese caso Rp (π) = −hRp (v, w)v, wip . Demostración. Si v1 , v2 ∈ π son linealmente independientes y x, y ∈ π también son linealmente independientes, entonces existen a1 , a2 , b1 , b2 ∈ R tales que x = a1 v1 + a2 v2 , y = b1 v1 + b2 v2 . Identificamos (π, h·, ·i) con R2 con el producto interno usual. Entonces A(x, y) = k(a1 v1 + a2 v2 ) × (b1 v1 + b2 v2 )k = |a1 b2 − b1 a2 |kv1 × v2 k = |a1 b2 − b1 a2 |A(v1 , v2 ). Por otra parte, hR(x, y)x, yi = 2 X i,j,k,l=1 ai ak bj bl hR(vi , vj )vk , vl i. Por el Lema 9.3.1, la última expresión se anula si k = l, luego debe ser k 6= l. Por otra parte, como R(w, z) = −R(z, w), también se anula si i = j, luego debe ser i 6= j. Por último, la identidad de Bianchi nos permite deshacernos de los términos cíclicos y es un ejercicio (Ejercicio 9.viii) ver que hR(x, y)x, yi = |a1 b2 − b1 a2 |2 hR(v, w)v, wi. En consecuencia usaremos la notación secπ para denotar la curvatura seccional de la subvariedad generada por el plano π ⊂ Tp M. 9.6.1. Curvatura de grupos lineales y espacios homogéneos En esta sección calculamos la curvatura seccional de los ejemplos que desarrollamos en la Sección 6.9 y en la Sección 9.1.2. 9.6.1.1. La esfera de un espacio de Hilbert Comenzamos con la esfera S de un espacio de Hilbert H. Se tiene para todo x, y, z ∈ Tp S = span(p)⊥ Rp (x, y)z = hy, zix − hx, ziy. 9.6. Curvatura seccional 221 Luego si π = span(x, y) ⊂ Tp S, y suponiendo sin pérdida de generalidad que x ⊥ y, se tiene secπ = − hhy, xix − hx, xiy, yi = hx, xihy, yi = 1. Es decir, la esfera tiene curvatura seccional constante = 1. No es difícil ver que si tomamos la esfera SR ⊂ H de radio R > 0, su estructura es similar con la diferencia de que su curvatura seccional es exactamente 1/R. 9.6.1.2. El spray métrico del grupo de inversibles El spray obtenido en (9.6) nos permite calcular la curvatura, apelando a la fórmula (9.10), obteniéndose la siguiente expresión para el tensor en g = 1 (hemos usado reiteradas veces la identidad de Jacobi para simplificar la expresión): 4R1 (x, y, z) = [z, [x, y]] + [z, [x∗ , y∗ ]] + [z∗ , [x∗ , y]] + [z∗ , [x, y∗ ]] (9.14) +[z, [x, y∗ ]] + [z, [x∗ , y]] − [x, [y∗ , z]] − [y, [z, x∗ ]]. En cuanto a la curvatura seccional, no aporta en principio mayor información, al ser una expresión que es posible reescribir de muchas formas gracias a la ciclicidad de la traza. ¿Es posible identificar subvariedades de curvatura seccional con signo constante? Como veremos en las próximas secciones, el grupo unitario tiene curvatura positiva mientras que los operadores positivos tienen curvatura negativa. 9.6.1.3. El grupo unitario Si nos restringimos al grupo unitario o a los operadores positivos e inversibles, el spray métrico coincide con el spray canónico F(v) = vg−1 v (g ∈ G, v ∈ A un álgebra C∗ ). Entonces el tensor de curvatura se reduce por los cálculos del capítulo previo a g−1 Rg (x, y, z) = −1/4[[g−1 x, g−1 y], g−1 z]. Es fácil ver que, por ser la métrica invariante a izquierda, la curvatura es la misma en cualquier punto del espacio homogéneo, luego podemos suponer que g = 1, y se tiene R1 (x, y)z = −1/4[[x, y], z]. Esta expresión también puede obtenerse apelando a (9.14), usando que x, y, z son antihermitianos y apelando a la identidad de Jacobi. Si x, y son ortonormales, y π = span(x, y), se tiene secπ = = −hR1 (x, y)x, yi2 = 1/4h[[x, y], x], yi2 ∗ 1/4Tr([[x, y], x]y ). (9.15) 222 Variedades Riemannianas y pseudo-Riemannianas Como x, y ∈ Aah , se tiene secπ = −1/4Tr([[x, y], x]y) = 1/2Tr(−xyxy + x2 y2 ). Pero Tr(xyxy) = Tr(xy(yx)∗ ) = hxy, yxi2 ≤ kxyk2 kyxk2 , por la desigualdad de Cauchy-Schwarz, y por otra parte es fácil ver que kyxk22 = kxyk22 = Tr(x2 y2 ), se tiene nuevamente por C-S 2secπ = Tr(−xyxy + x2 y2 ) = −hxy, yxi + kxyk22 ≥ 0. Esto nos dice que la curvatura del grupo unitario es no negativa, y de hecho es fácil ver que para que sea nula debe ser xy = yx, pues debe valer la igualdad en la desigualdad de Cauchy-Schwarz. Luego tenemos subvariedades planas (conocidas como flats) para cada familia de operadors que conmutan, y por ejemplo si estamos en dimensión finita y U es el grupo unitario de las matrices n × n, la dimensión maximal de los flats es n, que corresponde a considerar el álgebra abeliana maximal dada por las matrices unitarias diagonales respecto de una base ortonormal fija. En el lenguaje de espacios simétricos, esta cantidad se conoce como el rango del espacio. Es decir rango(U) = n donde n = dim H. Una referencia fundamental en este contexto de espacios simétricos es el libro de S. Helgason [40]. 9.6.1.4. Operadores positivos inversibles Supongamos ahora que estamos en el espacio de operadores positivos e inversibles M = G+ A . Cabe aquí distinguir dos casos sutilmente distintos. El primero compete a la discusión de las dos secciones previas, y es cuando pensamos a este espacio como subvariedad del grupo de inversibles, con el spray métrico. En ese caso, dados x, y, z Hermitianos, el tensor de curvatura en g = 1 se computa de (9.14) obteniéndose R1 (x, y)z = −7/4[[x, y], z]. Luego, con una cuenta similar a la efectuada en (9.15), recordando que con nuestra convención sec difiere de R en un signo, obtenemos + 2/7secGA π = Tr(xyxy − x2 y2 ) = hxy, yxi − kxyk22 ≤ 0 para todo π ⊂ T1 G+ A = Ah . Esta curvatura es nula si y sólo si xy = yx. 9.6. Curvatura seccional 223 El otro caso, corresponde a considerar a la variedad de operadores positivos e inversibles con la métrica dada por kvka = ka−1/2 va−1/2 k2 , según lo discutimos en la Sección 8.4.3. Aquí usamos la norma Frobenius (o la norma de Hilbert-Schmidt, ver la Sección 9.3.5.2) para computar la norma del + vector trasladado; a ∈ G+ A , v ∈ Ta GA al igual que antes. Esto es, hv, wia = hga v, wi2 donde ahora ga v = a−1 va−1 . Apelando a la ecuación (9.3), es fácil ver que en este caso el spray coincide con el spray canónico Fa (v) = va−1 v que introdujimos en la Sección 6.9.5.2. Luego se aplican las consideraciones allí hechas, y en particular tenemos la expresión para la curvatura dada por R1 (x, y)z = −1/4[[x, y], z] y con una cuenta idéntica a la recién hecha deducimos que en este caso también la curvatura es no positiva. Veremos (Teorema 9.7.4) que esta condición es en general equivalente a la condición de curvatura semi-negativa en el contexto de variedades de Finsler con spray. Observemos que si bien en ambos casos la curvatura es no positiva, las geometrías no coinciden ya que, en el segundo caso las geodésicas son los grupos a un parámetro, luego se describen como β(t) = aetv , así que la única geodésica que une a, b ∈ G+ A está dada por β(t) = a exp(t ln(a−1 b)) = a1/2 (a−1/2 ba−1/2 )t a1/2 . Notar que esta curva está íntegramente contenida en G+ A (lo cual es esperable pues es la geodésica de una conexión métrica definida allí). La geometría de este caso hace que la posición relativa de G+ A en GA sea buena. No ocurre lo mismo en el primer caso: de acuerdo a la ecuación (9.9), las tv∗ t(v−v∗ ) e . geodésicas que pasan por a ∈ G+ A se describen como α(t) = ae Notemos que por el teorema de Hopf-Rinow, como las geodésicas están definidas para todo t ∈ R, dado b ∈ G+ A existe una de estas que una a, b en el grupo GA . Para que esta curva sea un grupo a un parámetro aetz , debe ocurrir que z = v (esto se deduce derivando en t = 0). Pero etx ety = et(x+y) sólo es posible si x, y conmutan, lo cual equivale a que v sea normal; entonces v = ln(a−1 b) es normal o equivalentemente a−1 b es normal y a su vez esto equivale a que b conmuta con a (Ejercicio 9.xii). Dejamos también como ejercicio (9.xiii) verificar que α∗ = α solamente en el caso especial recién mencionado, luego esta curva en general no + permanece dentro de G+ A , es decir GA no es geodésicamente convexa en GA si dotamos a este último del spray métrico que viene de la métrica invariante a izquierda. 224 Variedades Riemannianas y pseudo-Riemannianas 9.6.1.5. La Grassmanniana Como vimos en la Sección 9.1.1.1, el spray que introdujimos en la Grassmanniana no es otra cosa que el spray métrico inducido por la inclusión Gr(p) ⊂ Ah , donde consideramos a este último como espacio de Hilbert con la norma Frobenius. Recordemos entonces que (Ejemplo 6.9.6 en la Sección 6.9), dado un proyector p se tenía la fórmula del tensor de curvatura Rp (x, y, z) = [[x, y], z]. A partir de este, calculamos, para x ⊥ y ∈ Tp P(A), la curvatura seccional sec(x, y) dada por sec(x, y) = −hRp (x, y)x, yip = −2Tr(xyxy) + 2Tr(x2 y2 ) = −2hxy, yxi + 2kxyk22 ≥ 0, de manera similar al caso de los operadores unitarios y el espacio de operadores positivos invertibles, obteniéndose sec(x, y) = 0 si y sólo si xy = yx. 9.6.2. Isometrías y curvatura seccional Diremos que f : (M, bM ) → (N, bN ) es una isometría local entre variedades de Finsler si kf∗ VkN = kVkM para todo V ∈ TM y f es un difeomorfismo local. Diremos que f es una isometría si dN (f(x), f(y)) = dM (x, y) para todo x, y ∈ M. Proposición 9.6.2. Sea f : (M, bM ) → (N, bN ) una aplicación de clase C1 entre variedades de Finsler. Entonces: 1. Si f es una isometría local, entonces para todo x, y ∈ M se tiene d(f(x), f(y)) ≤ d(x, y), mientras que si x, y están suficientemente cerca se tiene la igualdad. 2. Sean M, N Riemannianas fuertes. Si f es una isometría también es una isometría local. Demostración. Supongamos que f es isometría local. Sean x, y ∈ M, tomemos una curva γ ⊂ M tal que L(γ) < d(x, y) + ǫ. Sea β = f ◦ γ, que une f(x) con f(y) en M. Entonces d(f(x), f(y)) ≤ L(β) = L(γ) < d(x, y) + ǫ. 9.6. Curvatura seccional 225 Luego d(f(x), f(y)) ≤ d(x, y). Como f es un difeomorfismo local podemos revertir el argumento para probar que d(x, y) = d(f−1 f(x), f−1 f(y)) ≤ d(f(x), f(y)) si x, y están suficientemente cerca. Supongamos ahora que f es una isometría, sea V = (p, v) ∈ TM, sea α ⊂ M una geodésica tal que α ′ (0) = V. Entonces para t pequeño en el dominio de α se tiene Zt k(f ◦ α) ′ kf◦α dt ≥ d(f(α(t)), f(p)) = d(α(t), p) = Lt0 (α) = tL(α) = tkvkp 0 Rt Luego kvkp ≤ 1t 0 k(f ◦ α) ′ kf◦α dt, y haciendo tender t → 0+ se tiene kvkp ≤ kf∗p vkf(p) . Ahora revertimos el argumento, sea β ⊂ N una geodésica tal que β ′ (0) = f∗p v, sea α = f−1 β. Entonces Zt 0 kα ′ kα dt ≥ d(α(t), p) = d(β(t), f(p)) = Lt0 (β) = tL(β) = tkf∗p vkf(p) , y nuevamente dividiendo por t y haciendo tender t a cero se tiene la desigualdad opuesta. 9.6.2.1. Variedades planas Una variedad Riemanniana se dice plana cuando RM ≡ 0. En ese caso es localmente isométrica a un espacio de Hilbert, como muestra el siguiente resultado. Teorema 9.6.3. Sea (M, g) Riemanniana y completa. Supongamos que R ≡ 0. Entonces localmente la diferencial de la exponencial es el transporte paralelo y por ende una isometría, y expp : Tp M → M es un difeomorfismo isométrico local para todo p ∈ M. Si M es simplemente conexa entonces es isométricamente isomorfa a su espacio tangente. Demostración. Sea γ ⊂ Br (p) una geodésica (r pequeño) con γ(0) = x, γ̇(0) = v. Si R ≡ 0, entonces el único campo de Jacobi η ∈ Lev(γ) a lo largo de γ tal que η(0) = 0, Dγ ′ η(0) = w ∈ Tx M está dado por η(t) = tP(γ)t0 w puesto que Dt η = P(γ)t0 w + 0 y entonces D2t η = Dt P(γ)t0 w = 0 = R(γ̇, η)γ̇. Por otra parte, por el Teorema 6.8.4, se tiene que η(t) = (expp )∗tv tw luego la diferencial de la exponencial 226 Variedades Riemannianas y pseudo-Riemannianas coincide con el transporte paralelo y resulta así una isometría local. Si M es simplemente conexa, entonces podemos aplicar el Teorema de Cartan-Hadamard (Corolario 8.5.5) para concluir que expp : Tp M → M es un difeomorfismo, y por el primer item de la proposición previa resulta una isometría global. 9.6.2.2. Campos de Jacobi versus curvatura En esta proposición se hace explícita la relación entre los campos de Jacobi a lo largo de geodésicas y la curvatura seccional de una variedad Riemanniana (M, g), a través de las derivadas de la norma del campo. Proposición 9.6.4. Sean (M, g) Riemanniana débil, α(t) = expp (tv) una geodésica de M y η ∈ Lev(α) un campo de Jacobi. Sea f(t) = kηk. Entonces: 1. Para aquellos t tales que η(t) 6= 0, se tiene f ′ (t) = f ′′ (t) = y 1 hDt η, ηi, kηk 1 1 (kDt ηk2 kηk2 − hDt η, ηi2 ) + hR(α̇, η)α̇, ηi, 3 kηk kηk f ′′ (t) ≥ − 1 secπ (α̇, η)A(α̇, η). kηk 2. Si η(0) = 0 y η̇(0) = w ∈ Tp M, entonces f es derivable tres veces en el origen, siendo f ′ (0) = kwkp , f ′′ (0) = 0, f ′′′ (0) = 1 hRp (v, w)v, wip . kwkp Demostración. Las expresiones de f ′ , f ′′ son inmediatas de la compatibilidad de la métrica y la definición de campo de Jacobi. La desigualdad para f ′′ se obtiene utilizando la definición de curvatura seccional y la desigualdad Cauchy-Schwarz: kDt ηkkηk ≥ |hDt η, ηi|. Las derivadas en el origen se calculan recordando que en una carta, η(t) = tw + o(t2 ). 9.7. El teorema de Cartan 9.7. 227 El teorema de Cartan En esta sección probamos la equivalencia entre curvatura seccional no positiva, y la propiedad curvatura semi-negativa de la diferencial de la exponencial (Sección 8.5), obteniendo como corolario el teorema clásico de Cartan para variedades Riemannianas. Definición 9.7.1. Sea (M, g) Riemanniana. Diremos que M tiene curvatura seccional no positiva (secM ≤ 0) si secπ ≤ 0 para todo π que sea un 2-plano en Tp M, para todo p ∈ M. Corolario 9.7.2. Si (M, g) es Riemanniana débil, y secM ≤ 0, entonces para todo p ∈ M, para todo v ∈ Dom(expp ) y para todo w ∈ Tp M, se verifica k(expp )∗v wkexpp (v) ≥ kwkp y además (expp )∗tv tw no se anula en (0, 1]. Demostración. Sea α(t) = expp (tv), tomamos η el único campo de Jacobi a lo largo de α tal que η(0) = 0, Dt η(0) = w. Por el Teorema 6.8.4 que da la identificación entre η(t)/t y la diferencial de la exponencial, tenemos que probar que kη(t)k ≥ tkwk, y que η(t) 6= 0 para todo t ∈ (0, 1]. De no ser así, supongamos que η se anula en tn ∈ (0, 1] con tn → 0. Entonces w = η̇(0) = lı́m η(tn )/tn = 0 n lo cual es absurdo. La otra posibilidad es que exista t0 > 0 que es el mínimo de los t ∈ (0, 1] donde η se anula. Como la curvatura de M es no positiva, por la proposición previa se tiene que en el intervalo (0, t0 ) la función f es convexa, es decir f ′′ ≥ 0. Por otra parte, como f ′ (0) = kwkp > 0, se deduce que f es creciente en [0, t0 ) y como f(0) = 0 se tiene un absurdo pues f no se anulaba en (0, t0 ). Sea h(t) = kη(t)k − tkwk para t ∈ [0, 1]. Entonces aplicando la fórmula de la Proposición 9.6.4 en el intervalo [0, 1] tenemos que h ′ (t) = f ′ (t) − kwk, h ′′ (t) = f ′′ (t) ≥ 0. Como h ′ (0) = f ′ (0) − kwkp = 0, h también es creciente y se tiene la conclusión. 9.7.1. La adjunta de la diferencial de exp En esta sección supondremos que (M, g) es Riemanniana débil. 228 Variedades Riemannianas y pseudo-Riemannianas Lema 9.7.3. Sea (M, g) pseudo-Riemanniana, p ∈ M y α(t) = expp (tv) con v ∈ Dom(expp ) y q = α(1). Sea P el transporte paralelo a lo largo de α y sea v ′ = −Pv ∈ Tq M. Entonces si w ∈ Tp M, z ∈ Tq M, se verifica h(expp )∗v w, ziq = hw, (expq )∗v ′ zip , y si P∗ indica el transporte paralelo desde 1 hasta 0, entonces hP∗ (expp )∗v w, P∗ zip = hw, (expq )∗v ′ PP∗ zip , luego el operador adjunto de P∗ (expp )∗v es (expq )∗v ′ P. Demostración. Sea η el único campo de Jacobi a lo largo de α tal que η(0) = 0, η̇(0) = w, y sea ξ el único campo de Jacobi a lo largo de α tal que ξ(1) = 0 y ξ̇(1) = z. Derivando g(t) = hDt η, ξi − hη, Dt ξi se deduce que g ′ (t) = hR(α̇, η)α̇, ξi + hDt η, Dt ξi − hDt η, Dt ξi − hη, R(α̇, ξ)α̇i = 0 por el Lema 9.3.1. Entonces g(t) = C = cte, luego g(1) = g(0), y se tiene g(0) = hw, ξ(0)i − hη(0), Dt ξ(0)i = hw, ξ(0)ip . puesto que η(0) = 0. Por otra parte, considerando la curva revertida α∗ (t) = α(1 − t), el campo ξ∗ (t) = ξ(1 − t) es el único campo de Jacobi a lo largo de α∗ tal que ξ∗ (0) = 0, ξ̇∗ (0) = −Dt ξ(1) = −z, luego ξ(0) = ξ∗ (1) = (expq )∗v ′ z, y como g(1) = 0 − hη(1), Dt ξ(1)i = h(expp )∗v w, ziq , se tiene el resultado. 9.7.2. Curvatura no positiva Recordemos que en el contexto de variedades de Banach-Finsler (Sección 8.5) definimos curvatura semi-negativa via la diferencial de la exponencial (Definición 8.5.3). Probamos aquí la equivalencia en el contexto Riemanniano de esa noción con la de curvatura seccional no positiva. Nuevamente supondremos que g es acotada superiormente, es decir que (M, g) es Riemanniana débil. 9.7. El teorema de Cartan 229 Teorema 9.7.4. Sea (M, g) Riemanniana débil. Entonces M tiene curvatura seccional no positiva si y sólo si es una variedad de curvatura semi-negativa. Es decir secM ≤ 0 si y sólo si para todo p ∈ M, para todo v ∈ Dom(expp ) y para todo w ∈ Tp M, el operador (expp )∗v : Tp M → Texpp (v) M es invertible y se verifica k(expp )∗v wkexpp (v) ≥ kwkp . Demostración. Supongamos primero que M tiene curvatura seminegativa. Sea p ∈ M, v, w ∈ Tp M. Si α(t) = expp (tv) y η es el único campo de Jacobi a lo largo de α tal que η(0) = 0, η̇(0) = w, se tiene por hipótesis f(t) = kη(t)kα(t) ≥ tkwkp donde f es la función de la Proposición 9.6.4. Sea h(t) = f(t) − tkwkp , entonces h(t) ≥ 0 en [0, 1], y por la misma proposición se tiene h(0) = h ′ (0) = h ′′ (0) = 0, mientras que 1 h ′′′ (0) = hRp (v, w)v, wip . kwkp Si fuese sec(v, w) > 0, se tendría h ′′′ (0) < 0, lo cual diría que h es estrictamente decreciente en un entorno de cero, y esto es absurdo. Luego sec(v, w) ≤ 0, lo que prueba que secM ≤ 0. Ahora supongamos que secM ≤ 0. Sea η como antes, por el Corolario 9.7.2 se tiene la desigualdad de la curvatura seminegativa, resta ver que (expp )∗v es invertible para v ∈ Dom(expp ). Componiendo con el transporte paralelo P a lo largo de α∗ (t) = α(1 − t), se tiene que T = P(expp )∗v ∈ B(H) donde H = Tp M es un operador acotado, inyectivo y de rango cerrado por la desigualdad kTwk ≥ kwk para todo w ∈ H. Resta ver que Ran(T ) = H, o equivalentemente, como el rango es cerrado, que ker(T ∗ ) = {0}. Pero por el Lema previo, T ∗ es otra diferencial de la exponencial que por hipótesis es expansiva y por ende inyectiva. Tenemos el siguiente corolario, consecuencia de los resultados de la sección 8.5, que nos dice que la exponencial es un revestimiento y vale propiedad EMI (Teorema 8.5.4 y Corolario 8.5.5). Corolario 9.7.5 (Teorema de Cartan-Hadamard). Si (M, g) es Riemanniana fuerte, de curvatura seccional no positiva y geodésicamente completa, entonces la exponencial expp : Tp M → M es un revestimiento para todo p ∈ M. Si además M es simplemente conexa expp resulta un difeomorfismo. 230 9.A. Variedades Riemannianas y pseudo-Riemannianas Problemas 9.I. Si Γ es la forma bilineal asociada al spray métrico de una variedad Riemanniana (M, g), probar la propiedad de compatibilidad de la derivada covariante de campos (9.1) y la propiedad de compatibilidad de la derivada covariante de curvas levantadas (9.2) a partir de la identidad (9.4) que define localmente Γ . 9.II. Probar que si (M, g) es de dimensión n < ∞, el espacio de campos suaves sobre M tiene dimensión n como módulo sobre C∞ (M). 9.III. Probar la fórmula de la derivada covariante para curvas levantadas (9.11) del grupo de inversibles con su spray canónico. 9.IV. Probar el Teorema 9.3.14 sobre curvas cortas en la Grassmanniana con la métrica dada por una norma simétrica. Sugerencia: considerar el isomorfismo p 7→ 2p − 1 entre proyecciones y simetrías, el Teorema 9.3.13 y la Observación 4.6.1. R1 9.V. Probar que la funcional energía E(γ) = 1/2 0 kγ̇k2γ dt no es independiente de la parametrización de γ. 9.VI. Probar el Teorema 9.2.5 y el Corolario 9.2.6. 9.VII. Probar la segunda identidad del Lema 9.3.1, hRp (x, y)x, zig = hRp (x, z)x, yig para todo x, y, z ∈ Tp M, para todo p ∈ M. 9.VIII. Dado p ∈ M Riemanniana, sean ai , bi ∈ R, vi ∈ π ⊂ Tp M. Probar que, si x = a1 v1 + a2 v2 , y = b1 v1 + b2 v2 , entonces hR(x, y)x, yi = |a1 b2 − b1 a2 |2 hR(v, w)v, wi. 9.IX. Probar que si S es la esfera de un espacio de Hilbert con la métrica ambiente y la conexión de Levi-Civita, entonces la diferencial de la aplicación exponencial es un difeomorfismo (Ejemplo 9.3.9), en cada entorno {v ∈ Tp S : kvk < π}. 9.X. Sea R > 0 y H un espacio de Hilbert. Sea SR = {v ∈ H : kvk = R}. Calcular el spray métrico de SR , sus geodésicas y probar que la curvatura seccional de SR es exactamente 1/R. 9.XI. Probar la expresión de R1 para el grupo de inversibles de un álgebra C∗ dada en la Sección 9.6.1.2. 9.XII. Probar que si x, y ∈ A un álgebra de Banach y etx ety = et(x+y) en algún entorno de t = 0, entonces x conmuta con y. Probar que si a, b ∈ A es un 9.A. Problemas 231 álgebra C∗ son positivos e inversibles, y a−1 b es normal, entonces a conmuta con b. Sugerencia: probar que ab es normal y luego su espectro es real. ∗ ∗ 9.XIII. Probar que si α(t) = aetv et(v−v ) es una curva en A un álgebra C∗ con a, b = α(1) positivos e inversibles, entonces α(t) = α(t)∗ si y sólo si a conmuta con b. 9.XIV. Calcular las derivadas primera, segunda y tercera de la función f(t) = kηk, en la notación de la Proposición 9.6.4 (con las hipótesis del segundo ítem). ¿Existe la derivada cuarta en el origen? 9.A. Problemas 233 234 Variedades Riemannianas y pseudo-Riemannianas Parte III Álgebras de Operadores E n este apéndice, vamos a presentar los resultados que utilizamos a lo largo del texto del cálculo funcional en álgebras de operadores (sin restricciones de dimensión), así como resultados sobre funcionales continuas y normas en álgebras de operadores, para poder estudiar los ejemplos relevantes de estructuras geométricas en espacios homogéneos del grupo de operadores inversibles. Esencialmente, hay dos clases de álgebras que nos interesan por encima de las demás, que son las álgebras C∗ y de von Neumann. Una es una subclase de la otra, ambas son álgebras de Banach. Sea H un espacio de Hilbert complejo, usemos B(H) para denotar el conjunto de todos los operadores lineales acotados en H. Si h, i denota el producto escalar de H, y a ∈ B(H), entonces denotamos con a∗ ∈ B(H) al único operador acotado tal que ha∗ ψ, ηi = hψ, aηi para todo ψ, η ∈ H. Esta es la involución usual de B(H). Tiene la siguiente propiedad fundamental: si k · k denota la norma supremo de operadores acotados en H, entonces ka∗ ak = kak2 para todo a ∈ B(H). En particular se deduce de aquí que ∗ es isométrico, kx∗ k = kxk. Observemos que como (ab)∗ = b∗ a∗ no se trata de un automorfismo sino de un antiautomorfismo. La topología fuerte en B(H) se define de la siguiente manera: dados an , a ∈ B(H), decimos que an → a SOT (por Strong Operator Topology) si an ξ → aξ para todo ξ ∈ H -como vectores de H con la norma del espacio de Hilbert-. Es decir, es la topología de convergencia puntual. La topología débil en B(H) se define de la siguiente manera: dados an , a ∈ B(H), decimos que an → a WOT (por Weak Operator Topology) si han ξ, ηi → haξ, ηi para todo ξ, η ∈ H. 235 Estas topologías son una más débil que la otra, en el sentido siguiente: (an → a uniformemente ) ⇒ (an → a SOT) En efecto, dados ξ, η ∈ H, entonces ⇒ (an → a WOT) . |h(an − a)ξ, ηi| ≤ kan ξ − aξkH kηkH ≤ kan − akkξkHkηkH. En el caso dim H = +∞ estas topologías no coinciden. Una subálgebra involutiva A ⊂ B(H) es una subálgebra sobre C tal que a∗ ∈ A cada vez que a ∈ A. Diremos que una subálgebra involutiva A es Un álgebra C∗ cuando A es cerrada para la topología de la norma uniforme. Un álgebra W ∗ o álgebra de von Neumann si A es cerrada para la topología fuerte. Se deduce que toda álgebra de von Neumann es un álgebra C∗ . En la definición de álgebra de von Neumann, se puede reemplazar la topología fuerte por la débil. Supongamos que H es infinito dimensional y separable. El primer ejemplo de álgebra C∗ que no es de von Neumann es el álgebra K(H) de operadores compactos en H, donde por un operador compacto t : H → H entendemos un operador acotado tal que la imagen de todo conjunto acotado tiene clausura compacta. Equivalentemente, se consigue K(H) como la clausura en norma uniforme de todos los operadores de rango finito. De hecho, si {ei } es una b.o.n. de H y pi = ei ⊗ ei son los proyectores unidimensionales asociados, poniendo Tn = n X pi i=1 tenemos que cada Tn ∈ K(H) (de hecho, tiene rango finito). Pero si x = P y = i yi ei son dos vectores cualesquiera de H, entonces hTn x, yi = n X i=1 xi yj → X i≥1 P i xi ei , xi yj = hx, yi lo que prueba que Tn tiende débilmente a la identidad de H, que no es un operador compacto. Se pueden definir las álgebras C∗ y de von Neumann de manera abstracta (que resulta ser equivalente a la definición como operadores en H). En el primer apéndice introducimos las nociones necesarias para este enfoque. Apéndice Álgebras de Banach S ea A un álgebra asociativa con identidad 1 sobre C, provista de una norma k · k que la hace un álgebra de Banach, es decir A es un espacio de Banach y el producto no sólo es una función conjuntamente continua, sino que además se verifica la desigualdad siguiente: kxyk ≤ kxkkyk. En general supondremos que la identidad del álgebra tiene norma unitaria, es decir k1k = 1. A.1. Álgebras con involución Sea ∗ : A → A una involución es decir, para todo a ∈ A, se tiene (a∗ )∗ = a. Notemos que ∗ es una biyección. Supongamos que es también antiautomorfismo antilineal, es decir para todo a, b ∈ A, λ ∈ C, se tiene (λa)∗ = λa∗ (a + b)∗ = a∗ + b∗ (ab)∗ = b∗ a∗ . Usualmente se dice que A es un álgebra de Banach con involución. Diremos que A es un álgebra C∗ si la involución verifica ka∗ ak = kak2 para todo a ∈ A. 237 A 238 Álgebras de Banach En esta presentación abstracta, un álgebra de von Neumann es una álgebra C∗ que tiene predual (como espacio de Banach). En ese caso, el predual es (salvo isomorfismos) único. Este resultado se debe a S. Sakai, la prueba puede encontrarse en [64]. Observación A.1.1. Las álgebras de von Neumann se suelen considerar con 1, en todo caso siempre se puede adjuntar una identidad a un álgebra C∗ de manera estándar: tomamos la suma directa A˜ = A ⊕ C, que resulta ser un álgebra con identidad I = (0, 1), con el producto (a, λ) · (b, µ) = (ab + µa + λb, λµ). Se le da la norma k(a, λ)k = sup b∈A, kbk≤1 kab + λbk. Entonces A˜ es un álgebra C∗ y además A ⊂ A˜ es un ideal maximal (en particular cerrado). A.2. Cálculo funcional analítico En un álgebra de Banach B, el espectro σ(a) del elemento a ∈ B se define de la manera habitual como el conjunto de los λ ∈ C tales que a − λ no es inversible en B. El complemento de σ(a) es el conjunto resolvente de a, denotado ρ(a). A.2.1. Propiedades del espectro Observación A.2.1. Si µ ∈ C, entonces para todo a ∈ B se tiene σ(1 − µa) = {1 − µλ : λ ∈ σ(a)}. Para µ = 0 la afirmación es trivial. Supondremos µ 6= 0. Si λ ∈ σ(a) entonces 1 − µa − (1 − µλ) = µ(λ − a) lo que prueba que 1−µλ ∈ σ(1−µa). Recíprocamente, si x ∈ σ(1−µa), tomamos λx = 1−x µ y se tiene a − λx = 1/µ[(1 − µa) − x] lo que prueba que λx ∈ σ(a) y x = 1 − µλx . Lema A.2.2. Para todo a, b ∈ B, A.2. Cálculo funcional analítico 239 1 − ab tiene inversa a izquierda (resp. derecha) si y sólo si 1 − ba tiene inversa a izquierda (resp. derecha). σ(ab) ∪ {0} = σ(ba) ∪ {0}. Demostración. El segundo resultado es consecuencia más o menos inmediata del primero y de la observación previa, y queda como ejercicio. Para ver el primer resultado, supongamos que c ∈ B es la inversa a derecha de 1 − ab, es decir (1 − ab)c = 1. Esto se puede reescribir como abc = c − 1. Se tiene que 1 + bca es la inversa a derecha de 1 − ba: (1 − ba)(1 + bca) = = 1 − ba + bca − babca = 1 − ba + bca − b(c − 1)a 1 − ba + bca − bca + ba = 1. Para la inversa a izquierda se razona de forma análoga. A.2.1.1. Radio espectral El radio espectral de a ∈ B es r(a) = máx{|λ| : λ ∈ σ(a)}. Observemos que r puede anularse sobre elementos no nulos. Por ejemplo, si H = C2 y 0 1 a= , 0 0 entonces σ(a) = {0}, con lo cual r = 0, pero a 6= 0. En general, el radio espectral de cualquier nilpotente (ak = 0 para algún k ∈ N) es nulo. La fórmula X x−1 = (1 − x)n n≥0 si k1 − xk < 1 tiene la misma prueba que en el caso de matrices. Si b es inversible y kb − ck < kb−1 k−1 , como k1 − b−1 ck = kb−1 (b − c)k ≤ kb−1 kkb − ck < 1, se sigue que b−1 c es inversible y en consecuencia, c es inversible. Luego el conjunto de inversibles es un grupo abierto en B, que denotaremos con GB . Observemos 240 Álgebras de Banach que si |λ| > kak entonces k aλ k < 1 con lo cual 1 − aλ es inversible o equivalentemente λ−a es inversible lo que nos dice que λ ∈ / σ(a). Luego σ(a) es un conjunto acotado, r(a) ≤ kak para todo a ∈ B. Consideremos g(λ) = a − λ, que resulta ser una función continua g : C → B. El conjunto g−1 (GB ) = {λ ∈ C : a − λ es inversible} coincide con el complemento del espectro de a, es decir ρ(a) = g−1 (GB ), lo que prueba que la resolvente es abierta, y en consecuencia σ(a) es cerrado; como es acotado resulta ser compacto. Veremos que es siempre no vacío. Previamente, probamos un lema que establece que el espectro σ : B → 2C es una función semicontinua inferiormente en el siguiente sentido: Lema A.2.3. Sea a ∈ B tal que σ(a) ⊂ Ω con Ω ⊂ C abierto. Entonces existe ǫ(Ω) tal que kx − ak < ǫ implica σ(x) ⊂ Ω. Demostración. Si λ ∈ / σ(a), entonces f(λ) = k(a − λ)−1 k es una función continua, que verifica f(λ) → 0 cuando λ → ∞ pues para λ suficientemente grande ka/λk < 1 y entonces k(a − λ)−1 k = 1 X 1 1 k(1 − a/λ)−1 k ≤ . ka/λkn = |λ| |λ| |λ| − kak n≥0 En consecuencia, existe M > 0 tal que f(λ) < M para todo λ ∈ C − Ω. Sea ǫ = 1/M, entonces si x ∈ B verifica kx − ak < ǫ y µ ∈ / Ω, probaremos que µ∈ / σ(x). Se tiene que µ − a es inversible y además k(µ − a)−1 (x − a)k < f(µ)kx − ak < 1, con lo cual 1 − (µ − a)−1 (x − a) es inversible y entonces µ − x = (µ − a) 1 − (µ − a)−1 (x − a) también es inversible por ser producto de inversibles. A.2.2. El grupo de inversibles Observación A.2.4. Observemos que el producto m : GB × GB → GB m(x, y) = xy es una función continua en cada variable, pues k(x + h)y − xyk = khyk ≤ khkkyk. A.2. Cálculo funcional analítico 241 Por ser una forma bilineal, resulta continua, por ende diferenciable y de hecho analítica. Se sigue que la inversión también es analítica. Es sencillo ver que, como g = T1 G = B, por ser el grupo un abierto en el álgebra, entonces el corchete de Lie está dado por el conmutador usual, es decir si v, w ∈ g = B, entonces [v, w] = vw − wv. Observemos que aquí los grupos a un parámetro etv están de hecho dados por la serie de potencias usual de la exponencial, la prueba es que verifican la ecuación diferencial correspondiente al campo invariante a izquierda Xv (g) := gv. Luego exp : B → GB está dada por v 7→ ev = X 1 vn , n! n≥0 y la serie converge uniformemente en conjuntos acotados de B. Sea log : U = {k ∈ GB : kk − 1k < 1} → B la función analítica dada por la serie de potencias log(k) = X (−1)n+1 (k − 1)n . n! n≥0 Es fácil ver que elog(k) = k para todo k tal que kk − 1k < 1, y que log(ez ) = z para todo z ∈ B tal que kzk < log(2). Restringida a U, la exponencial es un isomorfismo con su imagen, y para cada g ∈ G ponemos ϕg = log(g−1 k), definida en el abierto gU ⊂ GB . Entonces (gU, ϕg ) es una carta en GB alrededor de g ∈ G, y si g, h están suficientemente cercanos entonces los mapas transición están dados por ϕh ◦ ϕg−1 (z) = log(h−1 gez ), lo que prueba que GB es un grupo de Lie-Banach de clase Cω . 242 A.2.3. Álgebras de Banach Cálculo funcional de Cauchy Ahora introducimos el cálculo funcional con una identidad fundamental: Lema A.2.5. Sea γ una curva simple alrededor del espectro de a, orientada de forma positiva. Para todo n ∈ N0 , se tiene I 1 an = wn (w − a)−1 dw. 2πi γ Demostración. En la resolvente de a, que como dijimos es un conjunto abierto en el plano complejo, definimos f : ρ(a) → B como f(λ) = (λ − a)−1 , que es una función continua -de hecho, analítica-. Sea ϕ ∈ B ′ una funcional continua, consideramos la composición g = ϕ ◦ f : ρ(a) → C, que es una función genuinamente analítica y por ende holomorfa en ρ(a). Supongamos que |λ| > kak: entonces por la fórmula de la serie de Neumann, X g(λ) = ϕ((λ − a)−1 ) = λ−1−k ϕ(ak ). k≥0 Tomando una circunferencia ΓR ⊂ C centrada en el origen y de radio R > kak nos aseguramos que ΓR ⊂ ρ(a) y que σ(a) ⊂ Int(ΓR ). Podemos entonces calcular, para cualquier n ∈ N0 , la integral I I X 1 1 n λ g(λ)dλ = λn−k−1 dλϕ(ak ) = ϕ(an ), 2πi ΓR 2πi ΓR k≥0 donde el único término que sobrevive es el correspondiente a k = n pues todos los demás tienen primitiva (estamos usando la fórmula de los residuos). Reemplazando la curva ΓR por una curva cualquiera γ simplemente orientada que tenga al espectro de a en su interior, tenemos que I 1 λn g(λ)dλ = ϕ(an ). 2πi γ pues λn g(λ) es analítica en el interior de la región encerrada por γ y ΓR . Como esto vale para cualquier ϕ en el dual, se tiene I 1 an = λn f(λ)dλ. 2πi γ A.2. Cálculo funcional analítico 243 Corolario A.2.6. Si a ∈ B, entonces El espectro σ(a) es un compacto no vacío en el plano complejo. El radio espectral satisface 1 1 r(x) = lı́m kxn k /n = ı́nf kxn k /n . n→∞ n≥1 Demostración. Ya probamos que σ(a) es un conjunto compacto. Si fuera vacío, entonces todas las integrales del lema previo serían nulas (basta componer con una ϕ del dual y observar que λn ϕ((a − λ)−1 ) es una función entera). Esto es absurdo, por ejemplo para n = 0 o n = 1. Si z ∈ σ(a), entonces zn − an = (z − a)q(z, a) nos dice que zn ∈ σ(an ), luego |zn | ≤ kan k, de donde deducimos |z| ≤ kan k1/n , con lo cual |z| ≤ lı́m ı́nf kan k1/n n→∞ y tomando supremo sobre z ∈ σ(a) se tiene r(a) ≤ lı́m ı́nf kan k1/n . n→∞ Por otra parte, si ponemos M(r) = máx kf(reiθ )k para r > r(a), con f la función θ f(λ) = (a − λ)−1 del lema anterior, tenemos por la fórmula integral que kan k ≤ rn+1 M(r), con lo cual lı́m sup kan k1/n ≤ r, de manera que n→∞ lı́m sup kan k1/n ≤ r(a). n→∞ Ahora r(a) ≤ lı́m ı́nf kan k1/n ≤ lı́m sup kan k1/n ≤ r(a), n→∞ n→∞ con lo cual el límite existe y coincide con r(a). Por último, de |z| ≤ kan k1/n también se deduce que r(a) ≤ ı́nf kan k1/n ≤ lı́m kan k1/n = r(a). n→∞ n→∞ 244 Álgebras de Banach Esta función analítica que tuvo gran protagonismo λ 7→ (a − λ)−1 se conoce como resolvente de a, y se suele denotar f(λ) = Ra (λ). Consideremos, para a ∈ B, el conjunto H(σ(a)) = {f : existe un abierto Ω ⊃ σ(a) tal que f es analítica en Ω}. Notemos que el abierto Ω ⊂ C depende de f. Dada f ∈ H(σ(a)), consideremos una curva simple cerrada γ : [0, 1] → Ω alrededor del espectro de a, orientada de forma positiva, y notamos que t 7→ f(γ(t))(a − γ(t))−1 γ ′ (t) ∈ B es una función continua. La integral I Z 1 1 1 f(w)(w − a)−1 dw = f(γ(t))(a − γ(t))−1 γ ′ (t)dt f(a) := 2πi γ 2πi 0 (A.1) está bien definida como integral de una curva continua a valores en el espacio de Banach B, y además no depende de la curva γ. Para convencernos, componemos con una ϕ ∈ B ′ , y si γ̃ es otra curva con las mismas características, entonces la diferencia de las integrales -que son ahora integrales de funciones a valores en C- se puede reescribir -como es habitual- como suma de integrales de curvas cerradas, y en este caso los integrandos quedan analíticos en los interiores, con lo cual la diferencia es nula. Esta fórmula se conoce como la fórmula de Cauchy del cálculo funcional analítico. Tomemos un polinomio p(z) = αn zn + · · · + α1 z + α0 donde los αi son números reales o complejos. Entonces tiene sentido calcular p(a) = αn an + · · · + α1 a + α0 para cualquier a ∈ B. Como es habitual, evaluar α0 en el elemento a ∈ A lo pensamos como el elemento α0 1 ∈ A, donde 1 denota a la identidad del álgebra A. También seguimos la costumbre de denotar α0 1 directamente como α0 . Claramente, si γ es cualquier curva simple orientada de manera positiva alrededor de σ(a), se tiene I 1 p(w)(w − a)−1 dw p(a) = 2πi γ por el Lema A.2.5. Por otra parte, los límites de polinomios dan funciones analíticas. Un resultado que necesitamos para seguir adelante es el teorema de Runge que recordamos a continuación (la prueba puede encontrarse en cualquier libro de variable compleja): A.2. Cálculo funcional analítico 245 Teorema A.2.7 (Teorema de Runge). Sea Ω ⊂ C un abierto contenido en un compacto K. Si f : K → C es continua y analítica en Ω, existe una sucesión de funciones racionales rn = pn /qn en K tales que rn → f uniformemente sobre K. Si C − K es conexo, existe una sucesión de polinomios pn = pn (z) tales que pn → f uniformemente sobre K. En nuestro caso, tomamos f ∈ H(σ(a)) y una curva simple γ que contiene al espectro de a, contenida en algún entorno abierto del mismo, y consideramos K = Int(γ), Ω = Int(γ). Si σ(a) es conexo, podemos suponer que Ω y por ende K es conexo, y se sigue del teorema de Runge que existe una sucesión de polinomios que aproxima a f en K, en particular en γ. Luego Z 1 |f(w) − pn (w)|k(w − a)−1 kd|γ| kf(a) − pn (a)k ≤ 2π γ ≤ cte. máx |f(w) − pn (w)| → 0. w∈γ (A.2) Esto prueba que la definición de la fórmula de Cauchy es natural para toda f ∈ H(σ(a)). Si σ(a) no es conexo, el argumento es válido en cada componente conexa Ki de σ(a), para funciones analíticas definidas en un abierto que contiene a alguna de las componentes. Terminamos esta sección con un resultado conocido como teorema espectral para funciones analíticas. El caso general queda como ejercicio, se deduce del caso para polinomios que probamos a continuación. Proposición A.2.8. Si p es un polinomio y a ∈ B, entonces σ(p(a)) = p(σ(a)) = {p(λ) : λ ∈ σ(a)}. Demostración. Supongamos primero que α ∈ σ(p(a)). Escribimos Y p(z) − α = cn (z − λi ) con λi ∈ C las n raíces del polinomio p − α. Como Y p(a) − α = cn (a − λi ) y p(a) − α no es inversible, al menos uno de los factores -digamos a − λ1 - es no inversible, es decir λ1 ∈ σ(a). Ahora observemos que p(λ1 ) − α = 0, luego α = p(λ1 ) con λ1 ∈ σ(a) lo que prueba que α ∈ p(σ(a)). Para ver la otra inclusión, tomamos p(λ) ∈ p(σ(a)) con λ ∈ σ(a). Escribimos p(z) = cn zn + · · · + c1 z + c0 , 246 Álgebras de Banach luego p(a) − p(λ) = cn (an − λn ) + · · · + c1 (a − λ) = (a − λ)q(a, λ) = q(a, λ)(a − λ). Como a − λ no es inversible, concluimos que p(a) − p(λ) no es inversible puesto que de serlo, si c es su inversa entonces cq(a, λ) resultaría la inversa de a−λ. Observación A.2.9. Si r(z) = p(z)/q(z) es una función racional en σ(a), entonces q(z) no se anula en σ(a), con lo cual q(a) es inversible lo que prueba que la definición de r(a) = p(a)q(a)−1 es natural usando las operaciones del álgebra de Banach (incluyendo la inversión). Luego el teorema de Runge nos dice que si f es analítica en un entorno de σ(a), existe una sucesión rn de funciones racionales que lo aproxima, y como tiene sentido calcular rn (a) para todo n ∈ N, se sigue de la fórmula integral de Cauchy que kf(a) − rn (a)k → 0 cuando n → ∞. La prueba del siguiente teorema queda para el lector (Ejercicio A.v). Teorema A.2.10. Dado a ∈ B, y H holomorfa en un entorno del espectro de a, se tiene 1. El mapa Ψ : H(σ(a)) → B dado por f 7→ f(a) es un monomorfismo de álgebras, continuo si en H(σ(a)) consideramos la topología de convergencia uniforme sobre compactos. 2. σ(f(a)) = f(σ(a)) para toda f ∈ H(σ(a)). A.3. Rango y radio numérico En este apéndice estudiamos propiedades del rango y radio numérico de un elemento de un álgebra de Banach, y su relación con el espectro. Una referencia fundamental sobre este tema es el libro de Bonsall y Duncan [18]. Para a no nulo en un espacio de Banach E, definimos D(a) = {ϕ ∈ E ′ : kϕk = 1, ϕ(a) = kak}. A.3. Rango y radio numérico 247 Observemos que por el teorema de Hahn-Banach, este conjunto es siempre no vacío. De hecho, como (tϕ + (1 − t)ψ)(a) = tϕ(a) + (1 − t)ψ(a) el conjunto D(a) es un convexo. Con un argumento similar, vemos que es cerrado en la topología ω∗ de E ′ . Luego es un compacto convexo no vacío. Observación A.3.1. Notar que si E es un espacio de Hilbert, entonces para x 6= 0 en E la funcional hx, ·i ϕx = kxk es un elemento de D(x), y por la convexidad estricta de la bola de E, resulta único. Si ahora B es un álgebra de Banach con identidad 1, los elementos de D(1) se denominan estados del álgebra. Observación A.3.2. Si B = Mn (C) es el álgebra de matrices con la norma uniforme, podemos considerar, para A ∈ B la descomposición polar dada por √ A = U|A| con U matriz unitaria y |A| = A∗ A (ver la Sección B.4 para más detalles). Entonces, si x es un autovector unitario correspondiente al máximo autovalor de |A|, como este autovalor coincide con k |A| k = kAk, definimos ϕA (T ) = hUx, Txi que resulta un elemento de D(A). Notar que si la multiplicidad de kAk como autovalor de |A| no es simple, entonces D(A) tiene más de un elemento (de hecho infinitos). En este contexto es fácil ver entonces que {ϕx = hx, · xi : x ∈ Cn , kxk = 1} ⊂ D(1), dejamos como ejercicio (A.vi) probar que en realidad D(1) = {ϕT = Tr(T · ) : Tr(T ) = 1 = kT k1 = Tr|T |} y por el Lema B.3.12, se tiene D(1) = {ϕT = Tr(T · ) : T ≥ 0, Tr(T ) = 1}. Volviendo al caso general, sea S ⊂ B la esfera unitaria de un álgebra de Banach, es decir S = {x ∈ B : kxk = 1}. 248 Álgebras de Banach Dados a ∈ B, definimos para x ∈ S V(a, x) = {ϕ(ax) : ϕ ∈ D(x)} ⊂ C. Es un conjunto no vacío, y observemos que si λ ∈ V(a, x) entonces |λ| ≤ kak. Se define el rango numérico de a ∈ B como V(a) = ∪x∈S V(a, x) ⊂ C. Claramente V(a) ⊂ B(0, kak). El radio numérico de a ∈ B es v(a) = sup{|λ| : λ ∈ V(a)} ≤ kak. Observemos que V(a, 1) ⊂ V(a) es obvio pero además si λ ∈ V(a) entonces existen x ∈ S, ϕ ∈ D(x) tal que λ = ϕ(ax). Definimos φ(z) = ϕ(zx) (z ∈ B). Entonces φ ∈ B ′ pero además φ(1) = ϕ(x) = 1 y kφk = 1; es decir φ ∈ D(1). Como λ = ϕ(ax) = φ(a), se deduce que λ ∈ V(a, 1). En resumen, para todo a ∈ B, V(a, 1) = V(a). Definición A.3.3. Dado un espacio de Banach E, podemos definir, para T : E → E lineal y acotado, el rango numérico espacial como VE (T ) = {ξ(Tx) : x ∈ E, kxk = 1, ξ ∈ D(x)}. Dado λ ∈ VE (T ), λ = ξ(Tx), podemos considerar ϕ(A) = ξ(Ax). Claramente ϕ ∈ B(E) ′ , pero además es fácil ver que ϕ ∈ D(T ). Como ϕ(T ) = ξ(Tx) = λ, se tiene la inclusión VE (T ) ⊂ V(T ) para todo T ∈ B(E). Puede probarse [18, p. 83] que coVE (T ) = V(T ), y por otro lado cuando E es un espacio de Hilbert el Teorema de ToeplitzHausdorff [30] nos dice que VE (T ) es un conjunto convexo, luego para todo operador T en un espacio de Hilbert H se tiene la igualdad entre rango numérico y rango numérico espacial. Observación A.3.4. ¿Qué es el rango numérico de una matriz A ∈ Mn (C)? Por la Observación A.3.2), se trata del conjunto compacto y convexo del plano complejo dado por V(A) = {Tr(TA) : T ≥ 0, Tr(T ) = 1} , A.3. Rango y radio numérico 249 y por lo comentado en el último párrafo, también se tiene la igualdad V(A) = {hAx, xi, kxk = 1}. Si A es una matriz de 2 × 2, entonces V(A) es una elipse cuyos focos son los autovalores de A [54] (cabe observar que esta elipse degenera a una línea en el plano cuyos extremos son los dos autovalores de A cuando A es normal, ver la próxima sección y los ejercicios). Lema A.3.5. Si a ∈ B un álgebra de Banach, entonces 1. V(a) es un conjunto compacto, convexo y no vacío de C. 2. σ(a) ⊂ V(a) y r(a) ≤ v(a) ≤ kak. Demostración. Sea S ′ la esfera unitaria de B ′ con la topología ω∗ y ev : S ′ → C la evaluación ev(ϕ) = ϕ(a). Esta es una función lineal y continua. Como D(1) ⊂ S ′ es compacto convexo y no vacío, lo mismo vale para V(a) = V(a, 1) = ev(D(1)). Veamos 2. Si λ ∈ σ(a), entonces a − λ no tiene inversa a izquierda o no tiene inversa a derecha. Supongamos que no tiene inversa a izquierda, entonces J = B(a − λ) es un ideal propio (a izquierda) de B. Se tiene k1 − xk ≥ 1 para todo x ∈ J pues la bola unitaria alrededor del uno consta de elementos inversibles. Luego J está dentro de un hiperplano cerrado que no contiene al 1 ∈ B. Por el teorema de Hahn-Banach, existe ϕ ∈ B ′ tal que ϕ(1) = 1 = k1k y J ⊂ ker ϕ. Es decir ϕ ∈ D(1) y como ϕ(a − λ) = 0, ϕ(a) = λ lo que nos dice que λ ∈ V(a). Si a−λ no tiene inversa a derecha, la prueba es idéntica. La desigualdad r(a) ≤ v(a) es ahora evidente, y ya mencionamos que v(a) ≤ kak. A.3.1. El rango numérico y los grupos a un parámetro En este teorema damos relaciones más finas entre espectro y rango numérico. Teorema A.3.6. Si a ∈ B un álgebra de Banach, entonces 1 n∈N n log kena k = lı́m sup 1t log keta k. 1 n∈N n log ke−ina k = lı́m sup 1t log ke−ita k. 1. máx{Re λ : λ ∈ σ(a)} = ı́nf 2. máx{Im λ : λ ∈ σ(a)} = ı́nf t→+∞ t→+∞ 250 Álgebras de Banach 3. máx{Re λ : λ ∈ V(a)} = sup 1t log keta k = lı́m+ 1t log keta k t→0 t>0 1 ( k1 t>0 t = ı́nf + tak − 1 ) = lı́m+ 1t ( k1 + tak − 1 ). t→0 4. máx{Im λ : λ ∈ V(a)} = sup 1t log ke−ita k = lı́m+ 1t log ke−ita k t→0 t>0 1 ( k1 t>0 t = ı́nf − itak − 1 ) = lı́m+ 1t ( k1 − itak − 1 ). t→0 Demostración. Veamos 1. Como σ(e ) = exp(σ(a)), se tiene a {|µ| : µ ∈ σ(ea )} = {eRe λ : λ ∈ σ(a)} luego log r(ea ) = máx{Reλ : λ ∈ σ(a)}. Por otro lado 1 log kena k. n∈N n log r(ea ) = log ı́nf k(ea )n k1/n = ı́nf n∈N Sea f(t) = log keta k, f : R → R. Esta es una función continua pero además es subaditiva pues f(t + s) = log keta esa k ≤ log keta kkesa k = f(t) + f(s). Ciertamente I = ı́nf n∈N 1 1 1 f(n) ≤ sup f(n) ≤ lı́m sup f(t) = S. n t→+∞ t n∈N n Para terminar la demostración del primer ítem, veamos que S = I. Tomemos 1 f(n) < α. Sea α > I y elijamos n ∈ N tal que n m = sup{f(r) : n ≤ r ≤ 2n} < ∞. Dado k ∈ N, tomemos t ∈ [(k + 1)n, (k + 2)n] y por la subaditividad de f, f(t) ≤ f(kn) + f(t − kn) ≤ kf(n) + m, luego kf(n) m kn m + < α+ . t t t t Si hacemos tender k → ∞, dejando que t permanezca en el intervalo dado, se tiene kn t ≤ 1, y deducimos que 1/t f(t) ≤ lı́m sup 1/t f(t) ≤ α, t→+∞ A.3. Rango y radio numérico 251 lo que prueba la desigualdad que faltaba, S ≤ I. El segundo ítem se deduce del primero, notando que σ(−ia) = −iσ(a) y entonces máx{Re λ : λ ∈ σ(−ia)} = máx{Re λ : λ ∈ −iσ(a)} = máx{Im µ : µ ∈ σ(a)}. Para probar el ítem 3., sea µ = máx{Re λ : λ ∈ V(a)}. Tomemos t > 0, y para x ∈ S, ϕ ∈ D(x) entonces ϕ((1 − ta)x) = ϕ(x) − tϕ(ax) = 1 − tλ con λ ∈ V(a). Entonces k(1 − ta)xk ≥ |ϕ((1 − ta)x)| ≥ Reϕ((1 − ta)x) ≥ 1 − tµ. (A.3) Si a = 0 la afirmación es trivial. Si tomamos 0 < t < kak−1 , se tiene 1 − tµ ≥ 1+ta 1 − αkak > 0, y aplicando la desigualdad (A.3) a x = k1+tak , obtenemos (1 − tµ)−1 (1 + t2 ka2 k) ≥ (1 − tµ)−1 k1 − t2 a2 k ≥ k1 + tak. Entonces k1 + tak − 1 ≤ 1t2 ka2 k tµ + t2 ka2 k −1= . 1 − tµ 1 − tµ Luego 1 µ + tka2 k 1 ( k1 + tak − 1 ) ≤ ( k1 + tak − 1 ) ≤ t>0 t t 1 − tµ i = ı́nf para 0 < t < kak−1 . Basta probar que µ ≤ i para obtener, tomando límite, la primera identidad µ = ı́nf t>0 1 1 ( k1 + tak − 1 ) = lı́m+ ( k1 + tak − 1 ). t→0 t t (A.4) Pero si ϕ ∈ D(1) entonces ϕ(a) = 1/t(ϕ(1 + ta) − 1) para todo t > 0, con lo cual Re ϕ(a) = 1/t(Re ϕ(1 + ta) − 1) ≤ 1/t(|ϕ(1 + ta)| − 1) ≤ 1/t(k1 + tak − 1), de donde se deduce que µ ≤ i. Ahora vamos a probar la identidad lı́m t→0+ 1 1 log keta k = sup log keta k = µ. t t>0 t Tomemos t > 0, e iteramos la ecuación (A.3) para obtener k(1 − ta)n xk ≥ (1 − tµ)n kxk (A.5) 252 Álgebras de Banach para todo x ∈ B, para todo n ∈ N. Dividiendo por n! y sumando sobre n, se deduce que k exp(1 − ta)xk ≥ e1−tµ kxk. Cancelando los términos exp(1) = e de ambos lados y tomando x = eta se tiene etµ ≥ keta k para todo t > 0 con lo cual sup t>0 1 log keta k ≤ µ. t Ahora, como ke k = k1+ta+o(t2)k ≥ k1+tak−o(t2), y usando que r−1 (r−1) ≤ log(r) para todo r > 0, tenemos ta 1 t {k1 + tak − 1} − o(t) 1 ≤ log keta k k1 + tak − o(t2 ) t para todo t > 0. Luego 1 t {k1 + tak − 1} − o(t) 1 1 ≤ log keta k ≤ sup log keta k ≤ µ. k1 + tak − o(t2 ) t t>0 t para todo t > 0, y haciendo tender t → 0+ en el término de la izquierda y usando (A.4), obtenemos (A.5). El cuarto ítem se deduce del tercero, de la misma manera que el segundo se dedujo del primero. A.3.2. La relación entre rango numérico y espectro Dado X ⊂ C, denotamos con co(X) a la cápsula convexa de X, co(X) = {z ∈ C : z = tµ + (1 − t)λ, λ, µ ∈ X, t ∈ [0, 1]}. Como V(a) es convexo (Lema A.3.5), se deduce que co(σ(a)) ⊂ V(a). Recordemos que x ∈ B es Hermitiano si eitx tiene norma unitaria para todo t ∈ R (Observación 4.4.3). Teorema A.3.7. Sea a ∈ Herm(B). Entonces: 1. kak = r(a). 2. mı́n σ(a) = mı́n V(a) y máx V(a) = máx σ(a). En particular r(a) = v(a) y V(a) = co(σ(a)). Demostración. Para probar el primer ítem, usamos el desarrollo en serie de potencias de la función arc sen : [−1, 1] → [−π/2, π/2]: X arc sen(x) = a k xk . n≥0 A.3. Rango y radio numérico 253 Los ak son reales y positivos. No es difícil probar que la serie converge uniformemente en |x| < 1, y que para x = 1 es convergente y X π arc sen(1) = ak = . 2 n≥0 Sea b ∈ Herm(B) tal que r(b) < π/2. Entonces r(sen(b)) = sen(r(b)) < 1, y por el cálculo funcional analítico, X b = arc sen(sen(b)) = ak sen(b)k . n≥0 Como sen(b) = ib e −ib −e 2i y b es Hermitiano, resulta k sen(b)k ≤ 1, con lo cual X X π kbk ≤ ak k sen(b)kk ≤ ak = . 2 n≥0 n≥0 Para a ∈ Herm(B), si r(a) = 0, tomamos t > 0 y entonces por lo que acabamos de probar, como r(ta) = r(a)t = 0, se tiene ktak ≤ π/2; haciendo tender π . Entonces r(ta) = t → +∞ se tiene un absurdo. Sea entonces 0 < t < 2r(a) π − r(a)t < π/2, con lo cual tkak ≤ π/2. Haciendo tender t → 2r(a) , se tiene π kak ≤ π/2, luego kak ≤ r(a) y la otra desigualdad vale siempre. 2r(a) Para probar 2, usamos el ítem previo y el ítem 3 del Teorema A.3.6: tomamos t > 0 tal que σ(a + t) ⊂ V(a + t) ⊂ [0, +∞) y calculamos 1 1 log keα(a+t) k ≤ sup log eαka+tk = ka + tk = r(a + t). α>0 α α>0 α máx V(a + t) = sup Como σ(a + t) ⊂ [0, +∞), se tiene r(a + t) = máx σ(a + t), luego máx V(a + t) ≤ máx σ(a + t). Como la otra desigualdad vale siempre en realidad tenemos máx V(a + t) = máx σ(a + t). Entonces de V(a) + t = V(a + t) y σ(a + t) = σ(a) + t deducimos que máx V(a) = máx σ(a). Ahora usamos que mı́n V(a) = = mı́n V(−(−a)) = mı́n −V(−a)) = − máx V(−a) − máx σ(−a) = mı́n −σ(−a) = mı́n σ(a). Luego mı́n σ(a) = mı́n V(a) ≤ máx V(a) = máx σ(a), y como V(a) es convexo se tiene la conclusión V(a) = co(σ(a)). 254 Álgebras de Banach A.4. Problemas A.I. Probar las afirmaciones de la Observación A.1.1: la unitización A˜ de un álgebra C∗ es a su vez un álgebra C∗ y además A ⊂ A˜ es un ideal maximal. A.II. Probar que todo ideal maximal en un álgebra C∗ es cerrado. A.III. Si a, b ∈ B un álgebra de Banach, probar que σ(ab) ∪ {0} = σ(ba) ∪ {0} (ver el Lema A.2.2). A.IV. Si B es un álgebra de Banach y GB es el grupo de inversibles, dados v, w ∈ B sean Xv , Xw los correspondientes campos invariantes a izquierda. Si [v, w] = LXv Xw (1) indica el corchete de Lie usual del grupo, probar que [v, w] = vw − wv. Probar además que la exponencial abstracta del grupo de Lie coincide con la serie de potencias de la exponencial usual del álgebra. A.V. Probar el Teorema A.2.10 del cálculo funcional analítico. A.VI. Sea B = Mn (C) el álgebra de matrices con la norma uniforme. 1. Probar que toda funcional ϕ del dual de B está realizad por la traza, es decir existe T ∈ Mn (C) tal que ϕ(A) = Tr(AT ). 2. Probar que kϕk = kT k1 = Tr|T |. 3. Probar que D(1) = {Tr(T ·) : Tr(T ) = 1 = Tr|T |}. A.VII. ∗ Sea B un álgebra de Banach. 1. Probar que si A ⊂ B es una subálgebra que contiene a la identidad, entonces el rango numérico no depende del álgebra que se mire. Es decir VB (a) = VA (a) para todo a ∈ A. 2. Un elemento n ∈ B es normal si existen h, k ∈ Herm(B) tales que n = h + ik y hk = kh. Probar que si n es normal, entonces co(σ(n)) = V(n). Sugerencia: aplicar la teoría de Gelfand (Lema B.3.1 y Corolario B.3.2) al doble conmutante del álgebra conmutativa generada por 1, h, k. Apéndice Álgebras C∗ C onsideraremos en este apéndice el cálculo funcional en el caso particular de un álgebra C∗ . Un elemento a ∈ A es autoadjunto o Hermitiano si a∗ = a. Un elemento n ∈ A es normal si n∗ n = nn∗ . Todo elemento autoadjunto es normal. Comenzamos con las propiedades del radio espectral para elementos normales. B.1. El radio espectral de un operador normal Proposición B.1.1. Sea a ∈ A un elemento normal en un álgebra C∗ . Entonces ka2 k = kaa∗ k = ka∗ ak = kak2 y además r(a) = kak. Demostración. Observemos primero que, si x∗ = x, entonces kxk2 = kx∗ xk = kx2 k. Ahora notemos que x = aa∗ = a∗ a es Hermitiano, y también que (aa)∗ = a∗ a∗ . Luego kaa∗k2 = kaa∗ aa∗ k = kaaa∗a∗ k = ka2 (a∗ )2 k = ka2 (a2 )∗ k = ka2 k2 . n Esto nos dice que ka2 k = kaa∗k = ka∗ ak = kak2 . Iterando, obtenemos ka2 k = n kak2 para todo n ∈ N. Luego n ka2 k 1/2n 255 = kak B Álgebras C∗ 256 y tomando límite se tiene el resultado, mediante la fórmula del radio espectral r(a) = lı́mk kak k1/k . B.2. Cálculo funcional continuo Combinando resultados previos, se deduce que si a∗ = a y f es analítica en un entorno de σ(a), entonces el elemento f(a) es normal, y autoadjunto si además f(R) ⊂ R. Luego kf(a)k = máx{|f(λ)| : λ ∈ σ(a)} = kfk∞,σ(a) . Por el Teorema de Runge (Teorema A.2.7) existe una sucesión de funciones racionales rn (z) que convergen uniformemente sobre σ(a) a la función f. Observemos que f(a), en este contexto de álgebras C∗ puede calcularse (o incluso definirse) como f(a) = lı́m rn (a) ∈ A, n donde la convergencia es en el sentido de la norma del álgebra A. Observemos que el límite existe pues krn (a) − rm (a)k = k(rn − rm )(a)k = krn − rm k∞,σ(a) , con lo cual la sucesión rn (a) ∈ A es de Cauchy y A es un espacio de Banach. De hecho, si f tiene una expansión analítica X f(z) = αk (z − z0 )k , k≥0 entonces f(a) = X αk (a − z0 )k k≥0 donde la convergencia de la serie es con la norma de A. Ahora supongamos que f es una función únicamente continua en el compacto σ(a). Enunciamos un caso particular del teorema de Stone-Weierstrass que será de extrema utilidad. La demostración puede verse en el libro de Reed-Simon, [62, pág. 103]. Teorema B.2.1 (Teorema de Stone-Weierstrass). Sea K ⊂ C compacto. Si C(K) denota el álgebra de Banach de funciones continuas a valores complejos sobre K, con la topología de convergencia uniforme, entonces los polinomios en dos variables p = p(z, z) son densos en C(K). B.2. Cálculo funcional continuo 257 Observación B.2.2. Si adoptamos la convención de que evaluando z en z = a obtenemos a∗ , tiene sentido calcular p(a, a∗ ) para un polinomio p = p(z, z). Por ejemplo, si p(z, z) = 2z2 + 3z + z2 z + z3 , entonces p(a, a∗ ) = 2a2 + 3a + (a∗ )2 a + (a∗ )3 . Supongamos que a ∈ A es normal, entonces p(a) es normal también, y el álgebra generada por a, a∗ y la identidad se identifica con los polinomios en dos variables evaluados en a, a∗ , donde z(a) = a∗ . Si a = a∗ , en realidad se tiene que p(z, z)|a = q(a) donde q = q(z) es otro polinomio únicamente en la variable z. Luego si pn → f, entonces kpn (a) − pm (a)k = kqn,m (a)k = kqn,m k∞,σ(a) = kpn − pm k∞,σ(a) → 0, con lo cual podemos definir como antes f(a) = lı́m pn (a). n→∞ Al álgebra C∗ (a) ⊂ A de todas las funciones continuas f ∈ C(σ(a)), evaluadas en a, la llamamos álgebra C∗ generada por a. Observemos que es un álgebra C∗ conmutativa, que de hecho por definición coincide con la clausura del álgebra generada por las potencias de a y la identidad de A. Lema B.2.3. Sean a = a∗ ∈ A, f, g ∈ C(σ(a)). Entonces: fg(a) = f(a)g(a) = g(a)f(a), f(a) = f(a)∗ . kf(a)k = kfk∞,σ(a) . f(a) es inversible si y sólo si f(λ) 6= 0 para todo λ ∈ σ(a). σ(f(a)) = f(σ(a)). Demostración. Las afirmaciones del primer ítem son obvias para polinomios, y se sigue que valen tomando límite. Lo mismo se puede decir del segundo ítem. Para ver el tercer ítem, supongamos primero que f no se anula en el espectro de a. Entonces g = 1/f es una función continua en σ(a). Como fg = 1, obtenemos f(a)g(a) = g(a)f(a) = 1, lo que prueba que f(a) es inversible. Recíprocamente, sea λ ∈ σ(a) tal que f(λ) = 0. Si pn es una sucesión de polinomios que aproxima a f uniformemente en σ(a), sea n(k) tal que |pn(k) (λ)| < 1/k. Álgebras C∗ 258 Tomamos la sucesión de polinomios qk dada por qk (x) = pn(k) (x) − pn(k) (λ). Como kf − qk k∞ ≤ kf − pn(k) k∞ + 1/k, esta sucesión también tiende uniformemente a f en σ(a). Como qk (λ) = 0 para todo k ∈ N, se deduce que 0 ∈ qk (σ(a)) = σ(qk (a)). Luego ninguno de los qk (a) es inversible. Se deduce que f(a) no puede ser inversible, pues los inversibles forman un conjunto abierto de A. Para probar el último ítem, sea β ∈ C. Observemos que f(a) − β es inversible si y sólo si β ∈ / σ(f(a)), lo cual ocurre por el ítem previo si y sólo si f(λ) − β 6= 0 para todo λ ∈ σ(a), o equivalentemente si y sólo si β ∈ / f(σ(a)). Observación B.2.4. Si f ∈ C(σ(a)) y g ∈ C(f(σ(a))), entonces g ◦ f ∈ C(σ(a)), y además (g ◦ f)(a) = g(f(a)). Esta afirmación es obvia si f, g son polinomios, y luego se deduce el caso general pasando al límite. B.3. Teorema de Gelfand y la representación GNS Observemos primero que el espacio C(X) de funciones continuas a valores en C sobre un espacio topológico compacto X, es un álgebra C∗ abeliana, si lo munimos de la norma supremo y la involución dada por la conjugación. El teorema del isomorfismo de Gelfand nos da la recíproca de este resultado. Sea a ∈ A normal, y f ∈ C(σ(a)). Por el Teorema de Stone-Weierstrass, existe una sucesión de polinomios pn (z, z), tales que pn → f en el compacto σ(a). Intentamos definir f(a) = lı́m pn (a, a∗ ) ∈ A, n donde la convergencia es en el sentido de la norma del álgebra A, que debiera ser un operador normal. Pero hay un obstáculo: no podemos probar directamente que este límite existe, pues no tenemos la fórmula del espectro σ(f(a)) = f(σ(a)) para elementos que no sean autoadjuntos. Sin embargo, la fórmula es correcta así como propiedades idénticas a las del Lema B.2.3. En lo que resta de esta sección veremos como se prueba esto, pasando por un teorema de Gelfand para álgebras conmutativas que tiene interés independiente. B.3. Teorema de Gelfand y la representación GNS B.3.1. 259 El espacio de caracteres Dada un álgebra de Banach abeliana A, podemos considerar homomorfismos h ∈ A ′ , es decir h(ab) = h(a)h(b), h(1) = 1, también conocidos como caracteres. No es difícil probar (ver por ejemplo la Sección 4.4 del primer tomo del libro de Kadison-Ringrose [45]) que todo homomorfismo a valores en C es continuo. Ponemos Σ = {h ∈ A ′ : h es un homomorfismo}, conocido como el espacio maximal o espacio de caracteres de A. Le damos la topología de subespacio de A ′ , y en A ′ consideramos la topología ω∗ , que es la topología de convergencia puntual. Recordemos que por el Teorema de Banach-Alaoglu (ver [62, IV.21]), la bola unitaria en A ′ es ω∗ -compacta. Lema B.3.1. Sea A un álgebra de Banach abeliana. Entonces: 1. Σ es ω∗ -compacto. 2. Si a ∈ A, entonces σ(a) = {h(a) : h ∈ Σ}. Demostración. Como la topología es la de convergencia puntual, es fácil ver que un punto límite de elementos en Σ es un homomorfismo, con lo cual Σ es cerrado y por ende compacto. Si b ∈ A es inversible, y h ∈ Σ, entonces 1 = h(bb−1 ) = h(b)h(b−1 ), con lo cual b ∈ / ker h. En particular, si a ∈ A y h ∈ Σ, entonces a − h(a) ∈ ker h, con lo cual h(a) ∈ σ(a). Recíprocamente, dado λ ∈ σ(a), entonces (a − λ)A es un ideal propio en A, contenido en algún ideal maximal Aλ . Si tomamos h : A → A/Aλ ≃ C la proyección al cociente, es fácil ver que h ∈ Σ. Por construcción h((a − λ)) = 0 con lo cual h(a) = λ. Corolario B.3.2. Sea B un álgebra de Banach arbitraria y sean x, y ∈ B que conmutan (xy = yx). Entonces σ(x + y) ⊂ σ(x) + σ(y) y σ(xy) ⊂ σ(x)σ(y). Demostración. Observemos que si x e y conmutan, entonces xn y = xn−1 xy = xn−1 yx = · · · = yxn para todo n ∈ N. Con un razonamiento análogo, xn yk = xn yyk−1 = yxn yk−1 = yxn yyk−2 = · · · = yk xn . Luego x, y generan un álgebra de Banach conmutativa que llamaremos A. Sean A ′ = {z ∈ B : zw = wz para todo w ∈ A}, A ′′ = (A ′ ) ′ = {a ∈ B : az = za para todo z ∈ A ′ }. Álgebras C∗ 260 Tautológicamente, A ⊂ A ′′ , y además como A es conmutativa, A ⊂ A ′ . Luego si a ∈ A ′′ , entonces en particular a conmuta con todos los elementos de A, con lo cual a ∈ A ′ , es decir A ′′ ⊂ A ′ . Resumiendo A ⊂ A ′′ ⊂ A ′ . Si a, b ∈ A ′′ , en particular b ∈ A ′ y por definición de A ′′ = (A ′ ) ′ se deduce que a y b conmutan, es decir A ′′ es un álgebra de Banach conmutativa. Afirmamos que σA ′′ (a) = σB (a) para todo a ∈ A. Ciertamente σA ′′ (a) ⊃ σB (a) pues A ′′ ⊂ B y una inversa en A ′′ de a − λ sirve de inversa en B. Recíprocamente, si b ∈ A ′′ y b−1 ∈ B, es su inversa, se tiene bw = wb para todo w ∈ A ′ , con lo cual wb−1 = b−1 w nos dice que b−1 ∈ A ′′ . Por último, si Σ es el espacio de caracteres de A ′′ , el ítem 2 del Lema previo nos dice que σA ′′ (a + b) = {h(a) + h(b) : h ∈ Σ} ⊂ σA ′′ (a) + σA ′′ (b), σA ′′ (ab) = {h(a).h(b) : h ∈ Σ} ⊂ σA ′′ (a)σA ′′ (b). B.3.2. La transformada de Gelfand en C∗ -álgebras b, donde La transformada de Gelfand de a ∈ A es la asignación a 7→ a b b a : A → C(Σ) está dada por a(h) = h(a), que es de hecho un homomorfismo. En el caso en que A es un álgebra C∗ , la transformada de Gelfand es un isomorfismo isométrico. Para probarlo necesitamos algunas herramientas específicas que condensamos en los siguientes dos resultados que tienen interés per se. Lema B.3.3. Si A es un álgebra C∗ abeliana, y h ∈ Σ, entonces 1. h(a) ∈ R si a∗ = a. 2. h(a∗ ) = h(a) para todo a ∈ A. 3. h(a∗ a) ≥ 0 para todo a ∈ A. 4. |h(u)| = 1 si u es unitario (uu∗ = u∗ u = 1). Demostración. Todos los ítems se deducen trivialmente del primero. Para probarlo, podemos suponer que khk = 1. Ponemos h(a) = x + iy con x, y ∈ R y observemos que para todo t ∈ R se tiene t2 + kak2 ≥ ka2 + t2 k = k(a + it)∗ (a + it)k = ka + itk2 ≥ |h(a + it)|2 = x2 + y2 + 2yt + t2 . Si y 6= 0 se tiene una contradicción. B.3. Teorema de Gelfand y la representación GNS B.3.2.1. 261 Invariancia del espectro Lema B.3.4. Si B ⊂ A es una inclusión de C∗ -álgebras, entonces para todo a ∈ B se tiene σB (a) = σA (a). Demostración. Ciertamente si a −λ tiene inversa en B tendrá inversa (el mismo elemento) en A. Luego σB (a) ⊃ σA (a). Para ver la otra inclusión, basta probar que si b ∈ B tiene una inversa b−1 ∈ A, en realidad b−1 ∈ B. Supongamos primero que b = b∗ . Dada f(t) = t−1 , tiene sentido entonces el cálculo funcional f(b) efectuado en la C∗ -álgebra A. Por el teorema espectral para autoadjuntos, en realidad debe ser f(b) ∈ B (por ejemplo porque es límite uniforme de polinomios en b). En el caso general, dado b ∈ B, supongamos que c ∈ A es su inversa. Entonces c∗ ∈ A es la inversa de b∗ ∈ B. Es fácil ver que cc∗ es inversible, y además bb∗ c∗ c = 1 = c∗ cbb∗ , con lo cual c∗ c es la inversa de bb∗ ∈ B. Como bb∗ es Hermitiano, se sigue por el caso anterior que c∗ c ∈ B. Luego c = (c∗ c)b∗ ∈ B. B.3.3. El Teorema de Gelfand Teorema B.3.5 (Teorema del isomorfismo de Gelfand). Sea A un álgebra C∗ abeliana, y Σ su espacio de caracteres. Entonces la transformada de Gelfand es un ∗ -isomorfismo isométrico entre A y C(Σ). b : A → C(Σ) es un morfismo, resulta ∗-morfismo Demostración. Ciertamente a por el segundo ítem del Lema B.3.3. Como σ(a) = {h(a) : h ∈ Σ}, tenemos kb ak∞ = máx |h(a)| = r(a) = kak, h∈Σ pues todo elemento de A es normal. Luego la transformada de Gelfand es un isomorfismo isométrico con su rango, que resulta cerrado en C(Σ). Para ver que es sobreyectiva, basta ver que la imagen es densa; esto último es una aplicación trivial del teorema de Stone-Weierstrass. Podemos tomar entonces, dado a ∈ A un elemento normal en un álgebra C∗ arbitraria, el álgebra abeliana generada por a, a∗ y 1, que denotamos C∗ (a). Es decir, clausuramos en la norma de A a los polinomios en 1, a, a∗ . Para esta álgebra C∗ abeliana especializamos el Teorema de Gelfand. Observemos que el Álgebras C∗ 262 espectro de a como elemento de A coincide con el espectro de a como elemento de C∗ (a), y en particular σ(a) = {h(a) : h es un caracter de C∗ (a)}. Lema B.3.6. Si Σ es el espacio de caracteres de C∗ (a) con a ∈ A normal, entonces la aplicación h 7→ h(a) es un homeomorfismo entre espacios topológicos compactos, Σ ≃ σ(a). Demostración. Que la aplicación es sobreyectiva se deduce de la observación previa. Que es continua es evidente pues la topología de Σ es la de convergencia puntual, luego si hn → h en Σ, entonces hn (a) → h(a) in C. Por último, para cualquier elemento b ∈ C∗ (a), se tiene b = lı́mn pn (a, a∗ ) con pn = pn (z, z) polinomios, luego si h1 , h2 ∈ Σ entonces h1 (b) = lı́m h1 (pn (a, a∗ )) = lı́m pn (h1 (a), h1 (a)), n n lo que prueba que h1 = h2 si h1 (a) = h2 (a). Observemos que si µ : C∗ (a) → C(σ(a)) = C(Σ) es el homomorfismo dado por µ(b)(λ) = h(b) para h ∈ Σ tal que h(a) = λ ∈ σ(a), este no es otra cosa que la transformada de Gelfand compuesta con el isomorfismo entre σ(a) y Σ. Hemos probado el siguiente teorema, los detalles quedan como ejercicio: Teorema B.3.7. Sea a ∈ A un elemento normal en un álgebra C∗ . La aplicación φ : C(σ(a)) → A dada por φ(f) = f(a) es un isomorfismo isométrico entre C(σ(a)) y C∗ (a), que preserva la involución en el sentido que φ(f) = f(a)∗ . Además se tiene σ(f(a)) = σ(φ(f)) = f(σ(a)) para toda f ∈ C(σ(a)). φ(1) = 1. Si id : σ(a) → σ(a) denota la función identidad, id(z) = z, entonces φ(id) = a. B.3. Teorema de Gelfand y la representación GNS B.3.4. 263 Propiedades del cálculo funcional continuo Observemos que todo elemento a∗ = a ∈ A tiene su espectro real. En efecto, φ(id) = a = a∗ = φ(id), lo que prueba que id = id, y esto sólo es posible si σ(a) ⊂ R. Asimismo, si u ∈ A es unitario (es decir u∗ u = uu∗ = 1) entonces φ(1) = 1 = φ(id)φ(id)∗ = φ(id · id) = φ(|id|2 ), lo que prueba que |z|2 = 1 sobre σ(u), con lo cual σ(u) ⊂ S1 . B.3.4.1. Elementos positivos Un elemento a ∈ A en un álgebra C∗ es positivo si a∗ = a y σ(a) ⊂ [0, +∞), lo denotamos a ≥ 0. Lema B.3.8. Sean a, b ∈ A. Entonces a ≥ 0 sii a = b∗ b para algún b ∈ A. −kak ≤ a ≤ kak para a = a∗ . Si 0 ≤ a ≤ b entonces kak ≤ kbk. Si a ≥ 0 entonces xax∗ ≥ 0 para todo x ∈ A. Si a ≤ b entonces xax∗ ≤ xbx∗ para todo x ∈ A. Demostración. Ciertamente, si b ∈ A entonces b∗ b es claramente autoadjunto y además σ(b∗ b) = σ(φ(id)φ(id)) = σ(φ(id · id)) = σ(φ(|id|2 )) = |id|2 (σ(a)). Pero f(z) = |z|2 toma sólo valores reales no negativos en cualquier subconjunto de C, lo que prueba que σ(b∗ b) ⊂ [0, +∞). Recíprocamente, si a ≥ 0 podemos √ considerar s(x) = x definida y continua en σ(a), y tomar b = f(a) ∈ A. Entonces b∗ = b (de hecho, b ≥ 0) y además como s2 = id se tiene b∗ b = b2 = (s(a))2 = a. Para ver el segundo ítem, observemos primero que kak − a es autoadjunto. Por otro lado, σ(a) ⊂ [−kak, kak], luego σ(kak − a) = {kak − λ : λ ∈ σ(a)} ⊂ [0, 2kak]. Álgebras C∗ 264 Esto nos dice que kak − a ≥ 0, o equivalentemente que a ≤ kak. La otra desigualdad es similar. Para ver el tercer ítem, si 0 ≤ a ≤ b entonces por el ítem anterior 0 ≤ a ≤ b ≤ kbk. Pero esto nos dice que σ(a) ⊂ [0, kbk], de donde se deduce que kak ≤ kbk. Para ver el cuarto ítem, denotamos a1/2 a la raíz cuadrada positiva de a. Entonces ∗ xax∗ = xa1/2 xa1/2 ≥ 0. El último ítem es una consecuencia trivial del anterior. B.3.4.2. Funciones monótonas y convexas de operadores Una función f : I → R (con I un intervalo de R) se denomina monótona de operadores si dados a, b positivos con espectro contenido en I, tales que a ≤ b, se verifica f(a) ≤ f(b). Una función g se denomina convexa de operadores si para a, b con espectro contenido en I, se verifica g (1/2a + 1/2b) ≤ 1/2g(a) + 1/2g(b). No toda función monótona en el sentido usual es monótona de operadores (Ejercicio B.iv). Tal vez el ejemplo más relevante de función monótona de operadores es f(t) = ts para s ∈ [0, 1]. Teorema B.3.9 (Löwner). Sea I ⊂ R un intervalo y a, b ∈ A tales que σ(a), σ(b) ⊂ I. Si 0 ≤ a ≤ b, entonces para todo s ∈ [0, 1] se verifica a s ≤ bs . Demostración. Usando un argumento con los números diádicos, basta probar el resultado para s = 1/2 (Ejercicio B.v). Supongamos primero que b es inversible. Entonces a ≤ b implica b−1/2 ab−1/2 ≤ 1, con lo cual kb−1/2 ab−1/2 k ≤ 1, y entonces b−1/4 a1/2 b−1/4 ≤ kb−1/4 a1/2 b−1/4 k ≤ ka1/2 b−1/2 k = = k(a1/2 b−1/2 )∗ (a1/2 b−1/2 )k1/2 kb−1/2 ab−1/2 k1/2 ≤ 1 donde en la segunda desigualdad usamos que si xy es autoadjunto entonces kxyk = ρ(xy) = ρ(yx) ≤ kyxk B.3. Teorema de Gelfand y la representación GNS 265 aplicado a x = b−1/4 , y = a1/2 b−1/4 . Esto prueba que b−1/4 a1/2 b−1/4 ≤ 1 o equivalentemente a1/2 ≤ b1/2 . Si b no es inversible, dado ǫ > 0 tenemos b ′ = b + ǫ > b ≥ a y aplicando el resultado previo a b ′ se deduce que (b + ǫ)1/2 ≥ a1/2 , haciendo tender ǫ a cero se tiene la conclusión. B.3.4.3. Los ∗-morfismos Un ∗-morfismo entre álgebras C∗ es un morfismo de álgebras π : A → B que preserva la estrella, es decir π(x∗ ) = π(x)∗ donde por supuesto la estrella de la izquierda es la de A, y estrella de la derecha es la de B. Lema B.3.10. Todo ∗-morfismo π : A → B entre álgebras C∗ Preserva el orden, es decir π(a∗ a) ≥ 0 para todo a ∈ A. Es contractivo kπ(x)k ≤ kxk, en particular continuo. Demostración. Observemos que π(a∗ a) = π(a∗ )π(a) = π(a)∗ π(a) ≥ 0. Ahora como x∗ x ≤ kx∗ xk = kxk2 para todo x ∈ A, luego π(kxk2 − x∗ x) ≥ 0, es decir 0 ≤ π(x∗ x) ≤ kxk2 π(1) = kxk2 . Luego kπ(x)k2 = kπ(x)∗ π(x)k = kπ(x∗ x)k ≤ kxk2 , que es lo que queríamos probar. B.3.5. La representación GNS Que toda álgebra C∗ abstracta admite alguna representación como una subálgebra uniformemente cerrada de B(H) para algún espacio de Hilbert H es consecuencia de la construcción de Gelfand-Naimark-Segal (GNS), que describimos brevemente a continuación porque la usaremos en reiteradas ocasiones. Álgebras C∗ 266 B.3.5.1. Funcionales positivas y estados Una funcional ρ ∈ A ′ es positiva si ρ(a∗ a) ≥ 0 para todo a ∈ A. A las funcionales positivas de norma unitaria se les suele decir estados de A y a este conjunto se lo denota S(A). Este es un conjunto convexo, a los extremales se los denomina estados puros de A. Si A es una subálgebra de B(H), entonces fijado η ∈ H, la funcional a 7→ ρ(a) = haη, ηi es positiva pues ρ(a∗ a) = ha∗ aη, ηi = haη, aηi = kaηk2 ≥ 0. Por otra parte, |ρ(a)| = |haη, ηi| ≤ kakkηk2 mientras que ρ(1) = kηk2 lo que nos dice que kρk = kηk2 , luego ρ tiene norma unitaria si y sólo si kηk = 1. De una manera que precisamos a continuación (ver la representación GNS), todos los estados son de esta forma para algún espacio de Hilbert H. Observación B.3.11. Si ρ ∈ A ′ es positiva, entonces ρ es Hermitiana, es decir ρ(a) ∈ R para todo a = a∗ . Para verlo basta notar que ρ(a) = 1/2 [ρ(kak + a) − ρ(kak − a)] y cada término es positivo pues −kak ≤ a ≤ kak. Se sigue que ρ(a) = ρ(a∗ ) tomando partes real e imaginaria, es decir si a = x + iy con x, y Hermitianos, entonces ρ(x + iy) = ρ(x) − iρ(y) = ρ(a∗ ). Lema B.3.12. Una funcional ρ : A → C es positiva si y sólo si es acotada y ρ(1) = kρk. Demostración. Supongamos primero que ρ es positiva, sea a ∈ A y eiθ ∈ S1 tal que eiθ ρ(a) = |ρ(a)| ≥ 0, sea h = Re(eiθ a) = 1/2(eiθ a + e−iθ a∗ ). B.3. Teorema de Gelfand y la representación GNS 267 Entonces h = h∗ y por ende h ≤ khk ≤ kak, con lo cual kakρ(1) − ρ(h) = ρ(kak − h) ≥ 0. Pero de aquí se sigue que |ρ(a)| = ρ(eiθ a) = ρ(eiθ a) = ρ(e−iθ a∗ ) = ρ(h) ≤ ρ(1)kak. Luego kρk ≤ ρ(1) y ρ es acotada. La otra desigualdad vale siempre. Supongamos ahora que ρ es acotada y que ρ(1) = kρk; claramente para ver si ρ es positiva podemos suponer que kρk = 1. Tomemos a ≥ 0, pongamos ρ(a) = α+iβ y veamos que α ≥ 0 y β = 0. Para s ∈ R positivo y suficientemente pequeño, tenemos que σ(1 − sa) = {1 − st : t ∈ σ(a)} ⊂ [0, 1] pues σ(a) ⊂ R≥0 . Como 1 − sa es autoadjunto, k1 − sak = r(1 − sa) ≤ 1, de donde se sigue que 0 ≤ 1 − sα ≤ |1 − sα − isβ| = |ρ(1 − sa)| ≤ k1 − sak ≤ 1 lo que nos dice que α ≥ 0. Por otra parte, si definimos Bn = a − α + inβ, para cada n ∈ N se tiene kBn k2 = kB∗n Bn k = k(a − α)2 + n2 β2 k ≤ ka − αk2 + n2 β2 . Luego, si β 6= 0 se tiene una contradicción pues (n2 + 2n + 1)β2 = |i(n + 1)β|2 = |ρ(Bn )|2 ≤ ka − αk2 + n2 β2 . Corolario B.3.13. Si A es C∗ -álgebra, entonces S(A) = {ρ ∈ A ′ : ρ(1) = 1 = kρk}. Además si a = a∗ y ρ(a) ≥ 0 para todo ρ ∈ S(A), entonces a ≥ 0. Demostración. Por el lema previo, se tiene la caracterización del espacio de estados. Por otra parte, {ρ ∈ A ′ : ρ(1) = 1 = kρk} = D(1), es decir el espacio de estados coincide con las funcionales normizantes de x = 1 ∈ A (ver la Sección A.3). Luego si a∗ = a y ρ(a) ≥ 0 para todo estado ρ, entonces V(a) ⊂ [0, +∞), así que σ(a) ⊂ [0, +∞) por el Lema A.3.5. Álgebras C∗ 268 B.3.5.2. Estados normizantes Lema B.3.14. Dado a ∈ A normal, existe ϕ ∈ S(A) que es normizante para a, es decir |ϕ(a)| = kak. Demostración. Si a es normal, kak = r(a), luego existe λ ∈ σ(a) tal que |λ| = kak. Tomamos h0 ∈ Σ -con Σ el espacio de caracteres del álgebra conmutativa C∗ (a) generada por 1, a, a∗ - tal que h0 (a) = λ, y lo extendemos por HahnBanach a una funcional ϕ en todo A, de norma kϕk = 1. Ciertamente |ϕ(a)| = |h0 (a)| = |λ| = kak. Por otra parte, ϕ(1) = h0 (1) = 1 = kϕk, y por el lema previo ϕ es un estado. B.3.6. La construcción de Gelfand, Naimark y Segal Dado a ∈ A no nulo, tomamos un estado ϕ tal que ϕ(a∗ a) > 0. Consideremos la forma bilineal h , iϕ : A × A → C dada por hx, yiϕ = ϕ(y∗ x) p para x, y ∈ A. Pongamos kxkϕ = hx, xiϕ . Como ϕ es positiva, este es un número real positivo, y además la forma sesquilineal es definida positiva. En particular vale la desigualdad de Cauchy-Schwarz, con la misma demostración que se da en Rn , |hx, yiϕ | ≤ kxkϕ kykϕ . Un detalle importante que usaremos en un momento es el siguiente: si tenemos una forma bilineal simétrica β, definida positiva, entonces |β(x, y)| = kxkβ kykβ sólo puede ocurrir si x = λy, con λ ∈ C. Consideremos el espacio Nϕ = {x ∈ A : kxkϕ = 0} ⊂ A. Por la desigualdad de Cauchy-Schwarz, si x ∈ Nϕ , entonces yx, xy ∈ Nϕ para todo y ∈ A, es decir, Nϕ es un ideal bilátero (propio pues a ∈ / Nϕ ). Luego, si Aϕ = A/Nϕ es el espacio cociente, la forma bilineal h, iϕ : Aϕ × Aϕ → C es no degenerada. El espacio Aϕ es un espacio vectorial con producto interno, si llamamos Hϕ a su completación con respecto a la norma k · kϕ , se deduce que Hϕ es un espacio de Hilbert. B.3. Teorema de Gelfand y la representación GNS 269 Observemos que la aplicación πa : A → B(Hϕ ) dada por x 7→ Lx , donde Lx · η = xη para η ∈ Hϕ , es una representación del álgebra A. Es decir πa (x + y) = πa (x) + πa (y), πa (xy) = πa (x)πa (y) para todo x, y ∈ A. Además es una ∗ representación, en el sentido que πa (x∗ ) = (πa (x))∗ para todo x ∈ A. Esta última propiedad no es tan evidente pero se deduce así hπa (x∗ )η, ξiϕ = ϕ(ξ∗ x∗ η) = ϕ((xξ)∗ η) = hη, xξiϕ = hη, πa (x)ξiϕ . Por ser πa un ∗-morfismo, se tiene kπa (x)k ≤ kxk para todo x ∈ A, y además πa (a) = La verifica kLa · 1k2 = ϕ(a∗ a) > 0 con lo cual la representación es fiel. Supongamos ahora que ϕ es normizante para a∗ a. Como q p kakϕ = ϕ(a∗ a) = kak2 = kak la representación preserva la norma de a como vector de Hϕ . Pero además, si pensamos en el operador La = πa (a) ∈ B(Hϕ ), entonces kLa · 1k2 = ϕ(a∗ a) = kak2 , con lo cual kLa k = kak. Observación B.3.15. Si elegimos al estado ϕ puro, la representación πϕ es irreducible. Siempre se puede encontrar un estado puro normizante para a ∈ A normal. Observación B.3.16. Como para cada a ∈ A se puede producir un espacio de Hilbert H y una representación π : A → B(H) que preserva la norma de a, podemos considerar la suma directa de las representaciones ⊕a∈A πa : A → B(⊕a∈AHa ) que resulta ser fiel. De esta manera A se representa como un álgebra de operadores en un espacio de Hilbert. Álgebras C∗ 270 B.3.6.1. Vectores normizantes Si a ≥ 0, podemos tomar un estado tal que ϕ(a) = kak. Repitiendo la construcción de arriba, tenemos que Lema B.3.17. Si a ≥ 0, existe ξ ∈ Hϕ de norma unitaria tal que La · ξ = kakξ. Demostración. Tomamos como ξ la clase de 1 en Hϕ , que resulta ser un vector de norma unitaria en Hϕ pues k1kϕ = ϕ(1) = 1. Para cualquier vector ξ de norma unitaria se tiene, por la desigualdad de Cauchy-Schwarz, que hLa · ξ, ξiϕ ≤ kLa k = kπa (a)k ≤ kak. Pero para esta elección particular de ξ se tiene hLa · ξ, ξiϕ = ϕ(ξ∗ aξ) = ϕ(a) = kak. Al valer la igualdad en C-S, debe ser La ξ = λξ, luego λkξk2 = hλξ, ξiϕ = hLa · ξ, ξiϕ = kak lo que prueba que λ = kak. B.4. Descomposición polar Nuevamente A es un álgebra C∗ . Representando el álgebra A en un espacio de Hilbert H, recordemos que ker(b) = ran(b∗ )⊥ y que ran(b∗ ) = ker(b)⊥ para todo b ∈ B(H). Dado a ∈ A, podemos considerar el cálculo funcional √ |a| := a∗ a, que tiene sentido siempre pues a∗ a ≥ 0. Luego |a| ≥ 0, además |a| = 0 implica que a = 0 pues la raíz cuadrada es inyectiva en positivos y a∗ a = 0 implica que σ(a) = 0 y como a∗ a es autoadjunto, kak = r(a) = 0. Sin embargo, |a + b| ≤ |a| + |b| es falso (ver el Ejercicio B.ix). Tomemos v ∈ H. Entonces kavk2 = hav, avi = ha∗ av, vi = h|a|2 v, vi = h|a|v, |a|vi = k |a|vk2 , de donde se deduce que ker(a) = ker(|a|). Definimos u : ran(|a|) → ran(a) como u|a|η := aη B.5. Problemas 271 para |a|η ∈ ran|a|. Esta es una buena definición pues si |a|η = |a|ξ entonces η − ξ ∈ ker(|a|) = ker(a). Extendemos a u como cero en ran(|a|)⊥ = ker(|a|), luego u ∈ B(H). Se tiene ku|a|ηk2 = kaηk2 = haη, aηi = ha∗ aη, ηi = h|a|2 η, ηi = h|a| · |a|η, ηi = k|a|ηk2 pues |a| es autoadjunto. Luego kuξk = kξk para ξ ∈ ran|a|, mientras que u = 0 en el complemento ortogonal. Extendemos a u para que sea una isometría de las clausuras de los respectivos rangos, ran(|a|) → ran(a) para obtener un operador acotado en H = ker |a| ⊕ ran|a|. Un operador con estas propiedades se conoce como isometría parcial. Equivalentemente, uu∗ u = u, o bien uu∗ es un proyector, o bien u∗ u es un proyector (en ese caso el otro también lo es). Algunas propiedades: Todo proyector es una isometría parcial. u∗ u se denomina proyector inicial de u. uu∗ se denomina proyector final de u. B.4.1. Descomposición polar Observemos que, escribiendo cualquier v ∈ H como v = ξ + ψ ∈ ran|a| ⊕ ker |a|, se tiene u|a|v = u|a|ξ + u|a|ψ = u|a|ξ = aξ = aξ + aψ = av. Es decir, a = u|a|. Esta fórmula se conoce como descomposición polar de a. Dado un subespacio S ⊂ H, la notación PS indica el único proyector ortogonal a (la clausura de) el subespacio S. Dejamos como ejercicio (B.x) algunos hechos de demostración sencilla. B.5. Problemas B.I. Probar la afirmación de la Observación B.2.4. B.II. Probar que todo homomorfismo es automáticamente continuo. B.III. Probar todos los detalles del Teorema B.3.7 sobre cálculo funcional continuo. B.IV. Probar mediante un ejemplo en M2 (R) que f(t) = t2 no es monótona de operadores. Álgebras C∗ 272 B.V. Probar que√f(t) = ts es monótona de operadores para s ∈ [0, 1]. Sugerencia: use que g(t) = t es monótona de operadores y un argumento con los numeros diádicos. B.VI. Si ϕ ∈ S(A) es un estado, probar la desigualdad de Cauchy-Schwarz |ϕ(a∗ b)| ≤ ϕ(a∗ a)1/2 ϕ(b∗ b)1/2 ∀ a, b ∈ A. B.VII. Probar que si el estado ϕ es puro, entonces la representación GNS inducida por ϕ es irreducible. B.VIII. ∗ Probar que para todo a ∈ A, existe un estado puro normizante para a. B.IX. Consideramos A = M2 (C), y las matrices 2 0 −1 1 a= , b= . 0 0 1 −1 Probar que |a + b| no es ≤ que |a| + |b|. B.X. Sea a ∈ A una C∗ -álgebra. Si a = u|a| es la descomposición polar de a, entonces u∗ u = Pran|a| mientras que uu∗ = Pran(a) . En general |a|u 6= u|a|. Empezando con a∗ se tiene a = |a∗ |v donde v es otra isometría parcial. Si a es normal, entonces |a| = |a∗ |, u = v y |a| conmuta con u. Podemos siempre extender u a un operador unitario sin perder la propiedad a = u|a|. Si a = a∗ , además se tiene que u∗ = u, es decir que u es una simetría. Observemos que σ(u) ⊂ {−1, 1}. Si a = −a∗ , se tiene que u∗ = −u, con lo cual σ(u) ⊂ {−i, i}. Apéndice Álgebras de von Neumann E xtendemos en esta sección el cálculo funcional para operadores en B(H), considerando funciones Borelianas en la recta. Recordemos que un álgebra de von Neumann es un álgebra C∗ que es además cerrada en la topología fuerte (convergencia puntual) de B(H). C.1. Cálculo funcional Boreliano Dado a ∈ B(H), sea W ∗ (a) el álgebra de von Neumann generada por a y a∗ , que es la clausura fuerte del álgebra C∗ generada por a. Resulta un álgebra abeliana si a es normal. En este capítulo, denotaremos con Bor(X) a las funciones Borelianas y acotadas en el espacio X. C.1.1. Teorema espectral Si a es normal, dado ξ ∈ H, y una función f ∈ C(σ(a)), podemos tomar la funcional lineal f 7→ hf(a)ξ, ξi que resulta ser un elemento del dual de C(σ(a)). Por el teorema de Riesz-Markov (ver por ejemplo [62, Teorema IV.14]), existe una única medida µξ en σ(a) tal que Z hξ, f(a)ξi = f(t)dµξ (t). σ(a) Esta medida se llama medida espectral asociada al vector ξ. Dada una función g ∈ Bor(C), ponemos Z g(t)dµξ (t) Qg (ξ) = σ(a) 273 C 274 Álgebras de von Neumann Supongamos que fn , f ∈ Bor(C), y que fn (x) → f(x) puntualmente y kfn k∞ es un conjunto acotado. Entonces Z [fn (t) − f(t)]dµξ (t) → 0 Qfn (ξ) − Qf (ξ) = hξ, [fn (a) − f(a)]ξi = σ(a) por convergencia dominada. Supongamos que las fn ∈ C(σ(a)), entonces acabamos de probar que Qf (ξ) = lı́mhξ, fn (a)ξi. n Luego Qf : H → C es una forma cuadrática, y es fácil ver que proviene de una forma bilineal continua βf : H × H → C por polarización. Por el Teorema de Riesz, proviene de un operador acotado que llamaremos f(a), que verifica hξ, f(a)ηi = lı́mhξ, fn (a)ηi n para todo ξ, η ∈ H, lo que nos dice que fn (a) → f(a) en la topología fuerte de B(H). Si f ∈ C(σ(a)) inicialmente, entonces ciertamente f(a) coincide con la definición anterior. Se deduce de aquí, aproximando puntualmente cualquier función Boreliana acotada f por funciones continuas fn en σ(a), que f(a) ∈ W ∗ (a). Recíprocamente, si b ∈ W ∗ (a) entonces existe una sucesión de elementos an ∈ C∗ (a) tales que an → b en la topología fuerte. Por el teorema de Gelfand, hay una sucesión de funciones fn ∈ C(σ(a)) tales que an = fn (a). Esta sucesión tiende puntualmente a una función f ∈ Bor(σ(a)), la cual extendemos por cero fuera. Se tiene por el resultado previo que f(a) ∈ W ∗ (a), pero además por la unicidad del límite en cada ξ ∈ H, debe ser b = f(a). No es difícil chequear que la asignación f 7→ f(a) para f Boreliana y acotada, es en efecto un ∗-morfismo. Hemos probado el siguiente teorema. Teorema C.1.1. Sea a ∈ B(H) normal. Existe un único ∗-isomorfismo Φ : Bor(σ(a)) → W ∗ (a) de manera que si id : C → C denota la función identidad, entonces Φ(id) = a. Además kΦ(f)k ≤ kfk∞ . Si ab = ba entonces Φ(f)b = bΦ(f). Si f ≥ 0, entonces Φ(f) ≥ 0. Los tres ítems se deducen del cálculo funcional para funciones continuas, aproximando puntualmente a la funcion Boreliana acotada f. C.1. Cálculo funcional Boreliano C.1.2. 275 Medida espectral Dado a normal, consideramos el conjunto χ de funciones características de conjuntos medibles acotados en R. Tenemos una asignación ε : χ → W ∗ (a) dada por ε(χI ) = χI (a). Como χI tiene su imagen en el {0, 1}, pI = ε(χI ) ≥ 0. Como χ2I = χI , entonces p2I = pI . Luego la función ε toma valores en los proyectores del álgebra. Con la convención de que ε(∅) = 0, se tiene que Si I ∩ J tiene medida nula, entonces pI = ε(χI ) y pJ = ε(χJ ) son disjuntos en el sentido que pI pJ = pJ = pI = 0; en general pI∩J = pI pJ . Si σ(a) ⊂ I entonces pI = 1. Si I = ∪n In e Ik ∩ Ij = ∅, entonces pI = en la topología fuerte. P n pIn donde la convergencia es Una asignación de este tipo se conoce como medida espectral, o medida a valores proyectores. En este caso se trata de la medida espectral de a. Es usual también denotar ε(A) en vez de ε(χA ) para A ⊂ R acotado. C.1.3. Descomposición polar en W ∗ -algebras Si a = u|a| es la descomposición polar de a ∈ B(H), aunque |a| está en el álgebra C∗ (a) generada por a -por ser un cálculo funcional continuo-, no es cierto que la isometría parcial u ∈ C∗ (a). Sin embargo, tomemos para x ≥ 0 la sucesión de funciones continuas 1/x x ≥ 1/n fn (x) = n x ≤ 1/n Observemos que fn converge puntualmente a x−1 . Sea ε la medida espectral de |a|, pongamos pn = ε[0, 1/n], qn = ε[1/n, kak] que son dos proyectores disjuntos tales que pn → Pker|a| , qn → Pran|a| en la topología fuerte. Además, conmutan entre sí y conmutan con |a|. Escribimos |a|n− = pn |a|, |a|n+ = qn |a| que son positivos que conmutan con |a| y disjuntos entre sí, luego |a| = (pn + qn )|a| = |a|n− + |a|n+ . En esta expresión, es sencillo calcular fn |a|, se tiene fn |a| = 1 pn + |a|−1 n+ . n 276 Álgebras de von Neumann Multiplicamos por |a| para obtener |a|fn |a| = n1 |a|n− + qn , ahora multiplicamos por u para obtener afn |a| = n1 u|a|n− + uqn . Esta expresión converge en la topología fuerte a 0 + uPran|a| = u. Luego u es límite fuerte de funciones Borelianas en a, con lo cual u ∈ W ∗ (a), el álgebra de von Neumann generada por a. Con un argumento similar se prueba que Pran|a| y Pker|a| = Pkera están en W ∗ (a). Observación C.1.2. Notemos que si a es inversible, entonces |a| es inversible con lo cual de a = u|a| se deduce que u = a|a|−1 ∈ C∗ (a) ∩ G( A), luego u ∈ U ∩ C∗ (a) pues uu∗ = a|a|−1 |a|−1 a∗ = a|a|−2 a∗ = a(a∗ a)−1 a∗ = aa−1 (a∗ )−1 a∗ = 1 y u∗ u = |a|−1 a∗ a|a|−1 = |a|−1 |a|2 |a|−1 = 1. C.2. Problemas C.I. Probar el Teorema C.1.1 sobre cálculo funcional Boreliano. C.II. Probar que si a ∈ M un álgebra de von Neumann, entonces Pran|a| y Pker|a| = Pkera están en W ∗ (a). Apéndice Normas en Álgebras de Operadores D iscutiremos en este apéndice nociones elementales de normas simétricas en álgebras de operadores. Comenzamos con el caso discreto, que se corresponde con los operadores compactos en un espacio de Hilbert. Obtendremos generalizaciones a operadores de las clásicas desigualdades de Hölder y Young, basadas en el cálculo de la traza de operadores compactos. D.1. Ideales en B(H) A lo largo de esta sección H denotará un espacio de Hilbert complejo separable, de dimensión n donde n ∈ N ó n = ∞. D.1.1. Descomposición en valores singulares Dado un √ operador a ∈ B(H), consideramos su descomposición polar a = u|a| donde |a| = a∗ a. Supongamos que b es un operador compacto (lo cual ocurre siempre si n 6= ∞). Si además b∗ = b, entonces b es diagonalizable, en el siguiente sentido: existe una base ortonormal {ek } de H y una sucesión de numeros reales λk (b) (que puede acumularse únicamente en z = 0) de manera que X b= λk (b)hek , ·iek k donde la suma es finita si n 6= ∞ e infinita y convergente en la topología uniforme de B(H) en el caso n = ∞. Una prueba de esto puede encontrarse en el libro de Reed-Simon [62, Teorema VI.17]. Los números λk son el espectro no nulo de b, y cada uno de ellos es un autovalor de b con multiplicidad geométrica finita. De hecho, de la expresión de arriba se deduce que bek = λk (b)ek . 277 D 278 Normas en Álgebras de Operadores La sucesión se acumula en cero si y sólo si es infinita si y sólo si ran(b) = ∞ si y sólo si ran(b) no es cerrado. Observación D.1.1. Los operadores compactos K(H) forman una C∗ -algebra, por ser la clausura en norma unifome de los operadores de rango finito. Luego si √ a es compacto, entonces también |a| = a∗ a es compacto. Aplicando el resultado de expansión al operador b = |a|, como σ(|a|) ⊂ [0, +∞), podemos ordenar los autovalores de forma decreciente y escribir la expresión X |a| = λk (|a|)hek , ·iek . (D.1) k Los números positivos µk (a) = λk (|a|) (ordenados de forma decreciente) se denominan valores singulares del operador a. Siendo que el espacio se descompone como H = ker |a|⊥ ⊕ ker |a| = ran|a| ⊕ ker(a), es conveniente pensar a la base {ek } ordenada en dos partes {ek } ∪ {ek′ } donde los {ek } son una base de ran|a| (y son los que efectivamente aparecen en la suma) y los {ek′ } son una base de ker |a| = ker(a) (y no aparecen en la suma). Multiplicando a izquierda (D.1) por la isometría parcial u de a, obtenemos la expresión X a = u|a| = µk (a)hek , ·iuek . k Observemos que, como u : ran|a| → ran(a) es una isometría, la familia {fk } con fk = uek es en efecto una base ortonormal de ran(a) y entonces X a= µk (a)hek , ·ifk . (D.2) k Observación D.1.2. Los µk están únicamente determinados en el siguiente sentido: si {gk }, {hk } son bases ortonormales de ran|a| y ran(a) respectivamente, y sk > 0 es una sucesión decreciente tal que X a= sk hgk , ·ihk , k entonces sk = µk (a) para todo k. En efecto, como el adjunto de hv, ·iw es hw, ·iv, entonces se tiene X a∗ = sj hhj , ·igj , j luego a∗ a = X j,k sj sk hhj , hk ihgj , ·igk = X k s2k hgk , ·igk , D.1. Ideales en B(H) 279 lo que nos dice que los s2k son los autovalores de a∗ a, que están únicamente determinados. Observación D.1.3. Tomando adjuntos en (D.2), X a∗ = |a|u∗ = µk (a)hfk , ·iek , k y como {ek } es una base ortonormal de ran|a| = ker |a|⊥ = ker(a)⊥ = ran(a∗ ), y {fk } es una base ortonormal de ran(a) = ker(a∗ )⊥ = ker |a∗ |⊥ = ran|a∗ |, entonces los µk (a) también son los números singulares de a∗ . Es decir µk (a) = µk (a∗ ) para todo k. D.1.1.1. Espacios de sucesiones Denotemos al espacio de sucesiones de números complejos que tienden a cero con c0 , es decir c0 = {{xn } : lı́m xn = 0}. n Dada una sucesión x = {xn } ∈ c , consideramos la sucesión x↓ ∈ c0 decreciente de números positivos que se consigue reordenando los módulos |xn | de la sucesión original, contando multiplicidades. Sea c(0) el espacio de sucesiones de números complejos con finitos términos no nulos. Una norma φ : c(0) → R+ se dice simétrica si φ es invariante por permutaciones y transformaciones an 7→ eiθn an de módulo uno. Esto es si 0 φ(x) = φ(|x|) = φ(x↓ ) para toda sucesión x ∈ c(0) . Diremos que una sucesión infinita x está en el espacio maximal sφ de φ si φ(x) := lı́m φ(x1 , x2 , . . . , xn , 0, 0, . . .) n→∞ existe y es finito. No es difícil ver que sφ es un espacio vectorial, y que φ resulta una norma para sφ , de aquí en más nos referiremos con sφ a este espacio (0) normado. Claramente c(0) ⊂ sφ para toda φ simétrica, definimos sφ ⊂ sφ como la clausura en sφ de c(0) y lo denominamos espacio minimal de φ. En el (0) caso que sφ = sφ , diremos que φ es regular. 280 Normas en Álgebras de Operadores Observación D.1.4. Si consideramos, para p ≥ 1, la función φ(x) = kxkp = X |xn |p 1/p es simétrica y regular. Los ideales sφ son los usuales espacios ℓp . El caso p = ∞ se corresponde con la norma φ(x) = kxk∞ = máx |xn |, que no es regular puesto que sφ = ℓ∞ , y la sucesión x = (1, 1, 1, . . .) no es límite en ℓ∞ de ninguna sucesión con finitos términos no nulos. Un caso más interesante de norma simétrica no regular es el siguiente: para p > 1, consideramos la norma de Calderón 1 φp,w (x) = sup{n−1+ p n n X x↓j }. j=1 1 El espacio maximal asociado es ℓp,w = {x : sup n p x↓n < ∞} conocido como n espacio ℓp -débil. El espacio minimal es (0) sφ = {x ∈ ℓp,w : lı́m n1/p x↓n = 0. n→∞ Algunas propiedades útiles de estos espacios las resumimos en el siguiente teorema, cuya prueba puede hallarse en el libro de ideales de traza de B. Simon [66, Teorema 1.16]. Teorema D.1.5. Sea φ una norma simétrica en c(0) . Entonces, 1. Si xn → 0, entonces φ(x) = φ(x↓ ). Pn Pn 2. Si xn , yn → 0 y j=1 y↓ ≤ j=1 x↓ para todo n ∈ N, entonces φ(y) ≤ φ(x). 3. Si φ(1, 0, 0, . . .) = c, entonces para todo x ∈ sφ se tiene ckxk∞ ≤ φ(x) ≤ ckxk1 . (0) 4. Los espacios sφ , sφ son completos. 5. Si sφ = sψ como conjuntos, entonces φ y ψ son normas equivalentes. 6. Si φ no es equivalente a k · k∞ , entonces sφ ⊂ c0 . D.1. Ideales en B(H) D.1.2. 281 Ideales de operadores compactos Comenzamos la sección con algunos resultados debidos a Calkin que caracterizan ideales biláteros de B(H). Denotemos con K(H) a los operadores compactos y con B(H)0 a los operadores de rango finito. Seguimos de cerca el libro de Simon [66]. Teorema D.1.6. Sea I ⊂ B(H) un ideal bilátero, con H separable y complejo. Entonces 1. Si existe a ∈ I que es no compacto, entonces I = B(H). 2. Si I es propio entonces I ⊂ K(H). 3. Si a, b son compactos con b ∈ I y µk (a) ≤ µk (b) para todo k, entonces a ∈ I. 4. a ∈ I si y sólo si a∗ ∈ I. 5. Si I = 6 0 entonces B(H)0 ⊂ I. 6. Si I es cerrado en la norma uniforme, entonces I es cero, es todo B(H) o es el ideal de operadores compactos K(H). Demostración. Si a ∈ I es no compacto, también lo es |a| = u∗ a. Para t > 0, sea Pt = ε[t, ∞) donde ε es la medida espectral de |a| (sección C.1.2). Observemos que at = |a|Pt + (1 − Pt ) es un operador acotado e inversible, pues tiene su espectro en [t, ∞). Entonces, como 1 = at a−1 t , multiplicando por Pt a la derecha se tiene −1 Pt = a−1 t at Pt = at |a|Pt ∈ I para todo t > 0 por ser I un ideal bilátero. Por otra parte, existe s > 0 tal que Ps es infinito-dimensional, ya que en caso contrario |a| = lı́m |a|P1/n en norma uniforn me y |a| resultaría compacto. Como Ps ∈ I es un proyector infinito-dimensional, existe una isometría V : H → ran(Ps ), y entonces 1 = V ∗ Ps V ∈ I, luego I = B(H). Se deduce de aquí que si I es un ideal propio, debe estar dentro de los operadores compactos. Sean a = u|a|, b = v|b| compactos, X X |a| = µi (a)hei , ·iei , |b| = µj (b)hfj , ·ifj , i∈I j∈J 282 Normas en Álgebras de Operadores con {ei } una base de ran|a| y {fj } una base de ran|b|. La hipótesis µk (a) ≤ µk (b) para todo k presupone que ran|a| y ran|b| tienen la misma dimensión, es decir I = J, luego existe una isometría w : ran|a| → ran|b| que se extiende (como cero en ker(a) = ran|a|⊥ ) a una isometría parcial w ∈ B(H), podemos incluso suponer que wek = fk para todo k. Luego X |b| = µk (b)hwek , ·iwek , k y multiplicando por w∗ se tiene w∗ |b| = X k µk (b)hwek , ·iek . Por otra parte, en cada ξ ∈ H se verifica X X w∗ |b|wξ = µk (b)hwek , wξiek = µk (a)hw∗ wek , ξiek k = X k µk (a)hek , ξiek , k luego w∗ |b|w = X k µk (b)hek , ·iek = X k hek , ·iµk (b)ek . Consideramos el operador c ∈ B(ran|a|) dado por cek = µk (a) ek , µk (b) que es una contracción, y lo extendemos al complemento ortogonal como cero, obteniéndose así una contracción c ∈ B(H). Entonces X X cw∗ |b|w = hek , ·iµk (b)cek = hek , ·iµk (a)ek = |a|, k k es decir |a| = cw∗ |b|w. Si b ∈ I entonces |b| = v∗ b ∈ I lo que prueba que |a| ∈ I, y de allí a = u|a| ∈ I. Como µk (a) = µk (a∗ ) para todo k, se deduce del ítem previo que a ∈ I si y sólo si a∗ ∈ I. Si I = 6 0, sea a = u|a| ∈ I con X |a| = µi (a)hei , ·iei , i∈I y sea {ei }i∈I ∪ {ej }j∈J una base de H = ran|a| ⊕ ker(a). Si b = hes , ·iel con s, l ∈ J ∪ I, entonces µ1 (b) = 1 y µk (b) = 0 para todo k > 1. Multiplicando |a| D.1. Ideales en B(H) 283 por un número positivo conveniente se tiene µk (b) ≤ µk (a) para todo k, luego b ∈ I por el ítem previo. Como todo operador de rango finito se escribe como combinación lineal finita de operadores elementales del tipo de b, se tiene que B(H)0 ⊂ I. El último ítem es consecuencia trivial del item anterior y del hecho de que la clausura uniforme de B(H)0 es exactamente K(H). Definición D.1.7. Fijemos una base ortonormal {ek } en H. Dado un ideal propio I ⊂ B(H), definimos s(I) como el conjunto de todas las sucesiones x ∈ c0 tales que al reordenarlas forman los valores singulares de algún operador a ∈ I. Es decir X ↓ s(I) = {x ∈ c0 : xk hek , ·iek ∈ I}. Recíprocamente, dado un espacio de sucesiones s ⊂ c0 , definimos J(s) como la familia de operadores compactos con valores singulares en s, es decir si µ(a) denota la sucesión {µk (a)}, entonces J(s) = {a ∈ B(H) : µ(a) ∈ s}. Diremos que s ⊂ c0 es un espacio de Calkin si, dadas x, y ∈ c0 con y ∈ s y x↓n ≤ y↓n para todo n ∈ N implica x ∈ s. Por el segundo y el sexto ítem del Teorema D.1.5, dada una norma φ : c(0) → (0) R+ simétrica, si φ no es equivalente a k · k∞ , entonces sφ , sφ son espacios de Calkin. Una norma k · kI : B(H) → R ∪ {+∞} con la propiedad kxyzkI ≤ kxkkykI kzk para todo x, y, z ∈ B(H) se dice simétrica. En particular toda norma simétrica es unitariamente invariante, es decir kuyvkI = kykI para todo u, v ∈ U(H). Definimos I = {a ∈ B(H) : kakI < ∞}, que resulta ser un ideal bilátero, que denominamos ideal simétricamente normado. Por el teorema de Calkin, este ideal es trivial, es todo o es un ideal propio de operadores compactos que contiene a todos los operadores de rango finito B(H)0 ⊂ I ⊂ K(H). 284 Normas en Álgebras de Operadores En este último caso, definimos I (0) = B(H)0 ⊂ I, donde la clausura está tomada con la norma k · kI . Diremos que la norma es regular cuando I (0) = I. Dada φ : c(0) → R+ simétrica, definimos Iφ = J(sφ ), (0) (0) Iφ = J(sφ ). Para a ∈ Iφ , definimos k · kφ : K(H) → R ∪ {+∞} como kakφ = φ(µ(a)). Recíprocamente, dada una norma simétrica k · kI : B(H) → R ∪ {+∞}, definimos φ : c(0) → R+ como X ↓ φI (x) = k xk hek , ·iek kI . El siguiente teorema condensa todas las propiedades que usaremos de los ideales simétricos normados y su relación con sucesiones de Calkin y normas simétricas en sucesiones. Su prueba puede encontrarse en [66, Teoremas 2.5-2.8]. Teorema D.1.8. Sean H un espacio de Hilbert complejo y separable, {ek } una base ortonormal, I ∈ B(H) un ideal bilátero propio. Entonces 1. s(I) es un espacio de Calkin y J(s(I)) = I. 2. Si s ⊂ c0 es un espacio de Calkin entonces J(s) es un ideal bilátero y s(J(s)) = s. 3. Dada φ : c(0) → R+ simétrica, la función k · kφ : Iφ → R+ es una norma simétrica. (0) (0) 4. Los espacios Iφ = J(sφ ), Iφ = J(sφ ) son completos con esta norma, (0) y Iφ es la clausura en la norma k · kφ de los operadores de rango finito. (0) 5. Para todo a = u|a| ∈ Iφ , la descomposición a= X k µk (a)hek , ·iuek es convergente en la norma k · kφ . D.1. Ideales en B(H) 285 6. Si I es simétricamente normado, y X ↓ φI (x) = k xk hek , ·iek kI , entonces φ es una norma simétrica en sucesiones, con s(I) ⊂ sφI . (0) Si I era completo entonces sφI ⊂ s(I) ⊂ sφI . 7. Con la notación del ítem previo, se tiene k · kφI = k · kI sobre los operadores de rango finito y I ⊂ IφI . (0) Si I era completo entonces IφI ⊂ I ⊂ IφI . 8. Desigualdad de Hölder: sean φ1 , φ2 , φ3 normas simétricas en c(0) , con la propiedad de que si x ∈ s2 , y ∈ s3 , entonces xy = (xn yn )n es una sucesión de s1 y además φ1 (xy) ≤ φ2 (x)φ3 (y). Entonces si a ∈ I2 , b ∈ I3 , se tiene ab ∈ I1 y kabkφ1 ≤ kakφ2 kbkφ3 . (0) Además si a ∈ I2 D.1.3. (0) (0) o bien b ∈ I3 , entonces ab ∈ I3 . Operadores compactos de Schatten Para p ≥ 1, se definen los ideales p-Schatten, que denotaremos con Bp (H) como Bp (H) := J(ℓp ), es decir son aquellos operadores compactos cuyos valores singulares están en la clase ℓp de sucesiones. Denotamos sX kakp = ks(a)kp = p sk (a)p , k la norma k · kp se conoce como norma p de Schatten. El espacio B1 (H) se conoce como espacio de operadores de traza o espacio de operadores nucleares. 286 Normas en Álgebras de Operadores Fijada una base ortonormal {en } del espacio H, y para a ∈ B1 (H), definimos la traza de a como X Tr(a) := haen , en i. n Veamos que esta cantidad es finita (de hecho, que la serie es absolutamente convergente) y no depende de la base elegida. Si X a= sk (a)hfk , ·iufk k es la descomposición en valores singulares de a = u|a|, con {fk } ∪ {fk′ } base de H = ran|a| ⊕ ker(a), podemos escribir, para cada n ∈ N, X X en = hen , fk ifk + hen , fk′ ifk′ . k k Luego aen = X k con lo cual hen , fk iu|a|fk + X |haen , en i| ≤ k hen , fk′ iu|a|fk′ = X k X k hen , fk isk (a)ufk + 0, sk (a)|hen , fk i| |hufk , en i|. Sumando sobre n y usando la desigualdad de Cauchy-Schwarz, se deduce que, como kfk k = kufk k = 1, X X X X |haen , en i| ≤ sk (a) |hen , fk i| |hufk , en i| ≤ sk (a) = kak1 . n n k k lo que prueba que la suma converge absolutamente, y además que |Tr(a)| ≤ kak1 . Como la suma converge absolutamente, podemos intercambiar el orden de las sumas en X XX haen , en i = sk (a)hen , fk ihufk , en i n n = X k = X k = X k k sk (a) X n * hen , fk ihufk , en i sk (a) ufk , X n sk (a)hufk , fk i, + hen , fk ien i D.1. Ideales en B(H) 287 lo que prueba que la traza no depende de la base ortonormal con la que comenzamos y que se puede calcular como X Tr(a) = sk (a)hufk , fk i. k Se tiene entonces que Tr es una funcional lineal acotada en B1 (H), es decir Tr ∈ B1 (H) ′ . Entonces X Tr(b) = sk (b) k para b = u|b| compacto con b= X k sk (b)hfk , ·iufk , y Tr(b) es finita si y sólo si b ∈ B1 (H). Corolario D.1.9. Sea p ≥ 1. Si a = u|a| ∈ Bp (H), entonces |a|p ∈ B1 (H) y podemos definir su norma k · kp como 1 kakp = (Tr|a|p ) p . Demostración. En primer lugar observemos que a ∈ Bp (H) si y sólo si |a| = u∗ a ∈ Bp (H). Luego, que si X |a| = sk (a)hfk , ·ifk k es la descomposición en valores singulares de |a|, entonces X |a|p = sk (a)p hfk , ·ifk k puesto que los proyectores fk ⊗ fk = hfk , ·ifk son disjuntos. Como {sk (a)p } ∈ ℓ1 , el operador |a|p tiene traza finita, es decir |a|p ∈ B1 . Por último X Tr|a|p = sk (a)p = kakp p. k D.1.4. Desigualdad de Hölder, dualidades, norma Frobenius Aplicando el último ítem del Teorema D.1.8 a estas clases de operadores, y usando la desigualdad clásica de Young para sucesiones, se tiene el siguiente corolario. 288 Normas en Álgebras de Operadores Corolario D.1.10 (Desigualdad de Young para operadores). Si 1/p + 1/q = 1/r, y a ∈ Bp (H), b ∈ Bq (H), entonces ab ∈ Br (H) y además kabkr ≤ kakp kbkq . En particular, si r = 1 se tiene la desigualdad de Hölder para operadores compactos, kabk1 ≤ kakp kbkq . Además, como ab ∈ B1 , se tiene |Tr(ab)| ≤ kabk1 ≤ kakp kbkq , y también si a ∈ B1 y b es sólo acotado |Tr(ab)| ≤ kabk1 ≤ kak1 kbk. A partir de aquí no es difícil probar (Ejercicio D.i), usando las dualidades de espacios de sucesiones, que la traza realiza las siguientes dualidades: para 1 < p < ∞ se tiene Bp (H) ′ = Bq (H), K(H) ′ = B1 (H), B1 (H) ′ = B(H). En particular B2 (H) es un espacio de Hilbert con el producto interno ha, bi = Re Tr(ab∗ ) = 1/2[Tr(ab∗ ) + Tr(ba∗ )], denominado espacio de operadores de Hilbert-Schmidt. En dimensión finita la norma 1 kak2 = Tr(a∗ a) 2 que proviene del producto interno de la traza se suele denominar norma Frobenius para matrices. D.1.5. El teorema de Lidskii y la propiedad cíclica de la traza De prueba mucho más compleja, es el resultado de gran utilidad que dice que Tr es en efecto una traza: Tr(ab) = Tr(ba) para todo a, b ∈ B(H), en el sentido que un lado es finito si y sólo si el otro lo es, y en ese caso los dos lados son iguales. Una prueba posible pasa por el hecho siguiente, también de difícil prueba [66, Teorema 3.7]: si λk (a) son los valores no nulos del espectro de a contados con multiplicidad, entonces para a ∈ B1 (H) la serie de los λk es convergente y además X Tr(a) = λk (a). k De aquí se deduce la ciclicidad de la traza, pues σ(ab)∪{0} = σ(ba)∪{0} y además cada autovalor no nulo tiene la misma multiplicidad si ab, ba son compactos. D.2. Normas simétricas en álgebras C∗ D.2. 289 Normas simétricas en álgebras C∗ Copiando la noción de norma simétrica en B(H), y dada una C∗ -álgebra, consideramos una norma simétrica k · kI : A → R+ ∪ {∞}, esto es una norma (que posiblemente toma el valor +∞ en elementos de A) con la propiedad adicional siguiente: si I = {a ∈ A : kakI < ∞} denota el conjunto de elementos con norma finita, entonces kxyzkI ≤ kxkkykI kzk para todo x, z ∈ A, y ∈ I. Se deduce de aquí (Ejercicio D.ii) que I es un ideal bilátero en A, y que kx∗ kI = kxkI para todo x ∈ A. D.2.1. Álgebras con traza finita Un caso particular que nos concierne es el que sigue. Si τ es un estado de A con la propiedad adicional τ(ab) = τ(ba) para todo a, b ∈ A, diremos que τ es una traza finita en A. Si para x ≥ 0 y no nulo se verifica τ(x) > 0, diremos que la traza es fiel. Supondremos que τ está normalizado o equivalentemente que τ(1) = 1. En presencia de una traza finita y fiel, podemos introducir análogos a las normas p de matrices de la siguiente manera: para 1 ≤ p < ∞ consideramos 1/p kxkp = τ(|x|p ) para x ∈ A. Observación D.2.1. Para todo x ∈ A y todo p ≥ 1, kxkp ≤ kxk. En efecto, basta probar el resultado para p = k n ∈ Q, y en ese caso 1 1 1 p n k n k n k kxkp p = τ(|x| ) = τ((|x| ) ) ≤ k(|x| ) k ≤ k|x| k , y por otro lado como 0 ≤ |x| ≤ kxk y 1 n 1 ∈ [0, 1], se tiene por el Teorema B.3.9 1 0 ≤ |x| n ≤ kxk n 1 1 p de donde se sigue que k|x| n k ≤ kxk n , y así kxkp p ≤ kxk . Veamos ahora la desigualdad de Hölder. Como preliminar presentamos un teorema debido a Hadamard conocido como teorema de las tres líneas. 290 Normas en Álgebras de Operadores Teorema D.2.2. Sea f : S → X una función continua y acotada, con S = {z ∈ C : 0 ≤ Re z ≤ 1} y X un espacio de Banach. Supongamos que f es analítica en S0 y que para y ∈ R se verifica |f(iy)| ≤ M0 , |f(1 + iy)| ≤ M1 para ciertas constantes M0 , M1 > 0. Entonces para todo z ∈ S, se verifica z z |f(z)| ≤ M1−Re MRe . 1 0 Demostración. Dada ϕ ∈ X ′ , consideramos g = ϕ ◦ f que es una función continua y acotada en S, analítica en el sentido usual en S0 . Reemplazando f por f(z)M1−z Mz1 , basta probar el caso M0 = M1 = 1, y aquí tenemos que probar 0 que |f(z)| ≤ 1 en la banda S; por el teorema de Hahn-Banach, basta probar que |g(z)| ≤ 1 en la banda. Si g(z) → 0 cuando z → ∞, entonces la conclusión se sigue del principio del módulo máximo usual para funciones de variable compleja. En caso contrario, consideramos 2 gn (z) = g(z)ez /n −1/n e , y como g es acotada en S, se sigue que gn → 0 cuando z → ∞ en la banda, luego |gn (z)| ≤ 1 para z ∈ S pues |gn | ≤ 1 en el borde. Como esto vale para todo 2 n ∈ N, se tiene la conclusión tomando límite en n puesto que ez /n e−1/n → 1 cuando n → ∞. Teorema D.2.3 (Desigualdad de Hölder). Si a, b ∈ A, entonces kabk1 ≤ kakp kbkq para p ≥ 1 y 1/p + 1/q = 1. Demostración. Basta probar que kabk1 ≤ 1 para kakp = kbkq = 1. Suponemos A representada en un espacio de Hilbert. Consideramos la descomposición polar de a, b y ab, dada por a = u|a|, b = v|b|, ab = w|ab|. Luego kabk1 = τ|ab| = τ(w∗ ab) = τ(w∗ u|a| v|b|) = τ(|a| v|b|w∗u). Dado ǫ > 0, sea Fǫ : C → C la función entera dada por Fǫ (z) = τ([ǫ + |a|p ]z v[ǫ + |b|q ]1−z w∗ u). D.2. Normas simétricas en álgebras C∗ 291 Si z = x + iy con 0 ≤ x ≤ 1 entonces |Fǫ (z)| ≤ k[ǫ + |a|p ]z v[ǫ + |b|q ]1−z w∗ uk ≤ k[ǫ + |a|p ]z kkǫ + |b|q ]1−z k = k[ǫ + |a|p ]x kk[ǫ + |b|q ]1−x k puesto que v, w∗ , u son isometrías parciales, mientras que (ǫ + |a|p ) > 0 luego (ǫ + |a|p )iy es unitario para y ∈ R, y lo mismo vale para b. Recordemos que para c ∈ A+ se verifica c ≤ kck, luego si s ∈ [0, 1] se tiene cs ≤ kcks con lo cual k[ǫ + |a|p ]x k ≤ kǫ + |a|p kx ≤ (ǫ + kakp )x ≤ ǫ + kakp q 1−x puesto que ǫ + kakp ≥ ǫ + kakp k≤ p = ǫ + 1 > 1. Similarmente k[ǫ + |b| ] ǫ + kbkq, luego Fǫ es acotada en Re z ∈ [0, 1]. Por otra parte, para y ∈ R se tiene |F(iy)| = |τ([ǫ + |a|p ]iy v[ǫ + |b|q ][ǫ + |b|q ]−iy w∗ u)| ≤ ǫk[ǫ + |a|p ]iy v[ǫ + |b|q ]−iy w∗ uk +|τ(w∗ u[ǫ + |a|p ]iy v[ǫ + |b|q ]−iy |b|q )k ≤ ǫ + τ(|b|q ) = ǫ + 1, puesto que todos los operadores involucrados salvo |b|q son unitarios o isometrías parciales (en el segundo término usamos |τ(c)| ≤ τ|c| para todo c ∈ A, hecho que dejamos como ejercicio (D.iii)). Con un cómputo similar, se tiene |Fǫ (1 + iy)| ≤ ǫ + 1, luego por el teorema de las tres líneas de Hadamard (Teorema D.2.2) se sigue que |Fǫ (z)| ≤ (1 + ǫ)z (1 + ǫ)1−z = 1 + ǫ para todo z tal que 0 ≤ Re z ≤ 1, y en particular kabk1 = lı́m+ Fǫ (1/p) ≤ 1 + ǫ ǫ→0 lo que prueba que kabk1 ≤ 1. Dejamos como ejercicio (D.v) la verificación de que, para p ≥ 1, la norma p se trata en efecto de una norma en A (es decir que se verifica la desigualdad de Minkowski). La misma es consecuencia inmediata de la desigualdad de Hölder que acabamos de probar. Las normas p resultan normas simétricas: si se tiene x, y, z ∈ A, entonces por la desigualdad de Young (ejercicio D.iv), kxyzkp ≤ kxkkyzkp ≤ kxkkykpkzk. 292 Normas en Álgebras de Operadores Una propiedad importante adicional de las normas p de una traza finita es que se comportan como las normas p de un espacio de medida finita, en el siguiente sentido. Proposición D.2.4. Si τ es una traza finita, entonces para todo x ∈ A y todo kxk ≥ ǫ > 0 se verifican: 1. Existe e2 = e∗ = e ∈ W ∗ (x) tal que |x|e ≥ (kxk − ǫ)e. 2. kxk = lı́m kxkp . p→∞ Demostración. Podemos suponer que kxk = 1, sea H el espacio de Hilbert asociado a L, que es la representación GNS de C∗ (x) dada por la traza τ (Sección B.3.6). Esta representación es fiel y consideramos W ∗ (x) ⊂ B(H) la clausura en la topología débil de LC∗ (x) ⊂ B(H). Observemos que τ pasa a LC∗ (x) de manera natural, pues τ̃(La ) = τ(a) está bien definido y da una traza fiel y finita. Por otra parte, dado b = ω − lı́m bn ∈ W ∗ (x) con bn ∈ C∗ (x), extendemos la traza n τ de la siguiente manera τ(b) = lı́mn τ(bn ). Esta definición no depende de la sucesión bn pues τ(bn ) = τ(Lbn [1][1]) = hLbn [1], [1]i → hLb [1], [1]i = τ(b). Sea ε : [0, 1] → W ∗ (x) la medida espectral de |x| (Sección C.1.3), definimos e = ε[1 − ǫ, 1]. Entonces e ∈ W ∗ (x) es un proyector autoadjunto y además, como χ[1−ǫ,1]id[0,1] = id[1−ǫ,1] ≥ χ[1−ǫ,1] (1 − ǫ), por el tercer ítem del Teorema C.1.1 se sigue que e|x| ≥ (1 − ǫ)e. Respecto de la segunda afirmación, por el resultado obtenido en la primera y la desigualdad de Hölder, tenemos 1 τ(e)(kxk − ǫ) ≤ τ(|x|e) ≤ kxkp kekq = kxkp τ(e) q , es decir 1 τ(e) p (kxk − ǫ) ≤ kxkp . Tomando límite superior para p → ∞, se tiene kxk − ǫ ≤ lı́m sup kxkp ≤ kxk p→∞ por la Observación D.2.1, luego el límite superior coincide con kxk, y como lo mismo es cierto para el límite inferior, se sigue que existe el límite y coincide con kxk. D.3. Problemas 293 Observación D.2.5. Usualmente estos espacios normados no son completos (salvo en el caso en el que A tiene dimensión finita). Por la desigualdad de Young, si t ≥ s ≥ 1, se tiene kxk1 ≤ kxks ≤ kxkt ≤ kxk luego si Ls = Ls (A, τ) denota la completación de A con la norma s, se verifica A ⊂ Lt ⊂ Ls ⊂ L1 , y no es difícil ver que la traza implementa las dualidades L1′ = A, Lq = Lp′ para p ≥ 1 y 1/p + 1/q = 1. Estos espacios de Banach, que no son más álgebras, se denominan Lp no conmutativos, y en general se considera a un álgebra finita como el análogo no conmutativo de un espacio de medida finita, por eso se suelen denominar a estos espacios de medidad no conmutativa. D.3. Problemas D.I. Usando las dualidades de espacios de sucesiones, probar que la traza realiza las siguientes dualidades: para 1 < p < ∞ se tiene Bp (H) ′ = Bq (H), K(H) ′ = B1 (H), B1 (H) ′ = B(H). D.II. Si k · kI es una norma simétrica en una C∗ -álgebra A, probar que I es un ideal bilátero en A, y que kx∗ kI = kxkI para todo x ∈ A. Sugerencia: probar primero que la norma es unitariamente invariante y luego considerar la descomposición polar de x. D.III. Si τ es una traza finita en un álgebra C∗ , probar que para todo x ∈ A, se verifica |τ(x)| ≤ τ|x|. D.IV. Probar la desigualdad de Young, kabkr ≤ kakp kbkq para p, q, r ≥ 1 tales que 1/p + 1/q = 1/r + 1. D.V. Probar la desigualdad de Minkowski ka + bkp ≤ kakp + kbkp para p ≥ 1 y a, b ∈ A (ver el Ejercicio 1.iii), con lo cual las normas p son en efecto normas en A. D.VI. Probar que para todo x ∈ A y todo p ≥ 1 se verifican 294 Normas en Álgebras de Operadores kxk1 = máx{|τ(xu)| : u ∈ W ∗ (x) isometría parcial}, kxkq = máx{|τ(xy)| : y ∈ W ∗ (x), kykp ≤ 1}, donde como siempre 1/p + 1/q = 1. D.VII. Probar las afirmaciones de la Observación D.2.5. Bibliografía [1] A. A. Albert, B. Muckenhoupt. On matrices of trace zeros. Michigan Math. J. 4 (1957), 1–3. [2] W. Ambrose, R. S. Palais, I. M. Singer. Sprays. An. Acad. Brasil. Ci. 32 (1960), 163–178. [3] J. An, K.-H. Neeb. An implicit function theorem for Banach spaces and some applications. Math. Z. 262 (2009), no. 3, 627–643. [4] E. Andruchow. Short geodesics of unitaries in the L2 metric. Canad. Math. Bull. 48 (2005), no. 3, 340–354. [5] E. Andruchow, E. Chiumiento, G. Larotonda. Homogeneous manifolds from noncommutative measure spaces. J. Math. Anal. Appl. 365, (2010), no. 2, 541–558. [6] E. Andruchow, G. Corach, D. Stojanoff. Geometry of oblique projections. Studia Math. 137 (1999), no. 1, 61–79. [7] E. Andruchow, G. Larotonda. Hopf-Rinow theorem in the Sato Grassmannian. J. Funct. Anal. 255 (2008), no. 7, 1692–1712. [8] E. Andruchow, G. Larotonda, L. Recht. Finsler geometry and actions of the p-Schatten unitary groups. Trans. Amer. Math. Soc. 362 (2010), 319-344. [9] E. Andruchow, G. Larotonda, L. Recht. A. Varela. The left invariant metric on the general linear group. arxiv preprint (2011). [10] E. Andruchow, D. Stojanoff. Geometry of unitary orbits. J. Operator Theory 26 (1991), no. 1, 25–41. [11] J. Antezana, G. Larotonda, A. Varela. Optimal paths for symmetric actions in the unitary group. Preprint (2011) arXiv:1107.2439v1 [math.DG]. [12] T. M. Apostol. Mathematical analysis. Second edition. Addison-Wesley Publishing Co., Reading, Mass.-London-Don Mills, Ont., 1974. 295 296 Bibliografía [13] V. I. Arnol’d. Mathematical Methods of Classical Mechanics. Translated from the Russian by K. Vogtmann and A. Weinstein. Second edition. Graduate Texts in Mathematics, 60. Springer-Verlag, New York, 1989. [14] C. J. Atkin. The Finsler geometry of groups of isometries of Hilbert space. J. Austral. Math. Soc. Ser. A 42 (1987), no. 2, 196–222. [15] C. J. Atkin. The Finsler geometry of certain covering groups of operator groups. Hokkaido Math. J. 18 (1989), no. 1, 45–77. [16] D. Bao, S.-S Chern, Z. Shen. An introduction to Riemann-Finsler geometry. Graduate Texts in Mathematics, 200. Springer-Verlag, New York, 2000. [17] D. Beltiţă. Smooth homogeneous structures in operator theory. Chapman & Hall/CRC Monographs and Surveys in Pure and Applied Mathematics, 137. Chapman & Hall/CRC, Boca Raton, FL, 2006. [18] F. F. Bonsall, J. Duncan. Numerical ranges of operators on normed spaces and of elements of normed algebras. London Mathematical Society Lecture Note Series, 2 Cambridge University Press, London-New York, 1971. [19] N. Bourbaki. Lie groups and Lie algebras. Chapters 7–9. Translated from the 1975 and 1982 French originals by Andrew Pressley. Elements of Mathematics (Berlin). Springer-Verlag, Berlin, 2005. [20] A. Brown, C. Pearcy. Structure of commutators of operators. Ann. of Math. (2) 82 (1965), 112–127. [21] M. P. do Carmo. Geometría Diferencial de Curvas y Superficies. Alianza Universidad Textos, 1990. [22] E. Cartan. Leçons sur la géométrie des espaces de Riemann. (French) [Lessons on the geometry of Riemann spaces] Reprint of the second (1946) edition. Les Grands Classiques Gauthier-Villars. [Gauthier-Villars Great Classics] Éditions Jacques Gabay, Sceaux, 1988. [23] K. Y. Chung. Subspaces and graphs. Proc. Amer. Math. Soc. 119 (1993), no. 1, 141–146. [24] S. Cohn-Vossen, Existenz kürzester Wege. (English) C. R. (Dokl.) Acad. Sci. URSS, n. Ser. 1935, No.3, 339–342 (1935). [25] G. Corach, A. Maestripieri. Geometry of positive operators and Uhlmann’s approach to the geometric phase. Rep. Math. Phys. 47 (2001), no. 2, 287– 299. Bibliografía 297 [26] G. Corach, A. Maestripieri, D. Stojanoff. Orbits of positive operators from a differentiable viewpoint. Positivity 8 (2004), no. 1, 31–48. [27] G. Corach, H. Porta, L. Recht. The geometry of spaces of projections in C∗ -algebras. Adv. Math. 101 (1993), no. 1, 59–77. [28] G. Corach, H. Porta, L. Recht. The geometry of the space of selfadjoint invertible elements in a C∗ -algebra. Integral Equations Operator Theory 16 (1993), no. 3, 333–359. [29] K. R. Davidson. C∗ -algebras by Example. Fields Institute Monographs, 6. American Mathematical Society, Providence, RI, 1996. [30] C. Davis. The Toeplitz-Hausdorff theorem explained. Canad. Math. Bull. 14 (1971), 245–246. [31] C. T. J. Dodson, G.N. Galanis, E. Vassiliou. Isomorphism classes for Banach vector bundle structures of second tangents. Math. Proc. Cambridge Philos. Soc. 141 (2006), no. 3, 489–496. [32] C. E. Durán, L.E. Mata-Lorenzo, L. Recht. Metric geometry in homogeneous spaces of the unitary group of a C∗ -algebra. I. Minimal curves. Adv. Math. 184 (2004), no. 2, 342–366. [33] C. E. Durán, L.E. Mata-Lorenzo, L. Recht. Metric geometry in homogeneous spaces of the unitary group of a C∗ -algebra. II. Geodesics joining fixed endpoints. Integral Equations Operator Theory 53 (2005), no. 1, 33–50. [34] E. B. Dynkin. Calculation of the coefficients in the Campbell-Hausdorff formula. (Russian) Doklady Akad. Nauk SSSR (N.S.) 57, (1947). 323–326.1 [35] H. Glöckner, K.-H. Neeb. Banach-Lie quotients, enlargibility, and universal complexifications. [Banach-Lie quotients, enlargeability, and universal complexifications] J. Reine Angew. Math. 560 (2003), 1–28. [36] M. Gromov. Metric structures for Riemannian and non-Riemannian spaces. Based on the 1981 French original. With appendices by M. Katz, P. Pansu and S. Semmes. Translated from the French by Sean Michael Bates. Reprint of the 2001 English edition. Modern Birkhäuser Classics. Birkhäuser Boston, Inc., Boston, MA, 2007. [37] J. Hadamard. Les surfaces à courbures opposées et leurs lignes géodésiques. (French) Jorn. de Math. (5) 4 (1898), 27-73 . traducción al inglés se halla en Selected papers of E. B. Dynkin with commentary. Edited by A. A. Yushkevich, G. M. Seitz and A. L. Onishchik. American Mathematical Society, Providence, RI; International Press, Cambridge, MA, 2000 1 Una 298 Bibliografía [38] P. de la Harpe. Classical Banach-Lie algebras and Banach-Lie groups of operators in Hilbert space. Lecture Notes in Mathematics, Vol. 285. Springer-Verlag, Berlin-New York, 1972. [39] L. A. Harris, W. Linear algebraic groups in infinite dimensions. Illinois J. Math. 21 (1977), no. 3, 666–674. [40] S. Helgason. Differential geometry, Lie groups, and symmetric spaces. Corrected reprint of the 1978 original. Graduate Studies in Mathematics, 34. American Mathematical Society, Providence, RI, 2001. [41] K. H. Hofmann, Karl H. Théorie directe des groupes de Lie. I. (French) Séminaire P. Dubreil (27e année: 1973/74), Algèbre, Fasc. 1, Exp. No. 1, 24 pp. Secrétariat Mathématique, Paris, 1975. [42] J. P. Holmes. Idempotents in differentiable semigroups. J. Math. Anal. Appl. 162 (1991), no. 1, 255–267. [43] J. P. Holmes. The structure of the set of idempotents in a Banach algebra. Illinois J. Math. 36 (1992), no. 1, 102–115. [44] H. Hopf, W. Rinow, W. Ueber den Begriff der vollständigen differentialgeometrischen Fläche. (German) Comment. Math. Helv. 3 (1931), no. 1, 209–225. [45] R. V. Kadison, J. R. Ringrose. Fundamentals of the theory of operator algebras. Vol. I. Elementary theory. Reprint of the 1983 original. Graduate Studies in Mathematics, 15. American Mathematical Society, Providence, RI, 1997. [46] Z. V. Kovarik. Manifolds of linear involutions. Linear Algebra Appl. 24 (1979), 271–287. [47] S. Lang. Differential and Riemannian manifolds. Third edition. Graduate Texts in Mathematics, 160. Springer-Verlag, New York, 1995. [48] A. R. Larotonda. Notas sobre variedades diferenciables. Notas de Geometría y Topología, 1. Universidad Nacional del Sur, Instituto de Matemática, Bahía Blanca, 1980. [49] M. Martin, N. Salinas. Differential geometry of generalized Grassmann manifolds in C∗ -algebras. Operator theory and boundary eigenvalue problems (Vienna, 1993), 206–243, Oper. Theory Adv. Appl., 80, Birkhäuser, Basel, 1995. Bibliografía 299 [50] J. McAlpin. Infinite dimensional manifolds and Morse theory. Thesis, Columbia University, 1965 (unpublished). [51] J. Milnor. Morse theory. Based on lecture notes by M. Spivak and R. Wells. Annals of Mathematics Studies, No. 51 Princeton University Press, Princeton, N.J., 1963. [52] G. A. Muñoz. Complexifications of polynomials and multilinear maps on real Banach spaces. Function spaces (Poznan, 1998), 389–406, Lecture Notes in Pure and Appl. Math., 213, Dekker, New York, 2000. [53] J.R. Munkres. Topology: a first course. Prentice-Hall, Inc., Englewood Cliffs, N.J., 1975. [54] F.D. Murnaghan. On the field of values of a complex matrix. Proc. Nat. Acad. Sci. USA, 18 (1932), 246–248. [55] B. Y. Levin. Lectures on Entire Functions. Translations of Mathematical Monographs Vol. 160, AMS Providence, Rhode Island, 1996. [56] K.-H. Neeb. A Cartan-Hadamard theorem for Banach-Finsler manifolds. Proceedings of the Conference on Geometric and Combinatorial Group Theory, Part II (Haifa, 2000). Geom. Dedicata 95 (2002), 115–156. [57] K.-H. Neeb. Towards a Lie theory of locally convex groups. Jpn. J. Math. 1 (2006), no. 2, 291–468. [58] H. Porta, L. Recht. Minimality of geodesics in Grassmann manifolds. Proc. Amer. Math. Soc. 100 (1987), no. 3, 464–466. [59] C. R. Putnam, A. Wintner. The connectedness of the orthogonal group in Hilbert space. Proc. Nat. Acad. Sci. U. S. A. 37, (1951). 110–112. [60] C. R. Putnam, A. Wintner. The orthogonal group in Hilbert space. Amer. J. Math. 74, (1952). 52–78. [61] I. Raeburn. The relationship between a commutative Banach algebra and its maximal ideal space. J. Funct. Anal. 25 (1977), no. 4, 366–390. [62] M. Reed, B. Simon. Methods of modern mathematical physics. I. Functional analysis. Academic Press, New York-London, 1972. [63] W. Rudin. Functional analysis. McGraw-Hill Series in Higher Mathematics. McGraw-Hill Book Co., New York-Düsseldorf-Johannesburg, 1973. [64] S. Sakai. C∗ -algebras and W ∗ -algebras. Ergebnisse der Mathematik und ihrer Grenzgebiete, Band 60. Springer-Verlag, New York-Heidelberg, 1971. 300 Bibliografía [65] N. Salinas. The Grassmann manifold of a C∗ -algebra, and Hermitian holomorphic bundles. Special classes of linear operators and other topics (Bucharest, 1986), 267–289, Oper. Theory Adv. Appl., 28, Birkhäuser, Basel, 1988. [66] B. Simon. Trace ideals and their applications. Second edition. Mathematical Surveys and Monographs, 120. American Mathematical Society, Providence, RI, 2005. [67] H. Upmeier. Symmetric Banach manifolds and Jordan C∗ -algebras. NorthHolland Mathematics Studies, 104. Notas de Matemática [Mathematical Notes], 96. North-Holland Publishing Co., Amsterdam, 1985. [68] H. Weyl. The Classical Groups. Their Invariants and Representations. Princeton University Press, Princeton, N.J., 1939. Índice alfabético acción de un grupo, 48 álgebra C∗ , 255 de Banach, 237 de Lie-Banach, 42 de un subgrupo, 71 de operadores, 235 de von Neumann, 273 atlas diferenciable, 21 conexión, 119 afín, 122 de Koszul, 122 cono positivo, 84 convexa bola Riemanniana, 217 función de operadores, 264 convexidad geodésica, 223 coordenadas polares, 199 corchete de Lie, 33, 36 curva admisible, 194 auto-paralela, 128 densa en el toro, 39 curva densa en el toro, 47 curvatura, 130 de la esfera, 135 de la Grassmanniana, 144 del grupo lineal, 139 seccional, 219 semi-negativa, 228 curvatura seccional de la esfera, 220 de la Grassmanniana, 224 de los operadores positivos inversibles, 222 del grupo unitario, 221, 222 del spray métrico en el grupo lineal, 221 nula, 225 semi-negativa, 228 Baker-Campbell-Hausdorff serie de, 67 cálculo de variaciones, 193 cálculo funcional, 54, 242, 256, 273 campo f-relacionado, 39 invariante, 42 vectorial, 32 campos de Jacobi, 131 de la Grassmanniana, 144 en el grupo lineal con el spray canónico, 140 en la esfera, 135 en operadores positivos, 142 versus curvatura seccional, 226 versus diferencial de exp, 134 Cartan descomposición de, 86 Cartan-Hadamard Teorema de, 181 301 302 Índice alfabético versus campos de Jacobi, 226 derivaciones, 38 derivada covariante, 122, 127 de la Grassmanniana, 144 del spray canónico en el grupo lineal, 138 del spray métrico del grupo lineal, 193 en operadores positivos, 142 derivada de Levi-Civita, 186 del grupo unitario, 193 del spray métrico del grupo lineal, 193 en la esfera, 135 en la Grassmanniana, 189 derivada de Lie, 36 descomposición de Cartan, 86 descomposición polar, 270, 275 desigualdad de Hölder, 287 de Minkowski, 293 de Young, 293 diferencial de orden superior, 7 de una función entre variedades, 26 primera, 5 diferencial de la exponencial adjunta de la, 227 del grupo lineal, 65 en operadores positivos, 83 versus campos de Jacobi, 134 distancia rectificable, 149 Dynkin fórmula de, 69 EMI en operadores positivos, 181 entorno normal, 118 esfera campos de Jacobi en la, 135 como superficie de nivel, 31 corchete de Lie en la, 34 curvas cortas en la, 204 curvatura de la, 135 curvatura seccional de la, 220 derivada de Levi-Civita en la, 135 exponencial de la, 135 fibrado TTS, 100 geodésicas en la, 135 radio de inyectividad, 204 spray en la, 135 spray no cuadrático en la, 137 transporte paralelo, 135 espacio de caracteres, 259 espacio de estados, 266 espacio de métrica interior, 153 espacio homogéneo, 48, 49 espacios de medida Lp no conmutativos, 293 espacios de sucesiones, 279 espectro, 238 exponencial de la Grassmanniana, 144 de un grupo de Lie, 43 del spray, 116 diferencial de, 65 en la esfera, 135 en operadores positivos, 142 factorización, 66 naturalidad de la, 46 fórmulas variacionales, 196 fibrado TTM, 97 de una superficie de nivel, 102 del grupo unitario, 140 en la esfera, 100 en la Grassmanniana, 143 flip canónico, 104 fibrado vertical VTM y VTM∗ , 99 flip canónico, 104 Índice alfabético Frobenius Teorema de, 37 función analítica, 11 cociente, 50 convexa de operadores, 264 de matrices, 54 monótona de operadores, 264 reglada, 9 funcional energía, 162 longitud, 162 positiva, 266 Gauss Lema de, 199 Gelfand transformada de, 260 Gelfand-Naimark-Segal representación de, 268 geodésicamente convexo, 223 geodésicas corta, 156 de la Grassmanniana, 144 del grupo unitario, 192 del spray, 115 del spray canónico del grupo lineal, 138 del spray canónico en operadores positivos, 142 del spray métrico del grupo lineal, 191 en la esfera, 135 geodésicas cortas en el grupo unitario, 206 con la norma uniforme, 210 métrica Frobenius, 207 norma simétrica, 212 en la esfera, 204 en la Grassmanniana, 212 303 existencia global en dimensión finita, 213 no existencia en dimensión infinita, 215 Grassmanniana, 89 campos de Jacobi en la, 144 como superficie de nivel, 143 curvatura de la, 144 curvatura seccional de la, 224 de matrices, 58 derivada covariante en la, 144 derivada de Levi-Civita en la, 189 exponencial de la, 144 geodésicas de la, 144 spray métrico en la, 144, 189 transporte paralelo en la, 144 grupo a un parámetro, 138 a un parámetro, 43 de inversibles de un álgebra, 64 de isometrías, 77 de Lie, 41 general lineal, 53, 64 lineal, 52 ortogonal, 56 simpléctico, 56 unitario, 54, 80, 81 grupo lineal, 63 campos de Jacobi del spray canónico, 140 curvatura del spray canónico, 139 curvatura seccional del spray métrico, 221 derivada covariante del spray canónico, 138 del spray métrico, 193 derivada de Levi-Civita, 193 diferencial de la exponencial, 65 espectro, 65 304 estructura diferenciable, 240 geodésicas, 138 del spray métrico, 191 métrica invariante, 172 métrica Riemanniana invariante, 191 métricas cociente, 172 representaciones, 65 spray canónico, 138 spray métrico, 191 subgrupo algebraico del, 74 transporte paralelo del spray canónico, 139 grupo unitario como superficie de nivel, 140 curvatura seccional, 222 curvatura seccional del, 221 derivada de Levi-Civita en el, 193 fibrado TTM, 140 geodésicas, 192 geodésicas cortas con la métrica uniforme, 210 métrica Frobenius, 207 métrica invariante, 212 geodésicas cortas en el, 206 radio de inyectividad del, 206 spray canónico, 140 Hopf-Rinow Teorema de, 157 ideal de operadores compactos, 281 identidad de Jacobi, 33 integral de una curva, 9 de una función reglada, 9 involución, 237 isometría, 224 isotropía, 48 Jacobi Índice alfabético campo de, 131 identidad de, 33 jets, 107 Lema de Gauss, 199 levantada canónica, 27 de un curva, 27 de una curva, 128 Lie-Trotter fórmulas de, 70 logaritmos de operadores unitarios, 81 longitud de una curva rectificable, 150 métrica de Finsler, 161, 163 acotada, 163, 168 débil, 163 fuerte, 163 invariante, 171 métrica invariante en el grupo lineal, 172, 191 matrices p-codiagonales, 58 p-diagonales, 58 positivas, 59 medida espectral, 275 naturalidad de la exponencial, 46 norma estrictamente convexa, 176 Frobenius, 287 rotunda, 176 simétrica, 283 unitariamente invariante, 283 en operadores positivos, 173 operador bilineal, 7 Índice alfabético cuadrático, 7 de Schatten, 285 Hermitiano, 78 lineal, 3 normal, 255 p-codiagonal, 58 p-diagonal, 58 positivo, 83, 263 unitario, 81 operadores positivos, 59 campos de Jacobi en, 142 curvatura seccional, 222 derivada covariante, 142 exponencial en los, 142 geodésicas, 142 métricas simétricas, 173 propiedad expansiva de la exponencial, 174 spray canónico en, 141 transporte paralelo, 142 órbita, 50 coadjunta, 87 de un operador autoadjunto, 88 de un proyector, 89 de similaridad, 88 orden de una función entera, 66 polinomio de Taylor, 11 homogéneo, 12 primera variación, 196 propiedad creciente de la métrica en operadores positivos, 181 propiedad expansiva de la métrica en variedades de Riemann, 227 proyector del fibrado doble tangente, 98 radio de inyectividad de la esfera, 204 305 del grupo unitario, 206 radio espectral, 255 radio numérico, 246 rango numérico, 246 reparametrización normal, 152 representación GNS, 265 representación adjunta, 44 representaciones L y R, 64 símbolos de Christoffel, 126 sección continua, 50 spray, 110, 114 afín o cuadrático, 116 spray canónico, 124 del grupo de inversibles, 138 del grupo unitario, 140 en operadores positivos, 141 spray métrico, 190 de la Grassmanniana, 144, 189 del grupo lineal, 191 subgrupo algebraico, 74 analítico, 46, 71 de Lie-Banach, 46, 71 de un grupo de Lie, 71 subvariedad de un espacio de Banach, 31 de una variedad diferenciable, 27 embebida, 29 regular, 29 tangente espacio, 23 fibrado, 24 Taylor fórmula, 11 tensor de curvatura, 130 Teorema 306 de Ascoli, 157 de Banach-Shauder, 4 de Banach-Steinhaus, 5 de Cartan en variedades de Finsler, 177 Riemanniano, 227 de Cartan-Hadamard, 229 de Frobenius, 37, 47, 71, 74 de Gelfand, 258, 261 de Hahn-Banach, 4 de Hopf-Rinow, 203, 213 en espacios de métrica interior, 157 en variedades de Finsler, 168 variedad de Riemann, 216 de la función abierta, 4 de la función implícita, 14, 16 de la función inversa, 13 del gráfico cerrado, 5 del valor medio, 10 espectral, 274 topología débil, 235 fuerte, 235 transformada de Gelfand, 260 transporte paralelo, 128 de la Grassmanniana, 144 del spray canónico del grupo lineal, 139 en la esfera, 135 en operadores positivos, 142 traza finita y fiel, 289 unitización, 238 valores singulares, 277 variedad de Cartan-Hadamard, 183 de Finsler, 163 débil, 164 de dimensión finita, 165 Índice alfabético fuerte, 164, 168 de Finsler con spray, 169 Riemanniana, 186 variedad Riemanniana débil, 202 variedades localmente planas, 225 vector normizante, 270 Índice de símbolos AC operadores p-codiagonales de A. 90 AD operadores p-diagonales de A. 90 Ah operadores Hermitianos de A. 80 Aah operadores anti Hermitianos de A. 90 Adg isomorfismo adjunto. 41 a∗ adjunto del elemento a. 235, 237 adv (w) = [v, w] representación adjunta. 44 A(v, w) área del paralelogramo generado por v, w. 219 b métrica de Finsler. 161 BCH(v, w) serie de Baker-Campbell-Hausdorff de v, w. 67, 69 B2 (H) operadores de Hilbert-Schmidt. 190, 206 B(E) operadores acotados de E en E. 4 B(E, F) operadores acotados de E en F. 3 B 2 (E × E; F) = B 2 (E2 ; F) operadores bilineales. 6 B(H) operadores acotados del espacio de Hilbert H. 87 B(H)0 operadores de rango finito en H. 190, 281 Bor(X) funciones Borelianas acotadas en el espacio X. 273 Bp (H) operadores compactos de Schatten. 285 c(0) sucesiones con finitos términos no nulos. 279 307 308 Índice de símbolos c0 sucesiones que tienden a cero. 279 C∗ (a) álgebra C∗ generada por a. 257 C(X) funciones continuas de X en el cuerpo k. 258 C(σ(a)) funciones continuas en el espectro de a. 257 D(a) funcionales normizantes de a,ver también S(A). 78, 246 db distancia inducida por la métrica b. 162 dℓ distancia inducida por la longitud rectificable ℓ. 153 Dfv ó f∗v diferencial de f en v. 5 Dt derivada covariante. 128 Dα ′ β derivada covariante. 127 Eb (α) energía de la curva suave α. 162 Ep proyector con rango Tp M. 125, 188 E ′ = B(E, k) dual topológico de E. 4 ǫp = 2p − 1 simetría inducida por el proyector p. 90, 189 ηv,w campo de Jacobi con η(0) = v, Dη(0) = w. 132 G+ A elementos positivos e inversibles de A. 83 GA grupo de inversibles del álgebra A. 64 b transformada de Gelfand de a. 260 a GL(E) operadores lineales inversibles de E. 44 GL(n, C) grupo general lineal. 53 gp métrica Riemanniana computada en p ∈ M. 186 Grk (n) Grassmanniana de dimensión k en Rn . 58 Gr(p) Grassmanniana dada por la órbita unitaria del proyector p. 89 H espacio de Hilbert. 31 Herm(A) operadores Hermitianos del álgebra A. 78 H(σ(a)) funciones holomorfas en un entorno del espectro de a. 244 Índice de símbolos 309 I ideal bilátero en un álgebra de operadores. 281, 283, 289 J(s) ideal de operadores dado por el espacio de sucesiones s. 283 K(H) operadores compactos en el espacio de Hilbert H. 190, 278 Lb (α) longitud de la curva suave α respecto de la métrica b. 162 ℓ(γ) longitud rectificable de γ. 149 LX Y derivada de Lie de Y en la dirección de X. 36 [X, Y] corchete de Lie. 36 log logaritmo analítico. 241 Mn (C) matrices complejas de n × n. 52 Mn (C)ah matrices anti Hermitianas de n × n. 55 ∇ conexión de Koszul, ver también Dα ′ β. 122 O(x) órbita de x por la acción de un grupo. 48, 50 Pab (α) transporte paralelo a lo largo de α. 128 πM proyección al punto base del fibrado TM → M. 98 π∗ = (πM )∗ diferencial de la proyección al punto base del fibrado TM → M. 98 π = πTM proyección al punto base del fibrado T (TM) → TM. 98 P(A) proyectores autoadjuntos del álgebra A. 90 R tensor de curvatura. 130 R transformación de curvatura. 130, 198 Rp (π) curvatura seccional del plano π en Tp M. 219 r(a) radio espectral de a. 239 R espacio de las curvas rectificables. 150 S(A) espacio de estados de A. 266 secπ curvatura seccional a lo largo del plano tangente π. 220 sφ espacio maximal de la norma simétrica φ. 279 (0) sφ espacio minimal de la norma simétrica φ. 279 310 Índice de símbolos s(I) espacio de sucesiones que deconstruye el ideal de operadores I. 283 Σ espacio de caracteres, espacio maximal. 259 σA (z) espectro de z relativo al álgebra A. 64 σ(a) espectro de a. 238 v ⊗ w tensor elemental. 136 TM ⊕ TM producto fibrado, suma de Whitney. 99 Tr traza del álgebra. 189, 190, 286 τ traza finita y fiel del álgebra. 207, 289 TTM = T (TM) fibrado doble tangente. 97 UA grupo de isometrias del álgebra A. 77 UHS grupo unitario de Hilbert-Schmidt. 206 U(n, C) = U grupo unitario. 54 V(a) rango numérico de a. 78, 248 VTM fibrado vertical inducido por la proyección al punto base πTM . 99 VTM∗ fibrado vertical inducido por la proyección π∗ . 99 W ∗ (a) álgebra de von Neumann generada por a. 273 x↓ reordenamiento decreciente de la sucesión x. 279 Índice de símbolos . 311 312 . Índice de símbolos