Download Estructuras geométricas para las variedades de

Document related concepts

Espacio de Banach wikipedia , lookup

Formulación débil de una ecuación diferencial wikipedia , lookup

Teorema de la función inversa wikipedia , lookup

Teoría espectral wikipedia , lookup

Teorema de Liouville (análisis complejo) wikipedia , lookup

Transcript
Gabriel Larotonda
Estructuras geométricas para las
V
ARIEDADES
DE BANACH
i
Dedicado a la memoria de
Ángel Rafael Larotonda
(1939-2005).
Índice general
Introducción
XI
I Estructuras Diferenciables
1
1 Cálculo Diferencial e Integral
1.1. Operadores lineales . . . . . . . . . . . . . .
1.1.1. Algunos teoremas útiles . . . . . . .
1.2. Diferenciabilidad en espacios de Banach . .
1.2.1. Operadores bilineales y cuadráticos .
1.3. Integración . . . . . . . . . . . . . . . . . .
1.4. Aproximaciones, acotaciones . . . . . . . . .
1.4.1. Fórmula de Taylor . . . . . . . . . .
1.5. Funciones Inversa e Implícita . . . . . . . .
1.5.1. Función Inversa . . . . . . . . . . . .
1.5.2. Función Implícita . . . . . . . . . . .
1.5.2.1. Subespacios sin suplemento
1.A. Problemas . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
4
5
7
9
10
11
13
13
14
16
17
2 Variedades Diferenciables
2.1. Cartas y Atlas . . . . . . . . . . . .
2.2. Espacio y Fibrado tangente . . . . .
2.2.1. Espacio tangente . . . . . . .
2.2.2. Fibrado tangente . . . . . . .
2.2.2.1. Fibrados . . . . . .
2.2.2.2. Fibrados vectoriales
2.2.2.3. Fibrado Tangente .
2.2.3. Diferencial de una función . .
2.3. Curvas . . . . . . . . . . . . . . . . .
2.3.1. Levantadas de una curva . . .
2.4. Subvariedades . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
21
21
22
22
23
24
24
25
26
26
26
27
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Índice general
iv
2.4.1. Subvariedades no regulares . . . . . . . . . . . . .
2.4.2. Subvariedades de un espacio de Banach . . . . . .
2.4.2.1. La esfera de un espacio de Hilbert . . . .
2.5. Campos . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.1. Corchetes de Lie . . . . . . . . . . . . . . . . . . .
2.5.1.1. El corchete de Lie de campos en la esfera
2.5.1.2. El corchete de Lie en superficies de nivel
2.5.1.3. Derivada de Lie . . . . . . . . . . . . . .
2.5.1.4. Derivaciones . . . . . . . . . . . . . . . .
2.5.2. Campos f-relacionados . . . . . . . . . . . . . . . .
2.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
29
30
31
32
33
34
35
36
38
39
39
3 Grupos de Lie
3.1. Teoría general . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1. Campos invariantes . . . . . . . . . . . . . . . .
3.1.2. Grupos a un parámetro y exponencial . . . . . .
3.1.2.1. La exponencial del grupo . . . . . . . .
3.1.3. La representación adjunta y morfismos . . . . . .
3.1.3.1. Homomorfismos y la naturalidad de exp
3.2. Subgrupos de Lie-Banach . . . . . . . . . . . . . . . . .
3.3. Espacios homogéneos . . . . . . . . . . . . . . . . . . . .
3.3.1. Órbitas . . . . . . . . . . . . . . . . . . . . . . .
3.4. Grupos lineales de matrices: un vistazo rápido . . . . . .
3.4.1. El grupo lineal GL(n, C) . . . . . . . . . . . . . .
3.4.2. El grupo de matrices unitarias . . . . . . . . . .
3.4.3. El grupo ortogonal . . . . . . . . . . . . . . . . .
3.4.4. El grupo simpléctico . . . . . . . . . . . . . . . .
3.5. Espacios homogéneos de grupos de matrices . . . . . . .
3.5.1. La variedad de Grassmann . . . . . . . . . . . .
3.5.2. Matrices positivas inversibles . . . . . . . . . . .
3.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
41
41
42
43
43
44
45
46
48
50
52
53
54
56
56
57
58
59
59
4 El Grupo Lineal
4.1. El grupo de elementos inversibles, estructura local
4.1.1. Las representaciones L y R . . . . . . . . . .
4.1.2. La diferencial del mapa exponencial . . . .
4.1.3. Factorización de la diferencial de exp . . . .
4.1.4. La serie de Baker-Campbell-Hausdorff . . .
4.1.4.1. Fórmulas de Lie-Trotter . . . . . .
4.2. Subgrupos . . . . . . . . . . . . . . . . . . . . . . .
4.2.1. El álgebra de Lie de un subgrupo cerrado .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
63
64
64
65
66
67
70
71
71
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Índice general
v
4.3. Subgrupos algebraicos . . . . . . . . . . . . . . . . . . . . . .
4.4. El grupo de isometrías . . . . . . . . . . . . . . . . . . . . . .
4.4.1. El grupo unitario de un álgebra C∗ . . . . . . . . . . .
4.4.1.1. Logaritmos de operadores unitarios . . . . .
4.5. El cono positivo de un álgebra C∗ . . . . . . . . . . . . . . .
4.5.1. Conos positivos . . . . . . . . . . . . . . . . . . . . . .
4.5.2. Descomposición de Cartan y conmutadores . . . . . .
4.6. Órbitas de similaridad y coadjuntas . . . . . . . . . . . . . .
4.6.1. La órbita de similaridad de un inversible autoadjunto
4.6.2. La órbita coadjunta de un operador autoadjunto . . .
4.6.3. La Grassmanniana como la órbita de un proyector . .
4.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
74
77
80
81
83
84
86
87
88
88
89
95
5 El Fibrado TTM
5.1. Expresiones locales para TTM y sus proyecciones . .
5.1.1. Proyecciones de TTM en TM . . . . . . . . .
5.1.1.1. Fibrados verticales . . . . . . . . . .
5.2. Subvariedades de un espacio lineal . . . . . . . . . .
5.2.1. La esfera de un espacio de Hilbert . . . . . .
5.2.2. Superficies de nivel . . . . . . . . . . . . . . .
5.2.2.1. Fibrados verticales en subvariedades
5.3. El flip canónico . . . . . . . . . . . . . . . . . . . . .
5.4. Aceleraciones y 2-jets . . . . . . . . . . . . . . . . . .
5.4.1. 2-jets . . . . . . . . . . . . . . . . . . . . . .
5.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
97
98
98
99
100
100
102
104
104
106
107
108
6 Conexiones y Sprays
6.1. Sprays . . . . . . . . . . . . . . . . . . . . . . .
6.1.1. Geodésicas . . . . . . . . . . . . . . . .
6.1.2. Exponencial . . . . . . . . . . . . . . . .
6.2. Sprays cuadráticos o afines . . . . . . . . . . .
6.2.1. Entornos normales . . . . . . . . . . . .
6.3. Conexiones . . . . . . . . . . . . . . . . . . . .
6.4. Conexión de Koszul . . . . . . . . . . . . . . .
6.5. Sprays canónicos . . . . . . . . . . . . . . . . .
6.6. La derivada covariante: derivar y proyectar . .
6.7. Derivada covariante y transporte paralelo . . .
6.7.1. Derivada covariante de levantadas . . .
6.7.2. Transporte paralelo . . . . . . . . . . .
6.8. El tensor de curvatura y campos de Jacobi . . .
6.8.1. Subvariedades de un espacio de Banach
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
109
110
115
116
116
118
119
122
123
124
127
127
128
130
131
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Índice general
vi
6.8.2. Campos de Jacobi . . . . . . . . . . . . . . . . .
6.8.2.1. Campos de Jacobi versus exponencial .
6.9. Ejemplos de sprays . . . . . . . . . . . . . . . . . . . . .
6.9.1. Espacios lineales . . . . . . . . . . . . . . . . . .
6.9.2. La esfera de un espacio de Hilbert . . . . . . . .
6.9.2.1. Un spray no cuadrático en la esfera . .
6.9.3. El grupo de inversibles de un álgebra de Banach
6.9.4. El grupo de operadores unitarios . . . . . . . . .
6.9.5. Operadores positivos e inversibles . . . . . . . .
6.9.5.1. El spray trivial . . . . . . . . . . . . . .
6.9.5.2. El spray canónico . . . . . . . . . . . .
6.9.6. La Grassmanniana . . . . . . . . . . . . . . . . .
6.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
II Estructuras Métricas
7 Espacios de Métrica Interior
7.1. La distancia rectificable . . . . . . . . . .
7.1.1. Espacios de métrica interior . . . .
7.1.2. Geodésicas . . . . . . . . . . . . .
7.2. El teorema de Hopf-Rinow métrico . . . .
7.2.1. El teorema de Ascoli . . . . . . . .
7.2.2. El teorema de Hopf-Rinow métrico
7.A. Problemas . . . . . . . . . . . . . . . . . .
131
134
134
134
135
137
138
140
141
141
141
143
145
147
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
149
149
153
156
157
157
157
160
8 Variedades de Finsler
8.1. Métricas de Finsler . . . . . . . . . . . . . . . . . . . .
8.1.1. Funcionales longitud y energía . . . . . . . . .
8.1.1.1. Las variedades de Finsler . . . . . . .
8.1.2. Normas acotadas y compatibles . . . . . . . . .
8.1.2.1. Hopf-Rinow en variedades de Finsler .
8.2. Variedades de Finsler con spray . . . . . . . . . . . . .
8.3. Métricas de Finsler vía operadores acotados . . . . . .
8.4. Métricas invariantes . . . . . . . . . . . . . . . . . . .
8.4.1. Métricas invariantes y el spray canónico . . . .
8.4.2. Espacios homogéneos y métricas cocientes . . .
8.4.3. Operadores positivos con métricas simétricas .
8.5. El teorema de Cartan . . . . . . . . . . . . . . . . . .
8.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
161
161
162
163
163
168
169
170
171
172
172
173
177
183
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Índice general
9 Variedades Riemannianas y pseudo-Riemannianas
9.1. La derivada de Levi-Civita . . . . . . . . . . . . . . . . . . . . .
9.1.1. La derivada de Levi-Civita de una subvariedad . . . . .
9.1.1.1. La Grassmanniana dentro de los autoadjuntos
9.1.2. Sprays métricos en espacios homogéneos . . . . . . . . .
9.1.2.1. El spray métrico del grupo de inversibles . . .
9.1.2.2. Geodésicas . . . . . . . . . . . . . . . . . . . .
9.2. Cálculo de variaciones . . . . . . . . . . . . . . . . . . . . . . .
9.2.1. Fórmulas variacionales . . . . . . . . . . . . . . . . . . .
9.2.1.1. La variación de la energía . . . . . . . . . . . .
9.3. Las geodésicas son localmente minimizantes . . . . . . . . . . .
9.3.1. El lema de Gauss . . . . . . . . . . . . . . . . . . . . . .
9.3.2. Coordenadas polares . . . . . . . . . . . . . . . . . . . .
9.3.3. Minimalidad de las geodésicas . . . . . . . . . . . . . . .
9.3.3.1. Variedades Riemannianas débiles . . . . . . . .
9.3.4. Las curvas continuas minimales . . . . . . . . . . . . . .
9.3.5. La esfera, grupos unitarios y la Grassmanniana . . . . .
9.3.5.1. La esfera de un espacio de Hilbert . . . . . . .
9.3.5.2. El grupo de operadores unitarios . . . . . . . .
9.3.5.3. El grupo de unitarios con la norma uniforme .
9.3.5.4. El grupo de unitarios con una norma simétrica
9.3.5.5. La Grassmanniana . . . . . . . . . . . . . . . .
9.4. Existencia global de geodésicas cortas . . . . . . . . . . . . . .
9.5. Convexidad local . . . . . . . . . . . . . . . . . . . . . . . . . .
9.6. Curvatura seccional . . . . . . . . . . . . . . . . . . . . . . . .
9.6.1. Curvatura de grupos lineales y espacios homogéneos . .
9.6.1.1. La esfera de un espacio de Hilbert . . . . . . .
9.6.1.2. El spray métrico del grupo de inversibles . . .
9.6.1.3. El grupo unitario . . . . . . . . . . . . . . . .
9.6.1.4. Operadores positivos inversibles . . . . . . . .
9.6.1.5. La Grassmanniana . . . . . . . . . . . . . . . .
9.6.2. Isometrías y curvatura seccional . . . . . . . . . . . . .
9.6.2.1. Variedades planas . . . . . . . . . . . . . . . .
9.6.2.2. Campos de Jacobi versus curvatura . . . . . .
9.7. El teorema de Cartan . . . . . . . . . . . . . . . . . . . . . . .
9.7.1. La adjunta de la diferencial de exp . . . . . . . . . . . .
9.7.2. Curvatura no positiva . . . . . . . . . . . . . . . . . . .
9.A. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
vii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
185
186
188
189
190
191
191
193
195
197
198
199
199
200
202
203
204
204
206
210
212
212
213
217
219
220
220
221
221
222
224
224
225
226
227
227
228
230
Índice general
viii
III Álgebras de Operadores
235
A Álgebras de Banach
A.1. Álgebras con involución . . . . . . . . . . . . . . . . .
A.2. Cálculo funcional analítico . . . . . . . . . . . . . . . .
A.2.1. Propiedades del espectro . . . . . . . . . . . . .
A.2.1.1. Radio espectral . . . . . . . . . . . . .
A.2.2. El grupo de inversibles . . . . . . . . . . . . . .
A.2.3. Cálculo funcional de Cauchy . . . . . . . . . .
A.3. Rango y radio numérico . . . . . . . . . . . . . . . . .
A.3.1. El rango numérico y los grupos a un parámetro
A.3.2. La relación entre rango numérico y espectro . .
A.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
237
237
238
238
239
240
242
246
249
252
254
B Álgebras C∗
B.1. El radio espectral de un operador normal . . . . . . . . . . . . .
B.2. Cálculo funcional continuo . . . . . . . . . . . . . . . . . . . . . .
B.3. Teorema de Gelfand y la representación GNS . . . . . . . . . . .
B.3.1. El espacio de caracteres . . . . . . . . . . . . . . . . . . .
B.3.2. La transformada de Gelfand en C∗ -álgebras . . . . . . . .
B.3.2.1. Invariancia del espectro . . . . . . . . . . . . . .
B.3.3. El Teorema de Gelfand . . . . . . . . . . . . . . . . . . .
B.3.4. Propiedades del cálculo funcional continuo . . . . . . . .
B.3.4.1. Elementos positivos . . . . . . . . . . . . . . . .
B.3.4.2. Funciones monótonas y convexas de operadores
B.3.4.3. Los ∗-morfismos . . . . . . . . . . . . . . . . . .
B.3.5. La representación GNS . . . . . . . . . . . . . . . . . . .
B.3.5.1. Funcionales positivas y estados . . . . . . . . . .
B.3.5.2. Estados normizantes . . . . . . . . . . . . . . . .
B.3.6. La construcción de Gelfand, Naimark y Segal . . . . . . .
B.3.6.1. Vectores normizantes . . . . . . . . . . . . . . .
B.4. Descomposición polar . . . . . . . . . . . . . . . . . . . . . . . .
B.4.1. Descomposición polar . . . . . . . . . . . . . . . . . . . .
B.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
255
255
256
258
259
260
261
261
263
263
264
265
265
266
268
268
270
270
271
271
C Álgebras de von Neumann
C.1. Cálculo funcional Boreliano . . . . . . . . . .
C.1.1. Teorema espectral . . . . . . . . . . .
C.1.2. Medida espectral . . . . . . . . . . . .
C.1.3. Descomposición polar en W ∗ -algebras
C.2. Problemas . . . . . . . . . . . . . . . . . . . .
273
273
273
275
275
276
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Índice general
D Normas en Álgebras de Operadores
D.1. Ideales en B(H) . . . . . . . . . . . . . . . . . . . . . . . . . . .
D.1.1. Descomposición en valores singulares . . . . . . . . . . .
D.1.1.1. Espacios de sucesiones . . . . . . . . . . . . . .
D.1.2. Ideales de operadores compactos . . . . . . . . . . . . .
D.1.3. Operadores compactos de Schatten . . . . . . . . . . . .
D.1.4. Desigualdad de Hölder, dualidades, norma Frobenius . .
D.1.5. El teorema de Lidskii y la propiedad cíclica de la traza .
D.2. Normas simétricas en álgebras C∗ . . . . . . . . . . . . . . . . .
D.2.1. Álgebras con traza finita . . . . . . . . . . . . . . . . . .
D.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
ix
.
.
.
.
.
.
.
.
.
.
277
277
277
279
281
285
287
288
289
289
293
Bibliografía
295
Índice alfabético
301
Índice de símbolos
307
Introducción
Nadie puede escribir un libro.
Para que un libro sea verdaderamente,
Se requieren la aurora y el poniente,
Siglos, armas, y el mar que une y separa.
E
J. L. Borges
ste texto nace con la idea de presentar una exposición sistemática del
estudio de la geometría de los grupos de Lie-Banach y sus espacios
homogéneos, con especial énfasis en las nociones métricas de la geometría diferencial, cuyo primer problema a nuestro entender es el de las curvas
minimales.
Habitualmente, se presentan las conexiones, las geodésicas y otros objetos
geométricos como derivados de una métrica inevitablemente Riemanniana, soslayando el hecho de que una conexión es simplemente una elección de suplementos
en cierto fibrado vectorial sobre la variedad, y que esto no implica necesariamente la existencia de un producto interno en este fibrado. La elección de estos
suplementos se puede presentar, en particular, como un spray en la variedad
(una familia de ecuaciones diferenciales ordinarias en el fibrado tangente), que
permite introducir de manera natural la noción de geodésica como la solución
local de este sistema de ecuaciones. Este es el enfoque con el que queremos abordar los problemas de geometría que hacen a las curvas cortas y la curvatura:
una perspectiva que nos permita trabajar en modelos sin limitaciones de dimensión, y sin supuestos sobre una estructura Hilbertiana o pre-Hilbertiana en el
espacio vectorial que modela la variedad. En particular, estamos interesados en
aquellos modelos que surgen de los grupos lineales y sus espacios homogéneos,
tanto en dimensión finita como infinita, donde puede observarse que, desde el
punto de vista del álgebra de operadores, las normas o métricas a introducir no
suelen derivarse de una estructura Hilbertiana: el caso paradigmático es la norma uniforme del álgebra de operadores acotados, la cual no proviene de ningún
xi
xii
Introducción
producto interno, y no es equivalente a ninguna norma con estas características
en el caso infinito dimensional. Este contexto de matrices y operadores es rico
en ejemplos que nos permiten introducir estas nociones de spray o conexión de
manera concreta e independiente de la métrica a partir de proyectores, idempotentes y esperanzas condicionales; en los últimos años esta manera de trabajar ha
tenido un desarrollo notable especialmente en el contexto de dimensión infinita
vinculado con las álgebras C∗ y las álgebras de von Neumann. Por otra parte,
estas álgebras son ricas en normas simétricas (invariantes por la acción del grupo
de unitario, que es el grupo de isometrías del espacio de Hilbert subyacente al
álgebra de operadores) y estas normas nos proveen de una importante cantidad
de ejemplos de métricas de Finsler en las variedades, es decir, elecciones continuas de normas en el fibrado tangente de la variedad (nos desviamos aquí de la
noción clásica de métrica de Finsler donde se supone que la norma introducida
es dos veces diferenciable fuera del origen y su Hessiano es definido positivo).
Entre las clases más relevantes de normas simétricas en operadores en un espacio
de Hilbert, se hallan las normas de p-Schatten, que se computan como la norma
p usual de la sucesión de valores singulares del operador en cuestión; en este
contexto son conocidos una serie de resultados geométricos vinculados con la
convexidad uniforme del espacio normado subyacente.
En la segunda parte del libro abordaremos la noción de espacio de longitud
o espacio de métrica interior, que a partir del trabajo de Mikhail Gromov en
gupos hiperbólicos [36], ha cobrado especial relevancia, en particular relacionada
con aquellos espacios que son de curvatura no positiva. En este contexto, la
distancia entre dos puntos se obtiene como el ínfimo de las longitudes de arcos
rectificables que los unen. Como estaremos interesados en la noción de curva
corta, presentaremos la versión métrica del Teorema Hopf-Rinow que establece la
existencia de geodésicas (entendidas como arcos rectificables de longitud mínima)
en espacios localmente compactos.
Estudiaremos la relación entre variedades de Finsler y espacios de métrica
interior, amalgamando los resultados de la primera parte del libro con la teoría
métrica introducida en la segunda. Abordaremos las nociones de curvatura y
curvatura seccional, presentando la primera como derivada del spray, es decir
independiente de la métrica, y estudiando la segunda como el puente que une
la noción de spray con la de geometría Riemanniana. La curvatura seccional
separa los espacios Riemannianos en dos categorías importantes (no exhaustivas),
según estos tengan curvatura seccional positiva o negativa en todos sus puntos;
el comportamiento de las curvas cortas es drásticamente distinto según sea el
caso. Para ilustrar esta afirmación, basta considerar dos ejemplos muy sencillos,
como la circunferencia unitaria S1 ⊂ R2 y una rama de hipérbola P ⊂ R2 , de
curvatura seccional positiva y negativa respectivamente (aunque cabe aclarar
Introducción
xiii
que en el primer caso la curvatura es constante y en el segundo no lo es): de
acuerdo al teorema de Cartan-Hadamard (que presentamos en este texto en el
contexto de variedades de Finsler con spray), en una variedad de curvatura no
positiva simplemente conexa, se da siempre este fenónomeno de unicidad de
curvas cortas.
Por otra parte el Teorema de Hopf-Rinow establece la equivalencia (en dimensión finita) entre completitud métrica y completitud geodésica, garantizando la
existencia de curvas cortas que unen dos puntos dados. Sin embargo, hay ejemplos sencillos de variedades Riemannianas de dimensión infinita donde ambos
conceptos no son equivalentes. En casos concretos, herramientas desarrolladas
ad-hoc para el ejemplo permiten encarar el problema de manera exitosa y no
sólo determinar la existencia de geodésicas minimales, sino construirlas explícitamente: presentaremos en este texto una serie de problemas y resultados sobre
minimalidad de curvas que hasta ahora sólo se hallan publicados en revistas
especializadas, concernientes tanto a variedades de dimensión infinita como a
variedades de Finsler donde la norma no es diferenciable y por lo tanto no está
disponible el cálculo de variaciones usual. Nos enfocaremos en ejemplos provenientes de la teoría de operadores, especialmente aquellos que provienen de los
llamados grupos de Lie-Banach clásicos, de las álgebras C∗ y las álgebras de
von Neumann, que juegan una parte importante en esta exposición, no sólo como modelos geométricos, sino también a traves de las técnicas propias de las
álgebras de operadores, que permiten abordar ciertos problemas de geometría
de una manera novedosa.
Prerequisitos: Para la lectura de este texto estimamos suficiente que el lector conozca en profundidad la geometría de curvas y superfices en el plano y en
el espacio, como es abordada por ejemplo en el texto de do Carmo [21]. Respecto
de la teoría de grupos y sus espacios homogéneos, es recomendable que el lector
tenga cierta familiaridad con las nociones topológicas generales vinculadas a estos espacios, o por lo menos domine los aspectos básicos de espacios topológicos
en general, como cubrimientos, bases de entornos, sucesiones, topologías cociente, etc.; si sumamos ciertas nociones básicas de análisis funcional, todos estos
temas ocupan por ejemplo los primeros cuatro capítulos del libro de Reed y Simon [62]. Los temas más especializados de álgebras de operadores se encuentran
desarrollados para beneficio del lector en los apéndices de este libro.
Agradecimientos: vaya mi agradecimiento expreso para todos aquellos matemáticos que me mostraron en primera persona cómo pensar la geometría de
esta manera singular, a través de problemas concretos en álgebras de operadores; en particular Esteban Andruchow, Gustavo Corach y Lázaro Recht. Un
agradecimiento especial para Cristian Conde, colega, amigo, editor y corrector
xiv
Introducción
desinteresado. También quiero agradecer a Martín Miglioli que estudió y corrigió minuciosamente el manuscrito. Por último, no puedo dejar de mencionar la
contribución de los dos evaluadores anónimos del libro, que mediante sus observaciones y correcciones hicieron sin duda de este un manuscrito mejor. De todas
las posibles faltas e imprecisiones que puedan quedar en el libro, sólo puedo culpar a mis limitaciones como escritor y matemático, esperando que puedan ser
tolerables para el lector, o que sean enmascaradas por el entusiasmo que espero
compartan conmigo sobre los temas aquí abordados.
Parte I
Estructuras Diferenciables
E
n esta primera parte del libro, desarrollaremos herramientas geométricas que no involucren la elección explícita de una norma o métrica en
la variedad diferenciable a estudiar. Como veremos, las variedades de
Banach tienen una gran riqueza geométrica una vez que uno consigue introducir
una conexión o spray en ellas, independientemente de si esta proviene de una
métrica o no.
De particular relevancia son aquellas variedades que provienen del grupo de
inversibles de un álgebra de Banach, y sus espacios homogéneos. En los apéndices del libro introducimos las nociones básicas del cálculo funcional y la teoría
de operadores para poder trabajar con una familia de ejemplos que ilustren las
nociones y provoquen nuevas preguntas, siempre con el espíritu de entender los
objetos de forma geométrica, sin necesidad de usar coordenadas y por consiguiente sin limitaciones de dimensión.
1
Capítulo
Cálculo Diferencial e Integral
Where ignorance is bliss, ’tis folly to be
wise.
Thomas Gray
C
omenzamos en este capítulo con los fundamentos de la teoría de operadores acotados en espacios de Banach, que nos permitirán introducir nociones de diferenciación e integración. Luego presentamos
versiones infinito-dimensionales de los teoremas de la función inversa y de la
función implícita. Este capítulo no debe tomarse como un capítulo de prerequisitos, sino como una parte integral de nuestro acercamiento sin coordenadas a la
geometría: revisaremos resultados clásicos del cálculo con una mirada no clásica.
Le debemos mucho de nuestra presentación al excelente libro de Lang [47] de
geometría Riemanniana.
1.1.
Operadores lineales
Todos nuestros espacios vectoriales serán sobre R ó C. Sean E, F espacios normados, o en particular espacios de Banach, es decir, espacio vectoriales normados
completos. Empecemos por recordar que T ∈ B(E, F) si T es lineal y además es
acotado en el siguiente sentido
kTxk
sup
: x ∈ E, x 6= 0 < ∞.
kxk
Notar que la norma del numerador es la norma de F, mientras que la del denominador es la de E. Equivalentemente, T ∈ B(E, F) si T es lineal y continuo. En
3
1
4
Cálculo Diferencial e Integral
el caso acotado se suele denominar a este número norma uniforme de T ,
kTxk
kT k = sup
: x ∈ E, x =
6 0 = sup {kTxk : x ∈ E, kxk ≤ 1}
kxk
o norma supremo. Notemos que el conjunto B(E, F) con la norma recién definida
es un espacio de Banach: en efecto es un espacio vectorial y no es difícil probar
que es completo, usando (únicamente) la completitud de F.
Como veremos más adelante en contextos específicos, la norma uniforme no
es la única manera de definir una norma en el conjunto de operadores lineales.
En el caso E = F se suele abreviar B(E, E) = B(E) al conjunto de endomorfismos acotados y nos referiremos a ellos como operadores lineales acotados
actuando en E o directamente operadores acotados en E.
En el caso F = k el cuerpo base, al espacio E ′ = B(E, k) se lo denomina
espacio dual de E. No debe confundirse con el dual algebraico, que consiste de
todas las funcionales lineales de E en k. Para distinguirlos, a veces se dice que
E ′ es el dual topológico de E.
1.1.1.
Algunos teoremas útiles
Listamos a continuación algunas herramientas fundamentales. La primera es
un teorema de separación de objetos convexos en espacios normados mediante
hiperplanos, que en el contexto de espacios de Banach enunciamos en una de sus
posibles formas equivalentes.
Teorema 1.1.1 (Teorema de Hahn-Banach). Sea E un espacio de Banach,
S ⊂ E un subespacio.
Sea N : E → R≥0 una funcional convexa, es decir si a, b ∈ k (k es R o
C) son tales que |a| + |b| ≤ 1, entonces
N(av + bw) ≤ |a|N(v) + |b|N(w)
para todo v, w ∈ E.
Entonces si ψ : S → k es una funcional lineal tal que |ψ(s)| ≤ N(s)
para todo s ∈ S, existe ϕ ∈ E ′ tal que ϕ = ψ en S y |ϕ| ≤ N en todo E.
En particular, dado v ∈ E, existe ϕ ∈ E ′ tal que ϕ(v) = kvk, kϕk = 1.
La prueba puede verse en el tomo I de “Methods of modern mathematical
physics", por Michael Reed y Barry Simon [62], Teorema III.5.
Teorema 1.1.2 (Teorema de la función abierta (Banach-Schauder)). Si E, F son
espacios de Banach y T ∈ B(E, F) es sobreyectiva, entonces T es abierta. Es
decir, si U ⊂ E es abierto, entonces TU ⊂ F es abierto.
1.2. Diferenciabilidad en espacios de Banach
5
Corolario 1.1.3. Si E, F son espacios de Banach y T ∈ B(E, F) es biyectivo,
entonces la inversa T −1 : F → E es continua. Es decir T es un isomorfismo
topológico de espacios de Banach.
Teorema 1.1.4 (Teorema del gráfico cerrado). Si E, F son espacios de Banach
y T : E → F es lineal, entonces T ∈ B(E, F) si y sólo si
Gr(T ) = {(v, Tv) : v ∈ E} ⊂ E × F
es un subespacio cerrado.
El siguiente resultado debido a Banach y Steinhaus es conocido como principio de acotación uniforme o por su sigla en castellano PAU.
Teorema 1.1.5 (Teorema de Banach-Steinhaus). Sea E un espacio de Banach
y F un espacio normado. Sea F una familia de operadores acotados de E en
F. Supongamos que para cada x ∈ E, el conjunto
{kTxk : T ∈ F}
es acotado. Entonces el conjunto {kT k : T ∈ F} es acotado.
El Teorema del gráfico cerrado y el de la función abierta son equivalentes, y
todos son consecuencia del teorema de categoría de Baire. Todos estos resultados
del análisis funcional pueden verse en la Sección III.5 del libro de Reed-Simon
[62].
1.2.
Diferenciabilidad en espacios de Banach
Sean E, F espacios de Banach, y f : E → F una función. Diremos que f es
diferenciable en v ∈ E si existe un operador lineal acotado Lv ∈ B(E, F) tal que
lı́m
khk→0
1
kf(v + h) − f(v) − Lv hk = 0.
khk
(1.1)
En ese caso al operador Lv lo denotaremos Dfv ó f∗v , usualmente leído como
diferencial de f en v. Observemos que, si f es diferenciable en v ∈ E, entonces
Lv x = lı́m
t→0
f(v + tx) − f(v)
t
para todo x ∈ E.
Toda función diferenciable es continua. Si f es diferenciable en todo v ∈ U
para algún abierto U ∈ E, diremos que f es diferenciable en U.
6
Cálculo Diferencial e Integral
Si f : E → F, g : F → G son funciones diferenciables, entonces es fácil ver que
g ◦ f : E → G es una función diferenciable y que vale la regla de la cadena:
D(g ◦ f)v = Dgf(v) Dfv .
Observación 1.2.1. Si f : E → F es lineal y continua (es decir si f ∈ B(E, F)),
entonces es fácil verificar que Df = f, es decir f es diferenciable en todo E y
además Dfv (w) = f(w) para todo v, w ∈ E.
Observación 1.2.2. Si f : E → F es diferenciable y T ∈ B(F, G) (con G otro
espacio de Banach), entonces un caso particular de la regla de la cadena de muy
fácil demostración es la siguiente identidad:
D(T ◦ f) = TDf.
Para poner un poco en contexto la definición (1.1), se suele decir que f es
diferenciable Fréchet (por Maurice Fréchet). Hay nociones más débiles de diferenciabilidad, como por ejemplo ser diferenciable Gâteaux en v ∈ E (por René
Gâteaux), que significa que para todo h ∈ E, existe el límite
dx f(h) = lı́m
t→0
1
{f(v + th) − f(v)} ,
|t|
y en este caso dx f(h) no tiene por qué ser lineal en h (ni acotado). En el caso
complejo el límite se toma cambiando t ∈ R por z ∈ C y haciendo z → 0.
Volviendo al caso que nos interesa (1.1), si f es diferenciable entonces tiene
sentido preguntarse sobre la continuidad de la función Df : E → B(E, F) dada
por
Df(v) = Dfv ,
es decir a la función que a cada vector le asigna la diferencial de f. Esta función,
aunque su imagen consiste de operadores lineales, es usualmente no lineal (salvo
que f sea una forma cuadrática). Cuando es continua en un abierto U ⊂ E,
decimos que f es C1 en U.
Como G = B(E, F) es un espacio de Banach, nos podemos preguntar si la
función Df : E → G es diferenciable en U. Si lo es, diremos que su diferencial
D(Df) = D2 f es la diferencial segunda de f. Observemos que
D2 f : U → B(E, G) = B(E, B(E, F)) ≃ B 2 (E × E; F) = B 2 (E2 ; F),
donde el último término indica los operadores bilineales de E × E en F. La identificación está dada por Φ(T )(e1 , e2 ) = (Te1 )(e2 ) para e1 , e2 ∈ E, que es de hecho
un isomorfismo isométrico. Denotaremos
D2 fp (v, w) := (D2 fp v)(w).
1.2. Diferenciabilidad en espacios de Banach
7
Una función es C2 si la asignación p 7→ D2 fp es continua de E en B 2 (E2 ; F).
En el caso clásico E = R2 , que exista la diferencial segunda es más fuerte que
decir que existen las derivadas parciales segundas, de hecho la existencia de la
diferencial segunda garantiza que además de existir sean iguales las derivadas
cruzadas1: ver por ejemplo el libro de T. Apostol [12], Teorema 12.12.
Observación 1.2.3. Si f : U → F es una función dos veces diferenciable en p ∈ U,
entonces D2 fp es un operador bilineal simétrico. Es decir, para todo v, w ∈ E
se tiene
D2 fp (v, w) = D2 fp (w, v).
En efecto, que es bilineal surge de la propia definición. Para ver que es simétrico,
sean v, w ∈ E. Consideremos, para cada ϕ ∈ F ′ , la función auxiliar
g(x, y) = ϕ(f(p + xv + yw)).
La función g : B → k está definida en algún entorno abierto B de (0, 0) ∈ k × k.
Por hipótesis, existen Dg(0,0) , D2 g(0,0) . Entonces D2 g(0,0) es una forma bilineal
simétrica. Esto nos dice que las derivadas cruzadas de g en el punto (0, 0) son
iguales
∂2 g
∂2 g
=
= ϕ((D2 fp v)w).
ϕ((D2 fp w)v) =
∂y∂x
∂x∂y
Como la identidad es cierta para cualquier ϕ ∈ F ′ , se tiene la conclusión.
En general, una función que tiene k diferenciales sucesivas en U ⊂ E -y la
de orden k es una función continua- es una función Ck en U, y directamente
anotaremos f ∈ Ck (U); como antes, consideramos a Dk f como un operador
multilineal, es decir Dk fv ∈ B k (Ek ; F) para v ∈ E. Por lo recién observado, es un
operador multilineal simétrico.
Una función es C∞ cuando sus diferenciales de todos los órdenes existen
(también es usual decir que f es suave).
Observemos que si f ∈ B(E, F) entonces Df = f es constante, es decir para
todo v ∈ E se tiene Dfv = f. Luego todas las derivadas de orden superior son
nulas, D2 f = D3 f = · · · = 0.
1.2.1.
Operadores bilineales y cuadráticos
Dados E, F espacios de Banach, sea β ∈ B 2 (E2 ; F) un operador bilineal. Entonces el operador cuadrático Q asociado a β está dado por
Q(v) = β(v, v)
1 Gracias
a Marcos Cossarini por hacerme notar este hecho
8
Cálculo Diferencial e Integral
para todo v ∈ E. Observemos que Q(tv) = t2 Q(v) para todo v ∈ E, t ∈ k.
En general, dado n ∈ N, una función f : E → F tal que f(tv) = tn f(v) para
todo t ∈ k, v ∈ E se dice homogénea de grado n.
La definición de objeto cuadrático que usaremos es la siguiente: diremos que
Q : E → F es un operador cuadrático si
β(v, w) := 1/2[Q(v + w) − Q(v) − Q(w)]
es bilineal. En particular Q(tv) = t2 Q(v) para todo v ∈ B, t ∈ k, pero esta
condición no es suficiente. Es fácil ver que Q es continuo si y sólo si β es continuo,
pues Q(v) = β(v, v) para todo v ∈ E.
Observación 1.2.4. Todo operador cuadrático continuo es acotado, es decir existe una constante C ≥ 0 tal que
kQ(v)k ≤ Ckvk2
para todo v ∈ E. Esto tiene una prueba directa: supongamos que Q es continua y
no está acotada. Dado n ∈ N existe entonces vn ∈ E tal que kQ(vn )k > n2 kvn k2 .
Como Q(0) = 0, debe ser vn 6= 0 para todo n. Luego
Q( vn ) > 1
nkvn k para todo n. Como Q es continua, haciendo tender n a infinito se tiene una
contradicción.
La conclusión de la observación anterior también es consecuencia del siguiente
resultado:
Lema 1.2.5. Si β : E × E → F es bilineal y continua en cada variable por
separado, entonces existe C ≥ 0 tal que, para todo v, w ∈ E se tiene
kβ(v, w)k ≤ Ckvkkwk.
En particular β es continua.
Demostración. Supongamos que x 7→ βy (x) := β(x, y) (y ∈ E fijo) es un operador acotado, y lo mismo ocurre con y 7→ βx (y) := β(x, y), ahora con x ∈ E fijo.
Consideremos la familia {βx : kxk ≤ 1}. Entonces, para cada y ∈ E, se tiene
kβx (y)k = kβ(x, y)k = kβy (x)k ≤ Cy kxk ≤ Cy .
Luego, por el principio de acotación uniforme (Teorema 1.1.5), el conjunto {kβx k :
kxk ≤ 1} es acotado. Esto quiere decir que existe una constante C ≥ 0 tal que
sup kβx (y)k = kβx k ≤ C
kyk≤1
1.3. Integración
9
para todo x ∈ E tal que kxk ≤ 1. Esto nos dice que, para todo x, y tales que
kxk ≤ 1 y kyk ≤ 1, se tiene kβ(x, y)k ≤ C. Usando la bilinealidad de β se tiene
la conclusión.
Definiciones y consideraciones análogas se tienen para formas cúbicas, cuárticas, etc. es decir para formas que provienen de operadores multilineales simétricos
de orden k ∈ N.
1.3.
Integración
Sea I = [a, b] ⊂ R un intervalo, y f : I → E una función. Diremos que f es
una función elemental si existe una partición de I en finitos intervalos disjuntos
Ij ⊂ I y una colección de vectores {vj }j=1...n ⊂ E tales que f|Ij = vj , es decir, si f
es constante en cada intervalo de la partición. En ese caso definimos la integral
de f sobre I como
Z
X
f=
vj µ(Ij )
I
j=1...n
donde µ denota la medida usual en R.
Diremos que una función f : I → E es reglada si f es límite uniforme de
funciones elementales, es decir si existe una sucesión de funciones elementales
fn : I → E tales que, dado ǫ > 0, se tiene
kfn − fkI := sup kfn (t) − f(t)k < ǫ
t∈I
para todo n ≥ n0 (ǫ).
No es difícil probar que toda función continua f : I → E es una función reglada.
La integral de una función reglada se define como el límite (en E) de las integrales
Z
fn .
I
Este límite no depende de la sucesión elegida para aproximar f.
Una propiedad fundamental de la integral es la siguiente: si T ∈ B(E, F)
entonces
Z Z
T
f
I
=
I
(T ◦ f).
La verificación es sencilla para funciones elementales, y luego se sigue de la
continuidad de T la propiedad general.
Esta propiedad es particularmente útil para reducir el problema a valores
reales o complejos si usamos funcionales del dual, es decir si usamos ϕ ∈ E ′ =
B(E, k) donde k = R o C según el contexto. Así, por ejemplo, si
Z
(ϕ ◦ f) = 0
I
′
para toda ϕ ∈ E , se deduce por el teorema de Hahn-Banach que
R
I
f = 0 ∈ E.
10
Cálculo Diferencial e Integral
Observación 1.3.1. Otra propiedad útil es la siguiente. Sea f : [a, b] → E reglada
y kf(t)k ≤ M, entonces
Z
Z
k fk ≤ kf(t)kdt ≤ (b − a)M.
I
I
En efecto, esta propiedad es simplemente la desigualdad triangular cuando la
función es elemental, y se extiende a regladas tomando límite.
1.4.
Aproximaciones, acotaciones
Veamos algunos resultados útiles que combinan diferenciación e integración.
Definición 1.4.1. Si E es un espacio vectorial, un conjunto C ⊂ E es convexo
si dados v, w ∈ C, entonces el segmento
t ∈ [0, 1]
tv + (1 − t)w,
esta íntegramente contenido en C.
Proposición 1.4.2 (Teorema del valor medio). Sean E, F espacios de Banach,
U ⊂ E abierto convexo y f : U → F una función C1 . Dados x, y ∈ U,
pongamos
M = máx kDftx+(1−t)y k.
t∈[0,1]
Entonces
kf(x) − f(y)k ≤ Mkx − yk.
Demostración. Sea g(t) = f(tx + (1 − t)y), g : [0, 1] → F. Observemos que g es
en realidad C1 en un entorno abierto del intervalo [0, 1]. Entonces g ′ : [0, 1] → F
es una función continua, con lo cual es fácil ver que
Z1
g(1) − g(0) = g ′ (t)dt.
0
Para convencernos, se puede considerar, dada ϕ ∈ F ′ , la aplicación real t 7→
ϕ(g(t)) para la cual vale claramente la propiedad, y como ϕ es arbitraria, se
tiene la propiedad enunciada para vectores de F (para más detalles ver la prueba
del Teorema de Taylor a continuación). Pasando en limpio
Z1
f(x) − f(y) = Dftx+(1−t)y (x − y)dt.
0
Usando la propiedad de la Observación 1.3.1 tenemos la conclusión.
1.4. Aproximaciones, acotaciones
1.4.1.
11
Fórmula de Taylor
Recordemos que si f : E → F es Ck y v ∈ E, pensamos a Dk fv (k ∈ N)
como una forma multilineal simétrica. Para h ∈ E, usemos la notación h(k) =
(h, · · · , h) ∈ Ek . Tenemos el siguiente teorema:
Teorema 1.4.3 (Fórmula de Taylor). Sean E, F espacios de Banach, U ⊂ E
un abierto convexo y f : U → F una función Ck en U. Entonces dados
v, v + h ∈ U se tiene
f(v + h) = Pk (v, h) + Rkv (h),
donde Pk (v, h) es el polinomio de Taylor de grado k centrado en v y evaluado
en h dado por
Pk (v, h) = f(v) + Dfv h + 1/2D2 fv h(2) + · · · +
1
Dk−1 fv h(k−1) ,
(k − 1)!
y la fórmula del resto está dada por
Rkv (h) =
1
(k − 1)!
Z1
(1 − t)k−1 Dk fv+th h(k) dt.
0
Demostración. Por el teorema de Hahn-Banach, basta probar el teorema después de componer con cualquier funcional ϕ ∈ F ′ , por la propiedad mencionada
en la Observación 1.2.2. En ese caso el problema se reduce al Teorema de Taylor
aplicado a la función real g : [0, 1] → R dada por g(t) = ϕ (f(v + th)), es decir
g(1)
=
g(0) + g ′ (0) + 1/2g ′′ (0) + · · · +
1
+
(k − 1)!
Z1
1
g(k−1) (0)
(k − 1)!
(1 − t)k−1 g(k) (t) dt.
0
Definición 1.4.4. Supongamos que f : U → F es una función C∞ . Entonces
diremos que f es analítica en U, denotado f ∈ Cω (U) si para todo v ∈ U existe
una bola abierta B ⊂ U centrada en v tal que
lı́m Rkv (h) = lı́m f(v + h) − Pk (v, h) = 0
k→∞
para todo h ∈ B.
k→∞
12
Cálculo Diferencial e Integral
Observación 1.4.5. Si Q : E → F es un operador cuadrático, se sigue que Q(v) =
β(v, v) para algún operador bilineal simétrico. Supongamos que Q es continuo,
entonces β es continuo y por lo señalado en la Observación 1.2.4, existe una
constante C ≥ 0 tal que
kQ(h)k
= kQ(h/khk)kkhk ≤ Ckhk
khk
para todo h 6= 0. Entonces, como Q(x + h) − Q(x) − 2β(x, h) = Q(h) para todo
x, h ∈ E, se deduce que Q es diferenciable pues
kQ(h)k
kQ(x + h) − Q(x) − 2β(x, h)k
=
→0
khk
khk
cuando h → 0.
Observemos que la diferencial de Q es DQx = 2β(x, ·) que es en efecto un
operador acotado. Como la asignación x 7→ DQx = 2β(x, ·) es un operador lineal
y acotado, se deduce que Q es dos veces diferenciable con 12 D2 Qx = β, es decir
D2 Q es constante, con lo cual Dn Q = 0 para todo n ≥ 3. Por último, se deduce
que para todo x ∈ E la expansión de Taylor de Q es simplemente su polinomio
de orden 2, es decir
Q(x + h) = Q(x) + 2β(x, h) + Q(h)
para todo h ∈ E, lo que prueba que Q es Cω en E.
Observación 1.4.6. En general, dado un operador P ∈ B k (Ek ; F) (es decir P es
multilineal, simétrico y continuo de grado k), diremos que P es un polinomio
homogéneo de grado k en el espacio de Banach E. Y un polinomio en E es una
suma finita de polinomios homogéneos, posiblemente de distintos grados. Entonces el Teorema de Taylor se puede pensar como un teorema de aproximación
de funciones por polinomios, y una función es analítica cuando es (localmente)
límite de polinomios.
Lema 1.4.7. Sea f : E → F dos veces diferenciable, y homogénea de grado
2, es decir f(tv) = t2 f(v) para todo v ∈ E, t ∈ k. Entonces f es un operador
cuadrático.
Demostración. Sea v ∈ E. Como f(tv) = t2 f(v), diferenciando respecto de t
tenemos, por la regla de la cadena, Dftv ((tv) ′ ) = 2tf(v), es decir Dftv (v) =
2tf(v). Diferenciando nuevamente respecto de t se tiene
D2 ftv v (v) = 2f(v).
1.5. Funciones Inversa e Implícita
13
Evaluando en t = 0 se deduce que
f(v) = 1/2(D2 f0 v)(v)
lo que prueba que f proviene del operador bilineal (y simétrico) β dado por
β(v, w) = 1/4 (D2 f0 v)(w) + (D2 f0 w)(v) = 1/2D2 f0 (v, w),
donde la última identidad se debe a que por existir D2 f0 , es simétrico.
Observación 1.4.8. Obviamente el lema se generaliza para todo k ∈ N de manera
natural, luego un polinomio homogéneo continuo de grado k está dado por una
función homogénea f : E → F de grado k -o sea f(tv) = tk f(v)- que es k veces
diferenciable.
Todas estas definiciones se pueden localizar de la siguiente manera: supongamos que f : U ⊂ E → F con U abierto y que
f(tv) = tk f(v)
para t ∈ R suficientemente pequeño, v ∈ U. Entonces f coincide en algún
entorno de 0 ∈ E con un polinomio homogéneo continuo.
1.5.
Funciones Inversa e Implícita
Los teoremas que vamos a enunciar en esta sección son esencialmente versiones sin coordenadas de los teoremas clásicos, por lo tanto las pruebas las
omitimos (se pueden ver en la sección [I, §5] del libro de Lang [47]).
1.5.1.
Función Inversa
Salvo que se aclare lo contrario, un isomorfismo T : E → F entre espacios de
Banach es un operador T ∈ B(E, F) biyectivo y bicontinuo. En realidad -siempre
que el dominio de T sea todo E- sólo hace falta chequear que sea acotado y
biyectivo, pues el Teorema de la función abierta (Teorema 1.1.2) nos garantiza
que la inversa será continua.
Teorema 1.5.1 (Teorema de la función inversa). Sean E, F espacios de Banach, U ⊂ E abierto y f : U → F una función Ck , con k ≥ 1. Supongamos
que para algún punto v ∈ U se tiene que Dfv : E → F es un isomorfismo de
espacios de Banach.
Entonces f es un isomorfismo local de clase Ck alrededor de v. Es decir,
existen abiertos A ⊂ U ⊂ E y B ⊂ F entornos de v y f(v) respectivamente,
tales que f|A : A → B es un difeomorfismo de clase Ck .
14
Cálculo Diferencial e Integral
Observación 1.5.2. Con la notación del teorema previo,
En particular, Dfx es inversible para todo x ∈ A, es más si f−1 : B → A
denota la inversa de f|A , entonces por la regla de la cadena
(Dfx )−1 = Df−1
f(x)
para todo x ∈ A.
El teorema no dice que tan grandes son los abiertos A, B pero esto en ciertos
casos se puede estimar si uno conoce explícitamente Df (ver el Lema 5.4
en [I,§5] del libro de Lang [47]).
1.5.2.
Función Implícita
Diremos que un subespacio cerrado F1 ⊂ F de un espacio de Banach F parte
a F si existe otro subespacio cerrado F2 ⊂ F tal que
F = F1 ⊕ F2 .
En ese caso diremos que F se parte.
Teorema 1.5.3 (Teorema de la función implícita). Sean E, F espacios de Banach, U ⊂ E abierto y f : U → F de clase Ck , k ≥ 1. Supongamos que
existe v ∈ U y un subespacio F1 que parte a F, tales que Dfv : E → F1 es un
isomorfismo y f(v) = 0.
Entonces existe un isomorfismo local g : F → F1 × F2 de clase Ck (alrededor de 0 ∈ F) y abiertos A ⊂ U, B ⊂ F1 que contienen a v y (g ◦ f)(v)
respectivamente, tales que g ◦ f|A : A → B es un isomorfismo de clase Ck .
Observación 1.5.4. Una hipótesis relevante del teorema es el hecho de que la
imagen F1 de Dfv parte al espacio total. Esto está garantizado en dimensión
finita, y también por ejemplo si F1 es un subespacio cerrado de un espacio de
Hilbert. Como veremos más adelante, en muchos casos no es tan sencillo garantizar esta condición (ver también el Teorema 1.5.8). Enunciamos a continuación
otras versiones útiles del teorema.
Dado un producto A × B llamaremos pr1 : A × B → A a la proyección a la
primera coordenada, análogamente definimos pr2 . Si Vi (i = 1, 2) son abiertos en
espacios de Banach, diremos que g : V1 × V2 → F es una proyección si existe un
1.5. Funciones Inversa e Implícita
15
difeomorfismo k de V1 en un abierto de F, k : V1 → k(V1 ) ⊂ F tal que g = k◦pr1 .
Esto es
pr1
/V
V1 × V2
v 1
v
v
g
vv
vv k
v
zvv
F
Corolario 1.5.5 (Teorema de la función implícita v2). Sea U ⊂ E abierto y
v ∈ U. Supongamos que f : U → F es una función Ck (k ≥ 1) tal que Dfv es
un epimorfismo y su núcleo parte a E.
Entonces existen: un abierto U0 ⊂ U que contiene a v, abiertos V1 , V2
en espacios de Banach, y un difeomorfismo de clase Ck , h : V1 × V2 → U0 ,
tales que f ◦ h es una proyección.
El teorema de la función implícita se puede reformular si ya asumimos al
espacio de salida “partido” como un producto de espacios de Banach, para poder
pensar (al menos localmente) a la superficie de nivel de una función f(x, y) = cte
como gráfico de otra función g, es decir que
{(x, y) : f(x, y) = c} = Gr(g) = {(x, g(x))}
al menos localmente. Para escribir esto con precisión, necesitamos hacer algunas
aclaraciones: si E, F, G son espacios de Banach y f : E × F → G es diferenciable,
podemos considerar las derivadas parciales de la manera usual, es decir:
Para w ∈ F fijo, consideramos la función f1 : E → G dada por f1 (x) =
f(x, w). Entonces esta función es diferenciable y a su diferencial en v ∈ E
la denotamos D1 f(v,w) .
Para v ∈ E fijo, consideramos la función f2 : F → G dada por f2 (y) =
f(v, y). Entonces esta función es diferenciable y a su diferencial en w ∈ F
la denotamos D2 f(v,w) .
Lema 1.5.6. Sean U ⊂ E, V ⊂ F abiertos. Entonces f : U × V → G es de
clase Ck en U × V, con k ≥ 1, si y sólo si existen las dos derivadas parciales
D1 f, D2 f y son de clase Ck−1 .
Demostración. Cambiando f por Dk−1 f basta probar el resultado para k = 1.
Si f es C1 , entonces f1 , f2 son C1 con lo cual Di f = Dfi son continuas para
i = 1, 2. Recíprocamente, si Di f existen y son continuas, basta probar que f es
diferenciable y que
Df(p,q) (v, w) = D1 f(p,q) v + D2 f(p,q) w,
(1.2)
16
Cálculo Diferencial e Integral
para todo (p, q) ∈ U × V, (v, w) ∈ E × F. Esto es porque en ese caso está claro
que Df es continua por ser una suma y composición de funciones continuas, es
decir
Df = D1 f ◦ pr1 + D2 f ◦ pr2 .
Para ver que vale (1.2), tenemos el candidato a Df; escribimos la diferencia
f(p + v, q + w) − f(p, q) − [D1 f(p,q) v + D2 f(p,q) w].
Separamos en dos términos, sumando y restando f(p, q + w), D1 f(p,q+w) v; por
ejemplo el primer término queda, acotando
≤ kf(p + v, q + w) − f(p, q + w) − D1f(p, q + w)vk + k[D1 f(p,q+w) − D1 f(p,q) ]vk
Observando que k(v, w)k = kvk + kwk ≥ kvk, el primer término tiende a cero al
dividirlo por k(v, w)k por la existencia de D1 f, y el segundo por la continuidad
de D1 f. La parte que queda involucra D2 f y es similar.
Corolario 1.5.7 (Teorema de la función implícita v3). Sean E, F, G espacios
de Banach, U ⊂ E, V ⊂ F abiertos, f : U × V → G una función Ck con k ≥ 1.
Sean (v, w) ∈ U × V y z ∈ G tales que f(v, w) = z y supongamos que
D2 f(v,w) : F → G
es un isomorfismo de espacios de Banach.
Entonces existen: un abierto U0 ⊂ U entorno de v y una (única) función
g : U0 → V de clase Ck con g(v) = w tales que
f(x, g(x)) = z
para todo x ∈ U0 , y esta función g parametriza el conjunto {(x, y) : f(x, y) =
z} ⊂ U × V en algún entorno abierto de (v, w).
1.5.2.1.
Subespacios sin suplemento
Mencionamos aquí un resultado reciente (2009) concerniente a teoremas de
la función implícita sin suplementos, que puede encontrarse en el trabajo [3] de
Jinpeng An y Karl-Hermann Neeb.
Teorema 1.5.8. Sean E, F, G espacios de Banach, U ⊂ E, V ⊂ F entornos
abiertos del cero. Sean f : U → V, g : V → G funciones C1 . Supongamos que
1.A. Problemas
17
f(0) = 0, g(0) = 0,
g ◦ f ≡ 0,
ranDf0 = ker Dg0 ,
ranDg0 ⊂ G es un subespacio cerrado.
Entonces existe un entorno W ⊂ V, alrededor de 0 en F, tal que
g−1 (0) ∩ W = f(U) ∩ W.
Observación 1.5.9. El teorema no pide que el rango de Dg0 parta a F, pero si
pide que sea un subespacio cerrado. Por otra parte, se deduce del teorema que
f : f−1 (f(U) ∩ W) ∩ U → g−1 (0) ∩ W
parametriza localmente la superficie de nivel N = g−1 (0) ⊂ V.
1.A.
Problemas
1.I. Probar que si F es un espacio de Banach y E es un espacio normado, entonces
B(E, F) es un espacio de Banach.
1.II. ∗ Dados p, q ∈ [1, +∞] tales que 1/p + 1/q = 1, y Tr : Mn (C) → C la traza
usual, se define la norma p de matrices como
p/2 1/p
) .
kAkp = Tr((A∗ A)
Probar la desigualdad de Hölder:
|Tr(AB)| ≤ Tr|AB| ≤ kAkp kBkq
donde A, B ∈ Mn (C).
1.III. Dado 1 ≤ p < ∞ probar la desigualdad de Minkowski:
kA + Bkp ≤ kAkp + kBkp
y concluir que las normas p son efecto normas sobre el espacio de matrices.
Sugerencia: aplique la desigualdad de Hölder del ejercicio previo a la identidad
p−1
kA + Bkp
|A + B| = Tr |A + B|p−1 U∗ (A + B)
p = Tr |A + B|
= Tr |A + B|p−1 U∗ A + Tr |A + B|p−1 U∗ B
donde A + B = U|A + B| es la descomposición polar de A + B.
1.IV. Desigualdades de Clarkson
18
Cálculo Diferencial e Integral
Sean x, y ∈ C y p ≥ 2, probar la siguientes desigualdades
(|x + y|p + |x − y|p )1/p
≤
≤
=
donde
1
p
+
1
q
(|x + y|2 + |x − y|2 )1/2
21/2 {2(p−2)/p ((|x|p + |y|p )2/p )}1/2
21/q (|x|p + |y|p )1/p
(1.3)
= 1 (considerar las desigualdades de Jensen y Hölder).
Sean x, y ∈ C y 1 < p ≤ 2, la idea de este ejercicio es probar que:
|x + y|q + |x − y|q ≤ 2(|x|p + |y|p )q−1
(1.4)
Probar que (1.4) se reduce a
|1 + c|q + |1 − c|q ≤ 2(1 + |c|p )q−1
(1.5)
con |c| ≤ 1.
Considerando c = ρeiθ , mostrar que es suficiente considerar θ = 0,
es decir 0 ≤ c ≤ 1. Además como (1.5) es trivial para c = 0 y c = 1,
sólo es necesario considerar 0 < c < 1.
Mediante la transformación c =
1−z
1+z
con 0 < z < 1, reducir (1.5) a
S = 1/2[(1 + z)p + (1 − z)p ] − (1 + zq )p−1 ≥ 0.
Expandiendo cada término de S en su serie de Taylor, probar que:
S=
∞
X
(2 − p)(3 − p) . . . (2k − p) 2k
z f(z, k, p)
(2k − 1)!
k=1
donde
f(z, k, p) =
1 − z(2k−p)/(p−1) 1 − z2k/(p−1)
.
−
(2k − p)/(p − 1)
2k/(p − 1)
Usando que la función (1 − zt )/t, para t > 0 y 0 < z < 1 es no
decreciente como función de t, establecer la desigualdad (1.5).
Probar las desigualdades de Clarkson: si x, y ∈ lp con p > 1 entonces
p
p−1
p
kx + ykp
(kxkp
p + kx − ykp ≤ 2
p + kykp ),
q
p
p q−1
kx + ykq
,
p + kx − ykp ≤ 2(kxkp + kykp )
si
si
p ≥ 2,
(1.6)
1 < p ≤ 2.
(1.7)
Sugerencia: Utilizar (1.3), (1.4) y la desigualdad de Minkowski
X
X
X
(
Asi )1/s + (
Bsi )1/s ≤ ( (Ai + Bi )s )1/s
para Ai , Bi ≥ 0 y 0 < s =
p
q
≤ 1.
1.A. Problemas
19
1.V. Un espacio de Banach (X, k.k) se dice uniformemente convexo si para cada
ǫ > 0, existe δ(ǫ) > 0 tal que
kxk = kyk = 1,
kx − yk ≥ ǫ
implican 1/2 kx + yk ≤ 1−δ(ǫ). Probar que lp es uniformemente convexo si p > 1
y estimar δ(ǫ) en términos de p.
1.VI.∗ Probar que (Mn (C), k · kp ) es uniformemente convexo para 1 < p < ∞.
1.VII. Probar que toda función diferenciable f : E → F entre espacios normados
es continua.
1.VIII. Sean E, F, G espacios normados. Si f : E → F es diferenciable y T ∈ B(F, G),
entonces
DTx = T para todo x ∈ F.
D(T ◦ f)p = T ◦ Dfp para todo p ∈ E.
p
1.IX. Sea H un espacio de Hilbert y f : H → R dada por f(x) = kxk = hx, xi.
Probar que si x 6= 0, entonces f es diferenciable en x y vale Dfx (v) = hx,vi
kxk .
1.X. Consideremos B 2 (E2 ; F) con la norma
kβk =
sup
kvk≤1,kwk≤1
kβ(v, w)k.
Probar que Φ : B(E, B(E, F)) → B 2 (E2 ; F) dada por Φ(T )(v, w) = (Tv)(w) es un
isomorfismo isométrico sobreyectivo.
1.XI. Probar que si g : R2 → R es dos veces diferenciable, entonces
∂2 g
∂2 g
(x, y) =
(x, y)
∂y∂x
∂x∂y
para todo (x, y) ∈ R2 .
1.XII. Probar que si U ⊂ E es un abierto conexo y f : U → F es diferenciable con
Df ≡ 0, entonces f es constante.
1.XIII. Dar una definición de operador k-homogéneo µ : Ek → F que sea consistente con la de operador 2-homogéneo (operador cuadrático).
1.XIV. Probar que si α : [a, b] → E es continua, entonces es reglada.
R
R
1.XV. Probar que k I f(t)dtk ≤ I kf(t)kdt para toda f : I → E reglada.
20
Cálculo Diferencial e Integral
1.XVI. Probar que si f : I → E es reglada y T ∈ B(E, F), entonces
Z Z
T
f = (T ◦ f).
I
I
1.XVII. Sea f : U ⊂ E → F analítica (Definición 1.4.4). Sea p ∈ U, B = BR (0) de
manera que Pk (p, v) → f(p + v) puntualmente para todo v ∈ B.
Dado v ∈ B, considerando ϕ ∈ F ′ y g(z) = ϕ(f(p + zv)) probar que g es
una función analítica en el sentido usual para |z| < 1 + R − kvk, y calcular
la serie de g alrededor de z = 0.
∗
Probar que Pk converge uniformemente a f en p + B.
1.XVIII. Sea A ∈ Mn (C), probar que las siguientes funciones son analíticas:
P
Inv : U ⊂ Mn (C) → Mn (C) dada por Inv(A) = A−1 = n≥0 (1 − A)n ,
donde U = {A : kA − 1k < 1}.
P
n+1
log : U ⊂ Mn (C) → Mn (C) dada por log(A) = n≥0 (−1) /n (A − 1)n .
P
exp : Mn (C) → Mn (C) dada por exp(A) = eA = n≥0 1/n! An .
Probar que exp ◦ log = idU , log ◦ exp = id.
1.XIX. Probar el Teorema de la función implícita v3 (Teorema 1.5.7).
Capítulo
Variedades Diferenciables
He decidido en primer lugar, abocarme a
la tarea de construir la noción de una
magnitud múltiplemente extendida, a
partir de nociones generales de magnitud.
P
Bernhard Riemann
resentamos en este capítulo las nociones básicas de variedades modeladas por espacios de Banach. Haremos uso de las herramientas
del cálculo diferencial e integral introducidas en el capítulo previo.
También presentamos un breve repaso de grupos de Lie-Banach y sus espacios
homogéneos, incluyendo algunos resultados recientes para espacios de dimensión
infinita. El capítulo concluye con una rápida presentación de los grupos clásicos
de matrices y sus espacios homogéneos.
2.1.
Cartas y Atlas
Dado un espacio de Banach fijo E y un espacio topológico M, supongamos
que tenemos una colección de abiertos U ⊂ M que lo recubren, y una colección
de mapas ϕ : U → E de manera que ϕ(U) ⊂ E es abierto y ϕ : U → ϕ(U)
es un homeomorfismo. Los pares (U, ϕ) se denominan cartas de M, y diremos
que M es una variedad topológica modelada por E si se verifica la condición
de compatibilidad siguiente: si (V, φ) es cualquier otra carta de M, entonces la
función de transición φ ◦ ϕ−1 : E → E es continua donde está definida,
φ ◦ ϕ−1 : ϕ(U ∩ V) ⊂ E → E.
Un atlas es una colección de cartas compatibles que cubre todo M.
21
2
22
Variedades Diferenciables
Observación 2.1.1. Algunas veces es conveniente olvidar la topología inicial de
M y dotar al espacio de una topología usando las cartas, es decir, si tenemos un
cubrimiento del conjunto M por conjuntos U y funciones inyectivas ϕ tales que
ϕ(U) ⊂ E es un conjunto abierto, entonces decretamos que los U son abiertos en
M y esto induce una topología allí (esto tiene sentido siempre que las funciones
de transición sean todas continuas).
Un ejemplo sencillo de la diferencia entre las topologías que puede obtenerse
es el dado por la Lemniscata ∞ en el plano R2 : con la topología de subespacio es
un conjunto compacto, mientras que con la topología que se le da al identificarlo
con la recta R mediante una única carta, claramente es no compacto.
Definición 2.1.2. Sea (∗) alguna de las siguentes categorías:
1. diferenciable,
2. Ck ,
3. C∞ o suave,
4. Cω o analítica.
Diremos que la variedad M es (∗) si las funciones de transición son (∗). Si N es
otra variedad modelada por un espacio de Banach F, diremos que una función
f : M → N entre variedades diferenciables es (∗) si para todo par de cartas
(U, ϕ), (U ′ , ξ) de M y N respectivamente, la función ξ ◦ f ◦ ϕ−1 : E → F es (∗)
en el abierto ϕ(U) ⊂ E.
2.2.
Espacio y Fibrado tangente
En esta sección discutimos algunas maneras de presentar el fibrado tangente
a una variedad diferenciable, y como las aplicaciones suaves entre variedades
inducen morfismos de los fibrados.
2.2.1.
Espacio tangente
Dada una variedad diferenciable, el espacio tangente Tp M en p ∈ M se
puede pensar de varias maneras equivalentes. Una bastante útil para nuestros
propósitos es la siguiente: consideremos ternas (U, ϕ, v) donde (U, ϕ) es una
carta de M alrededor de p ∈ M y v ∈ E. Dos ternas (U, ϕ, v), (V, ξ, w) son
equivalentes en p ∈ M si
D ξ ◦ ϕ−1 ϕ(p) v = w.
2.2. Espacio y Fibrado tangente
23
Esto define una relación de equivalencia en aquellas ternas donde el abierto
contiene al punto p ∈ M, y las clases son los elementos de Tp M. Si [(U, ϕ, v)]p ∈
Tp M denota una clase, la aplicación
ϕ∗ : [(U, ϕ, v)]p 7→ v
es una biyección, que permite identificar Tp M con el espacio de Banach E. Dada
un curva α : (−ǫ, ǫ) → M diferenciable definida en algún entorno de 0 ∈ R, tal
que α(0) = p, podemos calcular su velocidad en p usando una carta cualquiera
(U, ϕ) alrededor de p, es decir
α̇(0) := (ϕ ◦ α) ′ (0)
es la velocidad de α en p. Por supuesto que muchas curvas pueden tener la
misma velocidad con lo cual tenemos que hacer una identificación, diremos que
α̇(0), β̇(0) representan el mismo vector tangente v ∈ Tp M si α(0) = β(0) = p ∈
M y además
(ϕ ◦ α) ′ (0) = (ϕ ◦ β) ′ (0)
para alguna de carta (U, ϕ) alrededor de p ∈ M. Esto define una relación de
equivalencia entre curvas que pasan por p, y de hecho la relación no depende de
la carta elegida. Para convencernos, sea (V, ξ) otra carta alrededor de p ∈ M, y
observemos que
(ξ ◦ α) ′ (0) = (ξ ◦ ϕ−1 ◦ ϕ ◦ α) ′ (0) = D(ξ ◦ ϕ−1 )ϕ(p) (ϕ ◦ α) ′ (0).
Suponiendo que α y β son equivalentes, reemplazando el último término de la
derecha por (ϕ ◦ β) ′ (0) y volviendo a agrupar se tiene
(ξ ◦ α) ′ (0) = (ξ ◦ β) ′ (0).
El espacio tangente se puede pensar como el cociente por esta relación, pero
como veremos, en los ejemplos usaremos una curva concreta. A la clase de una
curva α la denotamos con [α]p . Observemos que, si ponemos
β(s) = α(t + s)
esta es una curva en M para s suficientemente pequeño, que verifica β(0) = α(t);
la clase de β la denotamos [α]α(t) .
2.2.2.
Fibrado tangente
Para definir el fibrado tangente conviene introducir algunas nociones generales, comenzando por fibrados.
24
Variedades Diferenciables
2.2.2.1.
Fibrados
Definición 2.2.1. Un fibrado sobre una variedad diferenciable M consiste en
una terna (X, M, π) dado por variedades diferenciables X, M y una función diferenciable π : X → M tal que, para cada p ∈ M,
existe un entorno abierto U de p
existe una variedad diferenciable Z, y un difeomorfismo h : π−1 (U) →
U × Z, tales que π = pr1 ◦ h.
Es decir, localmente π es una proyección (haciendo honor a su nombre):
h
h /
/ U×Z
π−1 (U)
U×Z
X
t
t
x
tt
xx
t
π
x
t
π
t pr1
xxpr1
yttt
, o más precisamente:
{xx
M
M
2.2.2.2.
Fibrados vectoriales
Con algunas especificaciones más, donde el espacio X sea localmente trivializable con un espacio de Banach fijo E, obtenemos un fibrado vectorial. Más
precisamente, sea E un espacio de Banach, entonces el fibrado (X, M, π) es un
fibrado vectorial, si existen
{Ui }i∈I cubrimiento por abiertos de M,
para cada i ∈ I hay una difeomorfismo τi : π−1 (Ui ) → Ui × E tal que
π = pr1 ◦τi , y en particular para cada p ∈ M, si llamamos τip := τi |π−1(p) ,
entonces
τip : π−1 (p) → E
es un isomorfismo,
para cada par i, j ∈ I, para cada p ∈ M, la función
τjp ◦ τ−1
ip : E → E
es un isomorfismo de espacios de Banach (es decir es lineal, continua y
biyectiva),
para cada par i, j ∈ I, la función
es diferenciable.
Ui ∩ Uj ∋ p 7→ τjp ◦ τ−1
ip ∈ B(E)
2.2. Espacio y Fibrado tangente
25
Las funciones τi se denominan trivializaciones del fibrado, y la familia {(Ui , τi )}
es un cubrimiento trivializador. Las funciones τjip := τjp ◦ τ−1
ip se llaman
funciones de transición del fibrado. Una sección s : M → X del fibrado es
una función tal que π ◦ s = idM .
2.2.2.3.
Fibrado Tangente
En esta sección pegamos los espacios tangentes usando la noción de fibrado.
Definición 2.2.2. Dada M una variedad diferenciable modelada por el espacio
de Banach E, definimos TM como la unión disjunta de todos los espacios tangentes de M, y sea π : TM → M la proyección natural que asigna p ∈ M al vector
v ∈ Tp M. Entonces (TM, M, π) es un fibrado vectorial, el fibrado tangente de
M, usualmente denotado simplemente TM. Se denota TU a la restricción de este
fibrado a la preimagen π−1 (U) de un abierto U ⊂ M.
Más concretamente, sea TM = ⊔p∈M Tp M y sea π : TM → M la proyección
canónica que a un elemento [α]p ∈ Tp M lo manda al punto p ∈ M. Consideremos
(Ui , ϕi ) un cubrimiento de M por cartas, pongamos
TUi = π−1 (Ui ) = ⊔p∈Ui Tp M
y consideramos la función τi : π−1 (Ui ) → Ui × E dada por
τi : [α]p 7→ (p, (ϕi ◦ α) ′ (0)).
Observemos que τi es diferenciable puesto que Ui × E tiene una carta global
ϕi × idE que identifica
Ui × E ≃ ϕi (Ui ) × E ⊂ E × E,
y en esta carta se tiene
(ϕi × idE ) ◦ τi ([α]p ) = (ϕi (p), (ϕi ◦ α) ′ (0)).
Luego si (Uj , ϕj ) es otra carta y q ∈ Ui ∩ Uj , denotemos
ϕji := ϕj ◦ ϕ−1
: ϕi (Ui ∩ Uj ) → ϕj (Ui ∩ Uj ).
i
En la presentación con cartas de T (Ui ∩ Uj ) se tiene
τji (x, v) = (ϕji (x), (Dϕji )x v)
para x ∈ ϕi (Ui ∩ Uj ), v ∈ E. Como x 7→ (Dϕji )x es de clase Ck−1 (suponiendo
que la variedad sea Ck con k ≥ 1), se deduce que TM es una variedad de clase
Ck−1 .
26
Variedades Diferenciables
2.2.3.
Diferencial de una función
Dada una función diferenciable f : M → N entre variedades, denotaremos
f∗ : TM → TN
a la aplicación que, si (U, ϕ) y (V, ξ) son cartas de M y N respectivamente,
localmente está dada, para x ∈ ϕ(U) y v ∈ E ≃ Tp M, por
f∗ (x, v) = (ξ ◦ f ◦ ϕ−1 (x), D ξ ◦ f ◦ ϕ−1 x v),
que nuevamente es de clase Ck−1 siempre que M, N, f sean de clase Ck (con
k ≥ 1).
Pensando en términos de clases de curvas, hay una manera útil de presentar
f∗ que es la siguiente: si [α]p ∈ Tp M es una clase con un representante α : I → M
tal que α(0) = p, entonces f ◦ α : I → N es una curva que pasa por f(p), y no es
difícil ver que
f∗p ([α]p ) = [f ◦ α]f(p) .
Entonces en general, si nos restringimos a una carta (U, ϕ) de M, tenemos
la carta de TU dada por
ϕ∗ = τϕ : [α]p 7→ (ϕ(p), (ϕ ◦ α) ′ (0)),
que da la identificación TU ≃ U × E ≃ ϕ(U) × E. Es habitual decir entonces que
un elemento de TU es sencillamente un par ordenado (x, v) con x ∈ ϕ(U) ⊂ E y
v ∈ E libre, y la proyección canónica en esta presentación es simplemente pr1 ,
es decir π(x, v) = x.
2.3.
Curvas
Si α : I → M es una curva Ck con I ⊂ R abierto, se la puede pensar como
una curva entre variedades (el fibrado tangente a I se identifica naturalmente
con I × R). La diferencial α∗ : TI = I × R → TM es una aplicación Ck−1 .
2.3.1.
Levantadas de una curva
A la diferencial de una curva dada α ⊂ M, es conveniente pensarla como otra
curva, pero a valores en TM, de la siguiente manera: el fibrado π : I × R → I
tiene una sección canónica i dada por i(t) = (t, 1). Entonces definimos
α ′ := α∗ ◦ i : I → TM
2.4. Subvariedades
27
que es la levantada canónica de α, que verifica π ◦ α ′ = α,
I ×O R
i
I
α∗
/ TM
w;
α ′ www
w
ww
ww α
π
/M
Esta es una curva Ck−1 a valores en TM. Notemos que en una carta local (U, ϕ)
de M, la expresión para α ′ es
α ′ (t) = ((ϕ ◦ α)(t), α̇(t)),
donde α̇(t) denota el vector de E dado por (ϕ◦α) ′ (t). En general, una levantada
de α : I → M es una curva β : I → TM, de clase Ck−1 tal que π ◦ β = α.
2.4.
Subvariedades
Supongamos que M es una variedad Ck modelada por el espacio de Banach
E, y que este espacio se descompone como E = F1 ⊕F2 con Fi espacios de Banach.
Sea N ⊂ M un subconjunto, y supongamos que para cada n ∈ N hay una
carta (U, ϕ) de M que induce un isomorfismo de U con un producto de abiertos
A1 × A2 ⊂ F1 × F2 , de manera tal que
ϕ(U ∩ N) = A1 × {a2 }
para algún punto a2 ∈ A2 . Llamemos ϕN = pr1 ◦ ϕ, entonces (U ∩ N, ϕN ) es
por definición una carta de N, ϕN (U ∩ N) = A1 es un abierto de F1 . No es
difícil ver que un cubrimiento de cartas de este tipo induce en N una estructura
diferenciable. Diremos que N ⊂ M es una subvariedad regular, que tiene la
topología heredada de M como subespacio.
En general no es sencillo garantizar esta construcción, incluso en el caso
finito dimensional (sin mencionar que en dimensión infinita puede ocurrir que
un subespacio F1 no parta a E). Un ejemplo molesto ocurre en el caso de la
lemniscata, donde ningún entorno de X = (0, 0) se puede identificar con R.
Otro ejemplo es el grupo a un parámetro con pendiente irracional en el toro,
que tiene estructura de variedad diferenciable por ser difeomorfo con R, pero no
es una subvariedad regular del toro. Específicamente, identificamos el toro con
28
Variedades Diferenciables
S1 × S1 y consideramos la subvariedad W parametrizada como t 7→ (eiπt , eiαπt )
para t ∈ R y α ∈ R irracional fijo. Es fácil ver que W ⊂ T es densa, con lo
cual cualquier abierto de T , al cortarlo con W, nos devuelve infinitos segmentos.
Dicho de otra forma, no hay manera de obtener el abierto A ⊂ W que viene del
intervalo (0, 1) en R, como intersección de un abierto del toro con W.
Dos criterios útiles para decidir si N ⊂ M es una subvariedad son los siguientes:
Proposición 2.4.1. Sea f : M → Z una función Ck (k ≥ 1) entre variedades
diferenciables. Supongamos que f es una sumersión, es decir para todo p ∈
M, se tiene que f∗p : Tp M → Tf(p) Z es un epimorfismo y el núcleo ker f∗p
parte a Tp M.
Entonces, si z0 ∈ Z y N = f−1 (z0 ) ⊂ M, con la topología de subespacio, se
tiene que N es una subvariedad cerrada de M de clase Ck , con Tp N ≃ ker f∗p
para todo p ∈ N.
Demostración. Que N es cerrado es trivial, supongamos que es no vacío. Dado
p ∈ N, si el espacio de Banach que modela M es E, tomamos una carta (Ũ, ϕ)
de M tal que ϕ(p) = 0 ∈ E, y llamamos U = ϕ(Ũ) ⊂ E. Tomemos ahora otra
carta (W, ξ) de Z tal que ξ(z0 ) = 0 ∈ F. Tenemos por hipótesis que, para cada
p ∈ N, f̃ = ξ ◦ f ◦ ϕ−1 : U → F es una aplicación Ck entre espacios de Banach,
cuya diferencial es sobreyectiva y el núcleo parte a E, es decir
F ⊕ ker Df̃0 ≃ E.
Por el Teorema de la Función Implícita v2 (Corolario 1.5.5), existe (achicando U
si fuese necesario) un difeomorfismo de clase Ck , h : V1 × V2 → U con V1 abierto
de F, V2 abierto del núcleo de Df̃0 , y f̃ ◦ h = pr1 . Tomemos φ = h−1 ◦ ϕ que
resulta una carta de M con dominio Ũ tal que ξ◦f◦φ−1 = pr1 . Por construcción,
φ(Ũ) = V1 × V2 , pero además como ξ ◦ f ◦ φ−1 (0, y) = 0, se deduce que
φ(Ũ ∩ N) = 0 × V2 ,
lo que prueba que N es subvariedad. Por último, observemos que en esta presentación Tp N ≃ 0 × ker Df̃0 , con lo cual se termina la prueba.
La utilidad de este criterio se termina cuando no podemos hallar un suplemento para el núcleo de f∗ . Sin embargo, en dimensión finita, en espacios de
Hilbert, y en ejemplos puntuales de espacios de Banach, es utilizable.
El próximo criterio es todavía más débil, pues aún en dimensión finita no
permite probar que un subconjunto es una subvariedad regular. La prueba la
omitimos, queda como ejercicio.
2.4. Subvariedades
29
Proposición 2.4.2. Sea f : X → Y una función Ck entre variedades, y
supongamos que f es una inmersión, es decir f∗p : Tp X → Tf(p) Y tiene rango
cerrado que se parte.
Entonces para cada p ∈ X existe un abierto U ⊂ X entorno de p y un
abierto V ⊂ Y entorno de f(p) tales que
f(U) es una subvariedad cerrada de Y.
f|U : U → f(U) es un Ck difeomorfismo.
El resultado parece muy lindo pero la clave de su inutilidad está en la localización de la conclusión. Es decir, no dice que f(X) ⊂ Y es una subvariedad. Y
la razón es muy simple: en general es falso aunque se verifiquen las hipótesis de
la proposición. Una vez más recurrimos a la lemniscata y/o a la curva densa en
el toro.
Localmente, la imagen de la parametrización, en pedazos pequeños, es una
subvariedad, en cualquiera de los dos casos. Pero si tomamos un abierto del
espacio más grande que sea entorno del punto de intersección, y lo cortamos con
la imagen de la parametrización, no conseguimos una carta de la subvariedad.
Hecha esta aclaración, si uno puede probar de alguna otra forma que Z ⊂ Y es
una subvariedad topológica, el teorema previo da una forma de darle estructura
diferenciable compatible con la de M: hay que encontrar el espacio X y la función
f : X → Y tal que f(X) = Z, que verifique las hipótesis del teorema.
Volveremos a tocar el tema de estructuras diferenciables y subvariedades
regulares cuando estudiemos espacios homogéneos de grupos de Lie-Banach, en
la Sección 3.3. De particular interés es un criterio para estudiar cuando un espacio
homogéneo G/K ⊂ X es subvariedad de X, que presentamos en el Lema 3.3.6.
2.4.1.
Subvariedades no regulares
Observemos que la definición de subvariedad regular es demasiado estricta
para espacios de Banach. Si un subespacio E ⊂ F de un espacio de Banach
no tiene suplemento topológico, entonces no será subvariedad regular. Podemos
relajar esta condición para que si lo sea, y pedir únicamente (si E es el espacio
de Banach que modela M y N ⊂ M es un subespacio topológico) que exista
un subespacio cerrado F ⊂ E tal que para todo punto p ∈ N exista una carta
30
Variedades Diferenciables
(U, ϕ) de M que contenga a p tal que ϕ(U ∩ N) sea un abierto de F. A estas
variedades, que tienen la topología de subespacio, las llamaremos subvariedades
embebidas. En este caso, el problema es encontrar buenos criterios que permitan
probar la existencia de una estructura de subvariedad, ya que el teorema de la
función inversa y sus derivados requieren -según discutimos- de la existencia de
suplementos lineales para núcleos o imágenes de las diferenciales de las funciones
involucradas. Un corolario no trivial del Teorema 1.5.8 de la función implícita
de Ann y Neeb que se halla en el mismo trabajo [3] es el siguiente:
Teorema 2.4.3. Sea f : M → Z una función Ck , k ≥ 1 entre variedades
diferenciables, y dado z0 ∈ Z pongamos
N = f−1 (z0 ).
Supongamos que
Dfp es un epimorfismo para cada p ∈ N.
Existe un espacio de Banach E de manera que para todo punto p ∈ N,
existe un entorno abierto Up ⊂ E del cero y una función Ck , gp :
Up → N ⊂ M, de manera que gp (0) = p, (Dgp )0 es un monomorfismo
y ran(Dgp )0 = ker Dfp .
Entonces N tiene una estructura de variedad diferenciable modelada por
E ≃ ker Dfp , que la hace una subvariedad embebida de M.
2.4.2.
Subvariedades de un espacio de Banach
Cuando M ⊂ F con F un espacio de Banach, podemos presentar de forma
“concreta” la estructura de subvariedad, las curvas, los espacios tangentes, los
campos y otros objetos que introduciremos luego.
Como la inclusión i : M → F es una función de clase Ck , podemos usar las
inversas de las cartas (U, ϕ) de M, que por definición son aplicaciones de clase
Ck , Φ := i ◦ ϕ−1 : W → F con W ⊂ E abierto en el espacio de Banach E que
modela M. Son inyectivas y con diferencial DΦx inyectiva en cada x ∈ W, cuyo
rango es un subespacio cerrado de F que identificamos con TΦ(x) M de la siguiente
manera
[(U, ϕ, v)]p 7→ DΦx v,
o equivalentemente si α(t) = Φ(tv) es una curva en M con α(0) = p, identificamos
[α]p 7→ v.
2.4. Subvariedades
31
Es necesario para ser subvariedad embebida que todo punto p ∈ M tenga alguna
bola abierta U ⊂ F de manera que U ∩ M esté parametrizado por alguna carta
(W, Φ). En el caso más restrictivo de subvariedad, necesitamos que el rango de
DΦx se parta en F.
Supongamos que M se presenta como superficie de nivel de una función suave
g, es decir: sean F, G espacios de Banach y sea g : F → G una función Ck (k ≥ 2),
consideremos el subconjunto
M = {v ∈ F : g(v) = 0}.
Suponemos que para cada p ∈ M, Dgp es un epimorfismo, y el espacio tangente
Tp M se identifica con el subespacio cerrado ker Dgp ⊂ F, que a su vez se identifica
con el espacio de Banach E que modela M. Esto ocurre por ejemplo si Dgp es
un epimorfismo con núcleo que se parte para todo p ∈ M. En esta presentación,
si Φ : W ⊂ E → F es una parametrización local de M (la inversa de una carta),
se tiene g ◦ Φ = 0 con lo cual
DgΦ(x) DΦx = 0
para todo x ∈ W.
Observación 2.4.4. Dada una curva α : I → M ⊂ F, está claro que α̇(0) ∈ Tp M
cuando α(0) = p, pero en general no es cierto que α̈(0) ∈ Tp M.
Un problema similar ocurre con la diferencial de una función X : M → TM,
que en este caso concreto se puede pensar como una aplicación X : W ⊂ E → F
tal que X(x) ∈ TΦ(x) M para todo p ∈ W; hay que pensar dónde yace X∗p v para
cada v ∈ E. Estos problemas los retomaremos en la sección de derivada de Lie y
luego cuando introduzcamos el segundo fibrado tangente TTM = T (TM).
2.4.2.1.
La esfera de un espacio de Hilbert
En este texto, denotaremos con H a un espacio de Hilbert separable, a su
producto interno con h, i, y con k · k a la norma asociada. En caso de que la
dimensión de H sea finita, identificaremos H = Cn .
Para simplificar la discusión de esta sección, supongamos que H es real.
Consideremos S ⊂ H la esfera unitaria,
S = {v ∈ H : kvk2 = 1},
con lo cual S es una superficie de nivel de la función analítica H(v) = kvk2 ,
H : H → R, cuya diferencial está dada por
DHp = 2hp, ·i
32
Variedades Diferenciables
y su diferencial segunda es -constantemente- la forma bilineal simétrica
D2 Hp = 2h·, ·i.
Observemos que la diferencial primera DHp : H → R es un epimorfismo para
cada p ∈ S, y además que ker DHp = span(p)⊥ es un hiperplano cerrado, con
lo cual es un subespacio que se parte (un suplemento natural es span(p) ⊂ H).
Luego S ⊂ H es una subvariedad de codimensión 1 en H, con
Tp S = span(p)⊥
para todo p ∈ S. Estos subespacios se identifican todos, es decir, para p, q ∈ S
se tiene
E := Tp S ≃ H/span(p) ≃ Tq S ≃ H/span(q).
Si el espacio de Hilbert es complejo, la funcional que se obtiene es la parte real del
producto interno, es decir DHp = 2Rehp·, ·i, y se puede hacer un razonamiento
análogo.
2.5.
Campos
Un campo vectorial en M es una función diferenciable X : M → TM que
es una sección del fibrado en el sentido siguiente: X(p) ∈ Tp M. Resumiendo,
si π : TM → M es la aplicación al punto base, entonces un campo verifica
π ◦ X = idM .
Dado un campo cualquiera X y un punto p ∈ M, tiene sentido plantearse el
problema de hallar una curva α : (a, b) → M tal que
′
α (t) = X(α(t))
α(0) = p
.
Esta es una ecuación que se traduce usando cartas a una ecuación diferencial
ordinaria en el espacio de Banach E. Suponiendo que X es Ck con k ≥ 1 (y que
M es Ck+1 para que TM sea Ck y tenga sentido la definición para X), la ecuación
tiene, para cada p ∈ M, una solución αp : Ip → M definida en algún intervalo
maximal alrededor de 0 ∈ R.
+
+
Si ponemos Ip = (t−
= +∞ y t− = −∞,
p , tp ), donde permitimos que t
llamemos D(X) ⊂ R × M al dominio abierto
+
(t, p) tales que t−
p < t < tp .
Entonces el flujo del campo X es la función α : D(X) → M que para cada p ∈ M
da la solución de la ecuación diferencial, es decir
α(t, p) = αp (t).
2.5. Campos
33
Este flujo es una función de clase Ck (k ≥ 1) siempre que X lo sea. La prueba de
esto y de que D(X) es abierto puede verse en el Teorema 2.6 de la sección [IV,§2]
del libro de Lang [47]. También puede probarse que D(X) = R × M cuando
M es compacta, pero no vale el resultado recíproco (ver el Corolario 2.4 y la
Proposición 2.5 de [47, IV,§2]).
Si denotamos αt (q) = α(t, q), observemos que α0 = idM , luego si t es
suficientemente peqeño αt será un difeomorfismo con su imagen, pero con precaución porque el dominio de αt no es en general todo M. Con precisión, se
tiene el siguiente resultado, cuya demostración dejamos como ejercicio.
Proposición 2.5.1. Fijado p0 ∈ M, si t es suficientemente pequeño (es
decir, si t ∈ Ip0 ), entonces existe un entorno abierto U ⊂ M de p0 tal que
t ∈ Ip para todo p ∈ U, y además
αt : p 7→ α(t, p)
es un isomorfismo de U con un entorno abierto de α(t, p0 ). Además, dado
t ∈ R, si ponemos Dt (X) como el conjunto de puntos de M tales que (t, p) ∈
D(X), entonces Dt (X) es un abierto de M y
αt (Dt (X)) = D−t (X) y α−1
t = α−t ,
αt+s = αs ◦ αt donde están definidos (s, t ∈ R).
2.5.1.
Corchetes de Lie
Dada M variedad Ck+1 y X, Y : M → TM campos Ck , estos permiten definir
un nuevo campo [X, Y], de clase Ck−1 , con las siguientes propiedades:
[X, Y] = −[Y, X]
[X, [Y, Z]] + [Y, [Z, X]] + [Z, [X, Y]] = 0 (identidad de Jacobi).
El corchete [X, Y] tiene el sentido de derivada direccional de Y a lo largo de X
-o al revés, salvo un signo-. Uno estaría tentado de definir la derivada direccional
de Y a lo largo de X como
p 7→ (Y∗p )(Xp )
pero observemos que Y : M → TM, entonces Y∗p : Tp M → TY(p) TM, con lo cual
Y∗p (Xp ) no es un vector tangente en p ∈ M.
34
2.5.1.1.
Variedades Diferenciables
El corchete de Lie de campos en la esfera
Este problema que parece puramente formal, se entiende mejor cuando uno
piensa en subvariedades de un espacio de Banach. Empecemos con un ejemplo
concreto, a saber la esfera unitaria S de un espacio de Hilbert H. Un campo
S → TS lo podemos identificar claramente con una función X : S → H con la
condición adicional de que Xp ∈ Tp S para todo p ∈ S, es decir
hXp , pi = 0
para todo p ∈ S. Si componemos con una carta Φ : W ⊂ E → H, donde E ≃ H/R
es el espacio de Hilbert que modela S, tenemos la identidad
hXΦ(x) , Φ(x)i = 0
para todo x ∈ W. Supondremos sin pérdida de generalidad que 0 ∈ W, Φ(0) =
p ∈ S. Tomemos una curva β ⊂ W tal que β(0) = 0 de manera de obtener una
curva α = Φ ◦ β ⊂ S que pasa por p, y reemplazando x por β, derivamos en
t = 0 para obtener (suponiendo que α̇(0) = v ∈ Tp S)
hDXp v, pi + hXp , vi = 0.
(2.1)
En particular, si tomamos v = Xp ∈ Tp S, se deduce que
hDXp Xp , pi = −kXp k2 .
¡Pero entonces, si suponemos que DXp Xp ∈ Tp S = span(p)⊥ , obtenemos que
Xp = 0! Es decir que X∗p Xp no es en general un elemento en Tp M y por eso no
tiene sentido pensarlo como derivada direccional.
Para aclarar un poco más lo que acabamos de decir, volvamos a la relación
(2.1), y ahora consideremos otro campo cualquiera Y : S → TS. ¿Qué tiene que
ocurrir para que
X∗p (Yp ) = DXp (Yp )
sea un elemento en Tp S? Reemplazando v por Yp obtenemos
hXp , Yp i = −hDXp Yp , pi = 0
con lo cual Xp debe ser ortogonal a Yp que es el caso trivial que no tiene ningún
interés. Es decir que en general X∗p (Yp ) no es un elemento de Tp M.
Pero las cuentas que acabamos de hacer nos dan una pista: observemos la
simetría de la ecuación
hXp , Yp i + hDXp Yp , pi = 0.
2.5. Campos
35
Si intercambiamos Xp por Yp y restamos (ahora sólo suponemos que X, Y son
campos en S), se cancelan los productos escalares y obtenemos
hDYp Xp − DXp Yp , pi = 0,
relación que nos dice que el vector
DYp Xp − DXp Yp
si es un vector tangente a la esfera en p. Esto nos permite obtener un campo
[X, Y] : S → TS a partir de dos campos cualesquiera, que definiremos como
[X, Y](p) := DYp Xp − DXp Yp
para p ∈ S.
2.5.1.2.
El corchete de Lie en superficies de nivel
El hecho de que DYp Xp − DXp Yp ∈ Tp S para cada p ∈ S no es fortuito, es
decir, no guarda relación con la estructura de la esfera. Por ejemplo, si
M = {v ∈ F : H(v) = 0}
es la superficie de nivel de una función H : F → G suficientemente regular,
dijimos que Tp M se identifica con ker DHp para p ∈ M. Luego si X : M → TM
es un campo, lo podemos identificar con una función X : M → F con la condición
adicional de que
DHp (Xp ) = 0
para todo p ∈ M. Supongamos que p ⊂ M es una curva con p0 = p y ṗ0 = v ∈
Tp M. Diferenciando esta relación obtenemos
D2 Hp (v, Xp ) + DHp (DXp v) = 0.
Dado otro campo cualquiera Y, como Yp ∈ Tp M podemos reemplazar para obtener
D2 Hp (Yp , Xp ) + DHp (DXp Yp ) = 0
(2.2)
para todo p ∈ M. Pero si suponemos que DXp Yp ∈ Tp M, entonces el segundo
término se anula con lo cual debe guardarse la relación particular
D2 Hp (Xp , Yp ) = 0
que como vimos en el ejemplo anterior es arbitraria, con lo cual DXp Yp no es un
elemento de Tp M en general. Sin embargo, apelando nuevamente a la simetría
36
Variedades Diferenciables
-y como D2 Hp es simétrica si existe-, intercambiando X con Y en la ecuación
(2.2) y restando, se obtiene
DHp (DYp Xp − DXp Yp ) = 0
lo que nos indica que
[X, Y](p) := DYp Xp − DXp Yp ∈ Tp M.
2.5.1.3.
Derivada de Lie
Volviendo al caso general, la expresión recién computada nos da la definición
de [X, Y]: se construye [X, Y] por medio de una carta, y en una representación
local (U, ϕ), si denotamos Y(p) = Yp , X(p) = Xp , se define
[X, Y](p) = DYp (Xp ) − DXp (Yp ),
donde se debe entender que X, Y ahora representan los campos compuestos con
la carta para pensarlos a valores en E.
El corchete [X, Y] también se suele denotar LX Y, conocido como derivada de
Lie de Y en la dirección de X. El nombre tiene la siguiente interpretación: si αX
t
denota el flujo del campo X de clase Ck , entonces observemos que fijado p ∈ M,
αt : U → V es un difeomorfismo para t suficientemente pequeño y U, V abiertos
de M con U entorno de p. En consecuencia (α−t )∗q : Tq M → Tα(−t,q) M es de
clase Ck−1 y tiene sentido calcular
g(t) = (α−t )∗ Y(αt (p)) ∈ Tp U
para t suficientemente pequeño. Esto es, evaluamos Y a lo largo de las trayectorias
del campo X, luego lo traemos hacia atrás para que vuelva a ser un vector de
Tp U. Observemos que g(0) = Yp = Y(p), y que por construcción para t pequeño
g(t) ∈ Tp M. Su derivada en t = 0 (que corresponde a pasar por el punto p con
las trayectorias del campo X) será entonces un vector de Tp M, que denotaremos
así:
d LX Y(p) =
(α−t )∗ Y(αt (p)).
dt t=0
Como adelantamos, LX Y coincide con [X, Y]. Para verlo, hay que componer
con una carta cualquiera, y observar que se trata de una identidad lineal del tipo
g(t) = A(t)v(t)
donde A(t) es un operador lineal para cada t fijo, y v(t) es un vector para cada t
fijo, en el dominio de A(t). En consecuencia, se debe usar la regla del producto
para derivar:
(Av) ′ = A ′ v + Av ′ .
2.5. Campos
37
Ahora α(s, q) es una función de dos variables, y (α−t )∗ indica la diferencial respecto de la segunda variable. Estamos suponiendo que las funciones son (por lo
menos) C2 , así que al derivar respecto de la primera variable podemos intercambiar el orden. Recordemos que
d
αs (q) = Xα(s,q)
ds
por ser el flujo de X, en particular
d (α−t )(q) = −Xq .
dt t=0
Luego, como A(t) = (α−t )∗αt (p) , se tiene A ′ (0) = −X∗p . Obtenemos
d g = −DXp (Yp ) + DYp (Xp )
dt t=0
que es exactamente [X, Y](p). Ojo que esta notación tiene sentido sólo en una
carta pues ninguno de los dos sumandos (como campos de M y sus diferenciales)
es un elemento de Tp M.
Observación 2.5.2. Además de representar una derivada direccional, el corchete
de Lie de dos campos es una medida de conmutación, como tal vez puede apreciarse en la última presentación usando flujos. De hecho, hay varios resultados
en esta dirección, mencionamos algunos. Sean X, Y campos en M; ahora α, β
denotan los respectivos flujos.
Si [X, Y] = 0, entonces los flujos conmutan, es decir αt ◦ βs = βs ◦ αt . Más
precisamente
α(t, β(s, p)) = β(s, α(t, p))
en el sentido siguiente: donde existe una expresión, existe la otra y son
iguales.
Si G es un grupo de Lie conexo y [X, Y] = 0 para todo X, Y campos invariantes a izquierda entonces G es un grupo conmutativo (ver el próximo
capítulo sobre grupos de Lie-Banach).
(Frobenius) Si E ⊂ TM es un subfibrado, entonces E es integrable -es
decir, existe una subvariedad inmersa N ⊂ M tal que TN = E- si y sólo
si [X, Y] ∈ E para todo par de campos X, Y ∈ E. La topología de N puede
ser más fina de la de M, como puede observarse en nuestro inseparable
ejemplo de la curva densa en el toro. Ver el Capítulo VI del libro de Lang
[47] para una prueba del teorema.
Observemos que el teorema de Frobenius es una generalización a dimensiones
mayores del teorema de existencia de curvas integrales.
38
Variedades Diferenciables
2.5.1.4.
Derivaciones
Es correcto -y útil- pensar que todo campo X : M → TM define una derivación
Ck (M) → Ck−1 (M) de la siguiente manera: si f ∈ Ck (M) -es decir, si f : M → R
es Ck -, ponemos
(Xf)(p) = pr2 ◦ f∗p (X(p)) ∈ R
puesto que Tf(p) R = R × R y la proyección a la segunda coordenada es la diferencial usual -en una carta de M- de la función f. Es decir, pasando a una carta
Xf(p) es simplemente la derivada direccional de f en el punto p en la dirección
del vector Xp ,
(Xf)(p) = Dfp (Xp ).
Que esto manda funciones Ck en Ck−1 es evidente, la linealidad y la propiedad de derivación
X(fg) = X(f)g + fX(g)
se deducen pasando por una carta. Una propiedad fundamental de esta acción
es la siguiente: si U ⊂ M es abierto y X : U → TU es campo Ck con X 6= 0
(donde por 0 entendemos la sección nula en TM), entonces existe f ∈ Ck (U) tal
que X(f) 6= 0. Para verlo, también hay que pasar por una carta y usar el teorema
de Hahn-Banach. Los detalles pueden verse en [V,§1] del libro de Lang [47].
Se deduce de esta propiedad que un campo queda definido si se lo piensa
como derivación. Luego definimos, dados X, Y campos, la derivación
[X, Y]f = X(Y(f)) − Y(X(f))
que define en consecuencia al campo [X, Y], y esta definición coincide con la
anterior. Las propiedades de derivación se pueden escribir de la siguiente manera.
Supongamos que f, g : M → R son funciones y X, Y : M → TM son campos.
Entonces
LX f = Xf.
LX (fg) = LX (f)g + fLX (g).
LX (fY) = LX (f)Y + fLX (Y).
LX ([Y, Z]) = LY ([X, Z]) + LZ ([Y, X]).
La última es simplemente una reescritura de la identidad de Jacobi.
2.A. Problemas
2.5.2.
39
Campos f-relacionados
Sean f : M → N diferenciable, X : M → TM, Y : N → TN campos. Supongamos que para cada p ∈ M, se tiene
f∗p (X(p)) = Y(f(p)).
En ese caso diremos que X, Y están f-relacionados y lo anotamos Y = f∗ X. Si f
es un difeomorfismo y X es un campo en M, entonces podemos definir
f∗ X := f∗ ◦ X ◦ f−1
que resulta un campo en N, y de hecho X, f∗ X están f-relacionados. No es difícil
probar que, si X1 , X2 son campos en M, Y1 , Y2 son campos en N, y además Xi , Yi
están f-relacionados (i = 1, 2), entonces [X1 , X2 ] está f-relacionado con [Y1 , Y2 ],
y de hecho
f∗ [X1 , X2 ] = [f∗ X1 , f∗ X2 ].
2.A.
Problemas
2.I. Probar que si α es irracional, entonces la imagen W de
µ(t) = (eiπt , eiαπt ) ⊂ S1 × S1
es densa en el toro S1 × S1 . Elegir una base conveniente de la topología del toro y
calcular la intersección entre W y un elemento cualquiera de la base para probar
que esta intersección tiene infinitas componentes conexas.
2.II. Probar el criterio para subvariedades de la Proposición 2.4.2.
2.III. Probar que si H es un espacio de Hilbert, entonces H es difeomorfo (con
un difeomorfismo de clase C∞ ) a la bola unitaria
B = {v ∈ H : kvk < 1}.
Sugerencia: considere g(x) = x(1 − kxk2 )−
1/2
.
¿Es esta aplicación analítica?
2.IV. Sean X, Y : M → TM campos y α, β sus respectivos flujos. Probar que si
[X, Y] = 0, entonces los flujos conmutan,
α(t, β(s, p)) = β(s, α(t, p))
en el siguiente sentido: donde existe una expresión existe la otra y son iguales.
2.V. Si f, g, h ∈ Ck (M) y X, Y, Z : M → TM son campos de clase C1 , probar que
40
Variedades Diferenciables
X(fg) = X(f)g + fX(g)
[X, fY] = X(f)Y + f[X, Y]
[X, [Y, Z]] = [Y, [X, Z]] + [Z, [Y, X]].
donde X(h)(p) = pr2 ◦ h∗p (X(p)) para h ∈ Ck (M) y p ∈ M.
2.VI. Probar la Proposición 2.5.1.
2.VII. Si f : M → N es un difeomorfismo y f∗ X := f∗ ◦ X ◦ f−1 , probar que
X : M → TM y f∗ X : N → TN están f-relacionados. Si Xi , Yi (i = 1, . . . , 2) están
f-relacionados, con Xi : M → TM e Yi : N → TN, probar que
f∗ [X1 , X2 ] = [f∗ X1 , f∗ X2 ]
y concluir que [X1 , X2 ] está f-relacionado con [Y1 , Y2 ].
2.VIII. Sea f : M → N una inmersión inyectiva. Si Y : N → TN es un campo
tal que Yf(x) ∈ ran(f∗x ) para todo x ∈ M, probar que existe un único campo
X : M → TM tal que f∗ X = Y.
Capítulo
Grupos de Lie
Ojalá supiera cómo hacer que los
matemáticos se interesen en los grupos de
transformaciones y sus aplicaciones a las
ecuaciones differenciales. Estoy seguro,
absolutamente seguro, de que estas
teorías serán, en algún momento futuro,
reconocidas como fundamentales.
Sophus Lie, en una carta dirigida a
Adolf Mayer
D
efinimos un grupo de Lie-Banach G como una variedad diferenciable
tal que las operaciones producto e inversa son diferenciables; esto se
puede resumir diciendo que la función (g, h) 7→ gh−1 es diferenciable
como función de G × G en G. Pidiendo que el producto sea Ck , se puede deducir
que la inversión es Ck , ver el problema 3.ii de este capítulo.
3.1.
Teoría general
Usaremos Lg : G → G, Rg : G → G, Adg : G → G para denotar los isomorfismos
Lg : h 7→ gh,
Rg : h 7→ hg,
Adg : h 7→ ghg−1 .
A las diferenciales de estas aplicaciones las denotamos con las mismas letras,
Lg , Rg , Adg : TG → TG, en general del contexto se desprende de cuál de las funciones hablamos. Observemos que por la regla de la cadena, para las diferenciales
41
3
42
Grupos de Lie
se verifica
Lhg = Lh Lg ,
3.1.1.
Rhg = Rg Rh .
Campos invariantes
Si e = 1 es la identidad del gupo G, y v ∈ Te G, consideremos dado (g, v) ∈
G × Te G la función
(g, v) 7→ Lg v =: Xv (g)
que de hecho define un campo en G. Este campo tiene la siguiente propiedad:
Lh Xv (g) = Lhg Xv (e) = Xv (hg),
es decir Lh Xv = Xv Lh para todo h ∈ G. Un campo con esta propiedad es un
campo invariante a izquierda en G, y el conjunto de los campos invariantes a
izquierda se identifica con Te G mediante la construcción recién mencionada y
su inversa, la cual está dada, para cualquier campo X : G → TG invariante a
izquierda, por
X 7→ X(e).
Proposición 3.1.1. Si X, Y : G → TG son campos invariantes a izquierda,
entonces el campo [X, Y] : G → TG también es invariante a izquierda.
Demostración. Simplemente hay que observar que Lg , por ser la diferencial
de una aplicación de G en G que es de hecho un isomorfismo, pasa dentro del
corchete de Lie (es decir X, Lg X están Lg -relacionados, y lo mismo ocurre con
Y), luego
Lg [X, Y] = [Lg X, Lg Y] = [X, Y].
El álgebra de Lie-Banach g del grupo de Lie-Banach G es el espacio tangente Te G en la identidad provisto de la estructura de Lie dada por los campos
invariantes a izquierda, esto es, si v, w ∈ Te G ≃ E, entonces
[v, w] := [Xv , Xw ](e).
En general, se puede definir un álgebra de Lie-Banach g como un espacio de
Banach (real o complejo), provisto de un operador denominado corchete, [ , ] :
g × g → g que es bilineal, antisimétrico y verifica la identidad de Jacobi para
todo x, y, z ∈ g
[x, [y, z]] + [y, [z, x]] + [z, [x, y]] = 0,
propiedad que se puede recordar teniendo en cuenta que un término se obtiene
del anterior desplazando los elementos a la izquierda, de manera cícilica.
3.1. Teoría general
3.1.2.
43
Grupos a un parámetro y exponencial
Si αv (s, g) denota el flujo del campo invariante a izquierda Xv (con v ∈ g),
ponemos φv : Iv → G la función φv (t) = αv (t, e), donde Iv es el intervalo
maximal donde está definida la curva αv (s, e). No es difícil ver que φv es un
homomorfismo de Iv en G, es decir, si s, t, s + t ∈ Iv , entonces
φv (s + t) = φv (s)φv (t) = φv (t)φv (s).
Para probarlo, basta ver que, por ejemplo µt (s) = φv (s)φv (t) es solución de la
ecuación diferencial
d
µt (s) = Xv (µt (s)),
ds
lo cual es sencillo usando la definición de todos los objetos (Problema 3.v). Con
esto, se tiene que φv en realidad está definido en todo R, pues se puede extender
al intervalo nIv (n ∈ N) poniendo
φv (t) = φv (t/n)n
para t/n ∈ Iv . Estas curvas son conocidas como grupos a un parámetro en G;
observemos que φv (0) = e mientras que φ˙v (0) = v ∈ Te G = g. De aquí en más
las denotaremos φv (t) = etv por obvios motivos.
Con un razonamiento similar, cambiando e por g ∈ G, tenemos las curvas a
un parámetro definidas en todo R dadas por
µg,v : t 7→ gφv (t) = getv
que verifican µg,v (0) = g, µ̇g,v (0) = Lg v ∈ Tg G ≃ Lg Te G.
¿Qué ocurre si tomamos campos invariantes a derecha, es decir
XR
v (g) := Rg v = vg
para v ∈ Te G y g ∈ G? Podemos volver a considerar el problema del flujo de
estos campos, y es bastante evidente que las soluciones ahora serán las curvas
etv g pues verifican la ecuación correspondiente. En particular los grupos por
la identidad son soluciones de la ecuación del campo invariante a izquierda y a
derecha -siempre que sea el campo inducido por el mismo v ∈ Te G.
3.1.2.1.
La exponencial del grupo
Definimos la exponencial del grupo de Lie G como la aplicación exp : g → G
que asigna
v 7→ e1v .
44
Grupos de Lie
Observemos que exp(tv) = etv es el grupo a un parámetro, solución de la ecuación diferencial
′
α = Xv (α)
α(0) = e .
También observemos que, como el flujo de los campos invariantes es suave, la
función exp es diferenciable. Además, como
exp∗0 (v) = (etv )˙ = Xv (e) = v,
se deduce que exp∗0 es la identidad de g. Asumiendo que G es un grupo de clase
de C1 por lo menos, se deduce que para algún entorno abierto V de 0 ∈ g , la
restricción
exp |V : V ⊂ g → exp(V) ⊂ G
es un difeomorfismo y por lo tanto sirve como carta local. Luego g exp(g) es una
carta local alrededor de g ∈ G, y de esta manera se arma un atlas canónico para
G.
3.1.3.
La representación adjunta y morfismos
Dados v, w ∈ g, si tomamos Xv , Xw los correspondientes campos invariantes
a izquierda y etv , etw los respectivos grupos a un parámetro por la identidad de
G, podemos calcular
g : t 7→ Adetv (w) = etv we−tv
donde con un abuso de notación Ad denota la derivada de Ad en el grupo.
Observemos que g es una función a valores en g = Te G para todo t ∈ R. Luego
su derivada en t = 0 será un elemento de g, y no es difícil ver que ġ(0) = [v, w]
(Ejercicio 3.vi).
Dado un espacio de Banach E, denotaremos con GL(E) ⊂ B(E) a los operadores inversibles de E en E. Llamamos entonces Ad : G → GL(g) a la aplicación
g 7→ Adg . Denotamos ad : g → B(g) a su derivada en g = 1. Entonces como
g(t) = (Ad(φv (t))(w),
derivando en t = 0 obtenemos por definición
adv (w) = [v, w] = [Xv , Xw ](1) = LXv Xw (1).
Entonces adv : g → g se interpreta como derivada direccional en la dirección del
vector v.
3.1. Teoría general
3.1.3.1.
45
Homomorfismos y la naturalidad de exp
Dados dos grupos de Lie-Banach G, K, y una aplicación diferenciable f : G →
K, diremos que f es un homomorfismo si f es un morfismo de grupos.
Observación 3.1.2. Supongamos que v ∈ g y que t 7→ etv es su flujo por la
identidad. Entonces
t 7→ f(etv )
es el flujo por la identidad del campo invariante a izquierda Xv ′ en K, donde
v ′ = f∗1 (v) ∈ k = Te K. En efecto, es un homomorfismo en K con lo cual es el
flujo de un campo invariante a izquierda, y verifica
d tv
tv f(e ) = f∗etv (Xv (e ))
= v ′.
dt t=0
t=0
′
Luego f(etv ) = etv , donde ahora la exponencial es la del grupo K.
Notar que si v, w ∈ g entonces
f(etv esw e−tv ) = f(etv )f(esw )f(etv )−1 .
(3.1)
Notemos que si x es una curva en K, tal que xx−1 = e entonces derivando (en
una carta) se tiene
ẋx−1 + x(x−1 )˙ = 0,
luego
(x−1 )˙ = −x−1 ẋx−1 .
En particular si x(0) = e se tiene en t = 0 que
d
|t=0 x−1 = −ẋ.
dt
Derivando primero respecto de t y luego respecto de s en s = t = 0, de (3.1) se
deduce
f∗1 ([v, w]) = [f∗1 v, f∗1 w].
Es decir que f∗1 : g → k es un morfismo de álgebras de Lie.
Denotemos con expG , expK las respectivas exponenciales de los grupos G, K,
y con g, k denotemos las respectivas álgebras de Lie-Banach. Puesto que el morfismo f manda grupos a un parámetro en grupos a un parámetro, según vimos
en la Observación 3.1.2, se tiene que el siguiente diagrama
f∗1
g
expG
G
f
/k
expK
/K
46
Grupos de Lie
es conmutativo, es decir expK ◦f∗1 = f ◦ expG . Esta propiedad nos dice que
la exponencial de grupos se comporta bien con los morfismos, y es entonces
un mapa natural. Luego esta propiedad se conoce como la naturalidad de la
exponencial en grupos de Lie.
3.2.
Subgrupos de Lie-Banach
Un subgrupo de Lie-Banach es un subgrupo que es también subvariedad. Nuevamente hay que considerar distintos tipos: subvariedades inmersas (el tangente
es un subespacio cerrado), embebidas (tienen la topología de subespacio pero
no necesariamente se parte el tangente), embebidas-partidas (regulares). Todo
subgrupo de Lie (embebido) K ⊂ G es topológicamente cerrado en G, pues es localmente cerrado por ser subvariedad (Ejercicio 3.vii). Reservaremos el nombre
subgrupo de Lie-Banach a aquellos subgrupos que sean subvariedades embebidas, es decir, a aquellos subgrupos que sean variedades diferenciables cuya
topología coincida con la heredada. También denominaremos subgrupo analítico a aquel subgrupo que siendo variedad diferenciable, tenga una topología más
fina o igual que la heredada.
Una exposición detallada sobre subgrupos para el caso particular en que el
grupo de Lie G es el grupo general lineal, o uno de sus subgrupos, puede hallarse
en la Sección 4.2 del próximo capítulo. Exponemos brevemente a continuación
los resultados que valen en el contexto más general, con referencias bibliográficas
concretas para el lector, y con una recomendación: antes de ir a las pruebas
generales, explorar primero la sección mencionada del próximo capítulo, ya que
las ideas centrales de las pruebas que omitimos de estos resultados, están todas
presentas en las pruebas que si desarrollamos para el grupo lineal.
En general, si H ⊂ G es un subgrupo topológico de un grupo de Lie-Banach
G, cerrado para la topología de subespacio, entonces si expG : g → G denota la
exponencial de G, podemos poner
h := {v ∈ g : expG (Rv) ⊂ H}.
Este resulta un subespacio cerrado de g. Pero no es difícil ver que se trata de
hecho de un álgebra de Lie-Banach, la demostración para el grupo lineal se halla
en el Corolario 4.2.1, y la demostración general (que es esencialmente la misma)
se halla en el libro de Daniel Beltiţǎ [57, Lemma IV.3.1]. Por restricción se tiene
una aplicación exponencial
expH : h → H.
Una consecuencia del Teorema de Frobenius (ver la Observación 2.5.2) es que
esta subálgebra es integrable, en el sentido siguiente: el grupo generado por las
3.2. Subgrupos de Lie-Banach
47
exponenciales de elementos de h, es decir
He = hexpG (h) : h ∈ hi,
tiene una estructura de grupo de Lie-Banach en la que h es su álgebra de
Lie-Banach y la exponencial del grupo He está dada por la restricción de la
exponencial de G según se explicó recién. La prueba de este resultado puede verse
por ejemplo en [VI,§5, Teorema 5.4] del libro de Lang, [47], aunque la prueba
del caso particular de un subgrupo del grupo lineal que damos en la Sección 4.2
del próximo capítulo contiene la mayor parte de las ideas de la prueba general
(Teorema 4.2.2).
La inclusión He ⊂ G es una subvariedad inmersa en el sentido de que la
inclusion es diferenciable y la diferencial de la inclusión es inyectiva y de rango
cerrado, y permite dar a H una estructura diferenciable que hace de éste un
grupo de Lie-Banach de manera que He es la componente conexa de la identidad
de H. En el caso finito dimensional, He es una subvariedad embebida de G y
entonces la topología inducida por la estructura de variedad que se le dio a H,
coincide con la topología original de éste. En el contexto de dimensión infinita,
no es difícil dar un ejemplo de un subgrupo topológico cerrado H de un grupo de
Lie-Banach G, cuya estructura diferenciable inducida por la construcción recién
mencionada le da una topología que no coincide con la topología original de H
como subespacio topológico de G (ver el Ejemplo 4.2.3 en el próximo capítulo).
Si comenzamos con una subálgebra de Lie (y no con un subgrupo cerrado),
la construcción recién mencionada del grupo generado por las exponenciales de
elementos de la subálgebra se puede hacer sin inconvenientes, pero cabe destacar
que en general He no resultará subvariedad regular (ni embebida) de G, ni
siquiera en dimensión finita. Un ejemplo sencillo de esta afirmación, se obtiene
considerando el ejemplo ya mentado
K ⊂ T = S1 × S1
donde K es el grupo de Lie que integra la subálgebra de Lie generada por el
elemento (π, πa), y a ∈ R es un número irracional a elección del lector. Este
subgrupo K resulta una curva densa en el toro, y por lo tanto no puede ser
subgrupo de Lie con la topología de subespacio.
El que sigue es un resultado que caracteriza los subgrupos de Lie.
Teorema 3.2.1. Sea H ⊂ G un subgrupo cerrado y h ⊂ g las respectivas
álgebras de Lie-Banach. Supongamos que existe un entorno U abierto de
0 ∈ g suficientemente pequeño tal que
exp(U ∩ h) = exp(U) ∩ H.
48
Grupos de Lie
Entonces H tiene una única estructura de variedad diferenciable que lo hace
subgrupo embebido de Lie-Banach de G.
Demostración. Como exp∗0 = idg , existe un entorno V del 0 ∈ g de manera que
exp |V : g → G es un difeomorfismo. La frase suficientemente pequeño quiere
decir que U ⊂ V. La idea de la prueba es la siguiente: hay una inclusión
exp(U ∩ h) ⊂ exp(U) ∩ H
que es trivial. En el caso en el que se cumpla la inclusión no trivial, lo que
obtuvimos es un cierto entorno abierto de e ∈ H -el conjunto exp(U ∩ h)- que
se obtiene como intersección del abierto exp(U) de G con el subgrupo H. Esto
permite utilizar la exponencial como carta de H en un entorno de e, para obtener
una subvariedad embebida. Esta carta se traslada a todo el grupo H usando los
difeomorfismos de G dados por {Lh }h∈H . Los detalles de la prueba quedan como
ejercicio (Ejercicio 3.viii).
3.3.
Espacios homogéneos
Dado un grupo de Lie-Banach G y un espacio X, supongamos que tenemos
una acción I : g → Ig de G en X, es decir, un aplicación I : G → Aut(X) que es
un homomorfismo en el sentido que
Ih (Ig (x)) = Ihg (x).
En particular Ie = idX . Si X es una variedad diferenciable, suponemos que
Ig es un difeomorfismo de X para todo g ∈ G. Denotamos al conjunto de los
difeomorfismos de X con Diff(X).
Supongamos que la acción de G es transitiva, es decir, si G·x = IG (x) = O(x)
denota la órbita de un x ∈ X cualquiera, entonces G ·x = X. En este caso diremos
que X es un espacio homogéneo de G.
La isotropía de x ∈ X es el conjunto
Hx = {g ∈ G : g · x = x},
esto es, la fibra de x en G por la acción. Es fácil ver que este es un subgrupo
cerrado de G, puesto que puede pensarse como la fibra de la aplicación πx : G →
X dada por πx (g) = g · x. Cabe plantearse si Hx es una subvariedad de G, es
decir si Hx ⊂ G es un subgrupo de Lie-Banach. Ciertamente O(x) ≃ G/Hx como
conjuntos, donde la proyección al cociente q : G → G/Hx se identifica con la
proyección πx : G → O(x), y también
Hg·x = gHx g−1 .
3.3. Espacios homogéneos
49
Otra manera de denotar una acción es la siguiente: tomamos el espacio X y
una función
π:G×X→X
que se denota π(g, x) = g · x ∈ X. De acuerdo a nuestra notación anterior,
πx = π(·, x), mientras que Ig = π(g, ·). Observemos que, como
Ig ◦ πx = πx ◦ Lg
para todo x ∈ X, g ∈ G, se verifica
(Ig )∗x ◦ (πx )∗e = (πx )∗g ◦ Lg .
(3.2)
Ahora Ig es un difeomorfismo de G y como tal (Ig )∗ es un isomorfismo, luego
(πx )∗g = (Ig )∗x ◦ (πx )∗e ◦ Lg−1 ,
lo que prueba que el comportamiento de las derivadas de πx es el mismo (independiente de g ∈ G).
Observación 3.3.1. Si (πx )∗e es un epimorfismo directo, entonces lo mismo vale
para (πx )∗g para todo g ∈ G, de lo que resulta que πx es una sumersión, y de
allí que, como Hx = π−1
x (x), resulte Hx subvariedad de G por el teorema de la
función implícita, Teorema 2.4.1.
Teorema 3.3.2. Sea G un grupo de Lie-Banach y H ⊂ G un subgrupo de
Lie-Banach regular (partido). Entonces existe una única estructura diferenciable en G/H que hace del mapa cociente q : G → G/H una sumersión
(diferenciable, epimorfismo y con núcleo que se parte).
Demostración. Ver el libro de D. Beltiţǎ [17, Teorema 4.19], o las notas de
Variedades Diferenciables de Angel Larotonda [48, Proposición 5.6, pág. 83].
Un corolario del teorema de la función implícita sin suplementos debido a
An y Neeb [3, Cor. 4.3] es el siguiente:
Teorema 3.3.3. Sea G un grupo de Lie-Banach y H ⊂ G un subgrupo
cerrado. Supongamos que G/H tiene estructura de variedad de Banach, y
supongamos que el mapa cociente q : G → G/H es diferenciable y que,
en algún punto g0 ∈ G, q tiene diferencial suryectiva. Entonces H es un
subgrupo de Lie-Banach embebido de G.
La recíproca de este enunciado es una conjetura que por ahora no está resuelta
(claro que si q se parte entonces estamos en la situación del Teorema 3.3.2). Sin
embargo, si H es un subgrupo normal de G, entonces sí vale la recíproca, la
prueba puede verse en un trabajo de H. Glockner y K.-H. Neeb [35].
50
3.3.1.
Grupos de Lie
Órbitas
Otro problema relacionado con el anterior es el siguiente: supongamos que
G es un grupo de Lie-Banach y que M es una variedad diferenciable y que hay
una acción suave I : G → Diff(M). Si la acción no es transitiva, dado x ∈ M
la órbita O(x) ⊂ M es un subconjunto propio. Cabe preguntarse si O(x) tiene
estructura de variedad diferenciable y si O(x) ⊂ M es una subvariedad -inmersa,
embebida- de M.
Observación 3.3.4. Recordemos que un mapa cociente es una función continua
y sobreyectiva q : A → B entre espacios topológicos tal que, si U ⊂ B es tal que
q−1 (U) ⊂ A es abierto, entonces U era abierto.
Dada f : A → B sobreyectiva y continua, una función continua s : B → A
es una sección si f ◦ s = idB . En caso de existir una sección continua, f resulta
un mapa cociente pues si U ⊂ B es tal que f−1 (U) ⊂ A es abierto, entonces
U = s−1 f−1 (U) es abierto.
Si f : A → B es continua, suryectiva y abierta (o cerrada) es fácil ver que f
es un mapa cociente, pero la recíproca no es cierta. Por ejemplo si
A = {(x, y) : x ≥ 0, y ∈ R} ∪ {(x, y) : x ≤ 0, y = 0}
y q = π1 |A : A → R, entonces es fácil ver que q es una proyección porque tiene
una sección continua dada por s(x) = (x, 0). Sin embargo q no es abierta pues si
V = {(x, y) : x ≥ 0, y > 0},
entonces V ⊂ A es abierto pero q(V) = [0, ∞) ⊂ R no es abierto.
Sin embargo si f : A → B es de clase Ck y tiene una sección s : B → A
de clase Ck (k ≥ 1), entonces f∗ es sobreyectiva y su núcleo se parte. Luego el
teorema de la función implícita (Teorema 1.5.5) nos dice que f es una proyección
y en particular es abierta. Los detalles están en el siguiente teorema.
Teorema 3.3.5. Sea π : G × M → M una acción suave, a ∈ M, O = O(a) ⊂
M la órbita de a por la acción. Si denotamos π = πa : g 7→ g·a, supongamos
que existe un abierto U ⊂ M entorno de a y una sección suave s : U → G
tal que
π ◦ s = idU , s(a) = 1.
Entonces O ⊂ M es una subvariedad abierta de M, ran(s∗ ) ⊂ g es un
espacio de Banach tal que
ran(s∗ ) ⊕ ker(π∗ ) = g,
3.3. Espacios homogéneos
51
y Ka = {g ∈ G : g · a = a} es subgrupo de Lie-Banach regular con álgebra
de Lie-Banach k = ker(π∗ ). Además π : G → O es una proyección y en
particular abierta.
Demostración. Si existe una tal sección, entonces
U = π ◦ s(U) ⊂ O ∩ U ⊂ U
con lo cual U = O ∩ U es abierto. Dado x = g · a = πa (g) ∈ O, consideramos el
conjunto
Ux = Ig (U) = {g · p : p ∈ U} ⊂ M
que es un entorno abierto de x ∈ M, y la sección sx : Ux → gVg−1 ⊂ G dada por
sx (g · p) = gs(p)g−1 . Entonces sx es suave, sx (x) = sx (g · a) = gs(a)g−1 = 1 y
πx ◦ sx (g · p) = gs(p)g−1 g · a = g · (s(p) · a) = g · p
para todo p ∈ U, es decir πx ◦ sx = idUx . Este argumento nos dice que O
es abierto en M. Ahora ran(s∗ ) ⊂ g es un subespacio cerrado pues, si vn =
s∗ (yn ) → v ∈ g (con yn ∈ Ta M) entonces
s∗ π∗ (v) = lı́m s∗ π∗ (vn ) = lı́m s∗ (yn ) = v
lo que prueba que v ∈ ran(s∗ ). Por otra parte dado w ∈ g tomamos h =
s∗ π∗ (w) ∈ ran(s∗ ) y descomponemos w = w − h + h con w − h ∈ ker(π∗ ). La
suma es directa pues si w ∈ ran(s∗ ) ∩ ker(π∗ ) entonces w = s∗ z para algún
z ∈ Ta M pero
z = π ∗ s∗ z = π ∗ w = 0
lo que nos dice que w = 0. En consecuencia el grupo de isotropía Ka = π−1 (a)
es una subvariedad regular de G por el teorema de la función implícita (Observación 3.3.1). Por último, como π∗ es sobreyectiva y su núcleo se parte, π es una
proyección por el teorema de la función implícita (Teorema 1.5.5).
El siguiente lema, originalmente debido a Ian Raeburn [61], es un criterio útil
para ver si la órbita O(x) ⊂ M es subvariedad.
Lema 3.3.6. Sea G un grupo de Lie-Banach, con una acción diferenciable
π : G → B(X) en un espacio de Banach X. Fijado x ∈ X, denotamos πx :
G → X la función diferenciable
πx (g) = g · x := π(g)(x).
Sea O(x) = {g · x : g ∈ G} ⊂ X la órbita de x con la topología heredada.
Supongamos que
52
Grupos de Lie
1. πx : G → O(x) es abierta.
2. La diferencial (πx )∗e : g → X parte al espacio, tanto el núcleo como el
rango.
Entonces O(x) ⊂ X es una subvariedad regular (partida) de X, y la función
πx : G → O(x) es una sumersión.
Demostración. Sea k = ker(πx )∗e . Se tiene por hipótesis que g = m ⊕ k para
algún subespacio cerrado m ⊂ g. Consideramos la aplicación Θ : (v, w) 7→ ev ew
con v ∈ m, w ∈ k que transforma un entorno U de 0 ∈ g en un entorno U ′ de
e ∈ G (Ejercicio 3.ix). Para z ∈ g, ahora consideramos ψ(z) = Θ(z) · x que es
diferenciable, ψ : U → X y toma valores en O. Como etw · x = πx (etw ), se tiene
por la ecuación (3.2)
d tw e · x
= (πx )∗etw ◦ Letw (w) = (Ietw )∗x ◦ (πx )∗1 (w) = 0
dt
t=0
para w ∈ k, con lo cual ew · x = x para todo w ∈ k, luego ψ(v, w) = ψ(v, 0).
Si llamamos J = ψ(U ∩ m) = Θ(U), se tiene x ∈ J ⊂ O y como J = πx (U ′ ) es
la imagen de un entorno abierto de e ∈ G, se tiene que J es abierto en O. Esto
prueba que O es un variedad diferenciable y un espacio homogéneo para G, pues
trasladando con la acción a izquierda del grupo se obtiene un resultado similar
para cualquier x ′ ∈ O. Si X = ran(πx )∗e ⊕ S con S ⊂ X subespacio cerrado,
consideramos la aplicación Ψ : m ⊕ S → X dada por (v, s) 7→ ψ(v) + s. Se tiene
Ψ∗0 (v, s) = v + s
y del teorema de la función inversa deducimos que Ψ es un difeomorfismo entre
un entorno V de 0 ∈ m⊕s en un entorno W de x ∈ X. Si consideramos (W, ϕ) con
ϕ = Ψ−1 |W , esta es una carta de X alrededor de x y además ϕ(W ∩ O) = m ∩ V
lo que prueba que O es localmente una subvariedad. Nuevamente, un simple
argumento de traslación nos dice que O es en efecto una subvariedad de X.
3.4.
Grupos lineales de matrices: un vistazo rápido
Los ejemplos inmediatos de grupos de Lie surgen de considerar grupos lineales. Es decir, subgrupos del grupo de matrices inversibles. Fijemos un poco
la notación. Sean H = Cn con el producto interno usual, Mn (C) el espacio de
matrices de n × n con entradas complejas. En estos grupos lineales se tiene que
3.4. Grupos lineales de matrices: un vistazo rápido
53
las diferenciales de Lg , Rg , Adg coinciden en efecto con las funciones, pues por
ejemplo si α es una curva en G, entonces
(Lg )∗α(t) α̇(t)
d
d
d
(Lg ◦ α) (t) =
(Lg α(t)) =
(gα(t))
dt
dt
dt
d
= g α(t) = Lg α̇(t).
dt
=
Estas cuatro grandes clases que presentaremos (grupos lineales, unitarios,
ortogonales y simplécticos) y sus variantes son lo que se conoce como grupos de
Lie clásicos, nombre debido a una obra de Hermann Weyl del año 1939 [68].
3.4.1.
El grupo lineal GL(n, C)
Usaremos GL(n, C) para denotar el grupo de matrices inversibles en Mn (C).
Este resulta ser un conjunto abierto en Mn (C), la prueba puede obtenerse considerando la función determinante. Sin embargo, hay una prueba más directa
que se traslada a otros contextos que tiene que ver con la serie de Neumann: si
a ∈ Mn (C) es tal que ka − 1k < 1, entonces a ∈ GL(n, C) y su inversa se calcula
así:
X
a−1 =
(1 − a)n
n≥0
Aquí estamos usando k · k para denotar la norma supremo de a vista como
operador lineal del espacio H = Cn en si mismo. Se sigue de la cuenta de
arriba que si b es inversible y kb − ck < kb−1 k−1 , entonces c es inversible, pues
kxyk ≤ kxkkyk y entonces
k1 − b−1 ck = kb−1 (b − c)k ≤ kb−1 kkb − ck < 1.
Como abierto de Mn (C), el conjunto GL(n, C) tiene la estructura diferenciable (de hecho analítica) dada por la carta global de la identidad del espacio de
Banach E = Mn (C), restringida a GL(n, C).
El álgebra de Lie de GL(n, C) consiste entonces del espacio de todas las
matrices Mn (C), y no es difícil ver que el corchete de dos elementos v, w ∈ g
está dado por el conmutador usual, es decir
[v, w] = vw − wv.
Esto se extiende de manera natural a cualquier subgrupo.
Si una matriz se diagonaliza como a = gdg−1 con g ∈ GL(n, C) y
d = diag(a1 , · · · , an )
54
Grupos de Lie
con ai ∈ C los autovalores de a (con multiplicidad), entonces dada una función
compleja f definida en σ(a) = ∪{ai } -el espectro de a-, tiene sentido definir
f(a) := g diag(f(a1 ), · · · , f(an ))g−1 = gf(d)g−1 .
Para potencias f(x) = xk , con k ∈ Z, esta definición coincide con la usual, es
decir
ak = g diag(ak1 , · · · , akn )g−1 .
Luego la definición coincide para polinomios, y se entiende cómo se calcula f(a)
para una función analítica en un entorno del espectro de a.
Algunas funciones, dadas por series de potencias convergentes, se pueden
definir aunque la matriz a no se diagonalice. Dos funciones muy importantes
son la exponencial del grupo lineal, dada por la serie de potencias
exp(a) = ea =
X 1
an
n!
n≥0
convergente para cualquier a ∈ GL(n, C), y el logaritmo,
ln(b) =
X (−1)n
(b − 1)n+1
n+1
n≥0
convergente para kb − 1k < 1. No es difícil chequear que, si kb − 1k < 1, entonces
exp(ln(b)) = b,
y que si kak < ln(2) entonces
log(ea ) = a.
En los apéndices de este libro se estudian álgebras de Banach y álgebras de
operadores, y allí mostramos como extender el logaritmo a cualquier operador
a cuyo espectro no separe al cero de infinito en el plano complejo, y en general
como calcular f(a) para funciones continuas en el espectro de a.
3.4.2.
El grupo de matrices unitarias
Un subgrupo que nos interesa es el grupo de matrices unitarias, definido de la
siguiente manera: si a∗ denota la transpuesta conjugada de a ∈ Mn (C), entonces
U(n, C) = U = {u ∈ GL(n, C) : u∗ u = 1}.
Notar que en este contexto de dimensión finita, como det(a∗ ) = det(a), la
condición u∗ u = 1 nos asegura que u es inversible y además u−1 = u∗ , luego
3.4. Grupos lineales de matrices: un vistazo rápido
55
también vale uu∗ = 1. En el caso infinito dimensional, el grupo unitario se define
agregando esta última condición a la expuesta.
Este es un grupo de Lie real, cuya álgebra de Lie se identifica con el conjunto
de las matrices antisimétricas (antihermitianas) en Mn (C), es decir
Mn (C)ah = {x ∈ Mn (C) : x∗ = −x}.
Esto se prueba de la siguiente manera: si u(t) es una curva suave en U tal que
u(0) = 1 y u̇(0) = x, entonces derivando en t = 0 la relación uu∗ = I se obtiene
x∗ + x = 0. Por supuesto, si x ∈ Mn (C)ah , entonces ex ∈ U, pues
∗
(ex )∗ = ex = e−x = (ex )−1 .
Se dice que a es autoadjunta o Hermitiana si a∗ = a, y que a es normal si
a∗ a = aa∗ . Un resultado importante del álgebra lineal nos dice que si a es
normal, entonces existe una matriz unitaria u tal que
a = udu∗
con d la matriz diagonal de los autovalores de a. Si además a es Hermitiana, los
autovalores son todos reales.
Observemos que toda matriz unitaria es normal, con lo cual dada u ∈ U,
existe v ∈ U tal que
u = vdv∗ .
No es difícil ver que en este caso, todos los autovalores están en S1 , es decir
|di | = 1 para todo i = 1, · · · , n.
Dada una matriz unitaria u, como σ(u) = {di }i=1,···,n ⊂ S1 , podemos elegir
una determinación log del logaritmo en el plano complejo de manera que log esté
definido en σ(u) y además | log(di )| ≤ π para todo i = 1 · · · n. En consecuencia,
toda matriz unitaria tiene un logaritmo
x = ln(u) = v ln(d)v∗
donde ln(d) es la matriz diagonal (ln(d1 ), · · · , ln(dn )). Si x = ln(u), es evidente
que ex = exp(x) = u, y además kxk ≤ π. Podemos considerar entonces el grupo
a un parámetro δ : [0, 1] → u dado por δ(t) = etx , que toma valores en U
puesto que tx es anti-hermitiana. Como δ(0) = 1, δ(1) = u, se deduce que el
grupo unitario es arcoconexo. Estas curvas jugarán un papel importante cuando
estudiemos la geometría de U, las llamaremos segmentos.
En contextos más generales, no siempre es posible hallar un logaritmo de un
operador unitario; sin embargo, para una clase importante de álgebras veremos
que siempre es posible.
56
Grupos de Lie
3.4.3.
El grupo ortogonal
Este es el caso real del grupo anterior; el grupo ortogonal O(n, R) es el grupo
de matrices que preserva la métrica, es decir
O(n, R) = {x ∈ Mn (R) : hxv, xwi = hv, wi para todo v, w ∈ Rn }.
Esta condición es -por polarización- equivalente a pedir que x sea una isometría
kxvk = kvk para todo v ∈ Rn , donde k · k denota en este caso la norma usual.
Equivalentemente, o ∈ O(n, R) si y sólo si
oT o = ooT = I.
El álgebra de Lie es el subespacio de matrices antisimétricas, es decir aquellos
x ∈ Mn (R) tales que
x + xT = 0.
Con mayor generalidad, fijado un producto escalar h, i en Rn , y q es la forma
cuadrática asociada, si definimos la traspuesta de x ∈ Mn (R) como la única
matriz xT tal que
hxT v, wi = hv, xwi
para todo v, w ∈ Rn , entonces O(n, R, q) es el grupo de matrices que preserva
la forma cuadrática q.
3.4.4.
El grupo simpléctico
Para n = 2k par, fijamos J ∈ GL(n, R) tal que
JT = −J = J−1 .
Esto es lo que se conoce como una estructura compleja en el grupo lineal real
GL(n, R). La estructura compleja recibe este nombre porque permite introducir,
en el espacio real R2k , una acción de C que lo convierte en un espacio vectorial
complejo: dado z = a + ib ∈ C, definimos para v ∈ R2k
zv := av + bJ(v).
Si h, i denota el producto escalar usual de Rn , J induce una forma bilineal
ω(v, w) = hJv, wi
conocida como forma simpléctica de la estructura compleja. La estructura compleja en R2k viene acompañada del producto escalar
hv, wiJ := hv, wi − iω(v, w)
3.5. Espacios homogéneos de grupos de matrices
57
que es de hecho un producto interno sesquilineal en el sentido siguiente
hz1 v, z2 wiJ = z1 z2 hv, wiJ
para z1 , z2 ∈ C y la acción de C sobre R2k inducida por J.
Se dice que una matriz a ∈ M2k (R) es una matriz compleja si conmuta con
J, es decir, si
aJ = Ja.
De la misma manera, un subespacio S ⊂ R2k es un subespacio complejo si
J(S) ⊂ S. Por ser J inversible, es equivalente a pedir J(S) = S. Esta condición es
de hecho la condición necesaria y suficiente para que el subespacio S herede la
acción de C sobre R2k introducida más arriba.
Salvo un cambio de base, toda estructura compleja en R2k = Rk × Rk viene
dada por una matriz
0 1
J=
∈ GL(2k, R)
−1 0
donde 0, 1 ∈ GL(k, R) son matrices cuadradas de k × k. En coordenadas, si
v = (η, ξ) ∈ Rk × Rk , entonces J(η, ξ) = (−ξ, η).
El grupo simpléctico es el grupo SpJ ⊂ GL(n, R) de matrices inversibles g
tales que
g−1 = JgT J.
Equivalentemente, son las matrices inversibles que preservan la forma simpléctica
ω, es decir, aquellas matrices tales que
ω(gv, gw) = ω(v, w)
para todo v, w ∈ R2k .
El álgebra de Lie de SpJ es el álgebra simpléctica spJ ⊂ Mn (2k, R) de las
matrices tales que
xT J = −Jx.
Esta relación se deduce considerando una curva g(t) ∈ SpJ tal que g(0) = I y
ġ(0) = x, y derivando la relación J = gT Jg en t = 0.
3.5.
Espacios homogéneos de grupos de matrices
En general un espacio homogéneo se presenta en forma abstracta; veremos sin
embargo que hay casos donde se los puede pensar como subconjuntos o incluso
subvariedades del grupo lineal.
En general, dado a ∈ Mn (C), y G algún grupo lineal subgrupo de GL(n, C),
llamaremos órbita de a al conjunto
O(a) := {gag−1 : g ∈ G} ⊂ Mn (C).
En el caso del grupo unitario U, se suele denominar órbita coadjunta de a.
58
Grupos de Lie
3.5.1.
La variedad de Grassmann
La variedad de Grassmann Grk (n) es el conjunto de subespacios de dimensión
k en Rn o Cn . Como tal, admite la acción del grupo de matrices inversibles de
la siguiente manera: dado S ∈ Grk (n), ponemos
g · S = g(S).
Observemos que por ser inversible g, se sigue que g(S) tiene la misma dimensión
que S. Se puede dar una presentación de la Grassmanniana como órbita, si pensamos que un subespacio S de dimensión k se identifica con el único proyector ortogonal p ∈ Mn (C) que lo tiene como rango (es decir p∗ = p, p2 = p, ranp = S).
En ese caso la acción se convierte en
g · p := gpg−1 .
Observemos que también podemos considerar la acción del grupo unitario U,
u · p = upu∗ .
Como dados dos subespacios S, S ′ de dimensión k, siempre podemos hallar una
base ortonormal de la intersección y completarla a una base de S y de S ′ respectivamente, no es difícil ver que la órbita unitaria recorre también toda la
Grassmaniana Grk (n). En este caso estamos identificando entonces
Grk (n) ≃ U/Kp
donde Kp ⊂ U es el subgrupo de isotropía del proyector p, es decir
Kp = {u ∈ U : upu∗ = p}.
Observemos que en este caso se trata de los unitarios que conmutan con p,
que en una representación matricial se pueden expresar en forma de operadores
diagonales:
⋆ 0
,
(3.3)
0 ⋆
donde en la primer fila ponemos el rango de p y en la segunda el de 1 − p. Es
decir, observemos que todo x se puede escribir de la siguiente manera:
x = pxp + (1 − p)xp + px(1 − p) + (1 − p)x(1 − p) = a + b + c + d,
y utilizamos para x la siguiente escritura por bloques:
a b
.
c d
Esta escritura se comporta bien el producto de matrices, es decir multiplicar dos
representaciones matriciales equivale a multiplicar las correspondientes matrices
originales.
3.A. Problemas
59
Observación 3.5.1. Por este motivo diremos que una matriz (o un operador) de
la forma (3.3) es una matriz (o un operador) p-diagonal ; una cuenta elemental
nos muestra que una matriz es p-diagonal si y sólo si conmuta con p. Por otra
parte, diremos que una matriz (o un operador) es p-codiagonal cuando la parte
diagonal de ésta sea nula, es decir cuando su escritura en bloques sea de la forma
!
0 ⋆
.
⋆ 0
Esta escritura compacta es muy útil para algunos cálculos, como veremos
más adelante. Derivando la relación up = pu en una curva u = ut tal que
u0 = 1 y u̇0 = v, se deduce que vp = pv, luego el álgebra de Lie de Kp son
los antihermitianos que conmutan con p, que nuevamente se representan como
matrices diagonales respecto de p.
3.5.2.
Matrices positivas inversibles
Una matriz es positiva cuando a = a∗ y además todos los autovalores de a
son ≥ 0. Si ninguno es cero, diremos que a es una matriz inversible positiva y lo
anotaremos a > 0. Es fácil ver que la exponencial de toda matriz Hermitiana es
inversible y positiva; lo que no es tan obvio es que todas tienen logaritmo Hermitiano. Este espacio P de matrices positivas inversibles se puede presentar como
un espacio homogéneo del grupo de todas las inversibles mediante la siguiente
acción: dada a > 0 y g ∈ GL(n, C), ponemos
g 7→ gag∗ .
Evidentemente gag∗ es inversible, para ver que es positiva hay que observar que
1
1
a tiene una raíz cuadrada positiva a 2 > 0 y entonces gag∗ = bb∗ con b = ba 2 .
Volveremos sobre este espacio homogéneo más adelante, para ello es necesario
familiarizarse primero con los contenidos de cálculo funcional de los apéndices
de este libro.
3.A.
Problemas
3.I. Una función f : X → Y es Ck si y sólo si su gráfico Gr = {(x, f(x)) : x ∈ X} ⊂
X × Y es una subvariedad regular y para cada x ∈ X, se verifica
T(x,f(x)) X × Y = T(x,f(x)) Gr ⊕ T(x,f(x)) {x} × Y.
Sugerencia: probar primero que pr1 |Gr → X es un difeomorfismo y considerar la
función pr2 ◦ (pr1 |Gr )−1 .
60
Grupos de Lie
3.II. Si G es grupo de Lie-Banach, el gráfico de g 7→ g−1 se puede pensar como la
superficie de nivel m−1 (e) con e la identidad de G y m : G × G → G el producto
m(x, y) = xy. La aplicación m es una sumersión (es decir su diferencial es un
epimorfismo con núcleo que se parte). Concluir que si el producto es de clase Ck
en el grupo G, también lo es la inversión.
3.III. Si G es un grupo de Lie-Banach, probar que [X, Y] = 0 para todo par de
campos invariantes a izquierda implica que G es un grupo conmutativo. Probar
la implicación recíproca.
3.IV. Sea G grupo topológico. Dado un subconjunto A ⊂ G denotamos hAi ⊂ G
al subgrupo generado por los productos finitos de los elementos de A y sus
inversas.
Probar que la componente conexa Ge de la identidad de G es subgrupo.
Probar que Ge es un subgrupo invariante (normal).
Probar que Ge es un subgrupo cerrado.
Supongamos que además G es un grupo de Lie-Banach de clase Ck , k ≥ 1.
Probar que Ge es abierto.
Probar que G/Ge es discreto.
Probar que hexp(v)iv∈g = Ge .
3.V. Probar que si v ∈ g (el álgebra de Lie-Banach del grupo G) y Xv denota el
único campo invariante a izquierda tal que Xv (e) = v, entonces φv (t) = αv (t, e)
(αv como siempre denota el flujo de Xv ) es un homomorfismo, es decir
φv (s + t) = φv (s)φ(t) = φv (t)φv (s)
para s, t ∈ R en el dominio de αv (·, e).
3.VI. Sea G un grupo de Lie-Banach, g su álgebra de Lie-Banach. Sean v, w ∈ g
y g : R → g la aplicación dada por t 7→ Adetv (w) = etv we−tv . Probar que
ġ(0) = adv(w) = [v, w].
3.VII. Sea G grupo de Lie-Banach, K ⊂ G subgrupo (o sea es subvariedad embebida). Probar que K es cerrado en G.
3.VIII. Escribir los detalles de la prueba del Teorema 3.2.1 sobre subgrupos
cerrados.
3.IX. Sea G grupo de Lie-Banach y =p ⊕ u una descomposición de su álgebra
de Lie. Probar que existen entornos U1 ⊂ p, U2 ⊂ u de los respectivos vectores
3.A. Problemas
61
nulos, y un entorno abierto V de e ∈ G de manera que (x, y) 7→ ex ey es un
difeomorfismo de U1 × U2 sobre V.
3.X. Sea f : A → B una función continua y suryectiva. Probar que si f es abierta
o cerrada, entonces f es un mapa cociente.
3.XI. Probar que, dado un proyector p = p2 = p∗ ∈ Mn (C) de dimensión
k, si S = ran(p) ⊂ Cn , entonces hay una correspondencia entre Grk (n) =
GL(n, C) · (S) donde la acción para g inversible está dada por S 7→ g · S = g(S), y
la órbita de similaridad del proyector p dada por gpg−1 , g ∈ GL(n, C). Probar
que dicha órbita de similaridad está también en correspondencia con la órbita
coadjunta upu∗ , u ∈ U(n, C) matriz unitaria.
3.XII. Con la notación del ejercicio anterior, sea z = zp + pz una matriz pcodiagonal y Hermitiana. Probar que
Para todo k ∈ N, se verifica
pz2k = z2k p,
(1 − p)z2k (1 − p) = z2k ,
(1 − p)z2k+1 = z2k+1 p,
pz2k+1 = z2k+1 (−p).
Si f es una función medible definida en un entorno de σ(z), y f es par,
entonces pf(z) = f(z)p, mientras que si f es impar pf(z) = f(z)(1 − p).
√
Si |z| = z∗ z, entonces |z| = |zp| + |pz| y además |zp||pz| = |pz||zp| = 0.
p|z| = |z|p = |zp|, (1 − p)|z| = |z|(1 − p) = |pz|, p|pz| = 0 = (1 − p)|zp|.
Si q = eiz peiz ∈ Grk (n) = O(p), entonces en la notación matricial que
induce la descomposición Cn = ran(p) ⊕ ran(1 − p) se tiene
cos2 (z)
−i cos(z) sen(z)
q=
.
i cos(z) sen(z)
sen2 (z)
Si q es como en el ejercicio previo, entonces
√
|qp| = pqp = p cos(z) = p cos |z| = cos |zp|
√
|pq| = qpq = (1 − p) cos(z) = (1 − p) cos |z| = cos |pz|,
con lo cual
√
√
pqp + qpq = cos(z) = cos |z|.
|qp||pq| = |qp| + |pq| − 1 = |pq||qp|.
62
Grupos de Lie
Sea arc cos : [0, 1] → [0, π/2] la inversa del coseno. Supongamos que kzk ≤
π/2. Probar que
|z| = arc cos |z| = arc cos(|qp| + |pq|)
y que
|zp| = arc cos |qp|,
|pz| = arc cos |pq|.
Capítulo
El Grupo Lineal
Mi trabajo siempre intentó unir lo
verdadero con lo bello, pero cuando tuve
que elegir uno o lo otro, usualmente elegí
lo bello.
Hermann Weyl
N
uestra intención no es presentar con toda generalidad la teoría de
grupos de Lie-Banach, para eso ya existen excelentes tratados como
los Elementos de Bourbaki [19], el reciente libro de Daniel Beltiţǎ
[17] de estructuras homogéneas o el libro de Harald Upmeier [67] sobre grupos
analíticos. Nos concentraremos en los subgrupos del grupo lineal de un álgebra de
Banach o más precisamente, en subgrupos del grupo de operadores inversibles en
un espacio de Banach. En este capítulo suponemos que el lector está familiarizado
con las nociones de cálculo funcional que presentamos en los apéndices.
Mencionamos algunas nociones que son de interés aunque quedan fuera de
nuestro enfoque. La primera es sobre grupos de Lie-Banach analíticos G: si g
denota el álgebra de Lie-Banach de G, entonces la aplicación Ad : G → B(g)
dada por g 7→ Adg es una representación del grupo, que resulta una aplicación
entre grupos analíticos; su isotropía es el centro del grupo, que en muchos casos
relevantes suele ser pequeño. En este caso la estructura local puede copiarse del
grupo de inversibles de B(g), que es un álgebra de Banach.
En el otro extremo, si M es una variedad diferenciable cualquiera, y Diff(M)
denota el grupo de difeomorfismos de M con la composición como la operación
del grupo, este espacio no admite en general una estructura de grupo de LieBanach, incluso en un caso tan “sencillo” como cuando M = S1 .
63
4
64
El Grupo Lineal
4.1.
El grupo de elementos inversibles, estructura local
Como dijimos, nos concentraremos en subgrupos de GA , el grupo de inversibles de un álgebra de Banach compleja y asociativa A. Es fácil ver (Observación
A.2.4 en el Apéndice III), se trata de un conjunto abierto y el álgebra de LieBanach g se identifica naturalmente con A; el corchete de Lie es el conmutador
usual y el grupo tiene una estructura de variedad analítica compleja.
4.1.1.
Las representaciones L y R
Si z ∈ A, entonces Lz : A → A es un operador lineal y acotado, con
kLz k = sup kzwk ≤ kzk.
kwk≤1
Denotemos con σA (z) al espectro de z relativo al álgebra A, y con σB(A) (Lz ) al
espectro de Lz como operador del espacio de Banach A. La aplicación z 7→ Lz
es de hecho una representación del álgebra A como operadores acotados en un
espacio de Banach. Definimos L : A → B(A) como La x = ax, y denotamos
L(A) = {Lz : z ∈ A} ⊂ B(A).
De manera análoga se definen Ra (a ∈ A) como el producto a derecha y R(A).
Lema 4.1.1. El conjunto L(A) es una subálgebra cerrada, L es una isometría
y además
σB(A) (Lz ) = σ(z).
para todo z ∈ A. Afirmaciones análogas valen para R(A).
Demostración. Que L(A) es cerrada se deduce del hecho de que L es una isometría, y esto último es porque
kzk = kLz · 1k ≤ kLz k ≤ kzk.
Por otra parte, si c ∈ A es la inversa de a − λ, entonces Lc es la inversa de La−λ ,
con lo cual σB(A) (Lz ) ⊂ σ(z). Recíprocamente, si La es inversible, entonces existe
un operador inversible T ∈ B(A) tal que La Tz = TLa z = z para todo z ∈ A.
Llamando b = T (1), se tiene que b es la inversa de a: en efecto ab = La T (1) = 1,
y por otro lado 1 = TLa (1) = T (a) con lo cual
ba = TLa (ba) = T (aba) = T (a) = 1.
4.1. El grupo de elementos inversibles, estructura local
65
Dada H : Ω ⊂ C → C una función analítica tal que σ(z) ⊂ Ω, entonces
ciertamente σ(Lz ) ⊂ Ω con lo cual tiene sentido hacer el cálculo funcional en las
dos álgebras. Se tiene
LH(z) = H(Lz ),
pues la fórmula es evidente para potencias de z y para H(z) = (z − λ)−1 , y el
resultado se deduce aproximando H uniformemente con funciones racionales en
σ(z) (Teorema A.2.7).
Respecto de la exponencial, se trata de la exponencial usual dada por ejemplo
por una serie de potencias. En particular para todo v ∈ A se tiene
Lev = eLv ,
Rev = eRv ,
eadv = Adev .
La última fórmula, válida en grupos de Lie-Banach arbitrarios, tiene en este
contexto una prueba sencilla: los operadores Lv , Rw ∈ B(A) conmutan para todo
v, w ∈ A.
4.1.2.
La diferencial del mapa exponencial
En esta sección presentamos fórmulas explícitas para la diferencial de la exponencial.
Lema 4.1.2. Si v, w ∈ A, entonces
Z1
d exp(v + tw) = e(1−t)v wetv dt
exp∗v (w) =
dt t=0
0
= ev F(adv)w = [G(adv)w] ev .
con F, G : C → C las funciones enteras dadas por
F(λ) =
1 − e−λ
λ
y
G(λ) =
eλ − 1
λ
respectivamente.
Demostración. Observemos que, como (eta ) ′ = eta a = aeta para todo a ∈ A,
entonces
d (1−t)v t(v+w)
(e
e
) = e(1−t)v wet(v+w) ,
dt
luego
Z1
ev+w − ev = e(1−t)v wet(v+w) dt.
0
Reemplazando w por sw se tiene
1 v+sw
(e
− ev ) =
s
Z1
0
e(1−t)v wet(v+sw) dt.
66
El Grupo Lineal
Haciendo tender s → 0 se tiene la primera identidad. Para ver que vale la segunda, reescribimos
Z1
(1−t)v
e
0
tv
v
we dt = e
Z1
L−tv Rtv
e
e
v
wdt = e
0
Observemos que
e−tadv =
Z1
e−tadv dt w.
0
X 1
(−1)n tn (adv)n .
n!
n≥0
Integrando término a término, se tiene la identidad con la función F. La identidad
con la función G se obtiene de esta última operando formalmente con el operador
eadv = Adev .
De la última fórmula se deduce que la diferencial es inversible si y sólo si
σ(adv) ∩ {2kπi : k ∈ Z6=0 } = ∅.
En particular, si kzk < π, entonces
kadzk ≤ 2kzk < 2π
con lo cual r(adz) < 2π y se tiene que la diferencial es inversible. Esta observación inocente es un hecho clave en la geometría de grupos lineales y sus espacios
homogéneos.
Con más precisión, como σ(adv) ⊂ σ(v) − σ(v) (Lema 4.1.1 y Corolario
B.3.2), la diferencial de la exponencial será inversible siempre que λ − µ 6= 2kπi
(k 6= 0) para todo λ, µ ∈ σ(v).
4.1.3.
Factorización de la diferencial de exp
Para una función entera F : C → C, existen relaciones entre su velocidad de
crecimiento y la cantidad de ceros que tiene F en regiones acotadas. Sin entrar
en detalles, mencionamos las nociones mínimas para escribir la factorización de
Weierstrass de una función entera F.
Consideremos el máximo de F en un disco,
M(r) = máx |F(λ)| = máx |F(λ)|.
|λ|≤r
|λ|=r
El orden de crecimiento ρ de F está dado por el límite
ρ = lı́m sup
r→+∞
ln ln M(r)
.
ln r
4.1. El grupo de elementos inversibles, estructura local
67
El orden puede ser +∞. Es fácil chequear que si F, G son enteras de orden ρF , ρG
respectivamente entonces
ρF+G , ρFG ≤ máx{ρF , ρG }.
Los detalles pueden verse en la monografía [55] de Boris Levin de acceso libre
en la página de la AMS. Cualquier función F de orden finito ρ ≤ 1 tiene una
expansión de Weierstrass
Y
λ
λ
j aλ
F(λ) = C λ e
1−
e zk .
zk
k∈Z
Aquí {zk } ⊂ C − {0} son las raíces no nulas de F y
C = F(λ)/λj |λ=0 ∈ C,
donde j ∈ N es el orden de λ = 0 como raíz de F. El producto converge uniformemente sobre compactos de C a la función F. El exponente a ∈ C se puede
calcular de la siguiente manera:
a=
d
ln(F(λ)/λj ) |λ=0 .
dλ
En particular, como la exponencial λ 7→ eλ tiene orden ρ = 1, lo mismo se
puede decir de senos y cosenos, con lo cual es fácil hallar la expresión
Y λ
λ
1
1 − e−λ
1−
e 2kπi .
= e− 2 λ
F(λ) =
λ
2kπi
k∈Z6=0
Corolario 4.1.3. Si v, w ∈ A, entonces
1
exp∗v (w) = ev e− 2 adv
4.1.4.
Y adv
adv
e 2kπi (w).
1−
2kπi
k∈Z6=0
La serie de Baker-Campbell-Hausdorff
La serie de Baker-Campbell-Hausdorff de v, w ∈ A está dada por
BCH(v, w) = v ∗ w = log(ev ew ),
para v, w suficientemente pequeños. Observemos que es una función analítica.
Luego podemos desarrollar en serie
X
BCH(tv, tw) = log(etv etw ) =
tk pk (v, w)
k≥0
68
El Grupo Lineal
con pk homogéneos de grado k en (v, w). Si uno escribe la serie de potencias del
logaritmo,
X (−1)n+1
log(a) =
(a − 1)n
n
n≥1
convergente para |a − 1| < 1, se obtiene
log(ev ew ) =
X (−1)m+1
(ev ew − 1)m
m
m≥1
=
l
X (−1)m+1 X X
1
(
vl wl−j − 1)m .
m
l!(l − j)!
l≥0 j=0
m≥1
Agrupando monomios tales que la suma de los grados sea igual a n, recuperamos
la fórmula previa
X
BCH(v, w) = log(ev ew ) =
pk (v, w)
k≥0
con los pk homogéneos.
Proposición 4.1.4. Si v, w ∈ A son suficientemente pequeños, entonces
BCH(v, w) =
X (−1)n+1 Z 1
n−1
etadv etadw − 1
(v + etadv w)dt.
n
0
n≥1
En particular, los pk de la serie son polinomios para el producto de Lie, es
decir BCH(v, w) se obtiene iterando corchetes de v y w.
Demostración. Sea z = z(t) = log(etv etw ), que como discutimos es una función
analítica para t suficientemente pequeño. Derivando la relación ez(t) = etv etw
obtenemos, por la fórmula de la diferencial de la exponencial
[G(adz)z ′ ]ez = vez + ez w,
luego
G(adz)z ′ = v + eadz w = v + etadv w,
puesto que eadz w = etadv etadw w = etadv w. Ahora notemos que, para λ ∈ C
con |λ| < log(2), se tiene
λ = log(eλ ) =
X (−1)n+1
(eλ − 1)n ,
n
n≥1
4.1. El grupo de elementos inversibles, estructura local
luego
G(λ)−1 =
eλ
69
X (−1)n+1
λ
=
(eλ − 1)n−1 .
−1
n
n≥1
Entonces, si t es suficientemente pequeño se verifica kadzk < log(2) con lo cual
X (−1)n+1 adz
z ′ = G(adz)−1 v + eadtv w =
(e
− 1)n−1 v + etadv w .
n
n≥1
Pero si observamos que z(0) = 0, entonces
log(ev ew ) = z(1) = z(1) − z(0) =
Z1
z ′ (t)dt
0
lo que nos da la fórmula del enunciado.
Observación 4.1.5. Reordenando la expresión integral del lema se obtiene la
fórmula
Z1
BCH(v, w) = log(ev ew ) = v + g(etadv etadw )wdt,
0
con g : C → C la función entera dada por
g(λ) = 1 +
X (−1)n+1
(λ − 1)n .
n(n + 1)
n≥1
Mientras que si desarrollamos (etadv etadw − 1)n−1 en serie en la expresión del
lema se obtiene una famosa fórmula debida a E.B. Dynkin de la serie de Baker
para v, w:
X (−1)n+1
1
[v(i1 ) , w(ji ) , · · · , v(in ) , w(jn ) ]
n
(i1 + j1 ) + · · · + (in + jn )
i1 !j1 ! · · · in !jn !
n≥1
donde la suma es sobre las 2n-uplas (i1 , · · · , in , j1 , · · · , jn ) tales que ik + jk ≥ n,
y para r ∈ N se denota
[· · · , v(r) , · · ·] := [· · · , [v, [v, [· · · [v,[· · ·]]].
|
{z
}
r veces
Los primeros términos de la serie BCH(v, w) son
p0 = 0,
p1 = v + w,
p2 = 1/2[v, w],
p3 = 1/12[v − w, [v, w]] = 1/12[v, [v, w]] + 1/12[w, [w, v]].
70
El Grupo Lineal
4.1.4.1.
Fórmulas de Lie-Trotter
Con la serie de BCH, estamos en condiciones de probar que los subgrupos
cerrados tienen una subálgebra de Lie-Banach natural asociada, y por ende tienen
una estructura de variedad diferenciable (con una estructura tal vez más fina que
la de A). Las siguientes fórmulas son conocidas como fórmulas de Lie-Trotter de
la exponencial.
Lema 4.1.6. Si v, w ∈ A, entonces
exp(v + w) = lı́m
n→∞
y
exp([v, w]) = lı́m
n→∞
ev/n ew/n
n
e−v/n e−w/n ev/n ew/n
n2
.
Demostración. Para n ∈ N suficientemente grande, v/n y w/n están suficientemente cerca del origen como para usar la serie de BCH. Entonces
log(ev/n ew/n ) = 1/n(v + w) +
1/2
n2
[v, w] + o(1/n3 )
de donde
ev/n ew/n
1/2
[v, w] + o(1/n3 ))
n2
= exp(1/n(v + w) + o(1/n2 ))
= exp(1/n(v + w) +
(4.1)
y entonces
n
(ev/n ew/n )n = exp(1/n(v + w) + o(1/n2 )) = exp((v + w) + o(1/n)).
Tomando límite para n → ∞ se tiene la primer identidad. Iterando la ecuación
(4.1), tenemos
e−v/n e−w/n ev/n ew/n = exp(A(n)) exp(B(n))
donde
1/2
A(n) = 1/n(v + w) +
n2
[v, w] + o(1/n3 )
y
B(n) = −1/n(v + w) +
1/2
n2
[v, w] + o(1/n3 ).
Aplicando nuevamente la serie de BCH,
log(eA eB ) = A + B + 1/2[A, B] +
X
k≥3
pk (A, B) = 0 +
1
[v, w] + o(1/n3 ),
n2
4.2. Subgrupos
71
luego
2
(e−v/n e−w/n ev/n ew/n )n
=
=
n2
exp(1/n2 [v, w] + o(1/n3 ))
exp([v, w] + o(1/n)),
y haciendo tender n → ∞ tenemos la segunda fórmula.
4.2.
Subgrupos
Exploramos en esta sección los subgrupos de un grupo de Lie-Banach, en
particular del grupo de inversibles de un álgebra de Banach.
4.2.1.
El álgebra de Lie de un subgrupo cerrado
Gracias a las fórmulas previas obtenemos la prueba de que todo subgrupo
cerrado tiene un álgebra de Lie-Banach asociada.
Corolario 4.2.1. Sea K ⊂ GA un subgrupo cerrado, y sea
k = {v ∈ A : etv ∈ K
∀t ∈ R}.
Entonces k ⊂ A es una subálgebra de Lie-Banach real.
Demostración. Si vn → v en A con vn ∈ k, entonces
exp(tv) = lı́m exp(tvn ) ∈ K
n
para todo t ∈ R, con lo cual k ⊂ A es un subconjunto cerrado. Por otra parte,
si v ∈ k entonces sv ∈ k para todo s ∈ R por definición. Por último, el lema
previo nos dice que la suma y el corchete de elementos en k está en k pues K es
cerrado.
Recordemos que reservamos la denominación subgrupo de Lie para aquel
subgrupo K ⊂ G cuya topología inducida por la estructura diferenciable, coincida
con la topología de subespacio del grupo G en el que están inmersos. Como ya
mencionamos en el capítulo previo, no es difícil verificar que un subgrupo cerrado
K es subgrupo de Lie-Banach si y sólo si existe un entorno U ⊂ g del origen, de
manera que
exp(U ∩ k) = exp(U) ∩ K
donde k denota como es habitual el álgebra de Lie-Banach de K, y la exponencial
es la función exponencial del grupo G.
72
El Grupo Lineal
Teorema 4.2.2. Sea G subgrupo de Lie-Banach de GA , g su álgebra de
Lie-Banach. Supongamos que k ⊂ g es una subálgebra cerrada. Entonces
1. Existe un grupo de Lie-Banach K∗ ⊂ G (subgrupo analítico) tal que el
álgebra de Lie-Banach de K∗ coincide con k.
2. Si K ⊂ G es un subgrupo topológico cerrado, y k denota el álgebra de
Lie-Banach de K, entonces K tiene una estructura de grupo de LieBanach de manera que la topología τ inducida es posiblemente más
fina que la de G. Además K∗ = K0τ (la componenente de la identidad
del grupo K munido de la topología τ), y K∗ es subgrupo de Lie-Banach
normal de Kτ .
3. Si dim(G) < ∞, la topología τ de K y la de subespacio coinciden.
Demostración. Tomamos el subfibrado de TG ≃ G×g dado por E = {Lg h}g∈G =
{gh}g∈G . Si X, Y ∈ E, entonces existen Ag , Bg funciones suaves a valores en k tales
que Xg = gAg , Yg = gBg . Calculamos
d (αBα − βAβ )
[Xg , Yg ] = Yg′ (Xg ) − Xg′ (Yg ) =
dt t=0
donde α es el flujo de X, es decir α̇ = Xα = αAα , α(0) = g, y β es el flujo de Y.
Observemos que como Aα ⊂ k, entonces su derivada en t = 0 (que denotaremos
como A0′ ) permanece en k. Lo mismo se aplica a Bβ . Se tiene
[Xg , Yg ] = g[Ag , Bg ] + g[B0′ , A0′ ] ∈ gk = E
luego por el Teorema de Frobenius (Observación 2.5.2) el subfibrado E es integrable. Sea K∗ la variedad integral conexa maximal de E que pasa por g0 = 1. Si
v ∈ k, entonces α(t) = etv es una variedad integral del subfibrado, luego α ⊂ K∗
y en consecuencia ev ∈ K∗ es decir, exp(k) ⊂ K∗ . Por otra parte tautológicamente
T1 K∗ = k. Luego si B es una bola -entorno de 0 ∈ g- donde la exponencial es
un difeomorfismo, se tiene que exp : B ∩ k → exp(B ∩ k) = U = U−1 es un difeomorfismo, luego este último es abierto en K∗ . Observemos que si ev , ew ∈ U,
entonces α(t) = ev etw es una curva integral de E, luego ev ew ∈ K∗ y entonces
hev iv∈B∩k = hUi = K∗ por ser este abierto y cerrado en K∗ . Luego K∗ es un
grupo de Lie-Banach cuya álgebra de Lie es k.
Si k es el álgebra de Lie-Banach de un subgrupo topológico cerrado K ⊂ G,
entonces dado v ∈ k se tiene ev ∈ K, luego U ⊂ K y entonces K∗ ⊂ K; notar
también que si x ∈ K y z ∈ k entonces
exp(txzx−1 ) = xetz x−1 ∈ K
4.2. Subgrupos
73
lo que nos dice que K∗ es un subgrupo normal de K.
Veamos ahora cómo dotar a K de estructura diferenciable a partir de la de
∗
K . Existe por la continuidad del producto un abierto simétrico V −1 = V en K∗
tal que V 4 ⊂ U. Notemos que {xV}x∈K es un cubrimiento K; le damos a K la
topología τ inducida por esta base de entornos (claramente compatible con la de
K∗ ), y definimos las cartas ϕx (g) = exp−1 (x−1 g) para g ∈ xV. Dados x, y ∈ K,
φ = ϕx ◦ ϕ−1
y : ϕy (xV ∩ yV) → ϕx (xV ∩ yV)
se calcula notando que si h ∈ xV ∩ yV entonces existen g1 , g2 ∈ V tales que
h = xg1 = yg2 , luego g0 = x−1 y ∈ V 2 y entonces g0 = es y además para
z = ϕy (h) = exp−1 (g2 ) se tiene
φ(z) = ϕx (h) = exp−1 (x−1 yg2 ) = exp−1 (g0 g2 ) = exp−1 (es ez ) = BCH(s, z),
y entonces z 7→ φ(z) es suave, de hecho analítica. Esto prueba que {(ϕx , xV)}x∈K
es un atlas analítico de K, con lo cual K tiene estructura de variedad diferenciable.
Veamos que, dado x ∈ K, la función Lx (h) = xh es diferenciable como función de
K en K. Computamos el mapa inducido en el entorno gV, tomando z ∈ exp−1 (V):
−1 z
ϕxg ◦ Lx ◦ ϕ−1
(e ) = z,
g (z) = exp
de donde Lx es obviamente diferenciable. Ahora veamos que Adg (h) = ghg−1
también es diferenciable, de hecho un difeomorfismo pues tiene una inversa que
se computa como Adg−1 que resultará por ende diferenciable. Como Adg ◦ Lh =
Lghg−1 ◦ Adg , basta probar que Adg es diferenciable en algún entorno de 1 ∈ K.
Pero como exp es localmente un difeomorfismo entre el abierto exp−1 (V) ⊂ k y
V, de getz g−1 = exp(tgzg−1 ) se sigue que x 7→ gxg−1 es un endorfismo de k, y
como este último es suave, también lo es Adg .
Si I(x) = x−1 denota la inversa del grupo y m(x, y) = xy denota el producto,
estas dos funciones se pueden escribir en términos de L y Ad, por ejemplo si
h = xg ∈ xV, entonces
I(h) = I(xg) = g−1 x−1 = Lx−1 ◦ Adx ◦ IV ◦ Lx−1 (h),
y como IV es analítica (pues se computa en la carta exponencial como z 7→ −z),
entonces I resulta suave, de hecho analítica. Con un argumento similar (Ejercicio
4.v) se prueba que m es analítica. Entonces (Kτ es un grupo de Lie-Banach que
tiene a K∗ como subgrupo de Lie-Banach normal, y como K∗ = hVi, debe ser
K∗ = K0τ .
74
El Grupo Lineal
Si dim(G) < ∞, consideramos la topología Kτ inducida por las cartas recién
introducidas, y este espacio resulta localmente compacto; asimismo K con la
topología original es Hausdorff, y como el entorno V ⊂ Kτ es acotado (pues la
exponencial es localmente Lipschitz), entonces si i : K∗ ֒→ Kτ denota la inclusión,
se sigue que i(V) es abierto en K, y por ende las topologías coinciden.
Todo subgrupo de Lie de un grupo de Lie-Banach G resulta cerrado (ejercicio
3.vii), y en dimensión finita, todo subgrupo cerrado, es subvariedad regular (una
prueba del caso general puede verse en el libro de Helgason [40, Teorema 2.3]).
Luego se tiene la equivalencia entre subgrupos cerrados y subgrupos de Lie. Sin
embargo, en dimensión infinita no es difícil dar con un contraejemplo a esta
afirmación:
Ejemplo 4.2.3. Consideramos G = L2 ([0, 1], R) como grupo de Lie-Banach aditivo y la topología inducida por la norma 2. Tomamos las funciones a valores
en Z, es decir K = L2 ([0, 1], Z), que resulta un grupo de Lie-Banach aditivo, y
subgrupo analítico de G. Es fácil ver que K es cerrado en G, pues se tiene convergencia en casi todo punto. Observemos que la exponencial de G es la identidad
por ser G un grupo abeliano. Luego el álgebra de Lie de K está dada por
k = {f ∈ G : tf ∈ K ∀t ∈ R}.
Esto sólo es posible si f = 0, luego k = {0}, y en consecuencia (en la notación del
teorema previo) K∗ = {0}, y luego Kτ tiene entonces que ser discreto. Pero por
otra parte, dada f ∈ K, si consideramos la función continua F : I × K → K dada
por
f(x) 0 ≤ x ≤ t
F(t, f)(x) =
0
t<x≤1
nos muestra que K es arco-conexo como subespacio topológico de G. Luego la
topología de K como grupo de Lie-Banach no coincide con la topología de K
como subespacio de G.
4.3.
Subgrupos algebraicos
A continuación desarrollamos un criterio útil en el contexto infinito dimensional para probar que la topología de un subgrupo K ⊂ G de un grupo proveniente
de un álgebra de Banach, es la topología de subespacio.
Dada un álgebra de Banach A, diremos que un subgrupo K ⊂ GA es algebraico si existe una familia {Pi }i∈I de polinomios Pi : A × A → C tales que
K = {g ∈ GA : Pi (g, g−1 ) = 0 ∀i ∈ I}.
4.3. Subgrupos algebraicos
75
Resulta entonces que P es una suma de funciones homogéneas en (a, b). El
grado del polinomio P se define como el máximo de los órdenes de las funciones
homogéneas en las que se descompone P. Por ejemplo,
P(a, b) = 3a2 b2 − 4a4 b + ab + 1
es un polinomio de grado 5 pues el monomio m(a, b) = −4a4 b es homogéneo de
grado 5, es decir
m(ta, tb) = −4(ta)4 (tb) = t5 m(a, b)
para todo t ∈ C. El grado del subgrupo K es el máximo de los grados de los
polinomios de la famila {Pi }i∈I .
El siguiente teorema debido a Carlson será útil en breve, lo enunciamos sin
demostración y la misma puede verse por ejemplo en el libro de B. Levin1 [55,
Teorema 3, Sección 8.3]:
Lema 4.3.1. Sea f : C → C una función entera de orden ρ ≤ 1 (es decir
|f(z)| ≤ AeB|z| para todo z ∈ C). Si
1. f(k) = 0 para todo k ∈ Z,
2. lı́m sup 1t log |f(±it)| < π,
t→∞
entonces f ≡ 0.
Para un subgrupo algebraico K, si definimos
k = {v ∈ A : etv ∈ K ∀t ∈ R},
el Corolario 4.2.1 nos dice que k es un álgebra de Lie-Banach, pues K es cerrado
por ser intersección de cerrados.
Teorema 4.3.2. Si A es un álgebra de Banach compleja y K ⊂ GA es un
subgrupo algebraico de grado n < ∞, entonces K tiene una estructura de
grupo de Lie-Banach dada por k y la exponencial de GA , cuya topología
concuerda con la topología de subespacio de GA .
Demostración. Trasladando con los difeomorfismos {Lg }g∈K , basta probar que
existe un entorno U ⊂ A del origen tal que exp(U ∩ k) = exp(U) ∩ K y exp es un
difeomorfismo entre U ∩ k y exp(U) ∩ K. Tomando U suficientemente pequeño,
1 Link
al libro online, de acceso gratuito en la página de la AMS-American Mathematical
Society (ver la página 58): http://www.ams.org/online_bks/mmono150/mmono150-ptI.pdf
76
El Grupo Lineal
esta última condición está garantizada; por otra parte exp(U ∩ k) ⊂ exp(U) ∩ K
siempre ocurre. Luego tenemos que probar que
exp(U) ∩ K ⊂ exp(U ∩ k),
y esto estará probado si vemos que, dado v ∈ U con g = ev ∈ K, entonces etv ∈ K
para todo t ∈ R. Por la definición del subgrupo algebraico, esto nos lleva a tener
que probar que para todo polinomio P de la familia que define K, se verifica
P(etv , e−tv ) = 0 para todo t ∈ R.
Para P y v fijos, consideramos la función f : C → C dada por
f(z) = P(ezv , e−zv ).
Esta es una función analítica pues la exponencial y los polinomios son analíticos.
Probaremos que f es idénticamente nula usando el lema previo. Observemos
primero que
f(k) = P(ekv , e−kv ) = P(gk , g−k ) = 0
para todo k ∈ Z,
puesto que K es un grupo. Además, usando que P tiene grado finito, f tiene orden
ρ ≤ 1 pues basta desarrollar el polinomio como suma de monomios y luego acotar
ke±zv kj ≤ ejkzvk = ej|z|kvk
en cada monomio. Por otra parte, como
P(x, y) =
n
X
pk (x, y)
k=0
con los pk homogéneos de grado k, entonces existen constantes ck , αjk ≥ 0 tales
que
n
k
X
X
|P(x, y)| ≤
ck
αjk kxkj kykk−j ≤ M máx{1, kxkn , kykn },
k=0
j=0
y entonces
log |P(x, y)| ≤ log M + n máx{0, log kxk, log kyk}.
Usando esto, para t ∈ R tenemos
log |f(±it)| = log |P(e±itv , e∓itv )| ≤ log M + n máx{0, log ke±itv k},
4.4. El grupo de isometrías
77
lo que nos dice que
lı́m sup
t→∞
1
1
log |f(±it)| ≤ n lı́m sup log ke±itv k.
t
t→∞ t
Por el primer ítem del Teorema A.3.6,
lı́m sup
t→∞
1
log ke±itv k = máx{|Im(λ)| : λ ∈ σ(v)} ≤ r(v) ≤ kvk,
t
es decir
lı́m sup
t→∞
1
log |f(±it)| ≤ nkvk.
t
Como n está dado por la familia de polinomios, podemos tomar el entorno U ⊂ A
suficientemente pequeño para que kvk < π/n para todo v ∈ U, con lo cual
lı́m sup
t→∞
4.4.
1
log |f(±it)| < π.
t
El grupo de isometrías
Si A es un álgebra de Banach, las isometrías de G = GA son los elementos
de norma unitaria con inversa de norma unitaria, es decir
U = UA = {g ∈ GA : kgk = kg−1 k = 1}.
Observación 4.4.1. El nombre se debe al siguiente hecho: si pensamos que A
actúa en un espacio de Banach E como operadores acotados (por ejemplo en
E = A via g 7→ Lg ) entonces g ∈ U sii
kgηk = kg−1 ηk = kηk
para todo η ∈ E. En efecto, kgηk ≤ kηk y por otro lado kηk = kg−1 gηk ≤ kgηk
lo que prueba que g es una isometría, y con un argumento análogo g−1 es una
isometría.
Lema 4.4.2. Si u ∈ U entonces σ(u) ⊂ S1 .
Demostración. En primer lugar, si |λ| > 1 entonces x = 1 − u
λ verifica kx − 1k =
1/|λ| < 1 lo que nos dice que x es inversible o equivalentemente, que λ ∈
/ σ(u).
−1
Supongamos ahora que |λ| < 1, entonces y = λu −1 también verifica ky−1k =
|λ| < 1 luego es inversible. Multiplicando por u deducimos que uy = λ − u es
inversible así que λ ∈
/ σ(u).
78
El Grupo Lineal
Las isometrías forman un subgrupo cerrado de G, y por ende el espacio de
Banach
u = uA = {v ∈ A : exp(Rv) ⊂ U}
es de hecho una subálgebra de Lie-Banach de A. Se sigue que U es un grupo
de Lie-Banach, con una topología tal vez más fina que la heredada de G (la
topología de G coincide con la de A por ser abierto). Puede probarse que si
X es un espacio de Banach complejo y A = B(X) es el álgebra de Banach de
operadores acotados en X, entonces el grupo de isometrías U ⊂ GL(X) = GA
tiene la topología de subespacio siempre y cuando la bola unitaria de X sea
homogénea, esto es, cuando las funciones biholomorfas actuen transitivamente
en la bola (ver [39, Teorema 2]). En el mismo artículo (Ejemplo 6), o en las notas
del Seminario Dubreil de K. H. Hofmann [41], puede hallarse un ejemplo de un
grupo de isometrías de un espacio de Banach que no es un grupo de Lie con la
topología heredada.
Observación 4.4.3. Se suele denominar Hermitiano a todo elemento x ∈ A tal
que ix ∈ u, es decir
Herm(A) = iu = {x ∈ A : exp(itx) ∈ U
∀ t ∈ R}.
En el contexto de álgebras C∗ , es fácil ver que los Hermitianos de una y otra
definición coinciden, es decir x ∈ Herm(A) si y sólo si x∗ = x, ver el Ejercicio
4.vi.
Definición 4.4.4. Para a ∈ A, denotaremos
D(a) = {ϕ ∈ A ′ : kϕk = 1, ϕ(a) = kak},
que es no vacío por el Teorema de Hahn-Banach (de hecho, es convexo y compacto
si se provee a A de la topología ω∗ , que es la topología de convergencia puntual,
ver el Apéndice A.3). Definimos
V(a) = {ϕ(a) : ϕ ∈ D(a)}
que resulta un conjunto compacto convexo de C, no vacío pues σ(a) ⊂ V(a) (ver
el Lema A.3.5) en los apéndices).
Proposición 4.4.5. Sea a ∈ A un álgebra de Banach. Son equivalentes:
1. a ∈ Herm(A).
2. keita k ≤ 1 para todo t ∈ R.
4.4. El grupo de isometrías
79
3. V(a) ⊂ R.
4. lı́m 1s {k1 + isak − 1} = 0 para s ∈ R.
s→0
5. Para todo t ∈ R, 1 + ita es inversible y expansivo, i.e. para todo z ∈ A
k(1 + ita)zk ≥ kzk.
Demostración. Como para todo g ∈ GA se tiene kgkkg−1 k ≥ kgg−1 k = 1,
entonces kg−1 k ≥ kgk−1 . Luego si keita k ≤ 1 para todo t ∈ R, entonces
1 ≥ keita k = k(ei(−t)a )−1 k ≥ kei(−t)a k−1 ≥ 1
lo que nos dice que 1. y 2. son equivalentes. La equivalencia entre 2. y los ítems
3. y 4. es consecuencia del cuarto ítem del Teorema A.3.6 del Apéndice.
Veamos que a Hermitiano implica la condición del ítem 5. Basta probarla
para t = 1. Como a es Hermitiano, V(a) ⊂ R y entonces σ(a) ⊂ R. Luego
σ(1 + ia) ⊂ 1 + iσ(a) ⊂ 1 + iR
lo que nos dice que 1 + ia es inversible. Para ver que es expansivo, basta probar que kz + iazk ≥ 1 para todo z ∈ A con kzk = 1. Tomemos
ϕ ∈ D(z) (ver el Apéndice A.3), observemos que como a es Hermitiano entonces ϕ(az) ∈ V(a, z) ⊂ V(a) ⊂ R. Luego Reϕ(iaz) = Reiϕ(az) = 0. En
consecuencia
1 = ϕ(z) = Reϕ(z) = Reϕ(z + iaz) ≤ |ϕ(z + iaz)| ≤ kz + iazk.
Recíprocamente, supongamos que 1 + ita es inversible y expansivo para todo
t ∈ R. Si t es suficientemente pequeño, entonces
X
(1 − ita)−1 =
(it)n an = 1 + ita + o(t2 ).
n≥0
Como k(1 − ita)−1 k ≤ 1 y k1 + itak ≥ 1, deducimos que para t suficientemente
pequeño y positivo
0 ≤
≤
k(1 − ita)−1 + o(t2 )k − 1
k1 + itak − 1
=
t
t
−1
k(1 − ita) k − 1
+ o(t) ≤ o(t)
t
con lo cual
lı́m
t→0+
k1 + itak − 1
= 0.
t
80
El Grupo Lineal
Como −a verifica las mismas hipótesis que a, se deduce que
lı́m
t→0+
k1 − itak − 1
= 0,
t
y cambiando t por −t se deduce que el otro límite lateral también es nulo, lo
que prueba que a es Hermitiano.
4.4.1.
El grupo unitario de un álgebra C∗
Para una C∗ -álgebra A, denotemos con Ah a los elementos Hermitianos del
álgebra.
Lema 4.4.6. Sea u ∈ A una C∗ -álgebra, que supondremos representada en
un espacio de Hilbert H. Entonces son equivalentes
1. uu∗ = u∗ u = 1.
2. kuηk = ku∗ ηk = kηk para todo η ∈ H.
3. u es una isometría, es decir u es inversible y kuk = ku−1 k = 1.
Demostración. Si u es unitario, es decir, si vale 1., entonces
kuηk2 = huη, uηi = hu∗ uη, ηi = h1η, ηi = kηk2
y lo mismo vale para u∗ , lo que prueba 2.
Si vale 2. u es inyectivo y su rango es cerrado, y lo mismo vale para u∗ , pero
como ran(u)⊥ = ker(u∗ ) = {0}, se deduce que ran(u) = H y entonces u es
inversible. Además kuk = ku∗ k = 1 y
Rehu∗ uη, ξi =
=
ku∗ u(η + ξ)k2 − ku∗ uηk2 − ku∗ uξk2
1/2 kη + ξk2 − kηk2 − kξk2 = Rehη, ξi,
1/2
y lo mismo vale para uu∗ , se tiene que u∗ = u−1 , luego ku−1 k = 1 y esto prueba
3.
Por último, supongamos que u es inversible y que kuk = ku−1 k = 1. Es
decir, u es una isometría. Entonces
hu∗ uη, ξi =
=
huη, uξi = 1/2 ku(η + ξ)k2 − kuηk2 − kuξk2
1/ kη + ξk2 − kηk2 − kξk2 = hη, ξi
2
con lo cual u∗ u = 1, y entonces uu∗ = uu∗ uu−1 = u1u−1 = 1 también.
4.4. El grupo de isometrías
81
Luego el grupo de isometrías en un álgebra C∗ es el grupo unitario del álgebra. Su álgebra de Lie-Banach es el espacio iAh de operadores antihermitianos,
y como
U = {u ∈ GA : u∗ u = uu∗ = 1},
es esperable que el Teorema 4.3.2 nos permita concluir que la topología de U
dada por la carta exponencial concuerda con la topología de subespacio de GA .
Es decir, todo abierto de U se consigue como unión de bolas -en norma- de
A, cortadas con el grupo unitario. Los polinomios naturales a considerar son la
familia indexada por ξ ∈ H dada por
{Pξ (a) = kaξk2 − kξk2 }
que claramente tiene grado 2 y anula al grupo unitario U. Sin embargo, una
cuidadosa inspección de la sección previa nos dice que los polinomios deben ser
polinomios complejos, es decir deben sacar constantes complejas, lo cual no se
verifica aquí. Sin embargo, este problema se puede solucionar considerando la
complexificación de los polinomios dada por una expresión estándar que puede
verse por ejemplo en [52, Sección 3]. En particular, la forma bilineal real
β(ξ, η) = Rehξ, ηi
que induce el polinomio real p(ξ) = kξk2 , nos permite obtener la complexificación de p, descomponiendo a ξ = x + iy ∈ H en sus partes real e imaginaria y
definiendo
p̃(x + iy) = kxk2 − kyk2 + 2i Re hx, yi.
Es fácil verificar que si λ = a + ib ∈ C entonces en efecto p̃(λ(x + iy)) =
λ2 p̃(x + iy), y por otra parte p̃(uξ) = p̃(ξ) para todo u ∈ U, luego el grupo
unitario es un grupo algebraico y se obtiene el resultado esperado:
Corolario 4.4.7. El grupo de operadores unitarios de un espacio de Hilbert
es un grupo de Lie-Banach cuya topología coincide con la de la norma
uniforme de B(H), y cuya álgebra de Lie-Banach consiste en el espacio de
operadores anti-Hermitianos.
4.4.1.1.
Logaritmos de operadores unitarios
Veremos algunas propiedades del grupo de unitarios de un álgebra C∗ . Recurrimos para ello al cálculo funcional continuo (ver el Apéndice B).
Observemos que si u ∈ U, entonces ku−1k ≤ 2 y más generalmente ku−vk ≤
2 para todo u, v ∈ U. Si ku − 1k < 1 entonces
z = log(u) =
X (−1)n+1
(u − 1)n .
n
n≥1
82
El Grupo Lineal
verifica ez = u. Por otra parte, supongamos que ku − 1k < 2. Entonces como
σ(u) ⊂ S1 , se tiene
máx{|eit − 1| : eit ∈ σ(u)} = r(u − 1) ≤ ku − 1k < 2,
lo que nos dice que −2 ∈
/ σ(u − 1) o equivalentemente −1 ∈
/ σ(u). Es decir,
σ(u) ⊂ S1 − {−1}.
Sea
log : {a + ib ∈ C : a > 0 ó b 6= 0} → {x + iy : −π < y < π}
la determinación usual del logaritmo en el plano complejo sin el semieje negativo de los números reales. Entonces log es una función analítica definida en un
entorno de σ(u), y por lo tanto está bien definido el cálculo funcional
I
1
log(w)(w − u)−1 dw
z = log(u) =
2πi γ
para cualquier curva simple γ, orientada de forma positiva, alrededor de σ(u).
Por propiedades generales del cálculo funcional, se verifica ez = exp ◦ log(u) =
id(u) = u, y además
σ(z) = log(σ(u)) ⊂ {it : t ∈ (−π, π)}.
Proposición 4.4.8. Si A es un álgebra C∗ entonces para todo u, v ∈ U tales
que ku − vk < 2 existe un único z ∈ Ah tal que kzk < π y v = ueiz . La
asignación (u, v) 7→ z es analítica en
U = {(u, v) ∈ U × U : ku − vk < 2}.
Demostración. Supongamos primero que v = 1 y que ku − 1k < 2. Entonces
z = log(u) es un operador normal pues se obtiene como cálculo funcional de u
que es normal. Como
z∗ = log(u)∗ = log(u∗ ) = log(u−1 ) = − log(u)
se deduce que z es antihermitiano. Además como σ(z) ⊂ i(−π, π) ⊂ iR, kzk =
r(z) < π. Si tomamos x = iz, entonces x verifica todo lo requerido.
Si ku−vk < 2, entonces w = u∗ v es unitario y además kw−1k = ku∗ v−1k =
kv − uk < 2, con lo cual por el caso anterior existe x ∈ Ah tal que kxk < π y
u∗ v = w = eix , de donde se deduce que v = ueix .
Para probar la última afirmación, podemos suponer nuevamente que v = 1
y que ku − 1k < 2. Como u 7→ (u − w)−1 es analítica para todo w ∈ γ (una
4.5. El cono positivo de un álgebra C∗
83
curva que rodee al espectro de u) admite localmente un desarrollo en serie con
polinomios homogéneos en el espacio de Banach A. Integrando término a término
la serie en γ, tenemos una nueva serie de potencias que nos da u 7→ log(u)
localmente, lo que nos dice que esta aplicación es analítica.
Proposición 4.4.9. Si A es un álgebra de von Neumann entonces para todo
u, v ∈ U existe x ∈ Ah tal que kxk ≤ π y v = ueix .
Demostración. Como ku − vk = k1 − u∗ vk, podemos suponer que u = 1. Si
σ(u) 6= S1 , usamos el corolario previo. En caso contrario, sea log definido como
el logaritmo usual en S1 − {−1}, y extendido arbitrariamente (por ejemplo, como
π) en λ = −1. Esta función es Boreliana y acotada en S1 , con lo cual podemos
hacer el cálculo funcional z = log(u) del elemento normal u, que verifica kzk ≤
klogk∞,σ(u) = klogk∞,S1 = π. Se verifica ez = exp ◦ log(u) = u, z∗ = −z con lo
cual x = (−i)z es el elemento buscado.
4.5.
El cono positivo de un álgebra C∗
Si A es un álgebra C∗ , denotemos con G+
A a los elementos positivos e inversibles, es decir
∗
G+
A = {g ∈ GA : g = g, σ(g) ⊂ (0, +∞)} ⊂ Ah .
Observemos que si v, w ∈ Ah , entonces adv(w) = [v, w] ∈ iAh , mientras que
ad2 v(w) = [v, [v, w]] = v2 w + wv2 − 2vwv ∈ Ah .
Teorema 4.5.1. Sea A una C∗ -álgebra. Entonces
+
1. exp(Ah ) = G+
A , y exp : Ah → GA es una biyección.
2. G+
A es abierto en Ah .
3. Si v, w ∈ Ah , entonces
v/2
exp∗v (w) = e
Y
senh(adv/2)
ad2 v
v/2
v/2
(w)·e
=e ·
·
1 − 2 2 (w)·ev/2
adv/2
4n π
n∈N
4. exp∗v : Ah → Ah es globalmente inversible y exp : Ah → G+
A es un
difeomorfismo.
84
El Grupo Lineal
Demostración. Para probar 1. primero notamos que si v∗ = v, entonces ev es
∗
positivo e inversible por el teorema espectral, ya que (ev )∗ = ev = ev y además
σ(ev ) = exp(σ(v)) ⊂ exp(R) ⊂ (0, +∞).
Luego exp(Ah ) ⊂ G+
A , pero nuevamente invocando el teorema espectral tenemos,
+
para cada a ∈ GA un único logaritmo real ln(a) que es Hermitiano y verifica
que exp(ln(a)) = a. Luego los conjuntos son iguales, y exp es una biyección ya
que ev = ew con v, w Hermitianos implica que tienen el mismo logaritmo real y
entonces v = w.
Para ver el ítem 2. recordemos que exp∗0 es la identidad, y si a ∈ G+
A,
podemos considerar
v 7→ a1/2 exp(v)a1/2
que es un difeomorfismo local y entonces manda un entorno abierto de 0 ∈ Ah
en un entorno abierto de a ∈ G+
A.
Para probar el ítem 3. observamos que
e−v/2 exp∗v (w)e−v/2
= ev/2 F(adv)we−v/2 = eadv/2 F(adv)w
=
eadv/2 − e−adv/2
(w),
2adv/2
y que la expansión en productos de Weierstrass de senh(λ)/λ es
Y Y
λ
λ2
λ
kπi
1−
=
1− 2 2 .
e
kπi
n π
k∈Z6=0
n∈N
Finalmente, observemos que σ(adv) ⊂ σ(Lv ) − σ(Rv ) pues estos operadores conmutan (ver el Corolario B.3.2), y por otra parte, por el Lema 4.1.1,
σ(Lv ) = σ(v) ⊂ R y lo mismo se aplica para Rv . Se sigue que σ(adv) ⊂ R,
con lo cual senh(λ)/λ no se anula en adv y entonces la diferencial de la exponencial es inversible globalmente, para todo v ∈ Ah . Como exp restringido a los
Hermitianos era una biyección global con los positivos invertibles, tenemos que
se trata de un difeomorfismo (por ser un difeomorfismo local).
4.5.1.
Conos positivos
Si a ≥ 0 y t ∈ R≥0 entonces obviamente ta ≥ 0. También es cierto que
la suma de positivos da positivo, para probarlo usamos el radio numérico: si
a, b ≥ 0 entonces a + b es autoadjunto y además para todo estado ρ se verifica
ρ(a + b) = ρ(a) + ρ(b) ≥ 0
4.5. El cono positivo de un álgebra C∗
85
lo que nos dice que a + b ≥ 0 (Corolario B.3.13).
En consecuencia, el conjunto de operadores positivos forma un cono convexo,
que se suele denominar cono de operadores positivos y denotado A+ .
Si a, b ∈ Ah , diremos que a ≥ b si a − b ≥ 0.
Corolario 4.5.2. La relación ≥ define un orden parcial en Ah , es decir
1. a ≤ a para todo a ∈ Ah .
2. a ≤ b y b ≤ a implican a = b.
3. a ≤ b y b ≤ c implican a ≤ c.
Además
a≥b
⇒
y
a≥b
ra ≥ rb para todo r ∈ R≥0 ,
c≥d
⇒
a + c ≥ b + d.
Demostración. Ciertamente a ≤ a pues a − a = 0 ≥ 0.
Si a ≤ b y b ≤ a entonces σ(a − b) = {0}, y como a − b ∈ Ah , se tiene
ka − bk = r(a) = 0 luego a = b.
Si a ≤ b y b ≤ c entonces b − a ≥ 0 y c − b ≥ 0; como la suma de positivos
es positivo se tiene c − a = b − a + (c − b) ≥ 0 con lo cual c ≥ a.
Si a ≤ b entonces obviamente ra ≥ rb; por otra parte a ≥ b y c ≥ d implican
a − b + c − d ≥ 0, que es lo mismo que decir a + c ≥ b + d.
Para a ∈ Ah , el número
ia = mı́n{s : s ∈ σ(a)} ∈ R
está bien definido por ser σ(a) un compacto en R.
Lema 4.5.3. Sea a ∈ Ah . Entonces
σ(a − ia ) = {t − ia : t ∈ σ(a)},
y en particular a ≥ ia 1.
Demostración. Si ia = 0 no hay nada que probar. Supondremos que ia 6= 0.
Entonces (ver la Observación A.2.1), se tiene
−1
σ(a − ia ) = (−ia )σ(1 − i−1
a a) = (−ia ){1 − ia t : t ∈ σ(a)} = {t − ia : t ∈ σ(a)}.
Como ia ∈ R, a − ia es Hermitiano y como t − ia ≥ 0 para todo t ∈ σ(a), se
deduce que a − ia ≥ 0.
86
El Grupo Lineal
Si a, b ≥ 0 son inversibles, entonces ia , ib > 0 con lo cual a + b ≥ ia + ib > 0
y esto nos dice que a + b no sólo es positivo, sino que también es inversible,
se sigue que G+
A es un cono convexo (las combinaciones convexas caen dentro).
Este admite una acción natural del grupo de inversibles GA ,
+
π : GA × G+
A → GA
(g, a) 7→ gag∗ = ga1/2 (ga1/2 )∗ .
1/2 −1/2
a
verifica
Esta acción es transitiva pues si a, b ∈ G+
A , entonces g = b
Ig (a) = gag∗ = b.
En particular podemos pensar que G+
A es O(1), la órbita de la identidad por la
acción. El grupo de isotropía H1 de esta acción en a = 1 es exactamente el grupo
unitario pues si g = u|g| es la descomposición polar de g con u ∈ U y |g| ∈ A+ ,
entonces
1 = Ig (1) = gg∗ = u|g|2 u∗
de donde se deduce que |g|2 = 1 y entonces |g| = 1. En este caso tanto G+
A =
O(1) ⊂ Ah como U = H1 ⊂ GA son subvariedades embebidas.
4.5.2.
Descomposición de Cartan y conmutadores
El álgebra A admite una descomposición
A=k⊕p
donde k = iAh es un álgebra de Lie-Banach (que corresponde al grupo unitario)
y p = Ah es un subespacio real cerrado que verifica ser un triple de Lie, esto es
ad2 v(w) = [v, [v, w]] ∈ p
siempre que v, w ∈ p. Como vw − vw ∈ iAh si v, w ∈ Ah y kv − vk ∈ Ah
si k ∈ iAh , v ∈ Ah , entonces el álgebra A es de esta manera un álgebra Z2 graduada, en el sentido siguiente
[k, k] ⊂ k,
[k, p] ⊂ p,
[p, p] ⊂ k.
Definición 4.5.4. Si g es un álgebra de Lie-Banach, y k, p ⊂ g son dos subespacios tales que
g = k⊕p
y además
[k, k] ⊂ k,
[k, p] ⊂ p,
[p, p] ⊂ k.
se dice que k, p es una descomposición de Cartan de g.
4.6. Órbitas de similaridad y coadjuntas
87
Si z ∈ k = iAh , entonces la pregunta de si existen v, w ∈ p = Ah tales que
[v, w] = z
es difícil de contestar. Si z = it con t ∈ R, entonces vw − wv = it implica
vw = it + wv con lo cual
σ(wv) ∪ {0} = σ(vw) ∪ {0} = {it + σ(wv)} ∪ {0}
y esto es absurdo salvo que t = 0.
Si A = Mn (C), tomando traza en el problema vw − wv = z de incógnita
z ∈ Mn (C) se obtiene también la condición necesaria
0 = tr(vw − wv) = tr(z),
lo que nos dice que los conmutadores de Hermitianos caen en un subespacio
propio de Mn (C), suplementario a C1. De hecho, esta condición es suficiente:
toda matriz de traza cero se puede escribir como el conmutador de dos matrices.
La prueba de este hecho (válido en cualquier cuerpo k) puede verse por ejemplo
en el trabajo [1].
En el caso infinito-dimensional, este enunciado está lejos de ser cierto pues
puede probarse que los conmutadores son densos con la topología uniforme (la de
la norma). Recordemos que denotamos B(H) a los operadores lineales acotados
del espacio de Hilbert H. Entonces, si A = B(H) con H infinito dimensional,
entonces dado z ∈ A existen v, w ∈ A tales que z = wv − vw si y sólo si
z∈
/ {λ + k : C ∋ λ 6= 0, k compacto }.
En particular el conjunto de conmutadores tiene interior no vacío. Todos estos
resultados están en el trabajo de Brown y Percy [20].
4.6.
Órbitas de similaridad y coadjuntas
En el caso de un operador a ∈ A donde A es una C∗ -álgebra, podemos
considerar su órbita con la acción del grupo de inversibles
O(a) = {gag∗ : g ∈ GA } ⊂ A.
En general no es sencillo garantizar que la órbita es una subvariedad del espacio
ambiente.
88
4.6.1.
El Grupo Lineal
La órbita de similaridad de un inversible autoadjunto
En un trabajo de Corach-Porta y Recht [28] se estudia el caso a ∈ GA , a = a∗ .
Puede verse que O(a) ⊂ Ah es una subvariedad: de hecho O(a) es abierto en
GA ∩ Ah , y el grupo de isotropía Ka ⊂ GA es subgrupo de Lie-Banach regular.
Esto es porque el fibrado
I : GA → O(a),
g 7→ πa (g) = gag∗
admite secciones suaves, en el sentido del Teorema 3.3.5. Especializando este
teorema para el caso de la órbita de un operador inversible autoadjunto, tomamos M = Gh
A y si B1 (1) ⊂ C denota la bola unitaria abierta alredor del 1,
consideramos
U = {b ∈ M : σ(ba−1 ) ⊂ B1 (1)}
que es un entorno abierto de a ∈ M por la semicontinuidad del espectro (Lema
A.2.3). Luego, para todo elemento b ∈ U, el producto ba−1 tiene un logaritmo
analítico, y por ende una raíz cuadrada analítica. Definimos s : U → GA la
1
sección s(b) = (ba−1 ) 2 . Entonces como gh(z)g−1 = h(gzg−1 ) para todo g
inversible y toda h analítica en un entorno del espectro de z, tenemos
∗
1
1
1
1
= (ba−1 ) 2 ab−1 b(a−1 b) 2 b−1 b
(ba−1 ) 2 a (ba−1 ) 2
=
1
1
(ba−1 ) 2 (ba−1 )−1 (ba−1 ) 2 b = b.
Esto nos dice que s es una sección para π, y por el Teorema 3.3.5 la órbita es
abierta. El grupo de isotropía en este caso es
Ka = {u ∈ GA : au∗ = u−1 a}.
4.6.2.
La órbita coadjunta de un operador autoadjunto
En el caso de actuar con el grupo unitario U de una C∗ -álgebra A, podemos
considerar la órbita de un operador autoadjunto a (no necesariamente inversible).
En este caso como πa (u) = uau∗ , se tiene que el grupo de isotropía
Ka = {u ∈ U : ua = au}
coincide con U ∩ C∗ (a) ′ donde aquí la prima denota el conmutante del álgebra
generada por a. El álgebra de Lie-Banach son los antihermitianos que conmutan
con a, es decir
k = {x∗ = −x : xa = ax}.
No se conocen buenos criterios generales para decidir si Ka ⊂ G es subgrupo de
Lie-Banach y si O ⊂ Ah es subvariedad (salvo en el caso finito dimensional). Sin
4.6. Órbitas de similaridad y coadjuntas
89
embargo, mencionamos algunos resultados en ese sentido. Diremos que A es un
álgebra de von Neumann inyectiva si contiene una sucesión ascendente
A1 ⊂ · · · ⊂ An ⊂ An+1 ⊂ · · · A
de subálgebras de dimensión finita de manera que la unión ∪n∈N An es densa
en la topología SOT. Por ejemplo B(H) es inyectiva pues la identidad es límite
fuerte de proyectores de rango finito.
Puede probarse (ver el Teorema 4.33 en el libro de D. Beltiţǎ [17]) que si
A es de von Neumann e inyectiva, entonces el álgebra de Lie-Banach se parte,
un suplemento está dado por el núcleo de un proyector E : A → W ∗ (a) ′ , donde
W ∗ (a) es el álgebra de von Neumann generada por a y nuevamente la prima
denota conmutante. En este caso el cociente O tiene una estructura natural de
variedad diferenciable para la cual π es una sumersión (ver el Teorema 3.3.2).
Respecto de la inclusión O ⊂ B(H)h , puede probarse que la óbita es cerrada
(esto ocurre si y sólo si tiene la topología de subespacio) si y sólo si C∗ (a) es un
álgebra de dimensión finita. La prueba de este hecho puede verse en un trabajo
de Esteban Andruchow y Demetrio Stojanoff [10].
4.6.3.
La Grassmanniana como la órbita de un proyector
El primer ejemplo de Grassmanniana surge de considerar un proyector p =
p∗ = p2 en un álgebra C∗ , y su órbita coadjunta
Gr(p) = {upu∗ : u ∈ U}.
donde identificamos un subespacio S ⊂ H con el único proyector ortogonal que lo
tiene como rango. Como discutimos en la sección de matrices, la acción p 7→ upu∗
es simplemente la traducción de la acción natural de “mover” el subespacio vía
S 7→ u(s), es decir pu(S) = upu∗ . Veamos la prueba de esta afirmación. En
primer lugar es evidente que upu∗ es un proyector, sea S ′ = ran(upu∗ ) su
rango. Entonces si ξ ∈ H,
ξ ∈ u(S) ⇔ u∗ ξ ∈ S ⇔ pu∗ ξ = u∗ ξ ⇔ upu∗ ξ = ξ ⇔ ξ ∈ ran(upu∗ ) = S ′ .
Los contenidos de esta sección están basados en los trabajos [6, 27, 58] de
Andruchow, Corach, Porta, Recht, Stojanoff et. al, pero cabe aclarar que la
estructura diferenciable de la órbita de un idempotentes p2 = p en un álgebra
de Banach fue estudiada en detalle con anterioridad por J. P. Holmes en [42, 43].
Asimismo, una presentación alternativa de un atlas para la Grassmanniana (en
este caso vista como subespacios del espacio de Hilbert), puede encontrarse en
el trabajo [23] de K. Chung. Se recomienda también ver el trabajo [49], donde
90
El Grupo Lineal
se estudian las Grassmannianas generalizadas (variedades de bandera) en un
álgebra C∗ .
Denotemos con
P(A) = {p = p∗ = p2 : p ∈ A}
al conjunto de los proyectores de A. Para q ∈ P(A), sea πq : U → P(A) la
acción πq (u) = uqu∗ , y
Kq = {u ∈ U : uq = qu}
el grupo de isotropía de πq . La inclusión
P(A) ⊂ Ah
es una inclusión de subvariedades, pero no necesariamente regular ni embebida.
En el resto de la sección, construimos una estructura diferenciable para P(A).
Fijado p ∈ P(A), descomponemos al espacio A como suma directa de operadores p-diagonales y p-codiagonales respectivamente (ver la Observación 3.5.1):
A = AD ⊕ AC
con
AC = {z ∈ A : pzp = (1 − p)z(1 − p) = 0}
y
AD = {z ∈ A : pz(1 − p) = (1 − p)zp = 0}.
Denotamos con Aah a los operadores anti Hermitianos, consideramos entonces
el mapa dado por
π
Q : AC
ah ∩ {z ∈ A : kzk < /2} → P(A)
Q(z) = πp ◦ exp(z) = ez pe−z .
Vamos a probar que esta función (claramente suave) cubre el abierto de P(A)
dado por
Up = {q ∈ P(A) : kq − pk < 1},
que Q es biyectiva y su inversa es suave. Necesitamos una observación sobre
proyectores primero.
Observación 4.6.1. Sea p ∈ P(A). Definimos ǫp = 2p − 1, entonces ǫp es una
simetría, es decir ǫp = ǫ∗p = ǫ−1
p . Esto es porque
ǫ2p = (2p − 1)(2p − 1) = 4p − 4p + 1 = 1.
4.6. Órbitas de similaridad y coadjuntas
91
Luego ǫp es unitario y en particular isometría; observemos que si q es otro
proyector y ǫq la simetría asociada entonces
kǫp ǫq − 1k = k(ǫp − ǫq )ǫq k = 2kq − pk.
Además, z ∈ AC
ah (respecto de p), si y sólo si ǫp anticonmuta con z, es decir
ǫp z = −zǫp
y entonces también ǫp ez ǫp = exp(ǫp zǫp ) = e−z , luego
ǫp e−z = ez ǫp .
Ahora si Q es el mapa que queremos usar como carta, vemos que
kQ − pk = kez (
ǫp + 1
ǫp + 1 −z
)e − (
)k = 1/2ke2z ǫp − ǫp k = 1/2ke2z − 1k.
2
2
Observación 4.6.2. Por el teorema espectral, σ(e2z − 1) = e2σ(z) − 1, y como el
espectro de z es puramente imaginario, tenemos que
σ(e2z − 1) = {e2it − 1 : it ∈ σ(z)} = {cos(2t) − 1 + i sen(2t) : it ∈ σ(z)}.
Luego
p
√
ke2z − 1k = 2 máx{ 1 − cos(2t) : t ∈ σ(−iz)}.
p
La función t 7→ 1 − cos(2t) es creciente, y como kzk = r(z), se tiene
√ p
ke2z − 1k = 2 1 − cos(2kzk).
Así que kQ − pk < 1 si y sólo si kzk <
π
2.
Por otra parte, como
2Q − 1 = ez ǫp e−z = e2z ǫp ,
resulta e2z = (2Q − 1)ǫp . Llamando ǫQ = 2Q − 1, tenemos
k(2Q − 1)ǫp − 1k = kǫQ ǫp − 1k = 2kQ − pk < 2,
lo que nos dice que Q tiene una inversa dada por la función analítica
Q 7→ 1/2 log((2Q − 1)ǫp ).
Es decir, Q donde está definida es suave, inyectiva, y tiene inversa suave. Nos
falta ver que la imagen es todo el conjunto
Up = {q ∈ P(A) : kq − pk < 1}.
Para ello tenemos la siguiente proposición.
92
El Grupo Lineal
Proposición 4.6.3. Sea p ∈ P(A). Dado q0 ∈ O = O(p), sea U ⊂ P(A) el
abierto
U = {q ∈ P(A) : kq − q0 k < 1}.
Entonces existe una sección local s : U → U para πq0 que es analítica (real),
tal que ks(q) − 1k < 2 y para tod q ∈ U se tiene
z = log(s(q)) ∈ AC
ah
(respecto de q0 ).
En particular O ⊂ P(A) es abierto y πp : U → O es una proyección.
Demostración. Supongamos primero que q0 = p. Si kq − pk < 1, entonces
w = qp + (1 − q)(1 − p) =
ǫq ǫp + 1
2
es inversible pues kw − 1k = kp − qk < 1 por la observación previa. Sea w = s|w|
la descomposición polar a izquierda de w. Como w es inversible s es unitario y
|w| es inversible, además
s = w(w∗ w)−1/2 = w|w|−1
es una función analítica real. Luego s = s(q) es una función analítica real en U.
Veamos que es una sección para π = πp (obviamente s(p) = 1 pues si q = p
entonces w = 1). Como wp = qw, se tiene pw∗ = w∗ q, luego
pw∗ w = (pw∗ )w = (w∗ q)w = w∗ (qw) = w∗ wp
y entonces w∗ w conmuta con p y por ende |w| conmuta con p. De wp = qw,
adjuntando deducimos que q = (w∗ )−1 pw∗ y entonces
πp ◦ s(q)
=
sps∗ = w|w|−1 p|w|−1 w∗ = w|w|−2 pw∗
=
w(w∗ w)−1 pw∗ = (w∗ )−1 pw∗ = q.
Dado q0 = upu∗ ∈ O arbitrario, tomamos el abierto correspondiente
U0 = {q ′ ∈ P(A) : kq ′ − q0 k < 1} = u{q ∈ O : kq − pk < 1}u∗
y la sección s0 : U0 → U dada por s0 (uqu∗ ) = us(q). Entonces
πq0 ◦ s0 (uqu∗ ) = us(q)ps(q)∗ u∗ = uqu∗
lo que prueba que s0 es una sección para πq0 .
4.6. Órbitas de similaridad y coadjuntas
93
En lo que sigue, ǫ = ǫp y u = ǫq ǫ para no cargar la notación. Observemos
que, como w = u+1
2 , con u unitario, entonces w es normal y además
|w|2 = w∗ w = 1/4(1 + u + u∗ + 1) = 1/2 (1 + Re(u)) .
Luego
1
1
1
1
s = w|w|−1 = √ (u + 1)(1 + Re(u))− 2 = √ (1 + Re(u))− 2 (u + 1),
2
2
y
1
1
s∗ = √ (u∗ + 1)(1 + Re(u))− 2
2
∗
Entonces como ǫu = ǫq , tenemos al multiplicar la última expresión por ǫ
√
1
1
2ǫs∗ = ǫ(ǫq ǫ + 1)ǫǫ(1 + Re(u))− 2 ǫǫ = (u + 1)(1 + Re(ǫuǫ))− 2 ǫ
√
1
= (u + 1)(1 + Re(u∗ ))− 2 ǫ = 2sǫ.
Es decir ǫs∗ = sǫ. Luego
ks2 − 1k = ks2 ǫ − ǫk = ksǫs∗ − ǫk = 2ksps∗ − pk = 2kq − pk < 2
Con lo cual si z = 12 log(s2 ) = log(s), se tiene que kzk <
ks2 − 1k. Ciertamente z es antihermitiano, pues
π
2
porque ke2z − 1k =
z∗ = log(s∗ ) = log(s−1 ) = − log(s) = −z.
Falta ver que es p-codiagonal:
ez = s = ǫs∗ ǫ = ǫe−z ǫ = exp(−ǫzǫ)
y tomando logaritmos se tiene que z anticonmuta con ǫ.
Corolario 4.6.4. Si p ∈ P(A), entonces el mapa dado por
Q(z) = πp ◦ exp(z) = ez pe−z ,
con
π
Q : AC
ah ∩ {kzk < /2} → P(A) ∩ {kq − pk < 1} = Gr(p) ∩ {kq − pk < 1},
es un difeomorfismo (analítico real), con inversa
h
i
1
Z(q) = log 1/√2(u + 1)(Re(u) + 1)− /2 ,
donde u = ǫp ǫq ∈ U.
94
El Grupo Lineal
Luego P(A) es una variedad diferenciable, las componentes conexas son las
órbitas Gr(pi ) de ciertos pi ∈ P(A), que resultan abiertas por la existencia de
las secciones locales construidas en la proposición previa.
Veamos cual es el rango de Q∗0 para saber quién es el espacio tangente en
un p ∈ P(A). Como exp∗0 = id, sólo hay que estudiar el mapa πp . Observemos
que πp : U → P(A) ⊂ Ah . Además, si z∗ = −z entonces
d d tz
π
(e
)
=
etz pe−tz = zp − pz.
p
dt t=0
dt t=0
Es decir, π∗ = (πp )∗1 toma valores en operadores p-codiagonales. Pero no es
difícil ver que el rango de π∗ coincide con los operadores p-codiagonales de Ah :
por ejemplo, si v ∈ Ah es p-codiagonal, podemos tomar z = vp − pv ∈ Aah y
entonces
π∗ (z) = (vp − pv)p − p(vp − pv) = vp − 0 − 0 + pv = v
pues pvp = 0 y (1 − p)v(1 − p) = 0. Es decir
Tp P(A) = ran(π∗ ) = AC
h = {v ∈ Ah : pv(1 − p) = 0},
que tiene un suplemento natural dado por los hermitianos diagonales
AD
h = {v ∈ Ah : (1 − p)v(1 − p) = pvp = 0}.
Por otra parte,
ker(π∗ ) = AD
ah = {z ∈ Aah : zp = pz},
tiene también un suplemento natural, que son los elementos antihermitianos
p-codiagonales, es decir
AC
ah = {z ∈ Aah : (1 − p)zp = 0}.
Entonces el Teorema de la Función Implícita (Teorema 1.5.5) nos dice que Kp ⊂
U es una subvariedad regular.
Por otra parte (Teorema 2.4.2) existe un abierto V ⊂ U tal que el pedazo de
la órbita O = Gr(p) dado por πp (V) ⊂ Ah es subvariedad regular. Si tenemos
en cuenta la proposición previa sobre las secciones suaves para O, este abierto
V es simplemente
√
π
2, ǫu∗ = uǫ}.
V = exp AC
ah ∩ {kzk < /2} = {u ∈ U : ku − 1k <
Sin embargo, con las cuentas que ya hicimos podemos probar el siguiente teorema
que es más fuerte.
4.A. Problemas
95
Teorema 4.6.5. Sea P(A) ⊂ Ah con la topología de subespacio. Entonces
la estructura diferenciable que introdujimos usando Q induce una topología
en P(A) que coincide con la heredada.
Demostración. La existencia de secciones suaves s : P(A) → U prueba que
πp : U → P(A) es abierta. Y según observamos π∗ se parte tanto en rango como
en núcleo, usando la descomposición en operadores p-diagonales y p-codiagonales
respectivamente. Entonces el criterio de Raeburn (Lema 3.3.6) nos asegura que
P(A) ⊂ Ah es una subvariedad regular que hace de π una sumersión.
4.A.
Problemas
4.I. Si A es un álgebra de Banach, probar que para todo v, w ∈ A se verifica
Z1
1 − e−adv
w.
e−tadv dtw =
adv
0
4.II. Si F, G son funciones enteras y ρF , ρG denotan los respectivos órdenes, probar
que
ρF+G , ρFG ≤ máx{ρF , ρG }.
Probar que sen(z), cos(z), sen(z)
z ,
tan(z) 1−ez
z , z
4.III. Probar que log(ev ew ) = v +
función entera dada por
g(λ) = 1 +
R1
0
tienen orden menor o igual a uno.
g(etadv etadw )wdt, con g : C → C la
X (−1)n+1
(λ − 1)n .
n(n + 1)
n≥1
4.IV. Desarrollando (etadv etadw − 1)n−1 en serie, probar la fórmula de Dynkin
para BCH(v, w) dada por
X (−1)n+1
1
[v(i1 ) , w(ji ) , · · · , v(in ) , w(jn ) ]
n
(i1 + j1 ) + · · · + (in + jn )
i1 !j1 ! · · · in !jn !
n≥1
donde la suma es sobre las 2n-uplas (i1 , · · · , in , j1 , · · · , jn ) tales que ik + jk ≥ n.
4.V. Si G es un grupo topológico, m : G × G → G denota el producto y V es
un entorno abierto de e ∈ G, tomamos W ⊂ V abierto tal que Ady−1 (W) ⊂ V.
Probar que si h, h ∈ xW, yW respectivamente entonces
m(h, h) = Lxy ◦ mV×V ◦ (Ady−1 × id) ◦ (Lx−1 × Ly−1 )(h, h).
4.VI. Sea A una C∗ -álgebra.
96
El Grupo Lineal
Probar que si a ∈ A es normal y σ(a) es un punto, entonces a es un
múltiplo de la identidad.
Si u ∈ A, probar que u es unitario si y sólo si u es normal y σ(u) ⊂ S1 .
Probar que x∗ = x si y sólo si x es normal y σ(x) ⊂ R.
Probar que x ∈ Herm(A) si y sólo si x∗ = x.
Capítulo
El Fibrado TTM
Que las teorias de gauge no abelianas
sean conceptualmente idénticas a las ideas
en la teoría de fibrados vectoriales,
desarrollada por matemáticos y sin
referencia alguna al mundo físico, me
maravillaba. En 1975 discutí esta
impresión con Chern, y le dije “es a la vez
emocionante y sorprendente, dado que
ustedes los matemáticos soñaron estos
conceptos de la nada“. El inmediatamente
protestó: “No, no. Estos conceptos no han
sido soñados. Eran naturales y bien
reales.”.
C.N. Yang
R
etomamos en este capítulo nociones generales de geometría que
nos permitirán introducir, en el próximo capítulo, las ideas de conexión y geodésica. Dada una variedad diferenciable M, el fibrado
TTM = T (TM) es simplemente el fibrado tangente de la variedad diferenciable
TM. Si M es de clase Ck , con k ≥ 2, TTM es una variedad de clase Ck−2 . Presenta,
por ser un espacio fibrado que se obtiene a partir de otro, ciertas características
especiales.
97
5
98
El Fibrado TTM
5.1.
Expresiones locales para TTM y sus proyecciones
Siguiendo la convención introducida en la Sección 2.2.2, con una carta (U, ϕ)
de M armamos una carta inducida (TU, τϕ ) de TM. Con esta carta armamos una
ϕ
carta (TTU, ττ ) de TTM = T (TM) copiando el procedimiento anterior. En estas
coordenadas se tiene entonces
U ≃ ϕ(U) ⊂ E,
TU ≃ τϕ (TU) ≃ V = ϕ(U) × E ⊂ E2 ,
y por último
ϕ
TTU ≃ ττ (TTU) ≃ W = V × (E × E) = (ϕ(U) × E) × (E × E) ⊂ E4 .
Es decir, si x = ϕ(p) ∈ ϕ(U), un punto genérico en TU se describe como (x, v)
con v ∈ E, y un punto genérico en TTU se describe como (x, v; u, w) con x ∈ M,
v ∈ Tx M, (u, w) ∈ T(x,v) TM. Con esta elección de coordenadas, el vector (u, w)
es el vector tangente al punto (x, v) ∈ TU, es decir (u, w) ∈ T(x,v) TU. Aquí
omitimos las identificaciones, es decir, en realidad TU es τϕ (TU).
5.1.1.
Proyecciones de TTM en TM
La proyección canónica πM : TM → M es (p, v) 7→ p, mientras que la proyección canónica de TTM, π = πTM : TTM → TM es en estas coordenadas el
mapa
(p, v; u, w) 7→ (p, v).
Pero atentos, que hay otra proyección natural, que es π∗ = (πM )∗ : TTM → TM,
que se obtiene diferenciando πM . Afirmamos que πTM 6= π∗ . Tomamos una
curva β : I → TM, que en coordenadas locales es β(t) = (xt , vt ) ∈ U × E con
x0 = x ∈ ϕ(U), v0 = v ∈ E. De acuerdo a nuestra convención, β ′ : I → T (TM)
d
(xt , vt )). Luego
es en coordenadas locales la curva β ′ (t) = ((xt , vt ); dt
β ′ (0) = (x, v; ẋ0 , v̇0 ).
Observemos que xt , debe pensarse como una curva en el espacio vectorial E por
ser ϕ(U) ⊂ E, con lo cual ẋ0 ∈ E, pero por otro lado si pensamos a xt como
una curva en la variedad N = ϕ(U), se tiene xt′ = (xt , ẋt ) de acuerdo a nuestra
convención. Diferenciando la relación π ◦ β(t) = xt en t = 0 y componiendo con
la inclusión canónica obtenemos π∗(x,v) ◦ β ′ (0) = (x, ẋ0 ), que es lo mismo que
decir que π∗(x,v) (x, v; ẋ0 , v̇0 ) = (x, ẋ0 ). Esto es, esencialmente
π∗ (x, v; u, w) = (x, u)
5.1. Expresiones locales para TTM y sus proyecciones
99
mientras que para la proyección canónica al punto base πTM : TTM → TM se
tiene como dijimos
π(x, v; u, w) = (x, v).
Como TTM es un fibrado vectorial sobre TM con respecto a dos proyecciones
distintas, hay que tener presente a cuál fibrado nos referimos para, por ejemplo
considerar la suma y el producto por escalares en el fibrado. Sin embargo, dada la
presencia del isomorfismo (llamado flip canónico) que discutiremos en la Sección
5.3, esta ambigüedad no presenta mayores inconvenientes.
5.1.1.1.
Fibrados verticales
Hay dos fibrados verticales a considerar, el primero VTM∗ ⊂ TTM es el
subfibrado vectorial que en cartas se describe como VTM∗ = (x, v; 0, w), donde se
sobreentiende que este debe ser un elemento de TTM; observemos que VTM∗ =
ker π∗ . Asimismo, se define VTM ⊂ TTM como ker πTM , que en coordenadas
locales se expresa como cuaterna del tipo (x, 0; u, w) ∈ TTM.
Observación 5.1.1. Razonamos
sobre la figura de la derecha:
identifiquemos q ∈ M con x =
ϕ(q) ∈ ϕ(U), y observemos las
fibras de q en la figura. Fijado
q ∈ M, la fibra sobre q es el espacio Tq M, que se representa verticalmente, pues son los V ∈ TM
tales que π(V) = q. Entonces
W ∈ TTM está en el fibrado vertical si y sólo si W es tangente a
π−1 q = Tq M.
Tv Tq M
VTM∗
TM
Tq M
πM
M
q
En efecto, basta considerar, en la curva β de arriba, la condición β ⊂ Tq M
que se traduce como xt = cte = x, con lo cual
W = β ′ (0) = (x, v; 0, v̇0 ) ∈ VTM.
En esta última expresión se puede ver que, para que (x, v; 0, w) ∈ VTM∗ debe
ser v y también w ∈ Tx M. Esto es, fijado x ∈ M, sobre él se hallan dos copias
(independientes) de Tx M. Este fibrado vectorial es de hecho isomorfo a la suma
de Whitney o producto fibrado del fibrado (TM, π, M) consigo mismo:
TM ⊕ TM = {(V, W) ∈ TM × TM : π(V) = π(W)},
100
El Fibrado TTM
es decir
TM ⊕ TM = {((x, v), (x, w)) :
x ∈ M,
v, w ∈ Tx M}.
El isomorfismo está implementado por el levantado vertical V : TM ⊕ TM →
VTM∗ dado por
V((x; v), (x, w)) = (x, v; 0, w).
Observación 5.1.2. Hay un endomorfismo canónico J : TTM → VTM∗ ⊂ TTM,
dado en coordenadas locales por
J(x, v; u, w) = (x, v; 0, u).
Observemos que si π ⊕ π∗ : TTM → (TM ⊕ TM) está dado por
(π ⊕ π∗ )(x, v; u, w) = ((x, v); (x, u)),
entonces
J = V ◦ (π, π∗ ).
Hay un campo canónico en TM a valores en VTM dado por V : TM → VTM∗ ⊂
TTM en coordenadas locales como
V(x, v) = (x, v; 0, v).
5.2.
Subvariedades de un espacio lineal
Las construcciones de la sección previa parecen esotéricas, veamos como se
presentan en subvariedades M ⊂ F de un espacio de Banach F.
5.2.1.
La esfera de un espacio de Hilbert
Comencemos como en otras ocasiones con la esfera unitaria S de un espacio de
Hilbert real H. Recordemos que para cada p ∈ S, Tp M se identifica naturalmente
con el conjunto de vectores v ∈ H tales que hv, pi = 0. Pensemos ahora en una
curva β : I → TM como en la sección anterior, que nos permitió presentar el
fibrado TTM. En este caso concreto la podemos pensar como una curva de pares
ordenados β(t) = (pt , vt ) donde pt ∈ S, vt ∈ Tpt S ⊂ H, es decir
hpt , vt i = 0
(5.1)
para todo t. Siguiendo con la idea de la sección anterior, calculamos β ′ : I → TTS,
y evaluando en t = 0 tenemos
β ′ (0) = (p0 , v0 ; ṗ0 , v̇0 ) = (p, v; u, w) ∈ TTS
5.2. Subvariedades de un espacio lineal
101
donde (p, v) ∈ TS y (u, w) ∈ T(p,v) TS. Observemos que por construcción u =
ṗ0 ∈ Tp0 S pues pt es una curva en S. Es decir, está claro como se mueven p, v, u.
¿Pero que hay de w? ¿Dónde se mueve? Derivando en t = 0 en la ecuación (5.1)
obtenemos
hu, vi + hp, wi = 0.
(5.2)
que es una condición necesaria para que (p, v; u, w) ∈ TTM. Fijados p, v, u apropiados, siempre podemos elegir algún w ∈ H de manera que se verifique la
ecuación de arriba: en efecto, la ecuación
ξp (w) = λ
con λ = −hu, vi ∈ R y ξp : H → R la funcional lineal y continua
ξp = hp, ·i
tiene siempre solución para algún w ∈ H por ser ξp : H → R un epimorfismo.
De hecho, el espacio de soluciones consiste del espacio afín
λp ⊕ Tp S ⊂ H
que tiene codimensión 1, puesto que ξp (p) = 1. Esto es razonable pues TTS se
trivializa localmente como
Tp S ⊕ Tp S ⊕ Tp S ⊕ Tp S = span(p)⊥ ⊕ span(p)⊥ ⊕ span(p)⊥ ⊕ span(p)⊥ .
Recíprocamente, si (p, v; u, w) verifican la ecuación (5.2) y además kpk = 1,
u, v ∈ Tp S, entonces la 4-upla en cuestión representa un vector en TTM en
coordenadas locales. Para verlo basta construir una curva en TM cuya derivada
en t = 0 coincida con este vector. Tomemos una carta Φ : W ⊂ E → H donde
E es el espacio de Hilbert que modela S, de manera que Φ(0) = p ∈ S. Como
u, v ∈ Tp M, existen u0 , v0 ∈ E tales que DΦ0 v0 = v, DΦ0 u0 = u. Observemos
que si w ∈ H verifica la ecuación (5.2), entonces
D2 Φ0 (u0 , v0 ) − w ∈ Tp S.
En efecto, derivando primero respecto de s y luego respecto de t la relación
siguiente
hΦ(su0 + tv0 ), Φ(su0 + tv0 )i = 1
y evaluando en s = t = 0 se obtiene
hD2 Φ0 (u0 , v0 ), pi + hDΦ0 u0 , DΦ0 v0 i = 0;
si ahora reemplazamos hu, vi por −hp, wi se deduce que
hp, D2 Φ0 (u0 , v0 ) − wi = 0
102
El Fibrado TTM
que es lo que queríamos probar. En consecuencia, existe h0 ∈ E tal que
DΦ0 (h0 ) = w − D2 Φ0 (u0 , v0 ).
Consideremos la curva β(t) = (pt , vt ) dada por
pt = Φ(tu0 ),
vt = DΦtu0 (v0 + th0 ).
Por construcción, se verifica pt ∈ S, vt ∈ Tpt S. Es decir, β es una curva en TS.
Si la derivamos en t = 0 obtenemos
β ′ (0) = (p, v; u, D2 Φ0 (u0 , v0 ) + DΦ0 (h0 )).
El último término coincide con w, luego hemos probado que con las condiciones
dadas, la 4-upla es en efecto un elemento en TTS.
5.2.2.
Superficies de nivel
Generalizando el ejemplo anterior, supongamos que la subvariedad M ⊂ F
modelada por E está dada como superficie de nivel de una función g : F → G,
donde E, F, G son espacios de Banach. Es decir
M = {p ∈ F : g(p) = 0},
con g suficientemente regular como para asegurar que se trata en efecto de una
subvariedad.
Nuevamente presentamos cartas Φ : W ⊂ E → F que parametrizan localmente M, y como mencionamos anteriormente DΦx (E) = TΦ(x) M = ker DgΦ(x) .
Construyamos una curva β en TM. Ponemos nuevamente
β(t) = (pt , vt )
con pt ∈ M y vt ∈ Tpt M. Ahora estas condiciones se escriben así:
g(pt ) = 0
y
Dgpt (vt ) = 0.
Nuevamente, llamando p0 = p ∈ M, v̇0 = w ∈ F, como pt ∈ M, se verifica
u := ṗ0 ∈ Tp M. Diferenciando la relación de arriba en t = 0 se tiene
D2 gp (u, v) + Dgp (w) = 0
(5.3)
Esta condición necesaria es también suficiente, con un argumento similar al de
la esfera. En efecto, la clave de la construcción de la curva con derivada prescrita
está, en el caso de la esfera, en el hecho
D2 Φ0 (u0 , v0 ) − w ∈ Tp M,
5.2. Subvariedades de un espacio lineal
103
siempre que p ∈ M, u = DΦ0 v0 , v = DΦ0 w0 ∈ Tp M, y suponiendo que w
verifica la ecuación (5.3). En el caso general, derivando primero respecto de s y
luego respecto de t la relación
g ◦ Φ(su0 + tv0 ) = 0
y evaluando en s = t = 0 se obtiene
Dg2p (v, u) + Dgp D2 Φ0 (u0 , v0 ) = 0;
si ahora reemplazamos Dg2p (v, u) por −Dgp w, se deduce que
Dgp D2 Φ0 (u0 , v0 ) − w = 0
que es lo que queríamos probar. En consecuencia, existe h0 ∈ E tal que
DΦ0 (h0 ) = w − D2 Φ0 (u0 , v0 ).
Consideremos la curva β(t) = (pt , vt ) dada por
pt = Φ(tu0 ),
vt = DΦtu0 (v0 + th0 ).
Por construcción, se verifica pt ∈ M, vt ∈ Tpt M. Es decir, β es una curva en TS.
Si la derivamos en t = 0 obtenemos
β ′ (0) = (p, v; u, D2 Φ0 (u0 , v0 ) + DΦ0 (h0 )).
El último término coincide con w, luego hemos probado que con las condiciones
dadas, la 4-upla es en efecto un elemento en TTS.
Observación 5.2.1. Luego (p, v; u, w) ∈ TTM si y sólo si
p∈M
u, v ∈ Tp M = ker Dgp
w ∈ F verifica Dgp (w) = −D2 gp (u, v).
Una relación -casi trivial- que usamos por el camino es la siguiente:
Dg2p (u, v) + Dgp D2 Φ0 (u0 , v0 ) = 0
siempre que Φ(0) = p sea una parametrización local de M y u = DΦ0 v0 , v =
DΦ0 w0 estén en Tp M. En particular, fijados u, v ∈ Tp M, w vive en una variedad
lineal afín de F que se obtiene trasladando Tp M al punto k(u, v) = D2 Φ0 (u0 , v0 ).
Observemos que u, v son completamente intercambiables en toda la construcción. Esto nos permite definir un isomorfismo involutivo que los intercambia. Lo
haremos con total generalidad en la Sección 5.3.
104
El Fibrado TTM
5.2.2.1.
Fibrados verticales en subvariedades
Demos un vistazo al fibrado vertical VTM∗ ⊂ TTM que recordamos se consigue como ker π∗ , o equivalentemente como clases de curvas β : I → TM con la
condición de que π ◦ β sea constante. En coordenadas eran los (x, v; u, w) ∈ TTM
tales que u = 0. En la presentación de superficies de nivel, la condición u = 0
fuerza que D2 gp (0, v) = 0, luego Dgp (w) = 0. Como observamos antes esto es
equivalente a que w ∈ Tp M, lo que nos dice que VTM∗ se representa en cada
p ∈ M como dos copias del mismo subespacio, una por el origen (Tp M) y otra
en algún sentido paralela que pasa por un punto que determinan u, v ∈ Tp M.
5.3.
El flip canónico
Según lo discutido en la sección anterior, (p, v; u, w) ∈ TTM si y sólo si p ∈ M,
u, v ∈ Tp M y además w verifica ciertas relaciones. En el caso de superficies de
nivel, estas condiciones son simétricas. Veremos que este es un hecho general que
no depende de la presentación de la variedad M como superficie de nivel.
Lema 5.3.1. Sea M una variedad diferenciable de orden k, con k ≥ 2.
Entonces, dado p ∈ M, u, v ∈ Tp M, en coordenadas locales se tiene que
(p, v; u, w) ∈ TTM ⇔ (p, u; v, w) ∈ TTM.
Demostración. Alcanza con probar -trivializando con una carta- que si p ∈ M
y u, v ∈ Tp M, entonces (u, w) ∈ T(p,v) TM implica que (v, w) ∈ T(p,u) TM. Para
verlo, tomemos una carta (U, φ) alrededor de p y observemos que si (u, w) ∈
T(p,v) TM es porque existe una curva β(t) = (pt , vt ) con pt ∈ M, vt ∈ Tp M tal
que p0 = p, v0 = v,
d
(ϕ ◦ pt )(0) = u,
dt
y además localmente la curva vt se representa como
d φ(mt (s)),
vt =
ds s=0
donde mt es una curva en M para cada t, de manera que mt (0) = pt . De aquí
se deduce que
d2
w = v̇0 =
(ϕ ◦ mt (s))(0, 0).
dtds
Construiremos una curva α(t) = (qt , wt ) ∈ TM con α(0) = (p, u) de manera
que
(q̇0 , ẇ0 ) = (v, w).
5.3. El flip canónico
105
Esto concluirá la prueba. Para ello, consideramos, para t pequeño, la curva qt ∈
M dada por
t 7→ φ−1 (φ(pt ) + t(v − u))
que verifica q0 = p, y además
d
(φ ◦ qt )(0) = u + v − u = v.
dt
Por otra parte, podemos considerar la familia de curvas en M dadas por
m̃t (s) = φ−1 [φ(mt (s)) + (t − s)(v − u)].
Observemos que m̃t (0) = qt , con lo cual su derivada en s = 0 será un vector en
Tqt M para todo t, es decir
d φ(m̃t (s)) ∈ Tqt M.
wt :=
ds s=0
Luego (qt , wt ) ∈ TM, es más
d wt =
φ(mt (s)) − (v − u) = vt + u − v,
ds s=0
con lo cual w0 = v + u − v = u. Por último, calculamos
ẇ0 =
d2
(ϕ ◦ m̃t (s))(0, 0) = v̇0 = w.
dtds
Entonces TTM tiene dos estructuras de fibrado vectorial, la primera es:
(x, v; αu, βw) +π (x, v; α ′ u ′ , β ′ w ′ ) = (x, v; αu + α ′ u ′ , βw + β ′ w ′ ).
es decir, pensando al punto base (x, v) ∈ TM fijo y usando la estructura de
espacio vectorial de T(x,v) TM. La segunda es
(x, αv; u, βw) +π∗ (x, α ′ v ′ ; u, β ′ w ′ ) = (x, αv + α ′ v ′ ; u, βw + β ′ w ′ ),
donde estamos fijando el punto (x, ·; u, ·) y usando la estructura vectorial en las
otras coordenadas. Análogamente se definen el producto por escalares ·1 y ·2 .
El flip canónico en TTM es el isomorfismo j : TTM → TTM que intercambia
estas estructuras; concretamente, en coordenadas
j(x, v; u, w) = (x, u; v, w).
Es un difeomorfismo involutivo es decir j2 = 1.
106
El Fibrado TTM
Observación 5.3.2. Consideremos, para t ∈ R y V = (x, v) ∈ TM, la aplicación
fV : R → TM dada por
fV (t) = (x, tv)
conocida como homotecia escalar. Diferenciando, obtenemos una aplicación
(fV )∗ : R × R → TTM. Evaluando en (1, 1) conseguimos, para cada V ∈ TM,
un elemento VV := (fV )∗ (1, 1) ∈ TV TM, que en en coordenadas locales es sencillamente
V(x, v) = (x, v; 0, v),
el campo vectorial canónico V : TM → TTM. Observemos que es un campo para
las dos estructuras de TTM. También se lo conoce como campo vectorial de
Liouville o campo vectorial de Euler.
5.4.
Aceleraciones y 2-jets
Observemos que, en términos de curvas, TM se identifica con las clases de
curvas en la variedad M, donde la identificación de dos curvas que pasan por
un punto dado es cuando también son iguales a primer orden, es decir, cuando
tienen la misma velocidad. Podríamos decir entonces que TM es por construcción
el espacio de las velocidades α ′ , donde α es una curva en M.
Si observamos la construcción de TTM, lo podemos pensar como T (TM),
y de acuerdo al razonamiento anterior, se trata de las clases de curvas en TM,
identificadas a primer orden. Pero si pensamos que TM está dado por velocidades
α ′ , entonces podemos imaginar a TTM como el espacio de las aceleraciones α ′′ ,
donde α es una curva en M. Más rigurosamente, identificamos dos curvas α, β
en M siempre que
α(0) = β(0) = p ∈ M.
α ′ (0) = β ′ (0) = (p, ṗ) ∈ TM
α ′′ (0) = β ′′ (0) = (p, ṗ; ṗ, p̈) ∈ TTM.
La clase de equivalencia de α en p la denotamos [α ′′ ]p . Es ciertamente un
elemento de TTM. Pero atención, que no todo elemento de TTM se puede
representar por una curva así: si α es una curva en M, en coordenadas locales
tendremos
α ′ (t) = (α(t), α̇(t))
mientras que
α ′′ (t) = (α ′ ) ′ (t) = (α ′ (t), α̇ ′ (t)) = (α(t), α̇(t); α̇(t), α̈(t)).
5.4. Aceleraciones y 2-jets
107
Es decir que las aceleraciones caen en el espacio de elementos que en coordenadas
locales se representa como
(x, v; v, w) ∈ TTM.
Este es un subfibrado de TTM (pero no tiene una estructura natural de fibrado
vectorial), y es el fibrado de puntos fijos del flip canónico. En presencia de una
conexión ∇ en M, se le puede dar una estructura de fibrado vectorial al fibrado
de aceleraciones: ver la Sección 6.3.
Observemos que si f : M → N es C2 , podemos indicar con T 2 f : TTM → TTN
a la diferencial segunda de f, que en coordenadas locales no es otra cosa que
(p, v; u, w) 7→ (f(p), Dfp v; Dfp u, D2 fp (u, v) + Dfp (w)).
Si nos restringimos al subfibrado de las aceleraciones, T 2 f las preserva: para
aquellos elementos de TTM que se representan como [α ′′ ]p para alguna curva α
en M, entonces T 2 f está dada simplemente por
[α ′′ ]p 7→ [(f ◦ α) ′′ ]f(p) .
Esto es
(p, v; v, w) 7→ (f(p), Dfp v; Dfp v, D2 fp (v, v) + Dfp (w)).
Esta aplicación es no lineal en el vector tangente (v, w) (Ejercicio 5.ii), lo que
nos da una idea de por qué el fibrado de aceleraciones no tiene una estructura
natural de fibrado vectorial.
5.4.1.
2-jets
¿Se puede pensar al fibrado TTM como clases de curvas? La respuesta es si,
pero hay que considerar “curvas” de dos variables, es decir funciones dos veces
diferenciables
ν:I×J→ M
donde I × J es algún producto de intervalos abiertos alrededor de (0, 0) ∈ R2 . Si
ν = ν(s, t) verifica ν(0, 0) = p ∈ M, componiendo con una carta (U, ϕ) de M
denotamos excepcionalmente
ν′ =
d
ϕ ◦ ν,
ds
ν̇ =
d
ϕ ◦ ν.
dt
Entonces localmente las derivadas de ν nos dan en (s, t) = (0, 0) las cuatro
combinaciones posibles:
(p, ν ′ ; ν ′ , ν ′′ )
(p, ν ′ ; ν̇, ν̇ ′ )
(p, ν̇; ν̇, ν̈)
(p, ν̇; ν ′ , ν̇ ′ )
108
El Fibrado TTM
Dadas dos curvas ν, τ, las identificaremos en p ∈ M siempre que los polinomios de Taylor de orden 2 de ϕ ◦ ν y de ϕ ◦ τ coinciden en p, exceptuando el
término de las derivadas segundas sucesivas. Esto define clases de equivalencia
[ν]p que se denominan 2-jets en M, y de hecho se identifica TTM con las clases
de 2-jets mediante la aplicación dada en coordenadas como
[ν]p 7→= (ν, ν ′ ; (ν, ν ′ )˙) = (p, ν ′ ; ν̇, ν̇ ′ )
en ese orden en particular. El flip canónico de TTM en esta presentación está
dado por intercambiar las variables s y t en los jets (Ejercicio 5.iii).
Si M ⊂ F es una subvariedad de un espacio de Banach, entonces tomamos
una parametrización local Φ = iϕ−1 : W → F alrededor de p ∈ M, con W ⊂ E
abierto en el espacio de Banach que modela M, y ϕ(p) = 0. Entonces podemos
considerar el 2-jet en p ∈ M dado por
ν(s, t) = Φ(sv0 + tu0 + stw0 + o(s2 ) + o(t2 )) ∈ M,
para v0 , u0 , w0 ∈ E y s, t suficientemente pequeños. Así
[ν]p 7→ (p, DΦ0 v0 ; DΦ0 u0 , DΦ0 (w0 ) + D2 Φ0 (u0 , v0 )).
Comparar con la Observación 5.2.1 para el caso particular de una superficie de
nivel.
Observemos que en esta presentación de 2-jets surge naturalmente la noción
de variación: si δ(t) = ν0 (t) = ν(0, t) es una curva en M con δ(0) = p, entonces
la familia νs de curvas es una variación de δ con un extremo fijo (el punto
p ∈ M).
5.A.
Problemas
5.I. Dar un atlas y una estructura de fibrado vectorial para el producto fibrado
TM ⊕ TM y para los fibrados verticales VTM y VTM∗ .
5.II. Probar, mediante un ejemplo concreto, que si f : M → N es dos veces
diferenciable, entonces T 2 f no es una aplicación lineal.
5.III. Probar que, dada α : I × J → M dos veces diferenciable, la aplicación
Ω : α(s, t) 7→ α(t, s)
induce el flip canónico en TTM cuando se presenta a este fibrado como clases de
equivalencia de 2-jets.
Capítulo
Conexiones y Sprays
El cálculo tensorial es la depravación de
los índices.
Henri Cartan
I
ntroducidas las nociones elementales de variedades, sabemos cómo
hacer cálculo en una variedad diferenciable M: esencialmente hay
que usar cartas para pasar al contexto del espacio de Banach E que
modela M, y luego usar las herramientas del cálculo -como diferenciación e
integración- que estén a nuestra disposición en E. Pero todavía no sabemos cómo
hacer geometría en M. ¿Qué queremos decir con esto? Dados dos puntos x, y ∈ M
no tenemos definido como se moverán las cosas desde x hasta y, ni siquiera en el
caso más simple cuando x, y se pueden trasladar al espacio E con la misma carta.
La riqueza de la estructura de TTM nos permite presentar de forma intrínseca los
conceptos necesarios. Queremos intentar contestar la siguiente serie de preguntas
más o menos naturales:
¿De todas las curvas que unen dos puntos x, y ∈ M, hay alguna -o una
familia- distinguida, alguna dirección natural en la cual moverse de un
punto a otro?
¿Cómo trasladar un vector tangente en x a otro vector tangente en y?
¿Cómo mover una curva, superficie, etc. que pasa por x a otra figura “congruente” que pase por y?
¿Cómo medir si x e y están lejos o cerca?
109
6
110
Conexiones y Sprays
¿Cómo medir si dos vectores tangentes en x apuntan en direcciones muy
disímiles?
Las primeras tres preguntas, como veremos, están relacionadas con la noción
de conexión en M, spray en M o derivada covariante en M, todas nociones
equivalentes. La cuarta pregunta tiene que ver con la noción de métrica en M.
La última pregunta está relacionada con la noción de producto escalar o métrica
Riemanniana en M.
Estas herramientas en principio independientes, pueden relacionarse imponiendo ciertas restricciones. Comenzamos por la noción de spray. Elegimos esta
presentación porque es la más natural en el contexto infinito dimensional, y porque creemos que nos hará más fácil encarar nuestro objetivo último de esta parte,
que es el teorema de Cartan-Hadamard. Dada una variedad diferenciable M, un
spray en M es una manera (impuesta por nosotros, es decir, no viene dada por
los datos de las cartas de M) de trasladar rígidamente vectores de un punto a
otro de la variedad. Para ello, una vez fijado el spray -como dijo el peluqueroprimero se obtienen las geodésicas del spray, que es una clase distinguida de
curvas sobre las cuales moverse de un punto a otro de M. Si nos dan dos puntos
x, y ∈ M y una curva α que los une -es decir α : [0, 1] → M es suave, α(0) = x.
α(1) = y-, veremos que el spray nos permite trasladar un vector v ∈ Tx M a
lo largo de la curva para obtener un vector Pv ∈ TyM. Los puntos extremos no
juegan ningún papel distinguido a lo largo de la trayectoria α, así que en realidad
lo que obtendremos será un vector ξ(t) = Pt v ∈ Tα(t) M para todo t ∈ [0, 1].
No requerimos unicidad en las curvas, ni que curvas distintas nos den el mismo
vector, es decir, si β es otra curva que une x con y en M, puede ocurrir -suele
ocurrir- que el trasladado de v a largo de α no coincida con el trasladado de v a
lo largo de β -como vectores en el espacio tangente Ty M, que es el único lugar
donde tiene sentido compararlos ya que α, β podrían tocarse únicamente en x e
y-.
Esta noción, una vez definida apropiadamente, es lo que se conoce como
transporte paralelo. Es decir, es una manera distinguida de mover vectores tangentes de un punto a otro de M a lo largo de geodésicas o curvas cualesquiera en
M. El nombre proviene del siguiente ejemplo: si tomamos como M = Rn con el
spray trivial, el transporte paralelo de un vector a lo largo de una recta consiste
exactamente en mover el vector v ∈ Tx M hasta el vector v ′ ∈ Ty M de forma
paralela, es decir sin rotarlo ni estirarlo (es esencialmente el mismo vector).
6.1.
Sprays
Queremos saber cuáles son las direcciones y caminos privilegiados de movimiento en la variedad M. Estas curvas son las que se conocen como geodésicas
6.1. Sprays
111
de M y como veremos, no están determinadas por la estructura diferenciable de
M -las cartas- sino que hace falta un dato más para determinarlas -una conexión
o spray-.
Por ejemplo, en el espacio vectorial E, es lógico considerar que la trayectoria
más sencilla para ir de v ∈ E hasta w ∈ E es el segmento γ : [0, 1] → E dado por
γ(t) = v(1 − t) + tw = v + t(w − v).
Observación 6.1.1. Una característica importante de los espacios normados E
es que los segmentos son caminos cortos entre dos puntos: en efecto, si v, w ∈ E
y Γ ⊂ E une v con w, entonces si S(t) = tv + (1 − t)w,
Z1
Z1
L(S) = kv − wkE = kΓ (0) − Γ (1)kE = k Γ̇ dtkE ≤ kΓ̇ kE dt = L(Γ ).
0
0
Esto no quita que pueda haber otros caminos cortos, ver el ejemplo a continuación.
Uno está orientado a pensar entonces que este segmento es el mejor camino
porque, como vimos, es el camino más corto entre v y w. Pero en principio, en
nuestra variedad no tenemos definida una métrica ni una distancia, así que vamos a postergar esas consideraciones. Además, hay otras complicaciones técnicas
porque, por ejemplo, dependiendo de cómo sea la norma de E, puede haber otras
curvas que no sean un segmento, con la misma longitud. Veamos un ejemplo.
Ejemplo 6.1.2. Sea E = R2 , con la norma
k(x, y)k1 = |x| + |y|.
Sean x = (0, 0), y = (1, 1). Entonces
d(x, y) = k(1, 1) − (0, 0)k1 = 1 + 1 = 2.
El segmento que los une es γ(t) = (t, t), cuya velocidad (derivada) es γ̇(t) =
(1, 1). Luego kγ̇k1 = 2, y obviamente
Z1
L1 (γ) = kγ̇kdt = 2 = d(x, y).
0
Pero podemos tomar también la curva suave a trozos dada por
(2t, 0)
t ∈ [0, 1/2]
β(t) =
(1, 0) + (0, 2t − 1) t ∈ [1/2, 1]
que une x con y en E. Su longitud es también
Z 1/2
Z1
L1 (β) =
k(2, 0)k1 +
k(0, 2)k1 = 1 + 1 = 2.
0
1/2
112
Conexiones y Sprays
Un ejemplo similar se puede armar si consideramos R2 con la norma supremo
k(x, y)k∞ = máx{|x|, |y|}.
En este caso se considera x = (−1, 0), y = (0, 1) y los dos caminos con la misma
longitud (= 2) son:
El segmento que los une.
Una poligonal pasando por el punto (0, 1).
Ejemplo 6.1.3. Sea E = M2 (C) (matrices 2 × 2 con coeficientes complejos), y
la norma de E es la norma supremo usual, entonces se pueden armar ejemplos
como los de antes usando matrices diagonales. Idem con la norma de la traza,
kak1 = Tr|a|.
Volviendo al caso general, también puede pensarse que un segmento γ ⊂ E
en un espacio normado es el mejor camino porque la curva γ “no se dobla”. Esto
es porque γ̈ = 0. En este caso la ecuación diferencial

 α̈(t) = 0
α(0) = v

α̇(0) = w − v
tiene por el teorema usual una única solución αv,w , que es el segmento γ. Esta
es la noción que queremos extender a la variedad diferenciable M. Si pensamos
en una superficie S ⊂ R3 , por ejemplo la esfera unitaria, queremos que la curva
no se doble en un sentido más específico, pues lo que queremos distinguir son
estas dos curvas, y quedarnos con la más “recta”:
S
q
p
Cuando uno intenta expresar esta idea con total generalidad, se encuentra
con una dificultad: está claro que si γ es una curva en M, entonces γ ′ es una
6.1. Sprays
113
curva en TM. Pero no está claro que quiere decir en general γ ′′ = 0. Consideremos la variedad unidimensional M = S1 . Dada una curva α : I → S1 , si la
reparametrizamos será esencialmente
α(t) = (cos t, sen t).
Observemos que, como
α ′ (t) = (− sen t, cos t) y α ′′ (t) = (− cos t, − sen t)
entonces α ′′ = 0 no tiene sentido pues es nunca nula. Exceptuando por supuesto
el caso en el que α fuera inicialmente una curva constante, que no es muy interesante. Sin mencionar que no verifica ninguna condición inicial no trivial del tipo
α ′ (0) = v ∈ Tp S. Observemos sin embargo que se verifica α ′ ⊥ α ′′ , que puede
pensarse como una condición sobre la métrica (el producto escalar de R2 ), pero
también puede pensarse como que α ′′ no tiene componenente tangente.
Traslademos este ejemplo a la esfera unitaria S2 ⊂ R3 . Tomemos una curva
de las que imaginamos “privilegiadas”, por ejemplo
α(t) = (cos t, sen t, 0),
que es el ecuador de la esfera. Observemos que, como antes
α ′ (t) = (− sen t, cos t, 0) y α ′′ (t) = (− cos t, − sen t, 0),
y nuevamente α ′′ no tiene componente tangente.
En general, dada una subvariedad S ⊂ Rn , uno podría pensar que las geodésicas son aquellas curvas (de velocidad constante) en S tales que α ′′ no tiene
componente tangencial a S en Rn . Esta definición es correcta y muy natural,
pero tiene algunos defectos:
En algunos casos es conveniente pensar que las geodésicas responden a
un principio de mínima acción, es decir, minimizan alguna funcional de
energía en la variedad que no es necesariamente la norma Euclídea.
Como caso particular de lo anterior, podemos buscar las curvas que minimizan (al menos localmente) la distancia para alguna norma que no coincida
con la norma Euclídea.
No queda claro que pasa si presentamos a S como subvariedad de otra forma, es decir, pareciera que las geodésicas dependen de la inclusión concreta
S ⊂ Rn , y no son algo intrínseco de la variedad S.
En el caso S ⊂ E, donde ahora E es un espacio de Banach, no siempre
está disponible un suplemento lineal en E para el espacio tangente Tp S
-para cada p ∈ S- con lo cual la noción de “componente tangente” no está
definida.
114
Conexiones y Sprays
Aquí aparece la maquinaria algebraica. Lo que haremos será dar un mapa
F : TM → TTM -llamado spray- para poder comparar a α ′ y α ′′ dentro del mismo
espacio, y diremos que las geodésicas son las curvas que verifican F(α ′ ) = α ′′ . En
el caso trivial M = E un espacio vectorial, tendremos F = 0 si queremos obtener
los segmentos usuales en E. En este mapa, lo único importante es lo que hace F
con la velocidad de α ′ , en el siguiente sentido: queremos que F sea una sección
del fibrado (π∗ , TTM, TM) donde π∗ : TTM → TM es la proyección dada por la
diferencial de la proyección canónica π : TM → M.
Observación 6.1.4. ¿Cómo se ve esto en coordenadas? Recordemos que en una
carta local (U, ϕ) de M, se tiene TU ≃ U × E y
T (TM) ≃ (U × E) × (E × E),
y si π : TU → U es π(p, v) = p, cuando movemos (p, v) ∈ TM la proyección sólo
se entera del movimiento del punto base, con lo cual para la diferencial de π las
variables son p y su trivialización; es decir, si escribimos un punto genérico en
TTM como (p, v; u, w), donde (p, v) ∈ U × E ≃ TM y (u, w) es la correspondiente
trivialización, entonces
π∗ (p, v; u, w) = (p, u),
Si F : TM → TTM lo describimos en estas coordenadas, se tiene en principio
F(p, v) = (p, v; f1 (p, v), f2 (p, v)).
Para que se verifique π∗ F = idTM debe ser f1 (p, v) = v, con lo cual
F(p, v) = (p, v; v, f2 (p, v)).
Observemos que F(p, v) vive en el fibrado de las aceleraciones α ′′ , que es el
fibrado invariante por el flip canónico. Esta condición es indispensable para que
pueda verificarse α ′′ = F(α ′ ).
Lo único que importa es la última coordenada, que es la que “opera” sobre
la velocidad v y la lleva al lugar donde vive la aceleración.
Hay un requerimiento adicional para que F : TM → TTM sea un spray: si M
es una variedad Ck , entonces TM es una variedad Ck−1 y TTM = T (TM) es una
variedad Ck−2 , con lo cual M debe ser de clase Ck con k ≥ 2, y si queremos que
haya -localmente al menos- única solución del problema F(α ′ ) = α ′′ , pediremos
que F sea C1 .
Diremos que un spray es homogéneo de grado m ≥ 0 si, en coordenadas
locales, se tiene
f2 (p, sv) = sm f2 (p, v)
6.1. Sprays
115
para todo (p, v) ∈ TU y s ∈ R. Si F es homogéneo de grado 2, diremos que F es un
spray cuadrático o afín. En ese caso, pongamos Qp (v) := f2 (p, v), Qp : E → E,
que es una forma cuadrática en v. Formalmente, dado s ∈ R, si s : E → E
denota la multiplicación en cada fibra de un fibrado vectorial s : (x, v) 7→ (x, sv),
denotamos con s∗ : TE → TE a su derivada y entonces un campo F : TM → TTM
es un spray cuadrático si para V ∈ TM se tiene
F(sV) = s∗ sF(V).
Una vez fijado un spray F en la variedad M -no repito el chiste- tenemos lo que
se llama una variedad diferenciable con spray (M, F). Introducida a principios
del siglo 20 -aunque sin ese nombre-, la noción de spray tuvos dos épocas de gran
desarrollo, la primera en los años 30 debida al trabajo de Élie Cartan, y luego
en la década del ’60 donde se terminaron de establecer las bases de la teoría,
por ejemplo Warren Ambrose, Richard Palais e Isadore Singer en el trabajo [2],
establecen la equivalencia de la noción de spray con la de conexión afín.
6.1.1.
Geodésicas
Una curva α : I → M de clase C2 es una geodésica de (M, F) si
α ′′ = F(α ′ ).
Por el teorema de existencia y unicidad de ODEs aplicado al problema β ′ = F(β)
-con β : I → TM una curva en el fibrado tangente-, esta ecuación tiene localmente
solución única β : I → TM; si llamamos α = π ◦ β : I → M, entonces α es la
geodésica del spray que estamos buscando (aquí π denota la proyección canónica
π : TM → M), lo cual se puede verificar de la siguiente manera: observemos
primero que α ′ = β, puesto que
α∗ = π∗β ◦ β∗ ,
y componiendo con la sección canónica i(t) = (t, 1), i : I → I × R se obtiene
α ′ = π∗β ◦ β ′ = (π∗β ◦ F)(β) = β
que es la observación (que no es otra cosa que decir que β es la levantada canónica
de α). Ahora, para ver que α es una geodésica diferenciamos (α ′ )∗ = β∗ y
volvemos a componer con la sección canónica para obtener
α ′′ = β ′ = F(β) = F(α ′ )
que es lo que queríamos probar. En realidad lo que estamos diciendo es que el
problema original se reduce a resolver el problema de orden uno dado por
A ′ = H(A)
116
Conexiones y Sprays
donde A = (α, β) ∈ U × TU y H : U × TU → TU × TTU está dada por
H(u, v) = (v, F(u, v)).
Observemos que una condición inicial para el problema es un par p ∈ M,
v ∈ Tp M, pues la curva β = α ′ toma valores en TM. Es decir, que una vez
fijado el spray, para cada punto p ∈ M y cada dirección v ∈ Tp M tenemos una
geodésica que pasa por p y tiene velocidad inicial v.
6.1.2.
Exponencial
Dado V = (p, v) ∈ TM, denotamos αV : IV ⊂ R → M a la única geodésica
del spray tal que αV (0) = p, α˙V (0) = v, con IV un intervalo abierto que contiene
al 0 ∈ R. Definimos el dominio de la exponencial del spray D ⊂ TM como el
conjunto
D = {V = (p, v) ∈ TM : 1 ∈ IV }.
No es difícil probar que este conjunto es un abierto en TM que contiene a la
sección nula (Ejercicio 6.iii). Definimos la exponencial del spray exp : D → M
como la función diferenciable
exp(p, v) = αV (1).
Observemos que exp(p, 0) = p para todo p ∈ M. Pongamos Dp = {v ∈ Tp M :
(p, v) ∈ D}, y denotemos expp : Dp ⊂ Tp M → M a la aplicación expp (v) =
exp(p, v). Esta resulta una aplicación diferenciable que asigna 0 7→ p.
Definición 6.1.5. Diremos que M es geodésicamente completa en p ∈ M si
Dp = Tp M. Es decir, si las geodésicas que pasan por p se pueden prolongar para
todo t ∈ R. Diremos que M es geodésicamente completa si es geodésicamente
completa en p para todo p ∈ M.
Por ejemplo, si M = R2 con el spray nulo F = 0, las geodésicas son las
rectas y resulta completa. Sin embargo, si removemos un punto, por ejemplo
p = (1, 0) ∈ R2 , entonces M = R2 − {p} no es geodésicamente completa en
ningún q ∈ M, pues la recta (geodésica del spray F = 0) que comienza en q, en
la dirección de p, sólo está definida para t < d(q, p).
6.2.
Sprays cuadráticos o afines
No vamos a lidiar con los sprays en toda generalidad, para lo que queremos
hacer nos alcanza con restringirnos a aquellos que son cuadráticos. Los distingue
una cualidad: las geodésicas de sprays cuadráticos son curvas de velocidad
constante. Con más precisión:
6.2. Sprays cuadráticos o afines
117
Lema 6.2.1. Sea F : TM → TTM un spray cuadrático, V = (p, v) ∈ TM.
Entonces
1. Si s, t ∈ R, entonces st ∈ IV si y sólo si s ∈ ItV , y además
αV (st) = αtV (s).
2. Las curvas ǫ(t) = expp (tv) son las únicas geodésicas del spray.
Demostración. Supongamos que st ∈ IV , esto es αV está definida en un intervalo que contiene al producto st. Sea β(x) = αV (sx), definida en [0, t] por lo
menos. Derivando, tenemos (en coordenadas locales para no cargar la notación)
β̇(x) = α̇V (sx)s,
reemplazando x = 0 se deduce que β ′ (0) = (p, sv). Si denotamos Q = Qp =
f2 (p, ·), derivando de nuevo respecto de x, se tiene
β̈(x) = α̈V (sx)s2 = s2 Q(α˙V (sx)) = Q(sα˙V (sx)) = Q(β̇(x))
con lo cual β es una geodésica del spray, lo que prueba de un saque que t ∈ IsV
y la identidad. Para probar la segunda afirmación, observemos que por lo que
recién probamos,
ǫ(t) := expp (tv) = exp(p, tv) = αp,tv (1) = αtV (1) = αV (t)
de donde se deduce que ǫ es la única geodésica del spray con ǫ ′ (0) = (p, v) =
V.
Recíprocamente, si vale la condición del primer ítem para un spray dado y
arbitrario, entonces derivando dos veces respecto de s y evaluando en s = 0
obtenemos que
′
′′
F(tV) = F(αtV
(0)) = αtV
(0) = t2 αV′′ (0) = t2 F(αV′ (0)) = t2 F(V).
Luego vale la recíproca del primer ítem, lo que caracteriza a los sprays
cuadráticos.
Observación 6.2.2. Se tiene
(expp )∗0 (v) = ǫ ′ (0) = (p, v).
Luego la diferencial de la exponencial en el origen es la identidad, y por ello
expp es un difeomorfismo local entre abiertos alrededor de 0 ∈ Tp M y p ∈ M
respectivamente.
118
6.2.1.
Conexiones y Sprays
Entornos normales
Usando la exponencial en todo el fibrado tangente, podemos construir entornos normales W en la variedad M que nos permiten asegurar que para todo
punto p ∈ W, la exponencial en p está definida en una cierta bola de radio r alrededor del origen de Tp M, y este r > 0 es el mismo para todo p ∈ W. Fijemos
la norma de E, el espacio de Banach que modela M, y denotemos k · k = k · kE
a la misma. Sea Br (0) la bola abierta de radio r > 0 alrededor de 0 ∈ Tp M ≃ E.
Sea D ⊂ M el dominio de la exponencial de (M, F), y definamos G : D → M × M
el mapa dado por
G(p, v) = (p, expp (v)).
Entonces en una carta, la diferencial de G en (p, 0) ∈ TM está dada por la matriz
1 0
DG(p,0) =
.
⋆ 1
En particular DG(p,0) es inversible y el teorema de la función inversa nos dice
que G es un isomorfismo local de un entorno de la sección nula 0TM en un entorno
de la diagonal ∆M = {(p, p) : p ∈ M}. Observemos que los entornos abiertos de
la sección nula en TM (en una carta) son de la pinta
V ≃ U × BR (0)
con U ⊂ M abierto.
Teorema 6.2.3. Sea p ∈ M, y sea V ≃ U × BR (0) entorno abierto de (p, 0) ∈
TM de manera que G|V es un difeomorfismo con su imagen y U = π(V) ⊂ M
es abierto. Sea W ⊂ M entorno abierto de M tal que W × W ⊂ G(V).
Entonces
1. Dados x, y ∈ W, existe una única geodésica γx,y de M que los conecta
con γ ⊂ U. La dependencia de γ respecto de x, y es suave.
2. Para cada x ∈ W la exponencial expx está definida por lo menos en
BR (0) ⊂ Tx M y es un difeomorfismo de Br (0) en el abierto Ur (x) =
expx (Br (0)) para todo r ≤ R. Además γx,y ⊂ UR (x) y en particular
W ⊂ UR (x).
Demostración. La existencia de la geodésica está dada por el mapa G|V , es decir
consideramos G−1 (x, y) = (x, v) ∈ V y entonces (x, y) = G(x, v) = (x, expx (v))
luego y = expx (v). La unicidad es consecuencia de que G es biyectiva, y la
dependencia suave de x, y es consecuencia de la suavidad de G.
6.3. Conexiones
119
Que la exponencial está definida por lo menos en BR (0) y es un difeomorfismo es nuevamente consecuencia del hecho de que G da las geodésicas y es un
difeomorfismo. Por último, como γ(t) = expx (tv) con v ∈ BR (0), obviamente
γ ⊂ UR (x).
6.3.
Conexiones
Una noción relacionada íntimamente con la de spray es la de conexión en
M. Diremos que C : TM ⊕ TM → TTM es una conexión afín si C es bilineal y
natural para las dos estructuras de TTM como fibrado vectorial sobre M. Más
precisamente, recordemos que TM ⊕ TM representa el producto fibrado de TM
con TM sobre M, mientras que pr1 , pr2 son las proyecciones naturales en cada
coordenada. Entonces C debe verificar que π∗ ◦ C = pr1 y πTM ◦ C = pr2 , es
decir deben conmutar los diagramas
C
/ TTM
r
r
r
r
pr1
rrrπ
yrrr ∗
TM
TM ⊕ TM
C
/ TTM
r
r
r
r
pr2
rrrπ
yrrr
TM
TM ⊕ TM
En coordenadas locales, se deduce que C tiene que tener la pinta
((x, v); (x, u)) 7→ (x, u; v, ΓxC (v, u))
con Γx lineal en v, u por separado. Es decir, Γ C es un operador bilineal.
Evidentemente, toda conexión afín induce un spray de forma natural tomando
Qp (v) = ΓpC (v, v).
Es decir si ∆ : TM → TM ⊕ TM indica la inclusión diagonal
∆(x, v) = ((x, v); (x, v)),
entonces F := C ◦ ∆ : TM → TTM es un spray cuadrático en M.
Recíprocamente, dado un spray cuadrático F : TM → TTM en M, podemos
considerar la conexión afín inducida por la forma bilineal Γ del spray, de la
siguiente manera. Si Qp es la forma cuadrática asociada al spray F (con p ∈ M),
recordemos que toda forma cuadrática de un espacio vectorial en otro (en este
caso el mismo) define una forma bilineal Γp : E × E → E de la siguiente manera:
Γp (v, u) = 1/2 [Qp (v + u) − Qp (v) − Qp (u)] .
120
Conexiones y Sprays
Sean V = (p, v), W = (p, w) vectores en TM. Formalmente, C : TM⊕TM → TTM
está dado por X = C(V, W) ∈ TTM donde X es la única solución de la ecuación
lineal
(F(V) +π∗ X) +π (F(W) +π∗ jX) = F(V + W),
donde j es el flip canónico de TTM. En coordenadas locales es simplemente
C((x, v); (x, w)) = (p, v; u, Qp (v + u) − Qp (v) − Qp (u)) = (p, v; u, 2Γp (v, u)).
Observemos que C ◦ ∆ = 2F, pero el factor 2 es irrelevante ya que F y 2F tienen
√
las mismas geodésicas; podría haberse obtenido Γ introduciendo un factor 2 en
la definición de la conexión C.
La presentación como sprays es la más directa para obtener las geodésicas,
de hecho un spray es como un set de ecuaciones diferenciables compatibles en
M. Sin embargo, tal vez la forma más honestamente geométrica de presentar el
spray es vía su conexión afín asociada. Para ello veamos qué información nos da
una conexión afín C : TM ⊕ TM → TTM genérica. Definimos
HC = Im(C) = {C(V, W) : (V, W) ∈ TM ⊕ TM} ⊂ TTM
que resulta una distribución de subespacios en TTM, es decir un subfibrado que
se denomina fibrado horizontal inducido por la conexión C. De hecho se trata
de una distribución vectorial para las dos estructuras vectoriales de TTM, ya
que
(p, v; w, Γ C (v, w)) +π (p, v; w ′ , Γ C (v, w ′ )) = (p, v; w + w ′ , Γ C (v, w + w ′ ))
y
(p, v; w, Γ C (v, w)) +π∗ (p, v ′ ; w, Γ C (v ′ , w)) = (p, v + v ′ ; w, Γ C (v + v ′ , w))
por ser Γ C bilineal. Un hecho fundamental de este fibrado horizontal es el siguiente: es un suplemento para el fibrado vertical en TTM.
Lema 6.3.1. Sea C una conexión en M y VTM ⊂ TTM el fibrado vertical.
Entonces
HC ⊕ VTM = TTM y HC ⊕∗ VTM∗ = TTM
como suma de Whitney sobre TM. En coordenadas, si Z = (x, v; u, w) ∈ TTM,
entonces tomando
ZV = (x, v; 0, w − Γ C (v, u)) ∈ VTM∗
y
ZH = (x, v; u, Γ C (v, u)) ∈ HC
se tiene Z = ZV +π∗ ZH y una descomposición similar se tiene para la otra
estructura de fibrado sobre TM.
6.3. Conexiones
121
Demostración. Definimos ZV = Z −π∗ ZH = Z −π∗ C(V, U), con V = (x, v),
U = (x, u) en TM. Que ZV ∈ VTM∗ se desprende de la Observación 5.1.1. Para
ver que la suma es directa, si
Z = (x, v; 0, w) = (x, v; u, Γ C (v, u)),
entonces u = 0 con lo cual Γ C (v, u) = 0 por la bilinealidad, y esto nos dice que
w = 0. Es decir Z = 0(x,v) que es lo que queríamos probar.
Recíprocamente (Ejercicio 6.iv), es fácil ver que dada una distribución H
de subfibrados de TTM que suplementen VTM, esta descomposición induce una
conexión afín (y por ende un spray cuadrático) en M.
Observación 6.3.2. En presencia de una conexión CM en M, es posible dotar
al fibrado de aceleraciones en M de una estructura de fibrado vectorial que lo
hace isomorfo a TM ⊕ TM, vía la identificación
es decir en coordenadas
α ′′ ↔ (α ′ , pr2 (αV′′ )),
(α, α̇; α̇, α̈) ↔ ((α, α̇); (α, α̈ − Γ C (α̇, α̇)).
Si N es otra variedad diferenciable, que tiene una conexión CN , entonces se
puede repetir el procedimiento. Una condición suficiente para que, dada f : M →
N de clase suave, la aplicación T 2 f : TTM → TTN, restringida al fibrado de
aceleraciones con sus correspondientes estructuras de fibrado vectorial, sea una
aplicación lineal, está dada por
∇N ◦ T 2 f = Tf ◦ ∇M
con ∇ las correspondientese derivadas covariantes inducidas (ver la próxima
sección). En este caso se dice que las conexiones están f-relacionadas. Es decir,
con esta condición, si α es una curva en M, entonces la aplicación
[α ′′ ]p 7→ [(f ◦ α) ′′ ]f(p)
es una aplicación lineal para las estructuras inducidas por las conexiones. Los
detalles pueden verse en un trabajo [31] de Dodson et. al.
122
6.4.
Conexiones y Sprays
Conexión de Koszul
Toda conexión afín induce naturalmente una derivada covariante. Recordemos brevemente la definición de derivada covariante (también conocida como conexión de Koszul : es una forma R-bilineal de campos en campos,
∇ : χ(M) × χ(X) → χ(M) que verifica
∇fX (Y) = f∇X Y,
∇X (fY) = X(f)Y + f∇X Y
para todo par X, Y ∈ χ(M), y toda f ∈ C1 (M). También vamos a pedir que
∇X Y − ∇Y X = [Y, X], aunque alguna definición más general no lo pone como
requisito, y de hecho
T (X, Y) = ∇X Y − ∇Y X − [Y, X]
es la torsión de la derivada covariante. Es decir, nos restringimos a derivadas
covariantes sin torsión.
Observación 6.4.1. Si T es la torsión, entonces es fácil ver usando las propiedades
de ∇ y del corchete de Lie que T (fX, Y) = fT (X, Y) = T (X, fY) para toda función
suave f. Si definimos
∇X Y = ∇X Y − 1/2T (X, Y) = 1/2 (∇X Y + ∇Y X + [Y, X])
(6.1)
podemos probar usando la propiedad mencionada que ∇ es una derivada covariante, y que T = 0, es decir que podemos obtener siempre una derivada
covariante con torsión nula a partir de una dada. Dejamos como ejercicio para el
lector probar que esta nueva conexión tiene las mismas geodésicas que la original.
Si tenemos una conexión afín Γ , definimos localmente
∇X Y = DY(X) − Γ (X, Y).
Es decir, en coordenadas,
∇X Y(p) = DYp (Xp ) − Γp (Xp , Yp ).
La definición intrínseca es como sigue: dado que Y, X : M → TM son campos,
consideramos Y∗ X = Y∗ ◦ X : M → TTM y X ⊕ Y : M → TM ⊕ TM. Es fácil ver
que, para cada p ∈ M,
Y∗ X −π Γ (X ⊕ Y)|p ∈ VTM = ker π∗
pues π∗ ◦ Y∗ = idTM y π∗ ◦ Γ = pr1 . Entonces si V : TM ⊕ TM → VTM indica el
isomorfimo vertical, se tiene
∇X Y(p) = pr2 ◦ V −1 (Y∗ X −π Γ (X ⊕ Y))(p) ∈ Tp M.
6.5. Sprays canónicos
123
No es difícil ver que ∇ es una derivada covariante: ciertamente es lineal para
funciones en la primer variable, y en la segunda
∇X (fY) =
=
D(fY)(X) − fΓ (X, Y) = Df(X)Y + fDY(X) − fΓ (X, Y)
X(f)Y + f∇X Y.
Recíprocamente, dada una derivada covariante en M, podemos definir localmente
Γ ∇ (X, Y) = Y ′ X − ∇X Y,
y es más o menos evidente que si ∇ era la derivada inducida por un spray F,
entonces Γ ∇ (X, X) = F(X), es decir se recupera el spray. Pero atención: queremos
definir Γ ∇ para vectores tangentes, no sólo para campos. Es necesario ver que
el valor de Γ ∇ (X, Y) sólo depende del valor de los campos Y, X en el punto
p ∈ M, y para ello es necesaria cierta condición de pegado que por ejemplo, se
satisface si E es un Hilbert o si E tiene dimensión finita. Los detalles de esta
construcción están en [47, pág. 197]. Esencialmente se requiere que la variedad
M admita particiones de la unidad de clase C2 y para ello, en el caso particular
en que M sea paracompacta, alcanza con que el espacio de Banach E que modela
M sea separable y C2 -normal, es decir, que para todo abierto U ⊂ E exista una
función ψ : E → [0, 1] de clase C2 de manera que U = {v ∈ E : ψ(v) > 0}. En
particular si E es separable y su norma es de clase C2 en E − {0}, entonces E
es C2 -normal. Los detalles y pruebas de estas afirmaciones pueden verse en [48,
III.§6].
6.5.
Sprays canónicos
En general, el nombre canónico aplicado a sprays es vago y depende mucho
del contexto. En líneas generales, podemos decir que son sprays que se construyen con la estructura dada de la variedad, sin agregar elementos novedosos o
elecciones particulares. Por ejemplo, a partir de diferenciales de campos. Seamos
precisos, pero primero hagamos una observación.
Observación 6.5.1. Si X(p) = (p, Xp ), Y(p) = (p, Yp ) son campos en M, calculamos Y∗ : TM → TTM en coordenadas: denotemos con [α] ∈ TM la clase de las
curvas con α(0) = p ∈ M, α̇(0) = v ∈ Tp M, entonces Y∗ ([α]) = [Y ◦ α], es decir,
poniendo
Y ◦ α = (α, Yα )
y derivando Yα(t) en t = 0 obtenemos
Y∗p (v) = Y∗ (p, v) = (p, Yp ; v, DYp v) ∈ TY(p) TM.
124
Conexiones y Sprays
Obviamente, π∗ ◦ Y∗ = idTM por construcción (aquí π : TM → M denota la
proyección canónica como antes), derivando π ◦ Y = idM . Entonces
Y ′ (X)(p) = Y∗ (p, Xp ) = (p, Yp ; Xp , DYp Xp )
Dado X : M → TM un campo, tenemos X∗ : TM → TTM en coordenadas:
X∗p (v) = X∗ (p, v) = (p, Xp ; v, DXp v) ∈ TX(p) TM.
Para v = Xp ,
X∗p (Xp ) = X∗ (p, Xp ) = (p, Xp ; Xp , DXp (Xp )) ∈ TX(p) TM,
lo que nos dice lo siguiente: es razonable suponer que hay algún spray en M de
manera que la forma cuadrática asociada sea Qp (Xp ) = DXp (Xp ) para cualquier
campo X : M → TM de clase Ck con k ≥ 1. La forma bilineal asociada en este
caso sería
2Γp (Xp , Yp ) = DXp (Yp ) + DYp (Xp ),
para cualquier par de campos X, Y : M → TM. La derivada covariante asociada
en este caso sería
∇X Y = Y ′ X − Γ (X, Y) = Y ′ X − 1/2X ′ Y − 1/2Y ′ X = 1/2(Y ′ X − X ′ Y) = 1/2[X, Y],
El problema es que no está claro si la definición que dimos es buena en el sentido
de que sólo razonamos sobre campos, pero tenemos que decir como actúa el
spray en cualquier V ∈ TM. Sin embargo si M = G es un grupo de Lie-Banach,
se puede definir correctamente F. No lo haremos con esta generalidad, nos vamos
a contentar con hacerlo para el grupo de inversibles de un álgebra de Banach,
en la Sección 6.9 (Ejemplo 6.9.3).
6.6.
La derivada covariante: derivar y proyectar
Veamos el sentido geométrico de la idea de conexión, que era el propósito del
Lema 6.3.1. Si M ⊂ F es una subvariedad de un espacio de Banach F, ya discutimos que VTM es en realidad una manera abstracta (intrínseca) de presentar los
espacios tangentes a M como subespacios de un espacio más gordo. En presencia
de un fibrado horizontal, lo que tenemos es, para cada punto Z = (p, z) ∈ TM,
un subespacio HZ ⊂ F que suplementa VZ TM, es decir
TZ TM = VZ TM ⊕ HZ ,
y la asignación V 7→ HV es suave. Esta noción deriva de la siguiente idea geométrica: supongamos que para cada p ∈ M ⊂ F existe un suplemento Hp ⊂ F que
varía en forma suave con p. Es decir, que para todo p ∈ M,
F = Tp M ⊕ Hp .
6.6. La derivada covariante: derivar y proyectar
125
Sea Ep ∈ B(F) el proyector asociado tal que ran(Ep ) = Tp M, ker(Ep ) = ran(1−
Ep ) = Hp . Estamos suponiendo que p 7→ Ep es un mapa suave E : M → P(F)
de M en los idempotentes de F. Notemos que, como E∗ : TM → T B(F) = B(F),
entonces para p ∈ M, v ∈ Tp M, E∗p,v es un operador lineal de F en F, que
depende también linealmente de v ∈ Tp M. Esta familia nos permite introducir
un spray en M de la siguiente manera.
Teorema 6.6.1. Dado (p, v) ∈ TM, sea F(p, v) = (p, v; v, E∗p,v v). Entonces F
es un spray cuadrático en M cuyas geodésicas son las curvas de aceleración
normal
Eα (α ′′ ) = 0.
La conexión asociada Γ : TM ⊕ TM → TTM está dada por la forma bilineal
Γp (v, w) = E∗p,v w = E∗p,w v.
Demostración. Para α ⊂ M con α ′ (0) = (p, v) ∈ TM, sea Et = Eα(t) . A partir
de Eα̇ = α̇ deducimos, derivando en t = 0 que Ėα̇ + Eα̈ = α̈. Luego
E∗p,v v = Ė0 α̇(0) = (1 − Ep )α̈(0).
Veamos usando esta última expresión que F(p, v) ∈ TTM. Sea
β(t) = (α(t), α̇ − tEt (α̈)) ∈ TM.
Entonces β(0) = (p, v), y por otra parte
β ′ (0) = (p, v; v, α̈(0) − Ep α̈(0) − 0) = F(V).
Evidentemente, F es un spray cuadrático, y como
F(α, α̇) = (α, α̇; α̇, (1 − E)α̈)
las geodésicas de este spray son las curvas con aceleración normal. Respecto de
Γ , lo que el teorema afirma es que para v, w ∈ Tp M, E∗p (v)w = E∗p (w)v. Para
probarlo, consideramos cualquier curva α(s, t) ∈ M dos veces diferenciable como
aplicación de R2 en M, tal que α(0, 0) = p, α ′ (0, 0) = v, α̇(0, 0) = w donde ′
denota d/ds y ˙ denota d/dt. Entonces de Eα α ′ = α ′ , derivando respecto de t
conseguimos
d ′
d ′
α =
α.
E∗α,α̇ α ′ + Eα
dt
dt
Evaluando en s = t = 0 obtenemos
E∗p,w v = (1 − Ep )α̇ ′ (0, 0),
2
2
d
d
y como α̇ ′ = dtds
α = dsdt
α, se sigue que v, w son intercambiables si uno repite
el argumento comenzando con la relación Eα α̇ = α̇.
126
Conexiones y Sprays
Observación 6.6.2. En general, el operador bilineal Γp : Tp M × F → F dado por
Γp (v, w) = E∗p,v w
es simétrico sólo cuando w ∈ Tp M (ver los ejemplos).
Observación 6.6.3. Si ∇ es la derivada covariante asociada al spray F, entonces
para cualquier par de campos X, Y : M → TM recordemos que
∇X Y = Y ′ X − Γ (X, Y)
es como se obtiene ∇ a partir del spray. Entonces, si α ⊂ M es cualquier curva
suave tal que α(0) = p, α̇(0) = Xp , derivando en t = 0 la relación Et (Yα ) = Yα
(donde Et = Eα(t) como antes), deducimos que
E∗p,Xp Yp + Ep (DYp Xp ) = DYp Xp ,
lo que nos dice que
∇X Y(p) = DYp Xp − Γp (Xp , Yp ) = DYp Xp − E∗p,Xp Yp = Ep (Y ′ X(p)),
es decir ∇X Y = E(Y ′ X), luego la derivada covariante es simplemente derivar en
el ambiente y proyectar al espacio tangente.
Observación 6.6.4. En el caso de una subvariedad de Rm , si consideramos los
suplementos dados por el producto interno, se tiene la conexión de Levi-Civita.
Si la subvariedad tiene dimensión n, podemos tomar una base {ei }i=1...n ortonormal en cada espacio tangente. Denotemos con Xi a los campos definidos
localmente por estos vectores: se tiene que ∇Xi Xj es nuevamente un elemento
en el espacio tangente y por ende lo podemos escribir como combinación lineal
de los elementos de la base:
Xi′ Xj − Γ (Xi , Xj ) = ∇Xi Xj =
n
X
k
−Γij
Xk ,
k=1
k
−Γij
números reales. Si α ⊂ M es una geodésica, entonces escribimos α̇ en
con
la base de los Xk :
n
X
α̇ =
α̇k Xk
k=1
y como ∇γ̇ γ̇ = Dα α̇ = 0, tenemos
α̈k =
X
k
Γij
α̇i α̇j .
i,j
Estos coeficientes son conocidos como símbolos de Christoffel de la conexión.
6.7. Derivada covariante y transporte paralelo
6.7.
127
Derivada covariante y transporte paralelo
En general, se puede definir la derivada covariante de una curva cualquiera
γ ⊂ M de la siguiente manera: se engorda la curva a un campo definido en
un entorno abierto U de γ en M, que llamaremos γ̇ : U → TU, que verifique
γ̇(γ(t)) = γ̇(t). Se define
Dγ(t) := ∇γ̇ γ̇(γ(t)),
donde ∇ es la derivada covariante del spray. No es difícil probar que esta definición es buena pues depende solamente de los valores del campo a lo largo de γ.
Explícitamente, en términos del spray, se tiene
Dγ = γ̈ − Γ (γ̇, γ̇).
Entonces las geodésicas son las curvas que tienen derivada covariante nula. La
ecuación
Dγ = γ̈ − Γ (γ̇, γ̇) = 0
se conoce como ecuación de Euler del spray.
6.7.1.
Derivada covariante de levantadas
Una manera más concreta usando Γ de definir la derivada covariante es la
siguiente: dada α : J → M una curva de clase Ck con k ≥ 2, definimos Lev(α)
como el espacio de todas las levantadas de α de clase C1 , es decir curvas β ⊂ TM
tales que πβ = α, donde π : TM → M es la proyección al punto base. Este
conjunto es no vacío ya que (por lo menos) β = α ′ ∈ Lev(α). Además Lev(α) es
un espacio lineal y un módulo sobre las funciones f : J → R con las operaciones
usuales del fibrado,
(α, µ) + (α, τ) = (α, µ + τ),
f(α, µ) = (α, fµ).
Lema 6.7.1. Si β = (α, µ) ∈ Lev(α), la aplicación Dα ′ : Lev(α) → Lev(α)
dada en una carta por
Dα ′ β = (α, µ̇ − Γα (α̇, µ))
(6.2)
es lineal, verifica Dfα ′ β = fDα ′ β para toda función suave f (donde fα ′ está
dado en una carta por (α, fα̇), y además es una derivación en el sentido
siguiente:
Dα ′ (fβ) = f ′ β + fDα ′ β
para toda f : J → R. Además si Y : M → TM es un campo tal que Y(α(t)) =
β(t) para todo t ∈ J, y X : M → TM es otro campo tal que α ′ (c) = X(α(c))
para algún c ∈ J, entonces
Dα ′ β(c) = ∇X Y(α(c)).
128
Conexiones y Sprays
Demostración. La prueba de que la definición no depende de la carta queda
como ejercicio; que es lineal y una derivación es obvio. La última afirmación es
consecuencia de la relación ∇X Y = Y ′ X − Γ (X, Y) y de
µ̇ =
d
Yα(t) = DYα α ′ = Y ′ X.
dt
Diremos que β ∈ Lev(α) es α-paralelo si Dα ′ β ≡ 0, es decir si
µ̇ = Γα (α̇, µ).
(6.3)
Al conjunto de levantadas α-paralelas lo denotamos con Par(α). Observemos
que si β = α ′ = (α, α̇), se tiene
Dα ′ α ′ = (α, α̈ − Γα (α̇, α̇)).
Luego α ′ es α-paralela si y sólo solo si α es una geodésica del spray, es decir si
verifica la ecuación de Euler. Por eso se suele decir que las geodésicas son las
únicas curvas auto-paralelas.
Observación 6.7.2. Es habitual denotar la derivada covariante a lo largo de α
como Dt a secas, cuando se desprende del contexto cuál es la curva a lo largo de
la cual se deriva. Así, por ejemplo, un geodésica se caracteriza con la ecuación
Dt α ′ = 0.
6.7.2.
Transporte paralelo
El siguiente teorema contiene los ingredientes necesarios para definir el transporte paralelo en M. Suponemos como antes que α : J → M es por lo menos
C2 .
Teorema 6.7.3. Sea a ∈ J. Dado v ∈ Tα(a) M existe una única βv = (α, µv ) ∈
Par(α) tal que µv (a) = v. Si b ∈ J y P = Pab (α) : Tα(a) M → Tα(b) M denota la
aplicación v 7→ µv (b), entonces P es un isomorfismo de espacios de Banach,
que denominamos transporte paralelo a lo largo de α. Además, para todo c ∈ J,
Pcb ◦ Pac = Pab .
Demostración. Consideramos la ecuación (6.3), que es esencialmente una ecuación del tipo µ̇(t) = A(t)µ(t) con el operador
A(t) = Γα(t) (α̇(t), ·)
6.7. Derivada covariante y transporte paralelo
129
lineal para cada t ∈ J fijo. Por el teorema de existencia y unicidad de ecuaciones
ordinarias, la curva solución µv con µv (a) = v es única y nos da la curva βv
requerida, que está definida en todo J porque la ecuación es lineal, con lo cual es
globalmente Lipschitz. Considerando que el flujo de la ecuación diferencial está
definido en J, entonces Pab = Pcb ◦ Pac para todo a, b, c ∈ J por propiedades generales del flujo. En particular, la aplicación Pab (α) es biyectiva entre los tangentes
porque tiene una inversa que se construye de manera análoga (intercambiando
a con b). Las relaciones
P(λv) = λP(v),
P(v + w) = P(v) + P(w)
se deducen de la unicidad de la solución reemplazando en la ecuación diferencial
lineal.
Observación 6.7.4. Si α(t) = expp (tv), entonces es fácil ver que el transporte
paralelo a lo largo de α del vector v ∈ Tp M está dado sencillamente por α̇(t),
pues esta levantada verifica la ecuación diferencial del transporte con la condición
inicial requerida.
Observación 6.7.5. Si X, Y son campos en M y usamos α para denotar el flujo
de X, entonces el transporte paralelo a lo largo de α nos permite calcular de
manera natural la derivada covariante, de la siguiente manera:
d P0 (α)(Yα(t) )
∇X Y(p) =
dt t=0 t
donde α(0) = p ∈ M. La verificación de esta fórmula queda a cargo del lector.
Observación 6.7.6. En el caso de una subvariedad M ⊂ F y una familia de
suplementos Hp ⊕ Tp M = F dada por proyectores Ep , la ecuación µ̇ − Γα (α̇, µ)
se traduce en
µ̇ − E∗α,α̇ µ
donde se sobreentiende que µ ∈ Tα M = ran(Eα ). Luego β = (α, µ) es α-paralela
si y sólo si µ̇ = E∗α,α̇ µ y la ecuación de transporte paralelo desde α(0) hasta
α(t) es, para v ∈ Tα(0) M,
µ̇ = E∗α,α̇ µ
.
µ(0) = v
(6.4)
130
6.8.
Conexiones y Sprays
El tensor de curvatura y campos de Jacobi
Sea M una variedad con spray cuadrático. Introducimos la curvatura R de
la variedad, junto con algunas nociones vinculadas, y dejamos para más adelante (en la sección de estructuras métricas) las interpretaciones geométricas más
precisas de R.
Sean X, Y, Z : M → TM campos de clase Ck , con k ≥ 2. Si ∇ es la derivada
covariante inducida por el spray, definimos el tensor de curvatura
R(X, Y, Z) = ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y] Z,
donde [X, Y] = LX Y denota la derivada de Lie de Y en la dirección de X. Observemos que la expresión R(X, Y, Z) es un campo en M. La transformación de
curvatura R(X, Y) : X (M) → X (M) está dada por
R(X, Y)Z = R(X, Y, Z).
Se tiene
R(X, Y) = −R(Y, X).
R(X, Y, Z) + R(Y, Z, X) + R(Z, X, Y) = 0.
Esta última es conocida como identidad algebraica de Bianchi.
Un cálculo en coordenadas muy fastidioso que dejamos como ejercicio (Ejercicio 6.ix) nos devuelve
R(X, Y, Z)(p) = Γp (Xp , Γp (Yp , Zp )) − Γp (Yp , Γp (Xp , Zp ))
−Γ∗p,Xp (Yp , Zp ) + Γ∗p,Yp (Xp , Zp ),
donde los últimos términos involucran la derivada de la forma Γ respecto del
punto base. Esta expresión nos dice que R sólo depende del valor de los campos
en el punto p. Luego se puede pensar a R como una aplicación trilineal en
TM × TM × TM. Es decir, dados x, y, z ∈ Tp M, definimos
Rp (x, y, z) =
Rp (x, y)z = Γp (x, Γp (y, z)) − Γp (y, Γp (x, z))
−Γ∗p,x (y, z) + Γ∗p,y (x, z),
(6.5)
Aunque está dada en coordenadas locales, la definición intrínseca es tomar tres
campos X, Y, Z en M tales que Xp = x, Yp = y, Zp = z y entonces Rp (x, y, z) =
R(X, Y, Z)(p) ∈ Tp M. También podemos pensar, para x, y ∈ Tp M, en el operador
lineal Rp (x, y) ∈ B(Tp M).
6.8. El tensor de curvatura y campos de Jacobi
6.8.1.
131
Subvariedades de un espacio de Banach
Hay que tener algún cuidado porque en principio Γ sólo está definida en
Tp M × Tp M, pero en la expresión en coordenadas al distribuir quedaron expresiones del tipo Γ (v, z) con v ∈ Tp M pero z ∈
/ Tp M. Para el caso de subvariedades,
la Observación 6.6.2 salva esta ambigüedad: hay que usar la extensión para que
el cálculo tenga sentido.
Observación 6.8.1. En este caso de subvariedades con la conexión inducida por
los proyectores, los términos que involucran la derivada de Γ respecto del punto
base se cancelan, es decir
−Γ∗p,x (y, z) + Γ∗p,y (x, y) = 0.
En efecto, si Ep (p ∈ M ⊂ F) es la familia de proyectores con rango Tp M,
como Γp (y, z) = E∗p,y z, tomando p = pt tal que p0 = p y ṗ0 = x, se deduce que
Γ∗p,x (y, z) = D2 Ep (x, y)z y con un argumento similar, Γ∗p,y (x, z) = D2 Ep (y, x)z.
Asumiendo que todas las aplicaciones son dos veces diferenciables, se tiene la
conclusión.
Entonces las fórmulas de la curvatura para subvariedades de un espacio de
Banach son:
Rp (x, y, z) =
=
6.8.2.
Γp (x, Γp (y, z)) − Γp (y, Γp (x, z))
[E∗p,x E∗p,y − E∗p,y E∗p,x ] z.
(6.6)
Campos de Jacobi
Dada α ⊂ M una geodésica, diremos que γ ∈ Lev(α) es una levantada de
Jacobi o campo de Jacobi si verifica la ecuación diferencial
D2α ′ γ = R(α ′ , γ)α ′ .
Esta es una ecuación de segundo orden lineal, luego para cada V = (p, v), W =
(p, w) con v, w ∈ Tp M existe una única levantada de Jacobi γ = γV,W tal que
γv,w (0) = V,
Dα ′ γv,w (0) = W.
En coordenadas, llamando γ = (α, η), iterando (6.2) y comparando con la ecuación de R en (6.5) obtenemos
η̈ =
d
Γα (α̇, η) + Γα (α̇, η̇) − Γα (Γα (α̇, α̇), η),
dt
132
Conexiones y Sprays
usando la identidad α̈ = Γα (α̇, α̇), obtenemos
η̈ =
d
Γα (α̇, η) + Γα (α̇, η̇) − Γα (α̈, η),
dt
(6.7)
que es una genuina ecuación diferencial lineal de segundo orden en η. Denotemos
p = α(0), z = α̇(0).
Luego para cada para v, w ∈ Tp M, existe una única solución ηv,w tal que
ηv,w (0) = v,
Dη(0) = η̇v,w (0) − Γp (v, z) = w.
Observación 6.8.2. En el caso particular en el que v = 0, denotaremos ηw =
η0,w . Entonces las condiciones iniciales se reescriben así
ηw (0) = 0,
η̇w (0) = w.
Mayormente usaremos estos campos de Jacobi con v = 0. Si además w = α̇(0),
entonces es fácil ver usando (6.7) que ηw (t) = tα̇(t).
Dada α : [a, b] → M una curva dos veces derivable, una variación de α es
una función ν : J × [a, b] → M dos veces diferenciable con 0 ∈ J ⊂ R, de manera
que ν(0, t) = α(t) para todo t ∈ [a, b]. Es usual denotar αs (t) = ν(s, t) para
pensar en la familia de curvas {αs }s∈J definidas en [a, b] con α0 = α. Si αs son
geodésicas para todo s ∈ J, diremos que ν es una variación por geodésicas. Si
αs (a) = α(a) y αs (b) = α(b) para todo s ∈ J, diremos que ν es una variación
de extremos fijos. La relevancia de los campos de Jacobi es evidente a partir del
próximo teorema, que establece que todo campo de Jacobi se obtiene derivando
una variación por geodésicas y viceversa.
Teorema 6.8.3. Sea α : [a, b] → M una geodésica.
1. Si ν : J × [a, b] → M es una variación por geodésicas de α en M,
entonces η : [a, b] → TM dada por
d
d η(t) =
αs (t)
ν(0, t) =
ds
ds s=0
es un campo de Jacobi a lo largo de α.
2. Si α está parametrizada por longitud de arco y η es un campo de
Jacobi a lo largo de α, entonces existe ǫ > 0 y una variación de α por
geodésicas ν : (−ǫ, ǫ) × [a, b] → M tal que
η(t) =
d
ν(0, t).
ds
6.8. El tensor de curvatura y campos de Jacobi
133
Demostración. Supongamos que ν = ν(s, t) es una variación de geodésicas, y
como siempre denotemos con ′ a la derivación d/ds, y con ˙ a la derivación d/dt.
Pongamos η = ν ′ . Luego η̇ = ν̇ ′ , con lo cual
Dν̇ η = ν̇ ′ − Γ (ν̇, ν ′ ) = Dν ′ η,
mientras que
η̈ = ν̈ ′ =
d
′
Γ (ν̇, ν̇) = Γα,η
(α̇, α̇) + 2Γα (η̇, α̇),
ds
pues para cada s fijo, ν(s, t) es una geodésica. Computando D2 η y usando estas
relaciones, se deduce directamente de la expresión local para R -fórmula (6.5)que η es un campo de Jacobi.
Recíprocamente, si η es un campo de Jacobi a lo largo de la geodésica α,
ponemos p = α(0), v = α̇(0), w = Dα ′ η(0). Sea β = β(s) la única geodésica del
spray con β(0) = p, β ′ (0) = η(0). Tomamos
ξ(s) = P0s (β)(v + sw).
Luego ξ(0) = v y w = Dβ ′ ξ = ξ ′ − Γβ (β ′ , ξ). Como ξ(s) ∈ Tβ(s) M, entonces
αs (t) = ν(s, t) = expβ(s) (tξ(s))
es una variación de geodésicas, y además α0 (t) = expp (tv) = α(t), luego αs es
una variación de α. Por el ítem previo,
d µ(t) =
αs (t)
ds s=0
es un campo de Jacobi a lo largo de α. Resta ver que coincide con η, y por
unicidad alcanza ver que verifica las mismas condiciones iniciales. Claramente
µ(0) = β ′ (0) = η(0). Por otra parte como
α˙s (0) = (expβ(s) )∗0 (ξ(s)) = ξ(s),
entonces
Dα ′ µ(0) = µ̇(0) − Γp (η(0), v) = ξ ′ (0) − Γp (η(0), v) = w = Dα ′ η(0).
134
Conexiones y Sprays
6.8.2.1.
Campos de Jacobi versus exponencial
La relación entre campos de Jacobi y la exponencial se hace explícita en el
siguiente teorema:
Teorema 6.8.4. Sean p ∈ M, w ∈ Tp M y α(t) = expp (tv). Sea ηw el único
campo de Jacobi a lo largo de α tal que η(0) = 0, η̇(0) = Dα ′ η(0) = w.
Entonces para todo t > 0 en el dominio de α, se tiene
1/t
η(t) = (expp )∗tv w.
En particular, w ∈ ker(expp )∗tv si y sólo si η(t) = 0.
Demostración. Consideramos la variación de α por geodésicas dada por
ν(s, t) = expp (t(v + sw)),
y µ = α0′ el campo de Jacobi inducido; afirmamos que µ = η. Nuevamente por
unicidad sólo hay que chequear las condiciones iniciales: se tiene
µ(t) = (expp )∗tv (tw),
fórmula que prueba todas las afirmaciones pues µ(0) = 0 y además
µ̇(0) = lı́m+ µ(t)/t = w.
t→0
6.9.
Ejemplos de sprays
En esta sección estudiamos algunos ejemplos relevantes de grupos y espacios
homogéneos de grupos lineales. En cada uno de ellos introducimos un spray y
calculamos todos los invariantes vinculados.
6.9.1.
Espacios lineales
Si M = E es un espacio de Banach, entonces TTE = E4 y podemos poner
el spray trivial F = 0 (es decir, en la notación de la Observación 6.1.4, estamos
eligiendo f2 = 0). Como mencionamos antes, fijados v ∈ E = M, z ∈ Tv E = E,
tenemos una única solución al problema α ′′ (t) = 0, α(0) = v, α̇(0) = z, que es
el segmento
α(t) = v + tz.
6.9. Ejemplos de sprays
135
Observemos que está definido en todo R. La derivada covariante es simplemente
∇X Y = Y ′ X. La conexión asociada es la conexión nula, y el transporte paralelo
a lo largo de una curva α ⊂ E se obtiene de la ecuación (6.3), µ̇ = 0 de donde
se desprende que para v ∈ Tα(a) E = E, se tiene Pab (α)v = v. Es decir que Pv se
obtiene de v moviéndolo en forma paralela a su estado inicial a lo largo de la
curva α. Para algunos, esto explica el nombre. Los formas de curvatura R, R son
idénticamente nulas.
6.9.2.
La esfera de un espacio de Hilbert
Si M = S, con S = {x ∈ H : kxk2 = hx, xi = 1}, la esfera unitaria de un
espacio de Hilbert H, podemos tomar, para p ∈ S, v ∈ Tp S = span(p)⊥ el spray
Fp (v) = F(p, v) = −kvk2 p.
Esta es una forma cuadrática que proviene de la forma bilineal simétrica
Γp (v, w) = −hv, wip.
Afirmamos que este spray es el que se obtiene al derivar y proyectar (Teorema
6.6.1) usando los suplementos naturales de Tp S dados por el producto interno
de H, es decir la descomposición
H = Tp S ⊕ span(p).
Para verlo, notemos que para p ∈ S, Ep ∈ B(H) dado por Ep (w) = w − hw, pip
es el proyector ortogonal sobre Tp S. Tomando pt ∈ S y derivando en t = 0
obtenemos
Γp (v, w) = E∗p,v w = −hw, vip − hw, piv
(6.8)
que para v = w ∈ Tp S = span(p)⊥ coincide con el spray que introdujimos.
Las soluciones son las geodésicas usuales de la esfera, es decir, círculos máximos.
Con mayor precisión, sea p ∈ S y tomemos cualquier q ∈ S tal que q ⊥ p. Para
k ∈ R, consideremos
γ(t) = cos(kt)p + sen(kt)q,
(6.9)
que es una curva suave en S con γ(0) = p. Entonces
γ̇(t) = [− sen(kt)p + cos(kt)q]k,
con lo cual kγ̇(t)k = cte = |k|, y por otra parte
γ̈(t) = [cos(kt)p + sen(kt)q](−k2 ) = −k2 γ(t),
136
Conexiones y Sprays
con lo cual γ verifica Fγ (γ̇) = γ̈. Si v ∈ Tp S = span(p)⊥ , poniendo q = v/kvk
y k = kvk, la exponencial de la variedad expp : Tp S → S está dada entonces por
γ(1), es decir
sen(k)
v
expp (v) = cos(k)p +
k
La derivada covariante de este spray es
∇X Y(p) = Y ′ X(p) + hXp , Yp ip,
es decir en curvas β ∈ Lev(α),
Dα ′ β = β̇ + hβ, α̇iα.
La conexión afín asociada está dada por la forma bilineal Γ , y su rango es span(p)
que en efecto es un suplemento para Tp S. El transporte paralelo a lo largo de
α ⊂ S se construye con la ecuación
µ̇ = −hα̇, µiα,
µ(0) = v ∈ Tα(0) S.
(6.10)
En general no es fácil dar una expresión explícita del transporte paralelo. Sin
embargo, si γ ⊂ S es una geodésica, dada por (6.9), entonces hay una manera
geométrica de presentarlo: el transporte a lo largo de γ está dado por una rotación
del plano Π = span(p, q) que fija el resto del espacio. Veamos los detalles:
descomponemos el espacio de Hilbert como
H = span(p) ⊕ span(q) ⊕ (span(p) ⊕ span(q))⊥ .
(6.11)
Para v, w ∈ H, denotamos v ⊗ w ∈ B(H) al tensor elemental dado por
v ⊗ w(z) = hw, ziv
para z ∈ H, que resulta un operador de rango uno. Observemos que
(v ⊗ w)(w ⊗ z) = kwk2 v ⊗ z
para todo v, w, z ∈ H. Sea P ∈ P(B(H)) el proyector al subespacio (span(p) ⊕
span(q))⊥ . Entonces P = (p ⊗ p + q ⊗ q)⊥ y
p ⊗ p + q ⊗ q + P = 1,
con cada proyector P, p ⊗ p, q ⊗ q disjunto respecto del otro (es decir que los
productos son nulos). Sea
Ut = cos(kt)(p ⊗ p + q ⊗ q) + sen(kt)(q ⊗ p − p ⊗ q) + P.
6.9. Ejemplos de sprays
137
Entonces es fácil ver que Ut ∈ U(H), de hecho, en la representación matricial
correspondiente a la descomposición (6.11), se escribe así:


cos(kt) − sen(kt) 0
Ut =  sen(kt)
cos(kt) 0 
0
0
1
y es en efecto una rotación del plano Π = span(p, q) que fija el ortogonal. Si
v ∈ Tp S = Tγ(0) S, entonces
P0t (γ)v = Ut v = hv, qi(− sen(kt)p + cos(kt)q) + Pv
verifica la ecuación diferencial (6.10).
De acuerdo a la ecuación del proyector (6.8) y la ecuación general de la
curvatura para subvariedades (6.6), obtenemos
Rp (x, y)z = hy, zix − hx, ziy.
para p ∈ S, x, y, z ∈ Tp S = span(p)⊥ .
Para simplificar las cuentas, supongamos que la geodésica α está parametrizada por longitud de arco. Entonces es fácil ver que el único campo de Jacobi
η = ηv,w a lo largo de α y tal que
η(0) = v,
Dα′ η(0) = η̇(0) + hα̇(0), η(0)ip = w
con v, w ∈ Tp S, está dado por
η(t) = v cos(t) + (w − hv, qip) sen(t).
6.9.2.1.
Un spray no cuadrático en la esfera
Por la descripción que dimos de TTS para una esfera, sabemos que un punto
(p, v; u, w) ∈ TTS si y sólo si v, u ∈ Tp S = span(p)⊥ , y w verifica
w ∈ −hu, vip ⊕ span(p)⊥ .
Luego es válido considerar sprays del tipo
Fp (v) = −kvk2 p + vp
con vp ∈ Tp S. En particular, podemos considerar
Fp (v) = −kvk2 p + v,
que en este caso no es homogéneo y no proviene de una forma bilineal. Los
círculos máximo no son solución de
α ′′ = −kα ′ k2 α + α ′ .
¿Quienes son las geodésicas de este spray?
138
6.9.3.
Conexiones y Sprays
El grupo de inversibles de un álgebra de Banach
Si B es un álgebra de Banach (real o compleja), y G = GB es el grupo de
elementos inversibles de B, con su estructura de variedad como abierto en B,
podemos considerar el spray canónico
F(gv) = gv2
para g ∈ GB , v ∈ B, gv ∈ Tg G. Las geodésicas del spray son los grupos a un
parámetro
γ(t) = getv .
Si llamamos w = gv ∈ Tg G, entonces v = g−1 w y este spray se describe como
F(w) = wg−1 w.
Observemos que engañosa que es la notación en coordenadas. Si elegimos la carta
local alrededor de g ∈ G dada por φ(h) = exp−1 (g−1 h) -definida en un entorno
conveniente de g-, entonces φ◦γ(t) = tv. Luego en coordenadas γ ′ (t) = (tv, v) y
con esto γ ′′ (t) = (tv, v; v, 0). Con lo cual el spray canónico en estas coordenadas
es
F(x, v) = (x, v; v, 0).
La conexión afín está dada por
Γg (v, w) = 1/2(vg−1 w + wg−1 v)
para g ∈ G, v, w ∈ Tg G = gB. En particular
Γ1 (v, w) = 1/2(vw + wv).
La derivada covariante del spray está dada por
∇X Y(g) = Y ′ X(g) − 1/2(Xg g−1 Yg + Yg g−1 Xg ).
(6.12)
Para geodésicas α(t) = getv , se tiene
Dα ′ β = β̇ − 1/2[βv + gvg−1 β].
Si X, Y son los campos invariantes a izquierda X(g) = gv, Y(g) = gw para g ∈ G,
v, w ∈ g = B, entonces derivando Y(getv ) = getv w en t = 0 obtenemos
Y ′ X(g) = Y∗g (X(g)) = Y∗g (gv) = gvw.
Luego
∇X Y(g) = gvw − 1/2(gvw + gwv) = 1/2g[v, w] = 1/2[X, Y](g).
6.9. Ejemplos de sprays
139
El transporte paralelo a lo largo de α ⊂ GB está dado por la ecuación
µ̇ = 1/2[µα−1 α̇ + α̇α−1 µ],
y si α(t) = getv es una geodésica del spray, entonces si R, L denotan los operadores multiplicar a derecha e izquierda respectivamente,
µ̇ = 1/2[µv + gvg−1 µ] = 1/2[Rv + Lgvg−1 ]µ = Aµ.
Luego µ(t) = etA µ0 , y como L, R conmutan entonces
µ(t) = eRtv/2 eLgtvg−1/2 µ0 = egtvg
tv
/2
µ0 e /2 .
−1
Operando con gg−1 en µ0 , obtenemos
v/2 −1 v/2
g ze
v
Pgge (α)z = ge
(6.13)
∈ Tgev G
para z ∈ Tg G = gB. En particular, para g = 1,
v
v/2 v/2
ze
P1e (α)z = e
∈ Tev G
para z ∈ g = B.
Si x, y, z ∈ Tg G, entonces el tensor de curvatura se calcula directamente
usando la forma bilineal Γ y su expresión local (6.5), obteniéndose
g−1 Rg (x, y, z) = −1/4[[g−1 x, g−1 y], g−1 z].
llamando x = gx0 , etc. para x0 , y0 , z0 ∈ g = B, se tiene
g−1 Rg (x, y, z) = −1/4[[x0 , y0 ], z0 ].
(6.14)
−1
Ahora tomemos la geodésica α(t) = geg tv = expg (tv). Dados z, w ∈ Tg G,
−1
tomamos β(s) = gesg z = expg (sz) y consideramos el transporte paralelo
s
ξ(s) = P0s (β)(v + sw) = ge 2 g
−1
z −1
g
s
(v + sw)e 2 g
−1
z
.
De acuerdo a la construcción del Teorema 6.8.3, a partir de la variación de α
dada por
αs (t) = expβ(s) (tξ(s))
construimos el único campo de Jacobi η a lo largo de α tal que η(0) = z,
d α (t), dado por
Dα ′ η(0) = w. Este es η(t) = ds
s=0 s
η(t) = zetg
−1
v
+ tg exp∗tg−1 v g−1 w + 1/2[g−1 vg−1 z − g−1 zg−1 v] .
140
Conexiones y Sprays
Si llamamos V = g−1 v, W = g−1 w, Z = g−1 z, se tiene
g−1 η(t) = ZetV + t exp∗tV (W + 1/2[V, Z])
tV
= Ze
(6.15)
+ t exp∗tV (W) + 1/2 exp∗tV ad tV(Z).
Si recordamos la fórmula de la diferencial de la exponencial (Lema 4.1.2), como
F(λ)λ = 1−e−λ , se simplifican los términos ZetV . Llamando µ = α−1 η se obtiene
la expresión
µ(t) = 1/2[Z + e−tV ZetV ] + F(ad tV)(tW).
6.9.4.
El grupo de operadores unitarios
Si A es un álgebra C∗ , consideremos M = U el grupo de Lie-Banach real de
operadores unitarios en A, cuya álgebra de Lie-Banach es el espacio de operadores
antihermitianos Aah . Este puede pensarse como la superficie de nivel (del punto
(0, 0) ∈ Ah × Ah ) de la función g : A → Ah × Ah dada por
g(v) = (v∗ v − 1, vv∗ − 1).
Entonces, para u ∈ U, y ∈ A, Dgu (y) = 2(Re(u∗ y), uRe(u∗ y)u∗ ). Por supuesto
que Tu U = uT1 U = uAah , pero derivando nuevamente esta expresión obtenemos
D2 gu (x, y) = 2(Re(x∗ y), Re(xy∗ )).
Comparando con la Observación 5.2.1, se deduce que, para u ∈ U, x, y ∈ Tu U,
entonces
(u, x; y, w) ∈ TTM ⇔ Re(u∗ w) = −Re(y∗ x).
poniendo x = ux0 , y = uy0 con x0 , y0 ∈ Aah , debe ser Re(u∗ w) = Re(y0 x0 ).
El spray canónico se reduce al subgrupo U ⊂ GA , pues podemos poner, para
z ∈ Tu U = uAah ,
Fu (z) = −uz∗ z = zu∗ z = zu−1 z,
pues z = uz0 , con lo cual Fu (uz0 ) = uz20 . Por supuesto que las geodésicas
del spray canónico son los grupos a un parámetro γ(t) = uetv con v∗ = −v.
La derivada covariante, el transporte paralelo y el tensor de curvatura tienen
entonces la misma pinta que en el ejemplo anterior (y de hecho, es la pinta en
cualquier grupo de Lie-Banach con este spray canónico que hace de los grupos
a un parámetro las geodésicas).
Observemos que para cada u ∈ U, Tu U = uAah tiene un suplemento natural
en A que es uAh . El único idempotente Eu : A → A tal que
ran(Eu ) = uAah = Tu U,
ker(Eu ) = uAh
6.9. Ejemplos de sprays
141
está dado por Eu (w) = 21 u[u∗ w − w∗ u]. Reemplazando u por u(t) = uetu
derivando en t = 0 obtenemos
∗
v
y
E∗u,v w = −1/2[vw∗ u + uw∗ v].
Si w = v = uz0 ∈ Tu U, con z∗0 = −z0 , entonces E∗u,uz0 uz0 = uz20 , y entonces el
Teorema 6.6.1 nos dice que el spray canónico coincide con el spray dado por los
suplementos naturales.
6.9.5.
Operadores positivos e inversibles
∗
Sea M = G+
A , el espacio de elementos positivos invertibles de un álgebra C .
6.9.5.1.
El spray trivial
+
Podemos tomar para a ∈ G+
A , v ∈ Ah = T GA el spray trivial F = 0. Como
G+
A ⊂ Ah es un abierto convexo, las geodésicas son los segmentos usuales
γ(t) = a + tv,
que en este caso no están definidas para todo t ∈ R. En efecto, si a ∈ G+
A
y v ∈ Ah entonces a + tv ∈ Ah , pero además como los elementos inversibles
forman un abierto, γ ⊂ G+
A para t ∈ (−t1 , t2 ), con t1 , t2 > 0 suficientemente
pequeños.
6.9.5.2.
El spray canónico
+
+
También si M = G+
A , podemos tomar para a ∈ GA , v ∈ Ah = TGA el spray
Fa (v) = va−1 v,
lo que nos dice algo sobre la inclusión G+
A ⊂ GL(A). La conexión afín está dada
por
Γa (v, w) = 1/2(va−1 w + wa−1 v).
Sabemos que las geodésicas del spray son las curvas a un parámetro aetz , pero
este tiene que ser un elemento positivo, y en general no es cierto que producto
de positivos sea positivo. Sin embargo, reescribiendo adecuadamente los grupos
a un parámetro descubrimos que no hay contradicción: sean a, b ∈ G+
A , entonces
,
luego
tiene
un
único
logaritmo
analítico
autoadjunto,
a−1/2 ba−1/2 ∈ G+
A
v = ln(a−1/2 ba−1/2 ) ∈ Ah .
Por otra parte, por el Lema A.2.2
σ(a−1 b) = σ(a−1/2 a−1/2 b) = σ(a−1/2 ba−1/2 ) ⊂ (0, +∞)
142
Conexiones y Sprays
pues ambos son inversibles. Entonces a−1 b tambien tiene un logaritmo analítico
(con el mismo cálculo funcional), sólo que en este caso no resulta autoadjunto.
Consideremos el grupo a un parámetro
γa,b (t) = aet ln(a
−1
b)
,
entonces γa,b es una curva de inversibles que une a con b. Pero por otra parte,
1
1
1
1
1
1
γa,b (t) = a 2 a 2 exp[t ln(a−1 b)]a− 2 a 2 = a 2 exp(tv)a 2 ,
+
luego γa,b ⊂ G+
A es la geodésica del spray que une a con b en GA . En particular:
Las geodésicas que comienzan en a = 1 son los grupos a un parámetro
γ(t) = etv con v ∈ Ah .
Dados a, b ∈ G+
A existe una única geodésica del spray que los une, que es
la curva γa,b .
La exponencial expa : Ah → G+
A está dada por
1
1
1
1
expa (v) = a 2 exp(a− 2 va− 2 )a 2 .
La derivada covariante del spray está dada por la expresión (6.12), para g =
a ∈ G+
A . El transporte paralelo a lo largo de γa,b se calcula usando (6.13) y la
reescritura de b = gev , obteniéndose
1
1
1
1
1
1
1
1
1
1
Pab (γa,b )Z = a 2 (a− 2 ba− 2 ) 2 a− 2 Za− 2 (a− 2 ba− 2 ) 2 a 2 ,
para Z∗ = Z; en particular
1
1
P1a (γa,b )Z = a 2 Za 2 .
El tensor de curvatura se reduce del grupo de inversibles, usando (6.14), que
es un operador Hermitiano siempre que x0 , y0 , z0 lo sean. Lo mismo se aplica a
los campos de Jacobi η ∈ Lev(γa,b ), que con una reescritura adecuada son los
mismos que los del grupo lineal. Explícitamente, a partir de la ecuación (6.15),
usando la expresión de la diferencial de la exponencial en el espacio de operadores
positivos (Teorema 4.5.1) se tiene que el único campo de Jacobi a lo largo de
γa,b con η(0) = v, Dt η(0) = w es
−1
−1
2
2
γa,b
η γa,b
= cosh(ad tV)Z +
1
1
1
senh(ad tV/2)
tW,
ad tV/2
1
1
1
donde en este caso Z = a− 2 ba− 2 , V = a− 2 va− 2 , W = a− 2 wa− 2 .
6.9. Ejemplos de sprays
6.9.6.
143
La Grassmanniana
Tomemos M = Gr(p) ⊂ Ah , la Grassmanniana de un proyector p ∈ P(A),
en una C∗ -álgebra A. Consideramos g : Ah → Ah dada por g(q) = q2 − q, para
pensar a P(A) como superficie de nivel de g = 0. Tomando α(t) = p + tx con
p ∈ P(A) y x ∈ Ah , descubrimos que
Dgp (x) = px + xp − x,
lo que nos dice que Tp P(A) = {x = xp + px : x∗ = x} = AC
h . Tomando β(t) =
p + ty con y∗ = y descubrimos derivando en t = 0 la expresión Dgβ (x), que
D2 gp (x, y) = xy + yx.
Comparando con la Observación 5.2.1 en la Sección 5.2, si w ∈ Ah entonces
(p, x; y, w) ∈ TTM ⇔ x, y ∈ AC
h,
pw + wp − w = −(xy + yx).
Si escribimos w = pwp + p⊥ wp⊥ + p⊥ wp + pwp⊥ , tenemos pw + wp − w =
pwp − p⊥ wp⊥ y entonces
pwp = −p(xy + yx)p,
p⊥ wp⊥ = p⊥ (xy + yx)p⊥ .
2
Observemos que x ∈ AC
h es equivalente a x = xp + px, y entonces x =
2
2
2
2
xpx + px p y también x p = px = px p con lo cual podemos considerar el
spray
Fp (x) = −2ǫp x2 = −2px2 p + 2xpx = −2px2 p + 2p⊥ x2 p⊥ ,
que corresponde a tomar x = y en la construcción del w de arriba y suponer que
w es p-diagonal. La forma bilineal asociada es
Γp (x, y) = −ǫp [xy + yx]
para x, y ∈ Tp P(A) = AC
h . Observemos que este es el spray natural proveniente
del suplemento que tiene AC
h en los operadores Hermitianos, que es el espacio
D
Ah . En efecto, si ponemos, para w ∈ Ah ,
Ep (w) = wp + pw − 2pwp
entonces es fácil verificar que Ep es el único idempotente Ep : Ah → Ah con
D
ran(Ep ) = AC
h = Tp P(A) y ker(Ep ) = Ah .
Entonces, de acuerdo a la construcción del Teorema 6.6.1, calculamos
d E∗p,v w =
Eα(t) (w) = wv + vw − 2vwp − 2pwv
dt t=0
= −[ǫp wv + vwǫp ]
(6.16)
144
Conexiones y Sprays
donde α(t) ⊂ Gr(p). En el caso en el que también w ∈ Tp P(A) = AC
h , se obtiene
E∗p,v w = −ǫp [wv + vw], luego nuestro spray coincide con E∗p,v v, por lo tanto
es el spray canónico dado por el suplemento natural de los tangentes, y como
veremos en la Sección 9.1.1.1, se trata del spray métrico de la Grassmanniana
cuando a la misma le damos la métrica de subespacio inducida por la norma
1
Frobenius de los operadores, dada por kxk2 = Tr(x∗ x) /2 .
Las geodésicas del spray deben verificar la ecuación
α̈ = −2ǫα α̇2 ,
y es fácil ver que son las curvas
γ(t) = etz pe−tz = πp ◦ exp(tz) = Q(tz)
(6.17)
C
para z ∈ AC
ah . Recordando que todo x = xp + px ∈ Ah = Tp P(A) se levanta
C
a un z ∈ Aah como z = xp − px, la exponencial de la variedad está dada por
expp : AC
h → P(A) con la expresión
expp (x) = e(xp−px) pe−(xp−px) .
la derivada covariante se deduce directamente de la expresión que dedujimos
para Γ , obteniéndose
Dα̇ µ = µ̇ + ǫα (α̇µ + µα̇).
(6.18)
para µ ∈ Lev(α) y α ⊂ P(A) de clase C2 . En consecuencia, el transporte
paralelo a lo largo de α ⊂ P(A) está dado por la ecuación
µ̇ = −ǫα (α̇µ + µα̇).
En particular, para una geodésica γ como en (6.17), y un vector x ∈ Tp P(A), se
tiene
µt = P0t x = etz xe−tz .
La verificación es sencilla y requiere primero comprobar que ǫα α̇ = −z y ǫα µ =
−µǫα , lo que nos dice que µ ∈ Tα P(A), y además permite calcular fácilmente
µ̇ = zµ − µz = −ǫα (α̇µ + µα̇).
El tensor de curvatura se obtiene iterando (6.16), usando la expresión local
Rp (x, y, z) = Γ (x, Γ (y, z)) − Γ (y, Γ (x, z))
y para x, y, z ∈ Tp P(A) se tiene
Rp (x, y, z) = [[x, y], z].
Los campos de Jacobi a lo largo de geodésicas se pueden calcular a partir de
variaciones usando el Teorema 6.8.3, como en el ejemplo del grupo lineal, y lo
dejamos como ejercicio.
6.A. Problemas
145
Observación 6.9.1. La variedad de involuciones ǫ2 = 1 en un espacio de Banach
complejo X fue estudiada por Z. Kovarik en [46]; los autores equipan a esta
variedad de una conexión afín como en 6.18 y caracterizan las geodésicas. Luego
estudian el caso particular en el que X es un espacio de Hilbert, restringiéndose
a la parte autoadjunta de la variedad de involuciones, es decir a la variedad
de simetrías ǫ = ǫ∗ = ǫ1 . Recordando que la asignación p 7→ 2p − 1 es un
isomorfismo entre las simetrías y la Grassmanniana de B(H), eso nos remite al
ejemplo recién estudiado.
6.A.
Problemas
6.I. Sea M una variedad diferenciable de clase Ck , con k ≥ 2. Si F : M → TM es
un spray (jF = F), probar que las siguientes condiciones son equivalentes:
F es un spray cuadrático en M.
Si V : TM → TTM es el campo vectorial canónico (Observación 5.3.2),
entonces [V, F] = F.
6.II. Sea J : TTM → TTM el endomorfismo canónico (Observación 5.1.2), sean
X, Y : TM → TTM campos. Probar que
ker(J) = ran(J) = VTM∗
[V, J] = −J
J[X, Y] = J[JX, Y] + J[X, JY].
6.III. Sea (M, F) una variedad con spray. Probar que el dominio de la exponencial
es un abierto en TM que contiene a la sección nula.
6.IV. Probar que dada una distribución H de subfibrados de TTM que suplementen VTM, esta descomposición induce una conexión afín (y por ende un spray
cuadrático) en M.
6.V. Probar que dada una conexión ∇ en M, la torsión T definida en la Observación 6.4.1 es C∞ (M)-lineal. Probar asimismo que la fórmula de ∇ dada en (6.1)
define una conexión, que esta conexión tiene torsión nula, y que las geodésicas
de ∇ coinciden con las de ∇.
6.VI. * ¿El transporte paralelo de las dos conexiones del ejercicio anterior, es el
mismo? ¿Y la curvatura?
146
Conexiones y Sprays
6.VII. Si α : J → M es una geodésica, probar que el transporte paralelo de α̇(0)
a lo largo de α coincide con α̇(t).
6.VIII. Probar que dados X, Y campos en M y α el flujo de X con α(0) = p, se
tiene
d P0 (α)(Yα(t) ).
∇X Y(p) =
dt t=0 t
6.IX. Probar que, en coordenadas locales, se tiene la fórmula
R(X, Y, Z)(p) = Γp (Xp , Γp (Yp , Zp )) − Γp (Yp , Γp (Xp , Zp ))
−Γ∗p,Xp (Yp , Zp ) + Γ∗p,Yp (Xp , Zp ),
para todo X, Y, Z : M → TM y todo p ∈ M.
6.X. Sea p ∈ M = P(A), α(t) = etz pe−tz una geodésica en M con z∗ = −z que
es p-codiagonal. Si v, w ∈ Tp P(A), hallar el único campo de Jacobi η a lo largo
de α tal que
η(0) = v, Dα ′ η(0) = w.
Parte II
Estructuras Métricas
E
n esta segunda parte del texto, estudiaremos las variedades diferenciables provistas de una métrica dada en los tangentes que permita medir
curvas. Esto, es introduciremos una norma en cada espacio tangente
de manera continua, y en los casos que la variedad tenga spray, intentaremos
hacerlo de manera que el transporte paralelo a lo largo de geodésicas sea un
isometría. Como la mayoría de los ejemplos que estudiaremos provienen de álgebras de operadores, es bueno conocer los fundamentos de la teoría de normas
simétricas en álgebras de operadores, que optamos por incluir sobre el final del
apéndice de álgebras de operadores de este texto.
En el caso Riemanniano, dada una métrica en una variedad M, siempre es
posible hallar un spray (conocido como spray métrico) compatible con la métrica, únicamente determinado por cierta condición adicional de compatibilidad,
su derivada covariante asociada se conoce como derivada de Levi-Civita. En
el extremo opuesto, ya que estudiaremos problemas de minimalidad de curvas,
decidimos conveniente comenzar con el estudio del problema de curvas continuas
y rectificables que resulten cortas o minimizantes en un espacio métrico (X, d)
dado, ya que muchas de estas ideas son más claras sin la introducción de objetos
adicionales como los dados por la estructura diferenciable.
147
Capítulo
Espacios de Métrica Interior
Una geometría no puede ser más cierta
que otra; sólo puede ser más conveniente.
L
Henri Poincare
as nociones elementales de espacios de métrica interior nos permitirán
en este capítulo probar el Teorema de Hopf-Rinow en este contexto:
dados dos puntos, existe una curva continua y rectificable de longitud
igual a la distancia entre los puntos, siempre que el espacio sea localmente compacto. Seguimos la exposición del libro de M. Gromov [36] con algunos pequeños
desvíos.
7.1.
La distancia rectificable
Sea (X, d) un espacio métrico. Dada una curva continua γ : [a, b] → X, y una
partición π : {a = t0 ≤ t1 ≤ · · · ≤ tn+1 = b} del intervalo, definimos
ℓ(γ, π) =
n
X
d(γ(ti ), γ(ti+1 )),
i=0
y a partir de allí
ℓ(γ) = sup{ℓ(γ, π) : π partición finita}.
Diremos que γ es rectificable si γ es continua y ℓ(γ) < +∞. Algunas propiedades
relevantes:
1. Al refinar la partición, las sumas aumentan por la desigualdad triangular.
149
7
150
Espacios de Métrica Interior
2. ℓ(γ) ≥ 0 y ℓ(γ) = 0 si y sólo si γ es constante.
3. Si γ se obtiene mediante α seguida de β, entonces ℓ(γ) = ℓ(α) + ℓ(β).
Observación 7.1.1. Si f : [c, d] → [a, b] es un homeomorfismo que preserva la
orientación, debe ser estrictamente monótona y entonces ℓ(γ ◦ f) = ℓ(γ), es decir
la longitud es invariante por reparametrizaciones. Y en realidad, la funcional ℓ
está definida en las clases de equivalencia de curvas.
Denotemos con C([a, b], X) al conjunto de todas las curvas continuas definidas
en [a, b] a valores en X. La distancia uniforme entre dos curvas está dada de
manera usual por
dist(α, β) = máx d(α(t), β(t)).
t∈[a,b]
Es decir que le damos a C([a, b], X) la topología compacto abierta. Denotaremos
con R([a, b], X) al subconjunto de las curvas rectificables. Denotaremos
R = R([0, 1], X).
Observación 7.1.2. La distancia uniforme no detecta reparametrizaciones, es
decir, si α es una reparametrización continua de β, diremos que α ≡ β. Se le
puede dar al espacio de clases (que son las que llamamos curvas) la distancia
distR (α, β) = ı́nf{dist(f, g) : f ≡ α, g ≡ β, f, g ∈ R}.
De esta manera se obtiene un espacio métrico donde funciones con la misma
imagen se identifican a la misma curva.
Proposición 7.1.3. Sean γk , γ ∈ C([0, 1], X) tales que γk → γ. Si γk ∈ R y
además ℓ(γk ) ≤ M para todo k ∈ N, entonces γ ∈ R y
ℓ(γ) ≤ lı́m inf ℓ(γk ),
k→∞
es decir ℓ es semi-continua inferiormente.
Demostración. Primero supongamos que ℓ(γ) = +∞. Dado R > 0 sea
π = {0 = t0 , . . . , tn+1 = 1}
una partición del [0, 1] tal que ℓ(γ, π) ≥ R. Si la partición tiene (n + 1) puntos,
R
y tomemos k0 (R) tal que k ≥ k0 implique d(γk , γ) < δ. Entonces,
sea δ = 4(n+1)
para cada i = 0..n, y cada k ≥ k0 ,
d(γ(ti ), γ(ti+1 ))
≤ d(γ(ti ), γk (ti )) + d(γk (ti ), γk (ti+1 ))
+d(γk (ti+1 ), γ(ti+1 )) < d(γk (ti ), γk (ti+1 )) + 2δ.
7.1. La distancia rectificable
151
Sumando sobre i se tiene
R ≤ ℓ(γ, π) < ℓ(γk , π) + 2(n + 1)δ ≤ ℓ(γk ) + R/2 ≤ M + R/2.
Luego M ≥ R/2 para todo R > 0, lo que es absurdo y prueba que γ ∈ R.
Repitiendo el argumento anterior pero ahora tomando una partición π tal que
ℓ(γ, π) > ℓ(γ) − ǫ/2,
ǫ
y δ = 4(n+1)
, se obtiene, para k ≥ k0 (ǫ), ℓ(γ) < ℓ(γk ) + ǫ, lo que prueba que ℓ
es semi-continua inferiormente.
Lema 7.1.4. Sean [a, b] ⊂ R y γ ∈ R([a, b], X). Entonces
1. La aplicación x : [a, b] → [0, ℓ(γ)] dada por x(t) = ℓ(γ|[a,t]) es continua
y creciente. Si γ es localmente inyectiva, entonces x es estrictamente
creciente.
2. Para cada x ∈ [0, ℓ(γ)] existe t ∈ [a, b] con ℓ(γ|[0,t] ) = x. El conjunto de
tales t es un intervalo cerrado de [a, b], y γ es constante allí.
Demostración. Veamos 1. Para a ≤ s < t ≤ b, tenemos
x(t) − x(s) = ℓ(γ|[a,t]) − ℓ(γ|[a,s] ) = ℓ(γ|[s,t] ),
entonces x es creciente y si γ es localmente inyectiva, no puede ser x(t) = x(s),
pues acercando t a s y usando la partición trivial de [s, t] se tiene
d(γ(s), γ(t)) ≤ ℓ(γ|[s,t] ) = x(t) − x(s) = 0,
una contradicción. Resta ver que x es continua, sea t ∈ [a, b] y ǫ > 0. Existe,
por la continuidad uniforme de γ, un δ > 0 tal que
|x − y| < δ ⇒ d(γ(x), γ(y)) < ǫ/2.
Como γ es rectificable, existe un número positivo (que supondremos igual a δ
tomando el mínimo) de manera que si una partición π tiene todos sus puntos
a distancia menor que δ, entonces ℓ(γ) < ℓ(γ, π) + ǫ/2. Sea s ∈ [a, b] tal que
0 ≤ t − s < δ. Entonces, tomando una partición
π = {t0 = a, t1 , . . . , s, t, . . . , tn+1 = b}
152
Espacios de Métrica Interior
de manera que todos los ti disten menos que δ, se tiene
x(t) − x(s) =
<
ℓ(γ|[s,t]) = ℓ(γ) − ℓ(γ|[a,s]) − ℓ(γ|[t,b])
ℓ(γ, π) + ǫ/2 − ℓ(γ|[a,s] ) − ℓ(γ|[t,b]).
Observando que ℓ(γ|[a,s]) ≥ ℓ(γ|[a,s], π) y lo mismo vale en el intervalo [t, b], se
tiene
0 ≤ x(t) − x(s) ≤ ℓ(γ, π) + ǫ/2 − ℓ(γ|[a,s], π) − ℓ(γ|[t,b], π)
=
ℓ(γ|[s,t] , π) + ǫ/2 = d(γ(s), γ(t)) + ǫ/2
<
ǫ/2
+ ǫ/2 = ǫ.
Ahora veamos 2. Como la aplicación x del ítem previo es continua, x(a) = 0,
x(b) = ℓ(γ), por el teorema del valor intermedio existe el punto t tal que x(t) =
ℓ(γ|[0,t] ) = x; nuevamente por la continuidad de x, el conjunto de tales t es
cerrado en [a, b]. Supongamos ahora que s, t verifican x(s) = x(t), con s ≤ t.
Entonces 0 = x(t) − x(s) = ℓ(γ|[s,t] ) luego γ|[s,t] es constante lo que prueba que
estos puntos forman un intervalo.
Observación 7.1.5. Gracias al lema previo, es posible reparametrizar las curvas
rectificables por longitud de arco. Esto es, la función x : [a, b] → [0, ℓ(γ)] es una
función continua. Definimos
γ̃ : [0, ℓ(γ)] → X
como γ̃(x) = γ(t) para cada x = x(t) ∈ [0, ℓ(γ)] con t ∈ [a, b]. Observemos que
esta definición no depende del valor de t tal que x(t) = x, pues γ es constante en
tales t. Se tiene ℓ(γ) = ℓ(γ̃) y además ℓ(γ̃|[x(t),x(s)]) = ℓ(γ|[t,s]) = |x(t) − x(s)|,
es decir
ℓ(γ̃|[x,y]) = |x − y|
para todo x, y ∈ [0, ℓ(γ)]. En este caso diremos que γ̃ está parametrizada por
longitud de arco. Observemos que con esta parametrización, la aplicación λ 7→
ℓ(γ̃|[0,λ] ) es estrictamente creciente.
Más útil aún es una reparametrización normal, es decir con un cambio de
variable lineal transformamos [0, ℓ(γ)] en el intervalo [0, 1] y podemos suponer
que γ ∈ R y además
ℓ(γ̃|[s,t]) = (t − s)ℓ(γ).
Tomando la partición trivial de cualquier intervalo [s, t] ⊂ [0, 1] se tiene el
siguiente corolario.
7.1. La distancia rectificable
153
Corolario 7.1.6. Si γ ∈ R es normal, entonces γ es Lipschitz con constante
ℓ(γ), es decir
d(γ(t), γ(s)) ≤ ℓ(γ)|t − s|.
La pseudo-métrica asociada a la funcional ℓ está dada por
dℓ (x, y) = ı́nf{ℓ(γ) : γ rectificable que une x con y}.
Como siempre podemos suponer que las curvas están parametrizadas por longitud de arco, usaremos que
dℓ (x, y) = ı́nf{ℓ(γ) : γ ∈ R, γ(0) = x, γ(1) = y}.
Observación 7.1.7. Esta métrica dℓ induce una topología en X que puede diferir
de la original, sin embargo tomando la partición trivial se ve que siempre se tiene
ℓ(γ) ≥ d(x, y) para todo γ que una x con y, luego siempre vale
dℓ ≥ d.
Esto nos dice que, fijado ǫ > 0, Bℓǫ (x) ⊂ Bǫ (x) donde la segunda bola es con la
métrica d. Luego si A es abierto en d, resulta abierto en dℓ . Luego la topología
de (X, dℓ ) es más fina (tiene más abiertos) que la de (X, d).
Lema 7.1.8. Las topologías de (X, d), (X, dℓ ) coinciden si y sólo si para cada
x ∈ X y cada ǫ > 0 existe un d-abierto V alrededor de x de manera que todo
punto allí se puede unir con x con un arco rectificable de longitud menor
que ǫ.
Demostración. Supongamos primero que las topologías coinciden, la afirmación
es trivial pues V = Bℓǫ (x) es abierto en ambas topologías y este sirve como dabierto que verifica las hipótesis. Recíprocamente, sea C ⊂ X un dℓ -cerrado, y
sea {xn } ⊂ C una sucesión que tiende a x ∈ X en la topología inducida por d.
Fijado ǫ > 0, la condición nos dice que hay un entorno d-abierto V de x tal que
todo punto allí dista en dℓ menos que ǫ. Luego si n ≥ n0 , xn ∈ V y por lo tanto
dℓ (xn , x) < ǫ. Esto prueba que x está en C pues C es dℓ -cerrado, luego C es
d-cerrado.
7.1.1.
Espacios de métrica interior
Una relación aún más fuerte entre las métricas es que d = dℓ , es decir que la
distancia d entre dos puntos cualesquiera de X se realiza como ínfimo de curvas
continuas que los unen. En ese caso diremos que (X, d) es un espacio de métrica
interior.
154
Espacios de Métrica Interior
Lema 7.1.9. Sea f : X → Y una función entre espacios métricos que es
Lipschitz, i.e. existe C > 0 tal que
d(f(x), f(y)) ≤ Cd(x, y)
para todo x, y ∈ X. Entonces f se extiende de manera única a las completaciones de X, Y a una función que es Lipschitz con la misma constante.
Demostración. Sean x0 en la completación de X, {xn } ∈ X tal que xn → x0 ,
entonces f(xn ) es de Cauchy en Y luego tiene un límite y0 en la completación de
Y. Definimos f(x0 ) = y0 , veamos que no depende de la sucesión xn . Si pn → x0
es otra sucesión, se tiene
d(f(pn ), f(xn )) ≤ Cd(pn , xn ) → 0
luego {f(pn )}, {f(xn )} están en la misma clase de equivalencia, y definen el mismo
elemento y0 ∈ Y. De hecho
d(f(xn ), f(x0 )) = lı́m d(f(xn ), f(xk )) ≤ lı́m Cd(xn , xk ) = Cd(xn , x0 )
k
k
si xk → x0 lo que prueba que f es continua. Por otra parte, si x0 , x1 están en la
completación de X, tomemos xn → x0 , pn → x1 con xn , pn ∈ X y se tiene
d(f(x0 ), f(x1 )) ≤
≤
d(f(x0 ), f(xn )) + d(f(xn ), f(pn )) + d(f(pn ), f(x1 ))
Cd(x0 , xn ) + Cd(xn , pn ) + Cd(pn , x1 ) → Cd(x0 , x1 )
lo que prueba que la extensión de f es Lipschitz con la misma constante.
Para x ∈ (X, d) espacio métrico, denotaremos con Br (x) a la bola abierta de
radio r alrededor de x, y con Br (x) a la bola cerrada. Para A, B ⊂ X, denotamos
con d(A, B) al ínfimo de las distancias entre A y B, es decir
d(A, B) =
ı́nf
a∈A,b∈B
d(a, b) = d(B, A).
Lema 7.1.10. Sea (X, d) un espacio métrico. Si X es de métrica interior,
entonces dados x, y ∈ X, r1 , r2 > 0 con r1 + r2 ≤ d(x, y), se tiene
d(Br1 (x), Br2 (y)) ≤ d(x, y) − r1 − r2 .
Recíprocamente, si vale la condición y (X, d) es completo, entonces es de
métrica interior.
7.1. La distancia rectificable
155
Demostración. Para la primera implicación, tomamos un arco continuo γ :
[0, 1] → X que une x con y de longitud ℓ(γ) < d(x, y) + ǫ. Sea t1 ∈ [0, 1] el
primer instante en el que γ(t1 ) ∈ Sr1 = ∂Br1 (x), sea t2 ∈ [0, 1] el primer instante, contando hacia atrás desde t = 1, en el que γ(t2 ) ∈ Sr2 = ∂Br2 (y). Entonces
considerando la partición t0 = 0, t1 , t2 , t3 = 1, se tiene
d(Br1 (x), Br2 (y))
≤
=
d(γ(t1 ), γ(t2 ))
2
X
d(γ(ti ), γ(ti+1 )) − d(x, γ(t1 )) − d(y, γ(t2 ))
i=0
≤
ℓ(γ) − r1 − r2 < d(x, y) − r1 − r2 + ǫ.
Como ǫ > 0 era arbitrario, se tiene la propiedad. Supongamos ahora que (X, d)
es un espacio métrico que verifica la propiedad. Entonces no es difícil ver que
(Ejercicio 7.iii), dados x, y ∈ X y ǫ > 0, existe z ∈ X tal que
máx{d(x, z), d(z, y)} ≤ 1/2d(x, y) + ǫ.
Sean x, y ∈ X, δ = d(x, y). Buscamos curvas continuas que unan x con y tales
que ℓ(γ) ≤ δ + ǫ. Dada una sucesión {ǫk } de números positivos, existe un punto
z1/2 tal que
máx{d(x, z1/2 ), d(z1/2 , y)} ≤ δ/2 + ǫ1 δ/2 = δ/2(1 + ǫ1 ),
y puntos z 1 , z 3 tales que máx{d(x, z 1 ), d(z 1 , z1/2 ), d(z1/2 , z 3 ), d(z 3 , y)} es me4
4
4
4
4
4
nor o igual que
1/2(δ/2
+ ǫ1 δ/2) + ǫ2/2(δ/2 + ǫ1 δ/2) = δ/4(1 + ǫ1 )(1 + ǫ2 ),
y así sucesivamente. Esto define una curva en los racionales diádicos, que verifica
d (γ(j/2n ), γ((j + 1)/2n )) ≤
∞
δ Y
(1 + ǫk )
2n
k=1
para j = 0, . . . , 2n −1, con γ(0) = x, γ(1) = y. Elegimos la sucesión ǫk de manera
que
∞
Y
(1 + ǫk ) < 1 + ǫ/δ.
k=1
De esta manera
d (γ(j/2n ), γ((j + 1)/2n )) ≤
∞
δ Y
(1 + ǫk ) < δ/2n (1 + ǫ/δ) = 1/2n (δ + ǫ).
2n
k=1
156
Espacios de Métrica Interior
Si t0 = r/2n , t1 = k/2n+p son diádicos, escribiendo t0 =
desigualdad triangular 2p k − r veces, se deduce que
d (γ(t0 ), γ(t1 )) ≤
r2p/2n+p
y aplicando la
|2p k − r|
(δ + ǫ) = |t0 − t1 |(δ + ǫ).
2n+p
Esto prueba que γ es Lipschitz en los racionales diádicos, y por el lema previo se
extiende a la completación (que es el intervalo [0, 1]) a una función continua γ a
valores en X (que estamos suponiendo que es completo) con la misma constante
Lipschitz. Entonces, dada cualquier partición π del intervalo [0, 1], se tiene
X
X
ℓ(γ, π) =
d (γ(ti ), γ(ti+1 )) ≤
|ti − ti+1 |(δ + ǫ) = δ + ǫ.
i
i
Luego, ℓ(γ) ≤ δ + ǫ.
7.1.2.
Geodésicas
Definición 7.1.11. Diremos que una curva continua γ : [0, 1] → X en un espacio
de métrica interior (X, d) es una geodésica corta si
d(γ(t), γ(s)) = |t − s|ℓ(γ)
para todo t, s ∈ [0, 1]. Una geodésica es una curva que es localmente una geodésica corta. Diremos que un espacio (X, d) es geodésico si es de métrica interior
y para todo par de puntos existe una geodésica corta que los une.
Observación 7.1.12. El típico ejemplo de geodésica es una circunferencia máxima en la esfera S2 ⊂ R3 , sólo es minimizante para puntos en ella que disten
menos que π.
Observación 7.1.13. Si γ une dos puntos x, y de un espacio métrico y es corta,
entonces también es corta restringida a cualquier subintervalo, por la siguiente
razón. De no ser así (suponiendo que no es corta entre p = γ(s) y q = γ(t)), se
tendría
d(x, y) =
>
lo que es absurdo.
ℓ(γ) = ℓ(γ|[0,s] ) + ℓ(γ|[s,t]) + ℓ(γ|[t,1] )
d(x, p) + d(p, q) + d(q, y) ≥ d(x, y)
7.2. El teorema de Hopf-Rinow métrico
7.2.
157
El teorema de Hopf-Rinow métrico
Pasemos a estudiar los espacios geodésicos. Primero demos algunas definiciones y resultados útiles sobre funciones continuas que aplicaremos a nuestras
curvas.
Definición 7.2.1. Una familia F de funciones continuas f : K → X con K
compacto métrico y X métrico se dice equicontinua si dados t ∈ K y ǫ > 0,
existe un entorno abierto Ut ⊂ K tal que
d(f(t), f(s)) < ǫ
para todo s ∈ Ut , para toda f ∈ F. La familia F se dice puntualmente precompacta si para todo t ∈ K, el conjunto
{f(t) : f ∈ F} ⊂ X
es precompacto.
Un espacio métrico (X, d) es localmente compacto si bolas cerradas suficientemente pequeñas son compactas. Por ejemplo R2 − {0} es localmente compacto
pero las bolas cerradas cercanas a (pero no centradas en) x = 0 no pueden ser
compactas si tienen radio grande.
7.2.1.
El teorema de Ascoli
Recordemos el teorema de Ascoli para familias de funciones continuas. La demostración puede verse en el libro Topología [53, Teorema 47.1], de J. Munkres.
Teorema 7.2.2 (Ascoli). Sean X un espacio métrico compacto, Y un espacio
métrico. Entonces un subconjunto F ⊂ C(X, Y) es precompacto en la topología compacto abierta si y sólo si es una familia equicontinua y puntualmente
precompacta.
7.2.2.
El teorema de Hopf-Rinow métrico
Estamos en condiciones de probar el Teorema de Hopf-Rinow con toda generalidad, este da un criterio para la existencia de curvas cortas. Aunque no
formulado con este nivel de generalidad, este resultado se suele atribuir a CohnVossen, ya que aborda el problema en un trabajo del año 1935 [24]. El resultado
para superficies, es ligeramente anterior (1931) y se debe a Hopf y Rinow [44]
de ahí que se haya generalizado el uso de la denominación Hopf-Rinow para este
tipo de teoremas de existencia de curvas cortas.
158
Espacios de Métrica Interior
Teorema 7.2.3 (Hopf-Rinow). Sea (X, d) un espacio de métrica interior,
x ∈ X. Entonces
1. Si X es completo, y Br (x) es compacta para todo 0 < r < ρ, entonces
Bρ (x) es compacta.
2. Si además X es localmente compacto, entonces toda bola cerrada en X
es compacta, y X es geodésico.
Demostración. Dado x ∈ X, primero probaremos que si Br (x) es compacta
para todo r ∈ [0, ρ), entonces Bρ (x) es compacta. Sea xn una sucesión de puntos
en Bρ (x), extraeremos una subsucesión convergente. Podemos suponer, pasando
a una subsucesión, que d(xn , x) ր ρ pues sino usamos la compacidad de las
bolas más chicas. Dada cualquier sucesión de números positivos ǫk que tiende
a cero, para cada k ∈ N existe n(k) ∈ N tal que d(x, xn ) > ρ − ǫk para todo
n ≥ n(k). Considerando el par x, y = xn en la propiedad del Lema 7.1.10, y
tomando r1 = ρ − ǫk > 0, r2 = d(x, xn ) − ρ + ǫk > 0 para n ≥ n(k), se verifica
r1 + r2 = d(x, y) con lo cual la distancia entre las bolas del citado lema es nula.
Luego existen, fijado n ≥ n(k) y tomando δn = ρ − d(x, xn ) > 0, elementos
yn (k) ∈ Bρ−ǫk (x), z ∈ Br2 (xn ) tales que d(yn (k), z) < δn . De aquí se deduce
que
d(yn (k), xn ) < δn + d(z, xn ) ≤ δn + r2 = ǫk .
Consideremos el conjunto compacto
Y
C=
Bρ−ǫk (x),
k∈N
y allí consideramos ({yn (k)}n≥n(k) )k∈N ⊂ C. Podemos extraer una subsucesión
ynj (k) convergente para todo k por la compacidad de C, esto es una subsucesión
que converge en cada una de las coordenadas k ∈ N. A partir de
d(ynj (k), xnj ) ≤ ǫk ,
haciendo tender k → ∞, descubrimos que la sucesión {xnj }j∈N es límite de
ynj (k). Luego
d(xnj , xnr ) ≤ d(xnj , ynj (k)) + d(ynj (k), ynr (k)) + d(ynr (k), xnr )
nos dice que {xnj }j∈N es una sucesión de Cauchy en X, convergente por la hipótesis de completitud. Ahora veamos que si X es localmente compacto, las bolas
7.2. El teorema de Hopf-Rinow métrico
159
cerradas de cualquier radio son compactas. Dado x ∈ X, si el supremo ρ para el cual Bρ (x) es compacta fuera finito, consideramos el conjunto compacto
Sρ = ∂Bρ (x) y lo cubrimos con bolas abiertas de clausura compacta. Por compacidad, extraemos un subcubrimiento finito Bi y consideramos
Bρ (x) ∪i Bi
que es un conjunto compacto, que contiene una bola cerrada centrada en x de
radio ρ ′ > ρ, que resulta compacta por ser cerrada en un compacto lo cual es
una contradicción. Ahora veamos que X es geodésico. Tomemos x, y ∈ X y sea
δ = d(x, y). Para cada n ∈ N existe una curva γn → X que une x con y tal que
ℓ(γn ) ≤ δ + 1/n.
Como podemos suponer que las γn están todas parametrizadas por longitud
de arco, reparametrizando el [0, ℓ(γn )] podemos suponer que todas las curvas
están parametrizadas en el intervalo [0, 1], es decir es una familia de funciones
{γn } ⊂ C([0, 1], X) que verifica
ℓ(γn |[s,t]) = |s − t|ℓ(γn ).
No es difícil ver que gracias a esta condición la familia {γn } ⊂ C([0, 1], X) es una
familia equicontinua de funciones:
d(γn (t), γn (s)) ≤ ℓ(γn |[s,t]) = |s − t|ℓ(γn ) ≤ |s − t|(δ + 1).
Tomando s suficientemente cercano a t, se deduce que γn (t) está a menos de
ǫ de γn (s) para todo n ∈ N. Por otra parte, podemos suponer que todas las
curvas están contenidas en la bola cerrada Bδ+1 (x) puesto que en caso contrario
ℓ(γn ) ≥ δ + 1, luego para t ∈ [0, 1]
{γn (t) : n ∈ N} ⊂ Bδ+1 (x)
que es compacto por el ítem previo. Es decir la familia {γn } ⊂ C([0, 1], X) es
puntualmente precompacta. Por el Teorema de Ascoli, existe una subsucesión
γnk uniformemente convergente a una curva continua γ : [0, 1] → X. Como la
longitud es semicontinua inferiormente,
δ ≤ ℓ(γ) ≤ lı́m ı́nf ℓ(γnk ) = δ
k→∞
lo que prueba que γ es una geodésica corta que une x con y.
160
Espacios de Métrica Interior
Observación 7.2.4. Si (X, d) es un espacio métrico tal que toda bola cerrada
es compacta, entonces es completo. En efecto, si {xn } ⊂ X es de Cauchy, el
conjunto {xn } es acotado y por ende vive en una bola compacta, luego tiene una
subsucesión convergente a un punto x ∈ X, y es fácil ver que xn → x.
Sin embargo, aún asumiendo que (X, d) es localmente compacto, es falso que
ser geodésico implique ser completo. Un ejemplo sencillo se obtiene a partir del
intervalo (0, 1) ⊂ R. Este espacio es localmente compacto y geodésico, pero no
es completo1.
7.A.
Problemas
7.I. Si γ : [a, b] → X es continua, probar que ℓ(γ) = 0 implica que γ es constante.
7.II. Probar que ℓ es invariante por reparametrizaciones.
7.III. Sea (X, d) un espacio métrico tal que, para todo x, y ∈ X, r1 , r2 > 0 con
r1 + r2 ≤ d(x, y), se tiene
d(Br1 (x), Br2 (y)) ≤ d(x, y) − r1 − r2 ,
Probar que para todo x, y ∈ X y ǫ > 0, existe z ∈ X tal que
máx{d(x, z), d(z, y)} ≤ 1/2d(x, y) + ǫ.
7.IV.
∗
Probar que vale el enunciado recíproco del ejercicio previo.
1 Debo
esta aclaración a Marcos Cossarini.
Capítulo
Variedades de Finsler
La geometría de Finsler es simplemente
geometría Riemanniana sin la restricción
cuadrática.
Shiing-Shen Chern
C
ombinaremos en este capítulo la noción de variedad diferenciable con
la de espacio métrico, dando en cada espacio tangente una norma que
varíe de manera continua con el punto base. Luego estudiaremos variedades con spray donde las normas sean compatibles con el transporte paralelo,
en el sentido que este sea una isometría de la variedad.
8.1.
Métricas de Finsler
Dada una variedad M modelada por un espacio de Banach E, consideramos
una norma en cada espacio tangente Tp M, p ∈ M, mediante una función continua
b : TM → [0, +∞) con las propiedades usuales de una norma, es decir, denotando
V = (p, v) ∈ TM y b(V) = kvkp , se tiene para v, w ∈ Tp M y t ∈ R,
1. b(tV) = |t|b(V),
2. b(V + W) ≤ b(V) + b(W),
3. b(V) ≥ 0 y b(V) = 0 sii V = 0.
La norma se suele denominar métrica de Finsler en la variedad M.
161
8
162
8.1.1.
Variedades de Finsler
Funcionales longitud y energía
Una métrica de Finsler nos permite introducir la funcional longitud de curvas α : [a, b] → M dada por
Lb (α) =
Zb
b(α ′ (t))dt =
a
Zb
a
kα̇(t)kα(t) dt,
donde estamos suponiendo que α es continua y C1 a trozos. Observemos que esta
cantidad no depende, por el teorema de cambio de variable en R y la propiedad
b(α ′ (t(s))
dt
dt
)=
b(α ′ (t(s)))
ds
ds
de la parametrización de α, sólo de su imagen. Claramente Lb (α) = 0 si y sólo
si α es constante, además si α♯β denota la curva α : [a, b] → M seguida de la
curva β : [c, d] → M, donde suponemos que α(b) = β(c), entonces
Lb (α♯β) = Lb (α) + Lb (β).
(8.1)
También se suele definir la funcional energía como
Eb (α) =
1/2
Zb
a
kα̇(t)k2α(t) dt.
Definimos db : M × M → [0, +∞) como
db (x, y) = ı́nf{Lb (γ) : γ ⊂ M es C1 a trozos, γ(0) = x, γ(1) = y}.
Supondremos que M es arcoconexa con lo cual db es finita. Tomando γ ≡ x la
curva constante, se deduce que db (x, x) = 0 para todo x ∈ M. Reemplazando γ
por γ̃(t) = γ(1 − t) para cada curva γ que une x con y, se deduce que db (x, y) =
db (y, x). La igualdad (8.1) nos dice que
db (x, y) ≤ db (x, z) + db (z, y)
para todo x, y, z ∈ M. Es decir db es una pseudo-distancia en M. En ciertos
casos es evidente pero en otros hay que verificar que db (x, y) = 0 implica x = y.
Observación 8.1.1. Por los mismos motivos que en el caso de arcos continuos
y rectificables, en general podemos suponer que γ es inyectiva y en particular
γ̇ 6= 0 salvo tal vez finitos puntos o un conjunto de medida nula en el intervalo.
De esta manera podemos pensar a las curvas C1 a trozos parametrizadas con
velocidad constante en el intervalo [0, 1] (ver la Observación 7.1.5). En ese caso
diremos que γ está adaptada a M y se tiene kγ̇kγ = cte = Lb (γ).
8.1. Métricas de Finsler
8.1.1.1.
163
Las variedades de Finsler
Proposición 8.1.2. Para toda curva C1 a trozos vale ℓ(γ) ≤ Lb (γ) y el
espacio (pseudo)-métrico (M, db ) es un espacio de métrica interior.
Demostración. La desigualdad dℓ ≥ db vale siempre tomando la partición trivial (Observación 7.1.7). Por otra parte, si γ es una curva C1 a trozos que une
x, y ∈ M, entonces
dℓ (x, y) ≤ ℓ(γ) = sup ℓ(γ, π).
π
Pero para cada partición π del intervalo [a, b], se tiene
db (γ(ti ), γ(ti+1 )) ≤ Lb (γ|[ti ,ti+1 ] )
luego
ℓ(γ, π) ≤
es decir
X
Lb (γ|[ti ,ti+1 ] ) = Lb (γ),
dℓ (x, y) ≤ ℓ(γ) ≤ Lb (γ),
y tomando ínfimo sobre las curvas γ que son C1 a trozos que unen x con y se
tiene la otra desigualdad dℓ ≤ db .
8.1.2.
Normas acotadas y compatibles
Recordemos que, fijada la norma k·kE del espacio de Banach E, consideramos,
para cada p ∈ M, al espacio vectorial Tp M como un espacio de Banach con la
misma norma via la identificación natural Tp M ≃ E.
Definición 8.1.3. Dada una norma de Finsler b : TM → R+ sobre M variedad
diferenciable modelada por el espacio de Banach E, diremos que b es acotada
superiormente si para cada punto p ∈ M existe una carta (U, ϕ) alrededor de
p y una constante mp > 0 de manera que
mp kvkx ≤ kϕ∗x vkE
para todo x ∈ U, para todo v ∈ Tx M. Diremos que b es acotada inferiormente
si para cada punto p ∈ M existe una carta (U, ϕ) alrededor de p y una constante
Mp > 0 de manera que
kϕ∗x vkE ≤ Mp kvkx
164
Variedades de Finsler
para todo x ∈ U, para todo v ∈ Tx U. Diremos que b es acotada, si es acotada
superiormente e inferiormente, es decir para cada p ∈ M existe una carta (U, ϕ)
alrededor de p de manera que
mp kvkx ≤ kϕ∗x vkE ≤ Mp kvkx
para todo x ∈ U, para todo v ∈ Tx U.
Observación 8.1.4. Si bien la terminología recién introducida es clara y en algún
sentido clásica, en trabajos recientes se ha impuesto la siguiente denominación
alternativa, por la que optaremos en lo que sigue. Si b : TM → R+ es una
métrica de Finsler, diremos que M es una variedad de Finsler, mientras que si
b es acotada superiormente diremos que M es una variedad de Finsler débil, y
si b es acotada diremos que M es una variedad de Finsler fuerte.
Teorema 8.1.5. Si M es una variedad diferenciable de dimensión finita y
b : TM → R+ es una métrica de Finsler, entonces M es una variedad de
Finsler fuerte, es decir b es acotada.
Demostración. Dado p ∈ M, tomemos una carta (U, ϕ) alrededor de p, con
ϕ(p) = 0 ∈ E. Achicando U podemos suponer que existe r > 0 tal que Br (0) ⊂
ϕ(U). Sea Tϕ = (ϕ, ϕ∗ ) la carta que trivializa TU ≃ ϕ(U) × E. Si S = {x ∈ E :
kxkE = 1} es la esfera unitaria, consideremos el conjunto compacto
C = Tϕ−1 Br (0) × S ⊂ TM.
La función b : C → R alcanza máximo y mínimo por ser continua, es decir
existen puntos x, y ∈ ϕ−1 Br (0) ⊂ U y vectores v ∈ Tx M, w ∈ Ty M tales que
kϕ∗x vkE = 1, kϕ∗y wkE = 1 y
b(x, v) ≤ b(q, z) ≤ b(y, w)
para todo (q, z) ∈ C. Como v, w son enviados a la esfera, son no nulos. Ponemos
m = b(x, v) = kvkx > 0, M = b(y, w) = kwky > 0 y entonces si z 6= 0,
m≤k
z
kq ≤ M
kϕ∗q zkE
con lo cual
m kϕ∗q zkE ≤ kzkq ≤ M kϕ∗q zkE
para todo q ∈ U = ϕ−1 Br (0) y todo z ∈ Tq M.
8.1. Métricas de Finsler
165
Estudiemos qué implican estas condiciones de acotación. En primer lugar,
hay que tener en cuenta que si vale la condición para alguna carta, entonces
vale para cualquier otra (en el mismo entorno), pues los mapas de transición son
difeomorfismos y por ende acotados en un entorno de p. Achicando y trasladando,
supondremos que ϕ(p) = 0 ∈ E y que ϕ(U) = Br (0) ⊂ E. Sean x, y ∈ U, y sea
α : [a, b] → M una curva suave a trozos que los une, α ⊂ U. Sea Γ = ϕ ◦ α :
[a, b] → ϕ(U) ⊂ E la levantada a la bola en E. Entonces las tres condiciones de
acotación quieren decir respectivamente, integrando en [a, b], que
mLb (α) ≤ L(Γ ),
L(Γ ) ≤ MLb (α),
(8.2)
mLb (α) ≤ L(Γ ) ≤ MLb (α),
donde L(Γ ) denota la longitud usual de Γ en el espacio de Banach E dada por
L(Γ ) =
Zb
a
kΓ̇ kE dt.
Recordemos que en un espacio normado, el segmento es una curva corta que
une los extremos (ver la Observación 6.1.1), aunque eso no impide que pueda
haber otros caminos cortos.
Si consideramos el segmento Γ (t) = ϕ(x) + t(ϕ(y) − ϕ(x)) ∈ Br (0), se deduce
en el primer caso que, como db (x, y) ≤ Lb (α) para cada α ⊂ U que une x con y,
se tiene
mdb (x, y) ≤ kϕ(x) − ϕ(y)kE .
(8.3)
Mientras que en el segundo caso como kϕ(x) − ϕ(y)kE ≤ L(Γ ) para toda Γ
también se tiene
kϕ(x) − ϕ(y)kE ≤ MLb (α).
(8.4)
Finalmente, si b es acotada juntando las dos condiciones de arriba obtenemos.
mdb (x, y) ≤ kϕ(x) − ϕ(y)kE ≤ MLb (α),
(8.5)
En el primer caso diremos que la métrica db está acotada superiormente,
o que M es una variedad de Finsler débil. Una condición suficiente para ello es
la siguiente.
Lema 8.1.6. Supongamos que b : TM → R es localmente Lipschitz. Entonces
la métrica db está acotada superiormente.
166
Variedades de Finsler
Demostración. La condición nos dice que, dados V = (p, v) ∈ TM, W =
(q, w) ∈ TM suficientemente cerca, entonces existe una constante K > 0 que
depende del entorno de V tal que, en una carta (U, ϕ) allí, se tiene
|b(W) − b(V)| ≤ Kkϕ(q) − ϕ(p)kE + Kkϕ∗q w − ϕ∗p vkE .
Achicando, suponemos que ϕ(U) es una bola centrada en el origen de E. Sean
x, y ∈ U, sea S(t) = ϕ(x) + t(ϕ(x) − ϕ(y)) el segmento que los une en la bola,
t ∈ [0, 1]. Pongamos x = p, q = α(t) = ϕ−1 S(t) que es una curva suave en U
que une x con y. Tomemos w = α̇ ∈ Tq M, v = 0 ∈ Tx M. Entonces nos queda
ϕ∗q w = Ṡ, luego
| kα̇kα − 0| ≤ Ktkϕ(x) − ϕ(y)kE + Kkϕ(x) − ϕ(y)kE .
Integrando respecto de t en [0, 1] se obtiene Lb (α) ≤ 3/2Kkϕ(y) − ϕ(x)kE , lo que
2
.
prueba (8.3) con m = 3K
Volviendo a las otras condiciones (b acotada inferiormente y b acotada), uno
estaría tentado de tomar ínfimo sobre las curvas α a la derecha de (8.4) y de (8.5)
para obtener allí también db (x, y). Pero las curvas α que estamos considerando
son especiales en el sentido que α ⊂ U es una restricción.
Observación 8.1.7. Denotemos con Sr = ∂Br (0) la esfera de radio r en E. Afirmamos que d = dist(Sr , Sr/2 ) = r/2. Supongamos que d < r/2, entonces existen
x ∈ Sr/2 , y ∈ Sr tales que kx − yk < r/2. Pero
r/2
= r − r/2 = kyk − kxk ≤ ky − xk < r/2
es una contradicción, luego d ≥ r/2. La otra desigualdad es trivial.
El siguiente resultado está adaptado del libro de H. Upmeier [67].
Lema 8.1.8. Si b es acotada inferiormente (8.4), entonces todo abierto de
M es un abierto de (M, d). Además para x, y suficientemente cerca existe
una carta (U, ϕ) tal que
kϕ(x) − ϕ(y)kE ≤ Mdb (x, y).
En particular db es una distancia en M, es decir db (x, y) = 0 implica x = y.
Demostración. Tomamos una carta (U, ϕ) alrededor de x donde b es acotada
inferiormente, y de manera que ϕ(U) = Br (0) ⊂ E. Achicando U podemos
suponer que ϕ esté definida en un entorno un poco más grande de U. Sean
8.1. Métricas de Finsler
167
α : [0, 1] → M una curva suave a trozos tal que α(0) = x, J ⊂ [0, 1] la componente
conexa de α−1 (U) que contiene a t = 0. Entonces si b es acotada inferiormente
(8.4),
sup kϕ(x) − ϕ(α(t))kE ≤ MLb (α|J ) ≤ MLb (α).
(8.6)
t∈J
Afirmamos que si t0 ≤ 1/Mdist(ϕ(x), Sr ) (la distancia en el espacio de Banach
E), entonces Bt0 (x) ⊂ U. Tomemos z ∈ Bt0 (x), supongamos que z ∈
/ U, entonces
tomando una curva α que une x con z, se tiene
sup kϕ(x) − ϕ(α(t))kE ≥ dist(ϕ(x), Sr )
t∈J
pues ϕ ◦ α se sale de Br (0) en E. Si db (z, x) < t0 , existe una curva α ⊂ M que
une x con z tal que
Lb (α) < t0 = 1/Mdist(ϕ(x), Sr ).
Juntando estas desigualdades se tiene la contradicción
dist(ϕ(x), Sr ) ≤ sup kϕ(x) − ϕ(α(t))kE ≤ MLb (α) < dist(ϕ(x), Sr ).
t∈J
Estamos suponiendo que U = ϕ−1 Br (0). Tomemos V = ϕ−1 Br/2 (0) y la restricción de ϕ al abierto V ⊂ M. Afirmamos que
kϕ(x) − ϕ(y)kE ≤ Mdb (x, y).
para x, y ∈ V. Supongamos que no es así, entonces existen x, y ∈ V tales que
kϕ(x) − ϕ(y)kE > Mdb (x, y), luego existe una curva γ ⊂ M suave a trozos con
γ(0) = x, γ(1) = y y además
MLb (γ) < kϕ(x) − ϕ(y)kE ≤ r.
Luego, por (8.6), se tiene
sup kϕ(x) − ϕ(γ(t))kE < kϕ(x) − ϕ(y)kE .
t∈J
Si fuera γ ⊂ U, entonces se tendría J = [0, 1] lo que nos lleva a la contradicción
kϕ(x) − ϕ(y)kE ≤ sup kϕ(x) − ϕ(α(t))kE < kϕ(x) − ϕ(y)kE .
t∈J
Luego γ se sale de U, o equivalentemente ϕ ◦ γ se sale de Br (0), es decir (ϕ ◦
γ) ∩ Sr 6= ∅. Entonces también ϕ ◦ γ toca Sr/2 al menos dos veces (una vez al ir
y otra al volver). Luego
L(ϕ ◦ γ) ≥ r/2 + r/2 = r,
168
Variedades de Finsler
con lo cual MLb (γ) ≥ L(ϕ ◦ γ) ≥ r, y esto es una contradicción. Por último,
veamos que db es una métrica. Sean x, y ∈ M con db (x, y) = 0, (U, ϕ) carta de
M alrededor de x, con ϕ(x) = 0 donde vale la desigualdad del enunciado,
kϕ(y)k ≤ Mdb (x, y).
Si y ∈
/ U, existe r > 0 tal que y ∈
/ Br (x) luego db (x, y) ≥ r lo cual es absurdo.
Luego y ∈ U, y entonces 0 = db (x, y) implica ϕ(y) = 0, luego x = y.
Corolario 8.1.9. Si vale (8.5), es decir si b es acotada, para x, y ∈ U se
tiene
mdb (x, y) ≤ kϕ(x) − ϕ(y)kE ≤ Mdb (x, y),
y las topologías de M como variedad sobre E y de (M, d) como espacio
métrico son equivalentes.
Es decir, las variedades de Finsler fuertes son extensiones buenas de las variedades de Finsler de dimensión finita.
8.1.2.1.
Hopf-Rinow en variedades de Finsler
De acuerdo a la terminología de espacios de métrica interior, diremos que
una curva continua γ : [a, b] → (M, db ) es una geodésica corta si su longitud
coincide con la distancia entre los puntos que une.
Es conveniente comparar el siguiente resultado con los resultados y ejemplos
de la Sección 9.4 del contexto Riemanniano.
Corolario 8.1.10 (Hopf-Rinow). Si el espacio de Banach que modela M es
de dimensión finita y (M, db ) es completo, entonces dados x, y en M existe
una geodésica corta (continua) que los une.
Demostración. El espacio métrico (M, db ) es localmente compacto pues E lo es,
y al ser (M, db ) de métrica interior, se tiene el corolario por el Teorema 7.2.3.
Observación 8.1.11. Si localmente se puede reemplazar curvas cortas γ por
curvas µi de clase C1 , que resulten cortas, entonces todo par de puntos x, y ∈ M
se puede unir con una curva C1 a trozos tal que Lb (β) = db (x, y). Esto es
porque si π es una partición del intervalo [0, 1] de manera que, en la curva corta
continua γ del corolario previo, los puntos γ(ti ), γ(ti+1 ) están suficientemente
cerca, entonces reemplazando γ en ese intervalo por µi y definiendo
β = µ1 ♯ . . . ♯ µn
8.2. Variedades de Finsler con spray
169
como la concatenación de las curvas µi , se tiene
X
X
X
Lb (β) =
Lb (βi ) =
d(γ(ti ), γ(ti+1 )) =
ℓ(γ|[ti ,ti+1 ] ) = ℓ(γ) = db (x, y).
i
8.2.
i
i
Variedades de Finsler con spray
Una variedad M sobre un espacio de Banach E, provista de una norma b :
TM → [0, +∞) como en la sección anterior, que defina una pseudo-distancia
db : M × M → [0, +∞), la denominaremos una variedad de Banach-Finsler
o directamente una variedad Finsleriana y denotaremos con (M, db ) al espacio
métrico inducido. Diremos que M es métricamente completa para b si (M, db )
resulta un espacio métrico completo. Si b es acotada superiormente, diremos que
M es una variedad de Finsler débil, mientras que si b es acotada, diremos que
M es una variedad de Finsler fuerte.
En el caso de que M tenga un spray dado F : TM → TTM, diremos que M
es una variedad Finsleriana con spray si M es Finsleriana y la métrica b es
invariante por el transporte paralelo del spray a lo largo de geodésicas. Es decir
si para toda geodésica del spray α ⊂ M, y para todo z ∈ Tα(s) M, para todo
s, t ∈ Dom(α), se verifica
kPst (α)zkα(t) = kzkα(s) .
Como el transporte paralelo de α̇(s) es simplemente α̇(t), se tiene
kα̇(t)kα(t) = cte = kvkp
si α(t) = expp (tv). Es decir, las geodésicas tienen velocidad constante.
El siguiente resultado se relaciona con el Teorema de Hopf-Rinow del contexto
Riemanniano (Teorema 9.4.3).
Proposición 8.2.1. Si M es una variedad de Finsler fuerte con spray, entonces cada una de las siguientes afirmaciones implica la que le sigue:
1. El espacio (M, db ) es completo.
2. Todas las geodésicas de M están definidas en todo R.
3. M es geodésicamente completa, es decir D(exp) = TM.
4. Existe p ∈ M tal que Dom(expp ) = Tp M.
170
Variedades de Finsler
Demostración. La única afirmación que hay que probar es 1 ⇒ 2, las demás
son triviales. Para verlo, sea α = expp (tv) una geodésica, supongamos que
Dom(α) = (a, b) con 0 < b < ∞. Sea {tn } ⊂ (a, b) una sucesión que crece
hasta b. Entonces es una sucesión de Cauchy, pero para m > n se tiene
Z tm
kα̇(t)kα(t) dt = (tm − tn )kvkp ,
db (α(tn ), α(tm )) ≤ Lb (α|[tn ,tm ] ) =
tn
lo que nos dice que {α(tn )} ⊂ M es de Cauchy y por hipótesis converge a un
punto q ∈ M. Tomemos un entorno normal W de q ∈ M como en el Teorema
6.2.3, con la exponencial definida en Br (0) para todo y ∈ W. Como la métrica
es acotada, podemos tomar k0 ∈ N tal que α(tk ) ∈ W y tk > b − r para todo
k ≥ k0 . Consideremos
µ(s) = expα(tk ) (sα̇(tk ))
definida por lo menos en (−r, r). Esta resulta una geodésica del spray, que coincide con α(tk ) en s = 0 y tiene la misma velocidad inicial allí. Luego por unicidad µ
coincide con α, es decir α(s+tk ) = µ(s). Pero s+tk > b si s está suficientemente
cerca de r, lo que contradice que α estaba definida sólo en (a, b).
8.3.
Métricas de Finsler vía operadores acotados
Supongamos que en una carta (U, ϕ) de M fijamos una norma en E, no
necesariamente compatible con la topología de E. Supongamos que tenemos una
sección continua p 7→ Ap con Ap ∈ GL(E) para todo p ∈ U. Esto nos permite
introducir una norma en cada espacio tangente de la siguiente manera
kvkp = kAp ϕ∗p vk,
para todo v ∈ Tp M, para todo p ∈ U. Con nuestra identificación habitual de Tp M
con E, podemos denotar esto como kvkp = kAp vk sin posibilidad de confusión.
Esto nos define una métrica de Finsler b : TU → R de manera obvia,
b(V) = b(p, v) = kvkp .
Observemos que kvkp ≤ kAp kkvk y kvk ≤ kA−1
p kkvkp , luego usando la
continuidad de p 7→ Ap , las normas k · k y k · kp son localmente equivalentes y
en particular si k · k daba la topología de E, entonces b : TU → R es una norma
acotada.
Si podemos hacer esto en un cubrimiento por cartas de M, de manera que en
las intersecciones las secciones A coincidan (por ejemplo si M admite particiones
de la unidad), entonces podemos definir así una métrica de Finsler b : TM → R
8.4. Métricas invariantes
171
en M. La condición de compatibilidad que se debe cumplir en la intersección
U ∩ V para obtener allí la misma norma es la siguiente: si (V, ψ) es otra carta
con una asignación q 7→ Bq ∈ GL(E), necesitamos que
kAp ϕ∗p vk = kBp ψ∗p vk
para todo p ∈ U ∩ V, para todo v ∈ Tp M.
Observación 8.3.1. En particular, si M tiene dimensión finita, toda norma así
definida es acotada y por ende (M, db ) es una variedad de Finsler fuerte.
Observación 8.3.2. Si k · k es alguna norma en E (no necesariamente equivalente a la norma original del espacio de Banach E) entonces una construcción
similar a la recién introducida nos permite definir una métrica de Finsler en M
que no es necesariamente acotada. Y es evidente que esta métrica será acotada
superiormente si la norma introducida es continua, es decir si existe C > 0 de
manera que
kvk ≤ CkvkE para todo v ∈ E,
donde k · kE denota aquí la norma de E que lo hace espacio de Banach.
8.4.
Métricas invariantes
Un caso particular de la discusión de la sección previa es el siguiente. Sea G
un grupo de Lie-Banach, g = T1 G su álgebra de Lie-Banach. Como Tg G = Lg T1 G
y TG ≃ G × g via los difeomorfismos Lg : v 7→ gv, dada una norma fija k · kg en
g, podemos definir, para w ∈ Tg G,
kwkg := kLg−1 wkg .
En este caso se obtiene una norma b : TG → R+ que es acotada puesto que, para
g ∈ G, si consideramos la carta alrededor de g dada por ϕ−1 = Lg exp : B ⊂
g → G con B entorno de cero suficientemente pequeño como para que exp sea un
difeomorfismo con su imagen, si h = ϕ(x) ∈ U = ϕ−1 (B) y v ∈ Th U, entonces
−1
ϕ∗h v = (Lg exp)−1
Lg−1 v,
∗h v = (exp∗x )
luego
Lh−1 v = Lh−1 g (exp∗x )ϕ∗h v = Ah v,
con Ah = Lh−1 g (exp∗x )ϕ∗h que es claramente un operador lineal inversible que
depende suavemente de h ∈ U. Esta métrica se denomina métrica invariante a
izquierda en G, pues verifica
kLh wkhg = kwkg
para todo h, g ∈ G, para todo w ∈ Tg G. De hecho, es fácil ver que toda métrica
invariante a izquierda en G se construye de esta manera.
172
8.4.1.
Variedades de Finsler
Métricas invariantes y el spray canónico
Recordemos que el spray canónonico F : TG → TTG está dado por F(w) =
wg−1 w para g ∈ G y w ∈ Tg G, y que el nombre se debe a que las geodésicas del
spray canónico son las curvas a un parámetro α(t) = getv donde ex denota la
exponencial del grupo como grupo de Lie-Banach, en el caso concreto del grupo
de inversibles de un álgebra de Banach, está dada por la serie de potencias usual.
Recordemos (Ejemplo 6.9.3 en la Sección 6.9) que el transporte paralelo a lo largo
de las geodésicas está dado por
1
1
P(α)10 z = ge 2 v g−1 ze 2 v
para z ∈ Tg G. Veamos en qué casos esta métrica invariante a izquierda es compatible con el spray. Debería ocurrir que
1
1
1
1
ke− 2 v g−1 ze 2 v kg = kge 2 v g−1 ze 2 v kgev = kzkg = kg−1 zkg ,
es decir, llamando w = g−1 v ∈ g, que
1
1
ke− 2 v we 2 v kg = kwkg
para todo v, w ∈ g. Equivalentemente, eadv = Adev : g → g debe ser una
isometría para la norma dada, para todo v ∈ g. En general, esto es falso por
supuesto. Pero en el caso del grupo de isometrías de un álgebra de Banach, es
evidentemente cierto si la norma es la original del álgebra (en particular para
el grupo de unitarios de un álgebra C∗ con la norma uniforme). También dada
cualquier norma k · kI unitariamente invariante en el álgebra A, se observa que
la métrica es compatible con el spray canónico.
8.4.2.
Espacios homogéneos y métricas cocientes
Dado un espacio homogéneo O = G · x0 = G/K de un grupo de Lie-Banach
G, si el grupo tiene una métrica de Finsler b : TG → R+ bi-invariante, podemos
considerar el espacio (pseudo)-métrico (G, db ). Si el subgrupo K es cerrado para
esta métrica, es relativemente sencillo probar que
ḋ(gK, hK) =
ı́nf
k1 ,k2 ∈K
db (gk1 , gk2 )
es una distancia en el cociente O. Esto es, se toma la distancia entre las fibras
gK, hK ⊂ G que son conjuntos cerrados disjuntos, y esto define una distancia
entre clases en el cociente.
Por otra parte, podemos considerar en O que es una variedad diferenciable
bajo ciertas hipótesis de regularidad del mapa cociente, la métrica cociente
8.4. Métricas invariantes
173
bO : O → R+ . Esta se define de la siguiente manera: si k es el álgebra de
Lie-Banach del grupo de isotropía K, y π = πx0 : G → O es la proyección
π(h) = h · x0 , entonces para x = g · x0 ∈ O y [w] = π∗ w ∈ Tx O ponemos
k[w]kx := ı́nf kw − gkkg .
k∈k
Esta definición no depende del w ∈ Tg G que define la clase [w] ∈ Tg·x0 O, y
tampoco del g ∈ G tal que g · x0 = x. Definimos dO como la distancia inducida
por la métrica de Finsler cociente en O.
Sean g, h ∈ G, k1 , k2 ∈ K, sea Γ ⊂ G que une gk1 con gk2 . Entonces si
γ = π ◦ Γ ⊂ O se tiene que γ une g · x0 con h · x0 . Además
kγ̇kγ := ı́nf kΓ̇ − ΓkkΓ ≤ kΓ̇ kΓ ,
k∈k
luego
LO (γ) ≤ Lb (Γ ).
Entonces
dO (g · x0 , h · x0 ) ≤ Lb (Γ ),
y tomando ínfimo sobre todas las curvas Γ de estas características se tiene
dO (g · x0 , h · x0 ) ≤ db (gk1 , hk2 ).
Tomando ahora ínfimo sobre k1 , k2 ∈ K, descubrimos que siempre vale la desigualdad
dO ≤ ḋ.
Respecto de la otra desigualdad, en general para obtenerla es necesario tener
suplementos en G que provean de curvas cortas en el cociente, o al menos aproximaciones de las mismas. Ejemplos de esto en espacios homogéneos del grupo
unitario de un álgebra de operadores pueden hallarse en los trabajos [5, 8, 32, 33]
de Andruchow, Durán, Chiumiento, Larotonda, Mata-Lorenzo y Recht.
8.4.3.
Operadores positivos con métricas simétricas
Dada una C∗ -álgebra A, recordemos que denotamos con G+
A al cono de operadores positivos e inversibles de A. Según vimos (Ejemplo 6.9.5.2), se puede
reducir el spray canónico del grupo total de inversibles a este cono, para obtener
las geodésicas
t 1
1
1
1
γa,b (t) = a exp(t log(a−1 b)) = a /2 a− /2 ba− /2 a /2
que une a, b ∈ G+
A . El transporte paralelo a lo largo de γa,b está dado por
P(γ)z = a
1/2 −1/2
1 1
1
1
1
1 1
1
(a
ba− /2 ) /2 a− /2 za− /2 (a− /2 ba− /2 ) /2 a /2
174
Variedades de Finsler
para z = z∗ ∈ Ta G+
A = Ah . Sea k · kI una norma simétrica en A (Apéndice D.2),
entonces definimos
1
1
kvka := ka− /2 va− /2 kI
para a ∈ I, v ∈ Ih . El espacio
+
G+
A = {a ∈ GA : a − 1 ∈ I}
es un espacio homogéneo del grupo de inversibles
GA = {g ∈ GA : g − 1 ∈ GA }
por la acción a 7→ gag∗ . Esta acción es transitiva y su grupo de isotropía en
a = 1 es el grupo de operadores unitarios
UI = {u ∈ U : u − 1 ∈ I}
Esta métrica tiene la siguiente propiedad: es invariante por la acción mencionada.
La prueba es elemental,
kgvg∗ kgag∗
=
=
k(gag∗ )−
1/2
1
gvg∗ (gag∗ )− /2 k
∗ −1/2
k(gag )
Llamando u = (gag∗ )−
1/2
1
ga /2
kgvg∗ kgag∗ = kua−
1
ga /2
·a
−1/2
va
I
−1/2
·a
1/2 ∗
1
g (gag∗ )− /2 k
I.
se tiene que u ∈ U y entonces
1/2
1
va− /2 u∗ k
1
I
= ka− /2 va−
1/2
k
I
= kvka .
(8.7)
En particular, el transporte paralelo a lo largo de geodésicas es una isometría
(basta inspeccionar la expresión arriba mencionada de P) y entonces la métrica
es compatible con el spray. A partir de esta propiedad es fácil ver que
LI (γa,b ) = k ln(a−
1/2
1
ba− /2 )k
I
(Ejercicio 8.iii). Esta métrica tiene una propiedad adicional, que enunciamos
como un lema a continuación. Esta propiedad está fuertemente vinculada al
teorema de Cartan que abordamos en la próxima sección. Recordemos que la
expresión de la exponencial de este spray está dada por
expa (z) = a
1/2
exp(a−
1/2
1
1
za− /2 )a /2 .
Se trata de un difeomorfismo global, por lo observado en el Teorema 4.5.1.
Lema 8.4.1. Para todo a ∈ G+
I , v, w ∈ Ih y toda norma unitariamente
invariante k · kI en A se verifica
k(expa )∗v wkexpa (v) ≥ kwka .
8.4. Métricas invariantes
175
1
1
1
1
Demostración. Llamemos x = a− /2 va− /2 , y = a− /2 wa− /2 . A partir de la
+
expresión de la exponencial en a ∈ G+
A , considerando una curva z = z(t) ⊂ GA
tal que z(0) = v, ż(0) = w, obtenemos
(expa )∗v w = a
1/2
[exp∗x y] a
1/2
,
donde ahora exp denota la exponencial usual del álgebra y exp∗x denota la
1
1
diferencial de la exponencial en x ∈ A. Por otra parte expa (v) = a /2 ex a /2 ,
luego
1
1
k(expa )∗v wkexpa (v) = ka /2 [exp∗x y] a /2 k 1/2 x 1/2 .
a
e a
1
a /2 ,
Tomando g =
b = ex , v = exp∗x y, y usando que la métrica es invariante
por la acción b 7→ gbg∗ , se tiene
x
x
k(expa )∗v wkexpa (v) = k exp∗x ykex = ke− 2 [exp∗x y] e− 2 kI .
Invocamos la fórmula de la diferencial de la exponencial (Teorema 4.5.1)
Y
Y
adx
ad2 x
−x
−x
2
2
(y).
1−i
e exp∗x (y)e
=
1 − 2 2 (y) =
4n π
2kπ
n∈N
k6=0
Ahora bien, consideremos el espacio de Banach I que se obtiene al completar A
con la norma k · kI . Consideremos a su vez el álgebra de Banach B = B(I) de
x
todos los operadores acotados en I. Sea c = 2kπ
∈ A, k ∈ Z 6= 0. Como c∗ = c,
±ic
se tiene que e
∈ U, y entonces para todo z ∈ A, y todo t ∈ R,
keitadc zkI = keitc ze−itc kI = kzkI
pues la norma es unitariamente invariante. Por densidad, se deduce que el elemento eiadc ∈ B = B(I) es una isometría, luego adc ∈ Herm(B) es decir adc es
elemento Hermitiano del álgebra (ver la Sección 4.4). Luego, por la Proposición
4.4.5, se tiene
k(1 − i
adx
)(y)kI = k(1 − iadc)ykI ≥ kykI .
2kπ
Entonces se tiene la desigualdad
k
Y
adx
1
1
)(y)kI ≥ kykI = ka− /2 wa− /2 kI = kwka
(1 − i
2kπ
para cualquier producto finito, y tomando límite se tiene la desigualdad deseada
k(expa )∗v wkexpa (v) ≥ kwka .
176
Variedades de Finsler
Observación 8.4.2. Recordemos que una norma de un espacio normado E se
dice estrictamente convexa o rotunda si la esfera de E no contiene segmentos,
o equivalentemente
kx + yk < kxk + kyk
excepto en el caso particular en el que x, y están alineados. No es difícil ver que
en un espacio normado con norma estrictamente convexa, la única curva corta
que une dos vectores v, w ∈ E es el segmento usual (Ejercicio 8.iv).
Como consecuencia de las observaciones previas, se tiene el siguiente teorema
que caracteriza las curvas minimales.
Teorema 8.4.3. Con las hipótesis del lema previo, γa,b es una geodésica
corta que une a, b ∈ G+
I , que resulta única si la norma k·kI es estrictamente
convexa. En particular,
1
1
dI (a, b) = LI (γa,b ) = k ln(a− /2 ba− /2 )kI .
Demostración. Sea α ⊂ G+
I suave a trozos, sea Γ = ln γ el único logaritmo
autoadjunto de γ, que también es suave a trozos pues ln es una función analítica.
Afirmamos que
LI (α) ≥ L(Γ ),
(8.8)
donde la última longitud es la longitud de arco usual en el espacio lineal I dada
R
por L(Γ ) = kΓ̇ kI . Y de aquí se sigue que
dI (γ(1), γ(0)) ≥ kΓ (1) − Γ (0)kI
(8.9)
Para probar (8.8), observemos que como γ = exp(Γ ), entonces γ̇ = exp∗Γ Γ̇ con
lo cual
1
1
kγ̇kγ = kγ− /2 exp∗Γ Γ̇ γ− /2 kI
y este último término es por el lema previo mayor o igual que kΓ̇ kI . Integrando
se obtiene la afirmación. Supongamos ahora que α ⊂ G+
I es una curva suave
1
1
a trozos tal que α(0) = a, α(1) = b, y consideremos β = a− /2 αa− /2 . Por la
1
invariancia de la métrica (tomando g = a− /2 en la ecuación (8.7)), se obtiene
Z
Z
Z
1
1
LI (β) = kβ̇kβ = ka− /2 α̇a− /2 k −1/2 −1/2 = kα̇kα = LI (α),
a
αa
1
1
y por otra parte, como β(0) = 1, β(1) = a− /2 ba /2 = ev , se tiene, invocando
(8.9) que
LI (β) ≥ dI (1, ev ) ≥ kv − 0kI = LI (γa,b ).
8.5. El teorema de Cartan
177
Es decir LI (α) ≥ LI (γa,b ), y tomando ínfimo sobre todas las curvas α se obtiene
la tesis. Supongamos ahora que la norma del ideal I es estrictamente convexa,
si se llegara a tener que α es corta entonces
L(ln(β)) ≤ LI (β) = LI (α) = LI (γa,b ) = kvkI
esto querría decir que ln β es una curva corta que une 0 con v y por la unicidad
debiera ser ln β(t) = tv, luego β(t) = etv con lo cual
α(t) = a
1/2 tv 1/2
e a
= γa,b (t).
Antecedentes de este resultado para la norma uniforme de un álgebra de
operadores pueden hallarse en los trabajos [25, 26] de A. Maestripieri, G. Corach
y D. Stojanoff.
8.5.
El teorema de Cartan
En esta sección probamos el teorema de Cartan para variedades de Finsler con
spray que verifican una condición denominada como curvatura semi-negativa.
La versión para superficies del teorema se debe a J. Hadamard [37] y se remonta
al año 1896. Posteriormente (1946) Elié Cartan demostró el teorema para variedades Riemannianas abstractas [22]. En el año 1965, J. McAlpin extiende en
su tesis doctoral [50] este resultado a variedades de Riemann-Hilbert, y recientemente, en 2002, K.-H. Neeb extiende el resultado a variedades de Finsler con
spray [56], esta última es la versión que presentamos aquí.
Definición 8.5.1. Sea f : M → N una aplicación C1 entre variedades diferenciables. Diremos que
1. f tiene la propiedad de levantadas únicas de curvas si para todo y =
f(p) ∈ N y toda curva γ ⊂ N que sea C1 a trozos y comience en y, existe
una única curva Γ ⊂ M que es C1 a trozos que comienza en p y es una
levantada de γ, es decir γ = f ◦ Γ .
2. f es un revestimiento si f es sobreyectiva y para todo y ∈ N existe un
entorno abierto Uy ⊂ N de manera que f−1 (Uy ) es una unión disjunta
∪i∈I Vi de abiertos en M, y f|Vi : Vi → Uy es un difeomorfismo para todo
i ∈ I.
178
Variedades de Finsler
Teorema 8.5.2. Sean (M, bM ) una variedad de Finsler fuerte completa y
(N, bN , FN ) una variedad de Finsler fuerte, con spray y conexa. Sea f : M →
N dos veces diferenciable y un difeomorfismo local tal que existe C > 0 de
manera que
kf∗ VkbN ≥ CkVkbM
para todo V ∈ TM. Entonces f tiene la propiedad de levantadas únicas de
curvas, es un revestimiento y (N, d) es completa.
Demostración. Sean y = f(p) ∈ N, z ∈ N. Como N es conexa, existe una curva
γ : [0, 1] → N adaptada a N de manera que γ(0) = y, γ(1) = z. Sea
L = {t ∈ [0, 1] : γ|[0,t] tiene una levantada única Γ ⊂ M con Γ (0) = p}.
El conjunto L es no vacío pues 0 ∈ L, y además es abierto pues f es un difeomorfismo local de clase C1 . Está claro que si t0 ∈ L entonces [0, t0 ] ∈ L pues se toma
la restricción de la levantada para cada s ∈ [0, t0 ]. Es decir, L es un intervalo de
la pinta [0, s) con s ≤ 1. Sea Γ : [0, s) → M una levantada de γ|[0,s) . Tomemos
tn ր s, entonces
CdM (Γ (tn ), Γ (tm )) ≤ CLbM (Γ |[tn ,tm ] ) ≤ LbN (γ|[tn ,tm ) ) = |tn − tm |LbN (γ),
lo que prueba que Γ (tn ) es de Cauchy en M y por ende converge a un punto q.
Por la continuidad de f debe ser γ(tn ) → f(q) luego f(q) = γ(s). Entonces
CdM (Γ (t), q) ≤ LbN (γ|[t,s]) = |t − s|LbN (γ)
lo que prueba que lı́m− Γ (t) = q. Si s = 1, ya terminamos. Si no es así, usando
t→s
que f es un difeomorfismo local, podemos extender Γ más allá de s levantando
γ, lo cual es absurdo. Esto prueba que f tiene la propiedad de levantadas únicas
y además que f es sobreyectiva.
Ahora vamos a reducir el problema al caso en el que f es una isometría local,
es decir que kf∗ Vk = kVk para todo V ∈ TM. Para ello, consideramos la métrica
b∗M en M dada por
kVkb∗M = kf∗ VkbN
para V ∈ TM. Como f es un difeomorfismo local, esta métrica es acotada, es
decir induce una métrica dM∗ localmente equivalente con la original de M y por
ende con la misma topología. Es más, se tiene
kVkb∗M = kf∗ VkbN ≥ CkVkbM
8.5. El teorema de Cartan
179
globalmente luego db∗M ≥ C dbM lo que nos dice que (M, dM∗ ) es un espacio
métrico completo pues si {xn } es de Cauchy, entonces es de Cauchy en (M, dM )
luego converge a un punto x ∈ M y como la métrica es compatible, la convergencia también ocurre en (M, dM∗ ).
Como f es un difeomorfismo local, existen abiertos U ⊂ M, V ⊂ N tales que
f∗ : TU → TV es un difeomorfismo. Luego la diferencial de f∗ , que denotaremos
T 2 fV : TV TM → Tf∗ V TN, es una aplicación inversible en cada V ∈ TM. Ahora
llevamos el spray de N para atrás, definiendo F : TM → TTM como
F(V) = (T 2 f)−1 FN (f∗ V).
En una carta, se tiene
T 2 f ΓM (V, W) = ΓN (f∗ V, f∗ W)
(8.10)
para V, W ∈ TM. Afirmamos que (M, bM∗ , F) es una variedad de Finsler con
spray, es decir que la métrica es invariante por transporte paralelo del spray. Sea
α ⊂ M una geodésica tomemos β = f ◦ α ⊂ N. Se tiene
FN (β ′ ) = FN (f∗ α ′ ) = T 2 fFM (α ′ ) = T 2 fα ′′ = β ′′
luego β es una geodésica de N. En particular
expN ◦f∗ = f ◦ expM .
(8.11)
Para z ∈ Tα(0) M y ξ = ξz el transporte paralelo a lo largo de α determinado en
forma única por la ecuación diferencial
ξ̇ = ΓM (ξ, α̇)
ξ(0) = z .
Sea η ∈ TN, η ∈ Lev(f ◦ α) dada por η = f∗ ◦ ξ. Entonces η(0) = f∗ z y por (8.10)
η̇ = T 2 fξ̇ = T 2 fΓM (ξ, α̇) = ΓN (f∗ ξ, f∗ α̇) = ΓN (η, (f ◦ α)˙).
Esto prueba que f∗ PM = PN , es decir f∗ transforma el tranporte paralelo en M
en el transporte paralelo en N. Luego
kPM (α)VkbM∗ = kf∗ PM (α)VkbN = kPN (f ◦ α)f∗ VkbN = kf∗ VkbN = kVkbM∗
Luego el spray FM es compatible con la métrica bM∗ .
180
Variedades de Finsler
Ahora por la Proposición 8.2.1, la exponencial de M está definida en todo
TM, y por (8.11), se tiene D(expN ) ⊃ f∗ TM = TN pues f es sobreyectiva y un
difeomorfismo local, luego (N, FN ) también es geodésicamente completa.
Ahora veamos que (N, dN ) es métricamente completa, sea {yn } de Cauchy en
N, pasando a una subsucesión podemos suponer que dN (yn , yn+1 ) < 1/2n . Por
la propiedad de levantada única, podemos hallar una sucesión {xn } de Cauchy
en M tal que f(xn ) = yn pero además dM∗ (xn , xn+1 ) < 1/2n : dados y1 , y2 ,
tomamos una curva γ ⊂ N que los une tal que LN (γ) < 1/2, la levantamos y
usamos que f es una isometría para definir x1 , x2 con la propiedad deseada. Ahora
tomamos una curva en N del longitud < 1/22 que une y2 con y3 , la levantamos
a M y usando que f es una isometría obtenemos x3 tal que d(x3 , x2 ) < 1/22 , y
así sucesivamente. Como (M, dM∗ ) es completo, existe x ∈ M tal que xn → x.
Si y = f(x), se tiene
dN (yn , y) = dM∗ (xn , x) → 0
luego yn → y.
Por último, dado y ∈ N, tomamos una bola abierta B centrada en el origen
de Ty N de manera que expy |B : B → V = expy (B) ⊂ N sea un difeomorfismo.
Vamos a probar que f es un revestimiento sobre V. Para cada x ∈ f−1 (y),
definimos
Bx = f−1
Vx = expx (Bx ) ⊂ M.
∗x (B) ⊂ Tx M,
Observemos que f(Vx ) = f(expx (Bx )) = expy (f∗x Bx ) = expy (B) = V por (8.11).
Es más, como f|Vx ◦expx |Bx : Bx → V coincide con expy |B ◦f∗x , entonces expx |Bx
es inyectiva, pero además
expx |Bx = f|−1
Vx ◦ expy |B ◦ f∗x
luego expx |Bx → Vx es un difeomorfismo y en particular Vx ⊂ M es abierto.
Afirmamos que f−1 (V) = ∪x/f(x)=y Vx y que los Vx son disjuntos, lo que probaría
que f es un revestimiento. Como f(Vx ) = V para todo x tal que f(x) = y, hay
que probar la otra inclusión. Sea z ∈ f−1 (V), luego f(z) = expy (v) para algún
v ∈ B, y la geodésica β(t) = expy ((1 − t)v) se levanta en forma única a una
geodésica α ∈ M tal que f ◦ α = β y además α(0) = z. Sea x = α(1) ∈ M,
entonces f(x) = f ◦ α(1) = β(1) = y. Como v ∈ B, de la relación
f∗x α̇(1) = β̇(1) = −v
se deduce que w = −α̇(1) = f−1
∗x (v) ∈ Bx , y además z = expx (w) ∈ Vx pues z es
el otro extremo de la geodésica α.
8.5. El teorema de Cartan
181
Ahora sean p 6= q ∈ f−1 (y), veamos que Vp ∩ Vq = ∅. Consideremos z ∈
Vp ∩ Vq dado por
z = expp (v) = expq (w)
con v ∈ Bp , w ∈ Bq . Aplicando f y usando (8.11) se obtiene
expy (f∗p v) = expy (f∗q w),
usando que expy |B es inyectiva tenemos que f∗p v = f∗q w. Las dos geodésicas
α1 (t) = expp (tv),
α2 (t) = expq (tw)
terminan en z, componiendo con f y usando nuevamente (8.11) se deduce que
las dos son levantadas de
β(t) = expy (tf∗p v) = expy (tf∗q w).
Por la unicidad de las levantadas, debe ser p = α1 (0) = α2 (0) = q.
Definición 8.5.3. Sea (M, b, F) una variedad de Finsler con spray. Diremos
que M tiene curvatura semi-negativa si para cada punto p ∈ M, y para v ∈
Dom(expp ), el operador (expp )∗v : Tp M → Texpp (v) M es expansivo e invertible.
Es decir, si es invertible y para todo w ∈ Tp M se verifica
k(expp )∗v wkexpp (v) ≥ kwkp .
La razón del nombre se debe a que en el contexto Riemanniano (ver Sección
9.6), esta condición es equivalente a que M tenga curvatura seccional seminegativa (≤ 0) para todo p ∈ M (Teorema 9.7.4).
Teorema 8.5.4 (Cartan-Hadamard-Grossmann-McAlpin-Neeb). Sea (M, b, F)
variedad de Finsler fuerte con spray, conexa, de curvatura semi-negativa y
geodésicamente completa. Entonces para cada p ∈ M la exponencial expp :
Tp M → M es un revestimiento y (M, d) es completa.
Demostración. Aplicamos el teorema anterior a la aplicación expp : Tp M → M,
donde le damos a Tp M la estructura de variedad de Finsler usual como espacio
de Banach.
Corolario 8.5.5. Sea (M, b, F) una variedad de Finsler fuerte con spray
conexa, completa y de curvatura semi-negativa. Sea p ∈ M, entonces
182
Variedades de Finsler
1. M tiene la propiedad EMI local (exponential metric increasing): para
todo v, w ∈ Tp M suficientemente pequeños,
dM (expp (v), expp (w)) ≥ kv − wkp .
2. Dados x, y ∈ M suficientemente cercanos, existe una geodésica del
spray que es corta y los une.
3. Si M es simplemente conexa, entonces expp : Tp M → M es un difeomorfismo, hay una única geodésica corta para cada par de puntos en
M y M tiene la propiedad EMI global.
Demostración. Sea Br (0) ⊂ Tp M un entorno del origen donde expp es un difeomorfismo, sea γ ⊂ M una curva adaptada a M que une x = expp (v) con
y = expp (w). Levantamos γ a una curva Γ ∈ Tp M tal que Γ (0) = v. Sea
w ′ = Γ (1); como γ(1) = expp (w ′ ) = expp (w) y expp es un revestimiento, si
r es suficientemente pequeño debe ser kv − wk ≤ kv − w ′ k. Como γ = expp ◦Γ ,
se tiene
kγ̇kγ = k(expx )∗Γ Γ̇ kγ ≥ kΓ̇ kp
Luego
kv − wkp ≤ kΓ (1) − Γ (0)kp = k
Z1
0
Γ̇ dtkp ≤
Z1
0
kΓ̇ kp dt ≤ L(γ).
Tomando ínfimo sobre las curvas γ que unen x con y se tiene la EMI.
Si y ∈ M está suficientemente cerca de x, escribiendo y = expx (v) como en
el argumento previo, y considerando γ(t) = expx (tv), se tiene
kv − 0kx ≤ d(expx (v), expx (0)) = d(y, x) ≤ L(γ) = kvkx ,
luego L(α) = d(x, y).
Si M es simplemente conexa, entonces expp tiene que ser inyectiva, porque
en caso contrario, dados v, w ∈ Tp M con x = expp (v) = expp (w), el segmento
S ⊂ Tp M que une v con w va a parar a un lazo ℓ ⊂ M con ℓ(0) = ℓ(1) = x que no
se puede retraer. Explícitamente, sabemos que expp es localmente inyectiva por
ser un revestimiento. Luego v, w deben estar en secciones disjuntas de exp−1
p (x),
es decir tomando un entorno V de x donde las fibras son abiertos disjuntos, v, w
deben estar en dos de estos abiertos Uv , Uw de Tp M distintos. Pero como el lazo
ℓ ⊂ M se puede retraer, a partir de un momento tendremos un lazo que cae en
el entorno V de x, y este se levanta de forma única a una curva Γ ⊂ Uv que
8.A. Problemas
183
comienza en v. Pero expp |Uv es inyectiva lo que contradice que expp ◦Γ es un
lazo cerrado en x.
Dados x, y ∈ M, sea v ∈ Tx M el único tal que expx (v) = y. Sea α(t) =
expx (tv), entonces
kv − 0kx ≤ d(expx (v), x) = d(y, x) ≤ L(α) = kvkx ,
Luego L(α) = d(x, y). La unicidad de las geodésicas cortas y la globalidad de la
EMI se siguen trivialmente de la inyectividad de expp .
Las variedades de curvatura semi-negativa completas, conexas y simplemente conexas se denominan variedades de Cartan-Hadamard. En particular, de
acuerdo al ejemplo trabajado en la sección anterior, el cono positivo de un álgebra C∗ con una norma unitariamente invariante que hace de I un espacio de
Banach, es una variedad de Cartan-Hadamard, y se recupera el Teorema 8.4.3,
siempre y cuando la norma sea equivalente con la norma uniforme. Sin embargo, en el caso en el que el ideal no es completo, la prueba ad-hoc de la sección
previa funciona pero la prueba general del teorema de Cartan de esta sección se
desmorona ya que para probar la existencia y unicidad de levantadas se utiliza la
completitud. En el caso en el que (M, bM ) no es completa se obtiene (copiando
la prueba del Teorema 8.4.3) el siguiente resultado cuya demostración dejamos
como ejercicio (Ejercicio 8.v).
Teorema 8.5.6. Sea (N, bN , FN ) variedad de Finsler con spray conexa de
curvatura semi-negativa, donde no se asume que los tangentes de N son
completos con la norma b. Supongamos que existe x ∈ N tal que expx es
inyectiva. Entonces dado y = expx (v) ∈ N, la geodésica γ(t) = expx (tv) es
una curva corta que une x con y.
8.A.
Problemas
8.I. Si O = G/K con K ⊂ G subgrupo del grupo métrico (G, d), probar que en
caso de que d sea bi-invariante,
ḋ(gK, hK) =
ı́nf
k1 ,k2 ∈K
d(gk1 , hk2 )
define una pseudo-distancia en O, y que esta es una distancia cuando K es cerrado
en (G, d).
8.II. Si G, K son grupos de Lie-Banach y O tiene una estructura diferenciable,
sea b : TG → R+ una métrica de Finsler. Probar que, para x = g · x0 ∈ O y
[w] ∈ Tx O = π∗g w,
k[w]kx = ı́nf kw − gkkg
k∈k
184
Variedades de Finsler
no depende de w ∈ Tg G ni de g ∈ G.
8.III. Sea A un álgebra C∗ y sea k · kI una norma unitariamente invariante en
A. Probar que si
t 1
1
1
1
γa,b (t) = a /2 a− /2 ba− /2 a /2 ,
1
1
entonces ℓI (γa,b ) = k ln a− /2 ba− /2 kI .
8.IV. Sea (E, k · k) un espacio normado con una norma estrictamente convexa.
Probar, dados v, w ∈ E, el segmento s(t) = tw + (1 − t)v es la única curva suave
a trozos en E cuya longitud coincide con d(v, w) = kv − wk.
8.V. Probar el Teorema 8.5.6 imitando la prueba del Teorema 8.4.3.
Capítulo
Variedades Riemannianas y
pseudo-Riemannianas
Las ecuaciones son la parte aburrida de la
matemática. Yo intento ver las cosas en
términos de la geometría.
Stephen Hawking
S
upongamos que E, el espacio de Banach que modela M, admite una
forma bilineal simétrica y continua h , i : E × E → C tal que hz, zi ∈ R
para todo z ∈ E. Supongamos además que E = E+ ⊕ E− y que la
forma es estrictamente definida positiva en E+ y estrictamente definida negativa
en E− , y estos subespacios resultan ortogonales para la forma bilineal. Fijada
una carta (U, ϕ) de M, si tenemos una sección continua A : U → GL(E+ ⊕ E− )
(en el sentido que el operador Ap tiene como subespacios invariantes a E+ , E− )
definimos
hv, wip = hAp ϕ∗p v, Ap ϕ∗p wi
para p ∈ U y v, w ∈ Tp U. Una vez más identificamos Tp U con E y denotamos
esta expresión como
hv, wip = hAp v, Ap wi.
Diremos que esta es una métrica Riemanniana cuando E− = 0, es decir si
hz, zi ≥ 0 para todo z ∈ E, lo que implica por supuesto que
hv, vip = hAp v, Ap vi ≥ 0
185
9
186
Variedades Riemannianas y pseudo-Riemannianas
para todo p ∈ U, para todo v ∈ Tp M. En este caso, definimos una métrica de
Finsler-Riemann como
q
kvkp = hv, vip .
Llamemos H a la completación de E con la forma bilineal h , i. Entonces la
extensión de Ap a H (que seguiremos llamando Ap ) es un operador inversible en
B(H) y por ende gp = g(p) = A∗p Ap ∈ B(H) es positivo e inversible. Entonces
hv, wip = hAp v, Ap wi = hg(p)v, wi = hv, g(p)wi.
Bajo ciertas condiciones de pegado al cambiar de carta para tener compatibilidad
sobre las que no discurriremos, este producto escalar y su métrica asociada se
extienden a todo M.
Se tiene entonces una sección g : M 7→ Bil(TM) que se denomina métrica
Riemanniana en M de manera tal que
g(p)(v, w) = hv, wip = hv, gp wi = hgp v, wi
para todo v, w ∈ Tp M. También es habitual denotar hv, wig cuando el punto base
está claro del contexto, y diremos que (M, g) es una variedad Riemanniana.
En caso de que el espacio de Banach E fuese un espacio de Hilbert y h , i
su producto interno (o uno equivalente a este), es fácil ver que la métrica que
introdujimos es compatible con la original (en el sentido de que la métrica b
dada por b(p, v)2 = hv, vip es acotada, ver la Sección 8.1.2).
En el caso pseudo-Riemanniano se procede en forma análoga, pero teniendo
presente que el operador g(p) = A∗p Ap es autoadjunto, tiene espectro real y
no nulo, y se puede descomponer en dos operadores positivos e inversibles g+ :
E+ → E+ , g− : E− → E− de manera que
g(p) = g+ (p) − g− (p).
Como g : U 7→ GL(E), su diferencial g∗p en cada p ∈ U es un operador de E
en B(E), es decir g∗p : E 7→ B(E). Luego fijado z ∈ E, se verifica g∗p,z : E 7→ E es
lineal y acotado, y denotaremos g∗p,z w a la acción de este sobre w ∈ E.
De la simetría hv, gp wi = hgp v, wi, si p = pt es una curva en U con p0 = p
y ṗ0 = z, se tiene
hv, g∗p,z wi = hg∗p,z v, wi.
9.1.
La derivada de Levi-Civita
En general, dada una variedad con spray (M, F), puede haber muchas métricas en M que hagan de esta una variedad de Finsler con spray, en el sentido
9.1. La derivada de Levi-Civita
187
que el transporte paralelo sea isométrico. El problema recíproco es aún más difícil, es decir, no es sencillo hallar, para una variedad de Finsler, un spray que
sea compatible con la métrica. Sin embargo, en el caso Riemanniano y pseudoRiemanniano, gracias a la linealidad o suavidad de las métricas involucradas
este problema tiene solución única en un sentido que precisamos a continuación.
Salvo que se indique lo contrario, no necesitamos suponer que la norma de
Finsler inducida por la métrica g es acotada.
Teorema 9.1.1. Sea (M, g) una variedad pseudo-Riemanniana. Entonces
existe un spray F en M compatible con la métrica que verifica
hP0t (α)v, P0t (α)wig = hv, wig
para toda curva α ⊂ M de clase C2 y todo v, w ∈ Tα(0) M. El spray F es
único en los siguientes sentidos equivalentes:
1. Dados tres campos X, Y, Z en M, si ∇ denota la derivada covariante
del spray, se verifica
X(hY, Zig ) = h∇X Y, Zig + hY, ∇X Zig .
(9.1)
2. Si α : J → M es una curva de clase C2 , Dt denota la derivada covariante respecto de α y las curvas η, µ ∈ Lev(α), entonces
d
hη, µig = hDt η, µig + hη, Dt µig .
dt
(9.2)
Este spray se denomina spray canónico o spray métrico y la derivada covariante se denomina derivada métrica o derivada de Levi-Civita. En una carta,
el spray está dado por
hFp (v), g(p)zi = −hg∗p,v v, zi + 1/2hg∗p,z v, vi.
(9.3)
Demostración. La existencia está dada localmente por la última expresión. La
forma bilineal inducida se recupera polarizando,
2hΓp (v, w), g(p)zi = hg∗p,z w, vi − hg∗p,w z, vi − hg∗p,v z, wi,
(9.4)
y de aquí se obtienen las expresiones para campos y derivadas covariantes.
Veamos que el spray es compatible con la métrica: si µv , µw son los transportes paralelos de v, w ∈ Tα(0) M a lo largo de una curva α ∈ M, entonces de
la propiedad de la derivada covariante, derivando
g(t) = hP0t (α)v, P0t (α)wig
188
Variedades Riemannianas y pseudo-Riemannianas
respecto de t se deduce que la derivada es nula, luego esta expresión es constante
y debe coincidir con su valor en t = 0 que es justamente hv, wig . Poniendo v = w
se deduce que el spray es compatible con la métrica.
La unicidad del spray y la prueba de que se extiende adecuadamente a todo
M pegando las expresiones locales puede verse en el libro de Lang, [47, Capítulo
VIII, §4, Teorema 4.1].
De aquí en más toda variedad (M, g) pseudo-Riemanniana la pensaremos con
su spray canónico.
9.1.1.
La derivada de Levi-Civita de una subvariedad
Un caso elemental que nos permite aplicar los resultados del teorema previo,
es cuando M ⊂ H es una subvariedad de un espacio de Banach provisto de un
producto interno (H, h·, ·i). En ese caso, dados p ∈ M, v, w ∈ Tp M, identificando
Tp M con un subespacio de H, podemos darle a Tp M el producto interno
hv, wip = hv, wi.
Diremos que (M, g) tiene la métrica inducida o la métrica de subespacio.
En esta sección supondremos que la métrica es acotada superiormente, lo
cual equivale a decir que la forma bilineal β(v, w) = hv, wig es continua, y en
particular es lícito usar la regla de derivación del producto. Es decir, estamos
en el contexto de variedades Riemannianas débiles.
Sea Ep ∈ B(H) el único proyector ortogonal (Ep = E2p = E∗p ) con rango Tp M.
Afirmamos que el spray métrico de M coincide con el spray dado por derivar y
proyectar al tangente, de acuerdo a los resultados de la Sección 6.6. Es decir,
Lema 9.1.2. Sea M ⊂ H con la métrica inducida y el spray métrico. Dada
α ⊂ M y µ ∈ Lev(α), se tiene
Dt µ = Eα µ̇
y en particular dado η ∈ Lev(α)
d
hη, µi = hη̇, µi + hη, µ̇i.
dt
Demostración. Sabemos que esta fórmula define, por el Teorema 6.6.1, un spray
en la variedad M, para probar que es el spray métrico, por la unicidad del mismo,
basta probar la condición de compatibilidad (9.2). Pero
hDt η, µi = hEα η̇, µi = hη̇, Eα µi = hη̇, µi,
9.1. La derivada de Levi-Civita
189
pues Eα es un operador autoadjunto y similarmente hη, Dt µi = hη, µ̇i, y como
vale la regla
d
hη, µi = hη̇, µi + hη, µ̇i
dt
puesto que la métrica es acotada superiormente, se tiene la condición de compatibilidad.
9.1.1.1.
La Grassmanniana dentro de los autoadjuntos
Para la Grassmanniana de un álgebra de operadores (Ejemplo 6.9.6), dado
un proyector p = p∗ = p2 se tenía el spray
Fp (x) = −2ǫp x2 ,
con ǫp = 2p − 1 la simetría asociada a p y x = xp + px ∈ AC
h = Tp P(A).
Equivalentemente, ǫp x = −xǫp . Definimos la métrica Riemanniana
kxkp := kxk2 ,
con kxk22 = Tr(x∗ x), y Tr denota la traza del álgebra. Afirmamos que el spray
antes introducido es el spray métrico de esta métrica. En particular la métrica
Riemanniana no es otra que la de la Grassmanniana como subvariedad del espacio
de Hilbert Ah con la norma Frobenius (Lema 9.1.2).
Proposición 9.1.3. Sea p ∈ P(A), x, y ∈ AC
h = Tp P(A) y consideremos a la
Grassmanniana con la métrica Riemanniana
hx, yig = Tr(xy).
Entonces el spray métrico de (P(A), g) está dado por Fp (v) = −2ǫp v2 . En
particular si α ⊂ P(A) es de clase C2 y η ∈ Lev(α) se tiene que
Dt η = η̇ + ǫα (ηα̇ + α̇η)
es la derivada de Levi-Civita de la variedad.
Demostración. Basta chequear la condición de compatibilidad a lo largo de una
curva α ⊂ M,
d
hη, µig = hDt η, µig + hη, Dt µig
dt
para η, µ ∈ Lev(α). El lado izquierdo es simplemente
Tr(η̇µ) + Tr(ηµ̇),
(9.5)
190
Variedades Riemannianas y pseudo-Riemannianas
mientras que
hDt η, µig = Tr(µ[η̇ + ǫα (ηα̇ + α̇η)]) = Tr(µη̇) + Tr(µǫα ηα̇) + Tr(µǫα α̇η)
y
hη, Dt µig = Tr(η[µ̇ + ǫα (µα̇ + α̇µ)]) = Tr(ηµ̇) + Tr(ηǫα µα̇) + Tr(ηǫα α̇µ).
Pero ǫα η = −ηǫα y lo mismo se aplica a µ, puesto que µ, η ∈ Tα P(A), y casi
todos los términos se cancelan usando la propiedad cíclica de la traza, salvo el
concerniente a la ecuación (9.5), probando así la compatibilidad.
9.1.2.
Sprays métricos en espacios homogéneos
En esta sección, H es un espacio de Hilbert complejo y separable, B(H) denota los operadores acotados en H mientras que B(H)0 , K(H) denotan respectivamente los operadores de rango finito y los compactos. Seguimos la notación
del Apéndice D de normas simétricas en sucesiones e ideales de operadores compactos.
Consideremos a los operadores de Hilbert-Schmidt B2 (H) con el producto
interno
ha, bi = ReTr(ab∗ ),
P
donde ahora Tr denota la traza infinita dada por Tr(x) =
n≥0 hxen , en i y
{en }n≥1 es cualquier base ortornormal del espacio de Hilbert H (ver el la Sección
D.1.3 para más detalles), y le agregamos unidad de manera natural, considerando
A = B2 (H) ⊕ C y la norma
p
kk + λk2 := kkk2 + |λ|2 .
Si se prefiere, se puede considerar al álgebra de matrices A = Mn (C) con la
norma Frobenius
1
kak2 = Tr(|a|2 ) /2 .
Observemos que estas son normas simétricas, por ende unitariamente invariante.
Introducimos la métrica invariante a izquierda en los operadores inversibles, de
acuerdo a lo discutido en la Sección 8.4
kvkg := kg−1 vk2 .
Esta proviene del producto interno
hv, wig := hg−1 v, g−1 wi = Re Tr(g−1 vw∗ (g∗ )−1 ) = Re Tr((gg∗ )−1 vw∗ )
para v, w cualesquiera y g inversible.
9.1. La derivada de Levi-Civita
9.1.2.1.
191
El spray métrico del grupo de inversibles
Procedemos a calcular el spray métrico para nuestros ejemplos de grupos
inversibles y sus espacios homogéneos. Esta cuenta es especialmente relevante
ya que, como vimos en la Sección 8.4, esta métrica invariante a izquierda no es
compatible con el spray canónico del grupo de inversibles.
A partir de la expresión de la métrica se deduce que gp v = (pp∗ )−1 v. Considerando una curva de inversibles x(t) tal que x(0) = p, ẋ(0) = z, obtenemos la
expresión
g∗p,z v = −(pp∗ )−1 (zp∗ + pz∗ )(pp∗ )−1 v = −gp (zp∗ + pz∗ )gp v.
Luego, de la expresión local del spray canónico (9.3) deducimos que (multiplicando por 2 para trabajar con el doble de la parte real de la traza)
2hgp Fp (v), zi = ReTr(gp Fp (v)z∗ + Fp (v)∗ gp z).
Por otro lado, el término de la derecha en (9.3), después de ciertas manipulaciones
usando la ciclicidad de la traza, es igual a
ReTr([gp vv∗ gp p − gp vp∗ gp v − gp pv∗ gp v]z∗ +
+[p∗ gp vv∗ gp − v∗ gp vp∗ gp − v∗ gp pv∗ gp ]z).
Como esto tiene que valer para todo z, se deduce (usando que p∗ gp = p−1 ) que
Fp (v) = vp−1 v + pv∗ gp v − vv∗ (p∗ )−1 .
(9.6)
Si tomamos w = p−1 v, es decir llevamos la velocidad v al origen del grupo, se
obtiene
p−1 Fp (pw) = w2 + w∗ w − ww∗ .
9.1.2.2.
Geodésicas
La ecuación de las geodésicas se calcula como es usual a partir de α ′′ = F(α ′ ),
obteniéndose
α̈ = α̇α−1 α̇ + αα̇∗ (αα∗ )−1 α̇ − α̇α̇∗ (α∗ )−1 ,
esto es
α−1 α̈ = (α−1 α̇)2 + (α−1 α̇)∗ α−1 α̇ − α−1 α̇(α−1 α̇)∗ .
Llamando β = α−1 α̇, la ecuación de Euler se convierte en
β̇ = [β∗ , β].
(9.7)
192
Variedades Riemannianas y pseudo-Riemannianas
Después de algunas experimentaciones, surge que la única geodésica del spray
con α(0) = g ∈ GA y α̇(0) = gv = g(x + iy) (donde x, y ∈ Ah son la parte real
e imaginaria de v respectivamente), es la curva
α(t) = get(x−iy) e2tiy .
(9.8)
Una manera de probar que α verifica la ecuación del spray es llamando w =
e−2tiy xe2tiy . Entonces
α̇ = α(w − iy) + α2iy = α(w + iy),
con lo cual
α−1 α̇ = w + iy,
y el lado derecho de la ecuación (9.7) se convierte en
(w + iy)2 + (w − iy)(w + iy) − (w + iy)(w − iy) = w2 − y2 + i(3wy − yw).
Por otro lado, como α̈ = α̇(w + iy) + αẇ, y ẇ = 2i(wy − yw), entonces también
se verifica
α−1 α̈ = (w + iy)2 + 2i(wy − yw) = w2 − y2 + i(3wy − yw).
Notemos que estas curvas pueden reescribirse como
∗
∗
α(t) = getv et(v−v ) .
(9.9)
Observación 9.1.4. La métrica invariante a izquierda del grupo general lineal, se
presenta de manera natural al estudiar el problema del cuerpo rígido generalizado
desde el punto de vista de la mecánica clásica. Recomendamos al lector interesado
el excelente Apéndice 2 del libro de mecánica de V. I. Arnol’d [13]. El estudio del
grupo lineal con esta conexión, pero reemplazando la norma 2 por las normas p
dadas por la traza, puede encontrarse en el trabajo [9] del año 2011, y es para
destacar que el caso no Riemanniano es mucho más complejo y se desconoce una
fórmula general para las geodésicas.
Observación 9.1.5. Restringiendo el spray al grupo unitario, si consideramos
p = u ∈ U, v = uv0 ∈ Tu U, con v∗0 = −v0 ∈ Aah , la ecuación del spray se reduce
de la siguiente manera
Fu (v) =
=
Fu (uv0 ) = vu∗ v + uv∗ v − vv∗ u = uv20 − uv20 + uv20
uv20 = vu∗ v = vu−1 v,
9.2. Cálculo de variaciones
193
que no es otra cosa que el spray canónico del grupo. En particular la derivada de
Levi-Civita en campos invariantes a izquierda es ∇X Y = 1/2[X, Y]. No es casual
entonces que las geodésicas (9.8) se reduzcan a los grupos a un parámetro cuando
la velocidad inicial es anti Hermitiana (x = 0), es decir
α(t) = get(0−iy) e2tiy = getiy
es un grupo a un parámetro.
Volviendo al caso general, a partir de la ecuación del spray (9.6), polarizando
obtenemos la expresión de la forma bilineal Γ , que es, para g ∈ G y v = gx, w =
gy ∈ Tg G,
2g−1 Γg (gx, gy) = xy + yx + x∗ y + y∗ x − xy∗ − yx∗ .
Sean Xg = gV, Yg = gW campos invariantes a izquierda, con V, W ∈ A. Definimos los campos adjuntos como X∗g = gV ∗ , Yg∗ = gW ∗ . Entonces un simple
cálculo, usando que la conexión del spray está dada por ∇X Y = Y ′ X − Γ (X, Y),
nos devuelve la conexión de Levi-Civita del grupo de inversibles con la métrica
invariante a izquierda dada por la norma Frobenius
∇X Y = 1/2 {[X, Y] + [X, Y ∗ ] + [Y, X∗ ]} ,
(9.10)
donde [X, Y] = LX Y denota como siempre el corchete de Lie de los campos dado
por [X, Y]g = g[V, W], etc. Atención que esta expresión sólo es válida para campos
invariantes a izquierda; en el caso finito dimensional se extiende por linealidad a
todos los campos de manera usual usando que los campos en las direcciones de
una base del tangente, forman una base del espacio de todos los campos como
módulo sobre C∞ (M).
La derivada covariante del spray es Dt µ = µ̇ − Γ (µ, α̇). Para α ⊂ M y
η ∈ Lev(α), ponemos
β = α−1 α̇, µ = α−1 η.
Entonces un simple cálculo nos devuelve la siguiente fórmula concreta para la
derivada covariante:
α−1 Dt η = µ̇ + 1/2 {[β, µ] + [β, µ∗ ] + [µ, β∗ ]} .
9.2.
(9.11)
Cálculo de variaciones
Estudiaremos en esta sección la geometría clásica de variedades Riemannianas y pseudo Riemannianas con sus herramientas distintivas: el cálculo de
194
Variedades Riemannianas y pseudo-Riemannianas
variaciones, las coordenadas polares, el Lema de Gauss, la curvatura seccional.
En esta parte estudiamos la relación entre curvas cortas y geodésicas del spray
mediante el cálculo de variaciones. Nuevamente supondremos en esta sección
que la métrica es acotada superiormente, es decir que (M, g) es una variedad
Riemanniana débil.
Diremos que una curva γ : [0, 1] → M es admisible si es C1 y con derivada
no nula a trozos, es decir existe π = {0 = t0 ≤ · · · ≤ tn+1 = 1} de manera que
γ|(ti ,ti+1 ) es C1 y con derivada no nula, y además existen los límites
lı́m γ̇(t) = γ̇(t+
i ),
t→t+
i
lı́m γ̇(t) = γ̇(t−
i )
t→t−
i
para todo i = 1, .., n.
Observación 9.2.1. Sea η : [0, 1] → TM una curva C1 y con velocidad no nula.
Si (M, g) es Riemanniana, entonces
2kη̇k
d
d
kη̇k =
kη̇k2 = 2hη̇, Dη̇ η̇ig
dt
dt
por (9.2). Luego
d
1
kη̇k =
hη̇, Dη̇ η̇ig .
dt
kη̇k
Dada una curva admisible γ : [0, 1] → M, si J = (−ǫ, ǫ) es un intervalo,
definimos una variación como una función continua ν : J × [0, 1] de manera
que ν(0, t) = γ(t), νs es admisible para cada s fijo y la restricción de ν a los
rectángulos (−ǫ, ǫ) × (ti , ti+1 ) es dos veces diferenciable.
Diremos que la variación es con un extremo fijo si νs (0) = γ(0) para todo
s ∈ (−ǫ, ǫ), y diremos que la variación es propia si tiene los dos extremos fijos.
Denotaremos con ′ a la derivada de ν respecto de s y con ˙ a la derivada de
ν respecto de t. Denotaremos con Ds a la derivada covariante a lo largo de νt
(con t fijo) y con Dt a la derivada covariante a lo largo νs (con s fijo).
Lema 9.2.2. Sea (M, g) pseudo-Riemanniana. Entonces
1. Si ν es una variación de γ, entonces Ds ν̇ = Dt ν ′ , es decir
Dνt′ ν̇(s, t) = Dν˙s ν ′ (s, t)
para (s, t) ∈ J × [0, 1].
2. Sea γ ⊂ M admisible con velocidad constante, sea µ ∈ Lev(γ) suave a
trozos. Existe ǫ > 0 tal que si J = (−ǫ, ǫ) y ν : J × [0, 1] → M está dada
por
ν(s, t) = expγ(t) (sµ(t)),
9.2. Cálculo de variaciones
195
entonces ν es una variación de γ con ν ′ (0, t) = µ(t). La variación ν
es propia si y sólo si µ(0) = µ(1) = 0.
Demostración. La prueba del primer ítem es trivial: los dos lados son iguales a
ν̇ ′ − Γν (ν̇, ν ′ ), puesto que Γ es simétrica y (ν ′ )˙ = ν̇ ′ .
Respecto del segundo ítem, podemos suponer, refinando la partición, que
los intervalos donde γ y µ son suaves, son los mismos. Tomando s suficientemente pequeño como para que sµ(t) ∈ Tγ(t) M esté en el entorno del origen
donde expγ(t) es un difeomorfismo con su imagen, se sigue que ν es suave en los
rectángulos donde γ lo era y además cada νs es admisible puesto que
νs : t 7→ expγ(t) (sµ(t)).
Como ν0 (t) = expγ(t) (0µ(t)) = γ(t), se trata de una variación de γ. Por otra
parte,
d ′
ν = (expγ(t) )∗sµ(t) µ(t)
= µ(t).
ν (0, t) =
ds (0,t)
s=0
Por último, como
νs (0) = expγ(0) (sµ(0)) y νs (1) = expγ(1) (sµ(1)),
para todo s ∈ J, se deduce que ν es propia si y sólo si µ(0) = µ(1) = 0.
9.2.1.
Fórmulas variacionales
Teorema 9.2.3. Sean (M, g) Riemanniana, γ ⊂ M admisible con velocidad
constante, µ ∈ Lev(γ) suave a trozos. Tomemos
ν(s, t) = expγ(t) (sµ(t)),
la variación propia de γ del lema previo. Entonces
Z1
n
X
d +
L(γ) L(νs ) = − hDt γ̇, µig dt +
hµ(ti ), γ̇(t−
i ) − γ̇(ti )ig
ds s=0
0
i=1
+hµ(1), γ̇(1− )ig − hµ(0), γ̇(0+ )ig .
Demostración. En primer lugar, como el integrando es continuo está justificado
derivar debajo del signo integral. Ahora calculamos, usando la Observación 9.2.1
y el primer ítem del lema previo
d
1
1
kν̇kν =
hν̇, Ds ν̇i =
hν̇, Dt ν ′ i
ds
kν̇k
kν̇k
196
Variedades Riemannianas y pseudo-Riemannianas
con t ∈ (ti , ti+1 ) fijo pues allí ν̇ 6= 0. Evaluando en s = 0, como v0 (t) = γ(t) y
v0′ (t) = µ(t), obtenemos
d 1
hγ̇, Dt µi.
kν̇kν =
ds s=0
kγ̇k
Por otra parte,
d
hγ̇, µi = hDt γ̇, µi + hγ̇, Dt µi.
dt
Reemplazando esta expresión en la inmediata anterior, recordando que kγ̇k =
k = cte, obtenemos
d
d hγ̇, µi − hDt γ̇, µi.
kν̇kν =
k
ds s=0
dt
Integrando respecto de t en [ti , ti+1 ], se tiene
Z ti+1
Z ti+1
d ti+1
k
hDt γ̇, µidt.
kν̇kν = hγ̇, µi|ti −
ds s=0
ti
ti
Sumando sobre i = 0, . . . , n tenemos la fórmula del enunciado agrupando convenientemente.
Corolario 9.2.4. Sean (M, g) Riemanniana débil y γ : [0, 1] → M.
1. Si γ es una geodésica del spray, entonces es un punto crítico de L para
toda variación propia.
2. Si γ es C1 y punto crítico de L (en particular minimal), entonces es
una geodésica del spray.
3. Si γ es adaptada y punto crítico de L (en particular minimal), entonces γ es una reparametrización de una geodésica del spray, en particular suave en [0, 1].
Demostración. Si γ es una geodésica, es suave y el término de la suma en el
teorema previo no está presente. Además la integral es nula pues el integrando
lo es.
Si γ es C1 , el término de la suma no está presente en el teorema previo.
Si γ es minimal, en particular es un extremo de la funcional L para cualquier
variación, en particular µ = Dt γ̇, y entonces debe ser Dt γ̇ = 0, es decir γ es una
geodésica del spray.
9.2. Cálculo de variaciones
197
Si γ es suave a trozos y minimal, en particular es minimal en cada tramo
donde es suave (Observación 7.1.13), luego es una geodésica allí. Luego
n
X
d +
0 = L(γ) L(νs ) =
hµ(ti ), γ(t−
i ) − γ(ti )ig .
ds s=0
i=0
Para cada i = 1, .., n, elegimos f : [0, 1] → [0, 1] suave de manera que f = 0
excepto en (ti − ǫ, ti + ǫ) y f(ti ) = 1. Definimos µ = 0 en [0, 1] exceptuando en
(ti − ǫ, ti + ǫ) donde lo definimos como el transporte paralelo de
+
vi = γ̇(t−
i ) − γ̇(ti )
a un lado y al otro de ti (que está bien definido pues a cada lado γ es suave),
multiplicado por la función f. Entonces µ ∈ Lev(γ) es suave y todos los términos
de la suma se desvanecen salvo el i-ésimo, donde se obtiene
+
−
+ 2
0 = hµ(ti ), γ̇(t−
i ) − γ̇(ti )ig = kγ̇(ti ) − γ̇(ti )k .
Se deduce que cada salto de γ no es tal, y como γ resulta suave por la unicidad
debe ser una geodésica del spray.
9.2.1.1.
La variación de la energía
Recordemos que la funcional energía se calcula, para curvas admisibles γ :
[0, 1] → M, como
Z1
1
E(γ) = /2 kγ̇k2γ dt.
0
Esta no es invariante por reparametrizaciones, dejamos los teoremas análogos a
los de la funcional longitud como ejercicio para el lector (Ejercicio 9.vi).
Teorema 9.2.5. Sean (M, g) Riemanniana débil, γ ⊂ M admisible, µ ∈
Lev(γ) y ν la variación del teorema previo. Entonces si µ(0) = µ(1) = 0, se
tiene
Z1
n
X
d +
hµ(ti ), γ̇(t−
E(ν
)
=
−
hD
γ̇,
µi
dt
+
s
t
g
i ) − γ̇(ti )ig .
ds s=0
0
i=1
Corolario 9.2.6. Sean (M, g) Riemanniana y γ : [0, 1] → M.
1. Si γ es una geodésica del spray, entonces es un punto crítico de E para
toda variación propia.
198
Variedades Riemannianas y pseudo-Riemannianas
2. Si γ es C1 y minimal para la energía, entonces es una geodésica del
spray.
3. Si γ es una suave a trozos (adaptada) y minimal para la energía entonces γ es una geodésica del spray, en particular suave en [0, 1].
9.3.
Las geodésicas son localmente minimizantes
En esta sección probamos resultados en algún sentido recíprocos de los de la
sección anterior: allí vimos que toda curva minimal debe ser una geodésica (pero
no sabemos si dados dos puntos hay una curva minimal que los une), y que todas
las geodésicas son extremales (pero no necesariamente minimales). Comenzamos
con un lema técnico sobre el tensor de curvatura.
Lema 9.3.1. Sean (M, g) pseudo-Riemanniana, p ∈ M, x, y, z ∈ Tp M. Entonces
1. hRp (x, y)z, zig = 0,
2. hRp (x, y)x, zig = hRp (x, z)x, yig .
Demostración. Para la primera identidad, probaremos que
hR(X, Y)Z, Zig = 0
para toda terna de campos X, Y, Z en M, de donde se deduce la propiedad pues
R sólo depende del valor de los campos en el punto p. A partir de la propiedad
(9.1), se deduce que XhZ, Zi = 2h∇X Z, Zi. Luego
Y(XhZ, Zi) = 2h∇Y ∇X Z, Zi + 2h∇X Z, ∇Y Zi.
Intercambiando X con Y y restando se deduce que
[Y, X]hZ, Zi = 2h(∇Y ∇X − ∇X ∇Y )Z, Zi.
Pero aplicando nuevamente la propiedad (9.1) al lado izquierdo se deduce que
[Y, X]hZ, Zi = 2h∇[Y,X] Z, Zi.
Comparando los lados derechos de las últimas ecuaciones, se tiene la propiedad
al revisar la definición de R. Respecto de la segunda identidad, tiene una prueba
análoga que omitimos.
9.3. Las geodésicas son localmente minimizantes
9.3.1.
199
El lema de Gauss
Teorema 9.3.2 (Lema de Gauss). Sea (M, g) pseudo-Riemanniana débil.
Consideramos γ : J → M, γ(t) = expp (tz) una geodésica de M, con z ∈ Tp M.
1. Dados v, w ∈ Tp M sea η ∈ Lev(γ) el único campo de Jacobi con η(0) =
v, Dt η(0) = w. Entonces
hγ̇(t), η(t)ig = hz, v + twip .
2. Para todo w ∈ Tp M y todo t ∈ J se tiene
h(expp )∗tz z, (expp )∗tz wig = hz, wip .
3. Si v = 0 y w ⊥ z, entonces γ̇ ⊥ η para todo t ∈ J.
Demostración. Sea f(t) = hγ̇(t), η(t)ig . Se tiene
0. Derivando nuevamente respecto de t se tiene
d
dt f(t)
= hγ̇, Dt ηi pues Dt γ̇ =
d2
f(t) = hγ̇, D2t ηi = hγ̇, R(γ̇, η)γ̇i = 0
dt2
para todo t ∈ J por el lema previo. Luego f(t) = f(0) + tf ′ (0), lo que prueba el
primer item. La segunda fórmula es un caso particular (v = 0) combinado con
la expresión
η(t) = (expp )∗tz tw
del Teorema 6.8.4, la tercera fórmula es evidente a partir de la segunda.
9.3.2.
Coordenadas polares
Observación 9.3.3. Sean p ∈ M, R > 0 de manera que
expp : BR (0p ) ⊂ Tp M → UR (p) = expp (BR (0p ))
es un difeomorfismo. Si α : [a, b] → UR (p) − {p} es admisible, consideremos
Γ = exp−1
p ◦α : [a, b] → Tp M. Sea r : [a, b] → (0, R) dada por r(t) = kΓ (t)kp .
Como Γ 6= 0, se deduce que r es suave a trozos y no nula. Sea u : [0, 1] → S =
{v : kvkp = 1} ⊂ Tp M dada por
u(t) =
1
Γ (t).
r(t)
Entonces u también es suave a trozos, y además Γ = ru. Como se verifica que
α(t) = expp (r(t)u(t)), diremos que estas son las coordenadas polares de γ.
200
9.3.3.
Variedades Riemannianas y pseudo-Riemannianas
Minimalidad de las geodésicas
Probamos primero una versión clásica del teorema de minimalidad, asumiendo que la métrica Riemanniana es acotada, es decir que la distancia inducida da
la topología de la variedad M.
Teorema 9.3.4 (Minimalidad local de las geodésicas, (M, g) Riemanniana
fuerte). Sean p ∈ M y R > 0 como en la observación previa. Dado
q ∈ UR (p), sea γp,q la geodésica del spray que une p, q, γp,q (t) = expp (tv)
con v ∈ BR (0p ) ⊂ Tp M. Entonces
1. Sea 0 < c ≤ R. Entonces L(α) ≥ c para toda curva α : [0, 1] → M
admisible que comienza en p, y se salga de Uc (p) = expp (Bc (0)).
2. L(α) ≥ L(γp,q ) para toda curva α : [0, 1] → M admisible que una p con
q, y en particular d(p, q) = L(γp,q ) = kvkp .
3. Vale la igualdad si y sólo si α es una reparametrización de γp,q .
Demostración. Sabemos que γp,q (t) = expp (tv) para algún v ∈ Tp M con
kvkp = L(γp,q ) < R. Sea I ⊂ [0, 1] la componente conexa del cero de α−1 Uc (p),
entonces I = [0, s) si α se sale de Uc (p), con r(s) := lı́m− r(t) = c o bien I = [0, 1]
t→s
si α ⊂ Uc (p). En cualquier caso, para 0 < δ < s sea αδ la restricción de α al
intervalo I ∩ {t ≥ δ}. Como podemos suponer que α no vuelve a pasar por p (estamos acotando inferiormente su longitud) podemos escribir αδ (t) = expp (Γ (t))
y con la descomposición polar de Γ obtenemos αδ (t) = expp (r(t)u(t)). Luego
α̇δ (t) = (expp )∗ru (ṙu + ru̇) = ṙ(expp )∗ru u + r(expp )∗ru u̇.
Ahora bien, kuk2 = 1 luego derivando se tiene u ⊥ u̇ para todo t. Por el segundo
item del Lema de Gauss, se deduce que
h(expp )∗ru u, (expp )∗ru u̇ig = hu, u̇ip = 0.
Entonces
kα˙δ (t)k2 = kṙ(expp )∗ru uk2 + kr(expp )∗ru u̇k2 ≥ ṙ2 k(expp )∗ru uk2 ,
es decir
kα˙δ (t)k ≥ |ṙ|k(expp )∗ru uk = |ṙ|,
(9.12)
9.3. Las geodésicas son localmente minimizantes
201
d
expp (ru) (con r, u variables independientes), y el
puesto que (expp )∗ru u = dr
transporte paralelo es isométrico. Supongamos primero que α se sale de Uc (p).
Integrando en [δ, s], obtenemos
Zs
Zs
|c − r(0)| = |r(s) − r(0)| ≤ |ṙ| ≤ kα˙δ (t)k ≤ L(αδ ) ≤ L(α).
0
0
Como r(0) = rδ (0), haciendo tender δ → 0+ se tiene L(α) ≥ c.
Supongamos ahora que α : [0, 1] → M une p con q. Como L(γp,q ) = kvkp <
R, tomando c = R en el ítem previo, se sigue que si α se sale de UR (p) entonces
L(α) ≥ R > L(γp,q ). Supongamos ahora que α no se sale de UR (p), entonces
α(1) = y = expp (1v) luego Γ (1) = v, con lo cual r(1) = kΓ (1)kp = kvkp y
entonces
|kvkp − rδ (0)| ≤ L(αδ )
y haciendo tender δ → 0+ nuevamente obtenemos L(α) ≥ kvkp . Esto prueba que
γp,q es minimal, y entonces d(p, q) = kvkp = L(γp,q ).
Si L(α) = L(γp,q ) = d(p, q), entonces α ⊂ UR (p). Como α también es
minimal, es una geodésica del spray por el tercer ítem del Corolario 9.2.4, y
como α ⊂ UR (p), debe ser una reparametrización de γp,q . Alternativamente, se
puede argumentar que si vale la igualdad, de (9.12) se deduce que debe ser
r k(expp )∗ru u̇k = 0
para todo t, como r 6= 0 (salvo para t = 0) se deduce que (expp )∗ru u̇ = 0.
La exponencial es un difeomorfimo, luego debe ser u̇ = 0 o equivalentemente u(t) = cte = u, y esto nos dice que α(t) = expp (r(t)u), luego α es una
reparametrización de expp (tv) = γp,q (t).
Se tiene la siguiente consecuencia del resultado local de minimalidad de las
geodésicas.
Proposición 9.3.5. Sean (M, g) Riemanniana fuerte y p ∈ M. Existe cp > 0
tal que para todo 0 < r < cp se tiene
expp (Br (0p )) = Br (p),
expp (Sr (0p )) = Sr (p).
Además expp es un difeomorfismo entre variedades en ambos casos.
El Lema de Gauss (Teorema 9.3.2) nos dice que los rayos geodésicos
que emanan de p son ortogonales a las esferas Sr (p).
202
Variedades Riemannianas y pseudo-Riemannianas
Demostración. Tomando cp para que la exponencial esté definida y sea un
difeomorfismo en Bcp (0p ), se tiene que Br (0), Sr (0) son subvariedades de Tp M,
y expp |Br (0p ) , expp |Sr (0p ) son difeomorfismos con su imagen, siempre que 0 <
r < cp . Si vemos que expp es una biyección en cada caso, resultará difeomorfismo.
Si kvkp < r < cp , entonces tomando γ(t) = expp (tv), q = expp (v) se verifica
que γ es minimizante por el Teorema de minimalidad local (Teorema 9.3.4) y
d(q, p) = L(γ) = kvkp < r,
luego expp (Br (0p )) ⊂ Br (p). Recíprocamente, si d(p, q) < r entonces q ∈ Ur (p)
porque cualquier curva que se sale de Ur (p) tiene longitud ≥ r por el teorema de
minimalidad local. Existe entonces una única geodésica γ ⊂ Ur (p) con velocidad
inicial en Br (0p ) tal que q = expp (v), y kvkp = d(p, q) < r, luego vale la otra
inclusión.
La segunda afirmación para Sr (p) tiene una prueba idéntica.
Respecto del Lema de Gauss, sean γ(t) = expp (tv) y q = expp (v), con
d(p, q) = r y w ∈ Tq Sr (p). Tomemos β ⊂ Sr (p) tal que β̇(0) = w, entonces se
tiene f(s) = dg (β(s), p)2 = r2 en un entorno de cero, y tomando para cada s
el vector v(s) = exp−1
p β(s), se verifica kv(s)kp = r, v(0) = v. Derivando f en
s = 0 se obtiene 0 = 2hv, v ′ (0)ip . Pero β(s) = expp v(s), luego w = β ′ (0) =
(expp )∗v v ′ (0), y por el segundo ítem del Lema de Gauss,
hγ̇(1), wi = h(expp )∗v v, (expp )∗v v ′ (0)i = hv, v ′ (0)i = 0.
9.3.3.1.
Variedades Riemannianas débiles
Si consideramos una métrica Riemanniana en la variedad M que sólo sea
acotada superiormente, perdemos la minimalidad de las geodésicas.
Observación 9.3.6. Usamos k · k para denotar la norma del espacio de Banach
E que modela M, y en este caso denotamos
BR (0p ) = {v ∈ Tp M : kvk < R}
a la bola abierta con la topología de E, con R suficientemente pequeño como para
que UR (p) = expp (BR (0p )) sea un entorno normal de p en M. Consideramos las
coordenadas polares de α como en la Observación 9.3.3, donde r = kΓ kp denota
ahora la norma de Γ con la métrica Riemanniana de M.
9.3. Las geodésicas son localmente minimizantes
203
Se tiene el siguiente resultado de minimalidad respecto de curvas que no
salen del entorno normal.
Teorema 9.3.7 (Minimalidad local de las geodésicas, (M, g) Riemanniana débil). Sean p ∈ M, R > 0 como en la observación previa, γp,q la geodésica
del spray que une p, q. Entonces
1. L(α) ≥ L(γp,q ) para toda curva α : [0, 1] → UR (p) admisible que una p
con q.
2. Vale la igualdad en el ítem previo si y sólo si α es una reparametrización de γp,q .
Demostración. Sea Γ = exp−1
p α, entonces Γ (1) = v, con lo cual r(1) = kvkp .
Razonando como en el Teorema 9.3.4, se tiene
L(γp,q ) = kvkp = |r(1) − r(0)| ≤ L(α).
Si L(α) = L(γp,q ) = d(p, q), como α también es minimal, es una geodésica del
spray por el tercer ítem del Corolario 9.2.4, y como α ⊂ UR (p), debe ser una
reparametrización de γp,q . Alternativamente, se puede argumentar que si vale
la igualdad, de (9.12) se deduce que debe ser
r k(expp )∗ru u̇k = 0
para todo t, como r 6= 0 (salvo para t = 0) se deduce que (expp )∗ru u̇ = 0.
La exponencial es un difeomorfimo, luego debe ser u̇ = 0 o equivalentemente u(t) = cte = u, y esto nos dice que α(t) = expp (r(t)u), luego α es una
reparametrización de expp (tv) = γp,q (t).
9.3.4.
Las curvas continuas minimales
En general, sabemos que una curva suave a trozos que es minimal debe ser
una geodésica. Pero este resultado se puede extender a curvas rectificables, lo
cual resulta útil para comparar estos resultados con el Teorema de Hopf-Rinow
métrico (Teorema 7.2.3).
Proposición 9.3.8. Sea (M, g) Riemanniana fuerte. Supongamos que γ :
[0, 1] → M es una curva continua rectificable tal que ℓ(γ) es minimal, es
decir, realiza la distancia Riemanniana entre los extremos. Entonces γ es
una reparametrización de una geodésica corta del spray.
204
Variedades Riemannianas y pseudo-Riemannianas
Demostración. Como todo punto pt = γ(t) tiene un entorno normal de manera
que en un entorno de él la exponencial está definida por lo menos en la bola Brt
del tangente, tomando un cubrimiento de la imagen de γ por entornos normales
y extrayendo un subcubrimiento finito, resulta que existe R > 0 de manera
que, para todo t ∈ [0, 1], expγ(t) está definida en BR (0) ⊂ Tpt M. Tomamos
una partición π = {ti } del [0, 1] de manera que d(γ(ti ), γ(ti+1 )) < R. Basta
probar que γ es una reparametrización de una geodésica minimal en el intervalo
[ti , ti+1 ], ya que en ese caso se obtiene una geodésica a trozos que es minimal,
y por el tercer ítem del Corolario 9.2.4, γ es una geodésica del spray. Sean
p = γ(ti ), q = γ(ti+1 ) y notemos que γ restringida a este intervalo sigue siendo
minimal. Como d(p, q) < R, existe β geodésica minimal que los une. Supongamos
que existe x ∈ γ entre p, q tal que x ∈
/ β. Como d(p, x) = ℓ(γp,x ) ≤ ℓ(γp,q ) < R,
existe una geodésica corta µ1 que comienza en p y termina en x. Análogamente,
como d(x, q) = ℓ(γx,q ) ≤ ℓ(γp,q ) < R, existe una geodésica corta que comienza
en q y termina en r, llamaremos µ2 a esta geodésica pero revertida, es decir, a
la geodésica corta que comienza en x y termina en q. Sea µ = µ2 ♯ µ1 que es
una curva admisible que une p con q. Entonces
L(µ)
=
L(µ1 ) + L(µ2 ) = d(p, x) + d(x, q) = ℓ(γ|p,x ) + ℓ(γ|x,q )
=
ℓ(γ|p,q ) = d(p, q),
lo que prueba que µ es corta. Entonces es una reparametrización de β, luego
x ∈ β, y esto es absurdo.
9.3.5.
La esfera, grupos unitarios y la Grassmanniana
En algunos casos es posible estimar directamente el radio R de minimalidad
del Teorema 9.3.4.
9.3.5.1.
La esfera de un espacio de Hilbert
Ejemplo 9.3.9. Un ejemplo importante donde se pueden calcular los radios de
inyectividad de la exponencial, es la esfera S de un espacio de Hilbert H. Dado
p ∈ S, sea p ′ ∈ M su opuesto. Afirmamos que BR (p) = S − {p ′ } es un entorno
normal de p con las propiedades deseadas, para R = π. En primer lugar, la
exponencial está definida en todo el tangente Tp M, para todo p ∈ S. En segundo
lugar, a partir de la expresión explícita de la exponencial que obtuvimos en la
Sección 6.9,
sen(k)
v
expp (v) = cos(k)p +
k
9.3. Las geodésicas son localmente minimizantes
205
para v ∈ Tp S = span(p)⊥ y k = kvk, no es difícil ver que esta es inyectiva
para k < π, pues p, v son linealmente independientes, de hecho ortogonales.
k cos(k)−sen(k)
, un cálculo sencillo nos dice que
Denotando g(k) = sen(k)
k , h(k) =
k3
⊥
su diferencial en w ∈ Tp M = span(p) es
(expp )∗v w = −g(k)hv, wip + h(k)hv, wiv + g(k)w.
Este es un operador acotado, entre los espacios de Hilbert de la misma dimensión
H0 = span(p)⊥ y H1 = span(expp (v))⊥ . Si fuera (expp )∗v w = 0, haciendo el
producto escalar contra p se obtendría
−g(k)hv, wi = 0.
Como g(k) 6= 0, se deduce que w = 0. Por otra parte, dado z ∈ Texpp (v) S =
1
{cos(k)p+g(k)v}⊥ , entonces tomando r = cos(k)
hv, zi -que está bien determinado
siempre que k < π- aseveramos que
w=
1
(z + g(k)rp − h(k)rv)
g(k)
verifica w ∈ Tp S y exp∗v w = z (Ejercicio 9.ix). Esto prueba que esta aplicación
diferencial es un epimorfismo, y en consecuencia, un isomorfismo.
Ahora, dado q ∈ S − {p ′ }, existe una única geodésica γ del spray que une
p, q, y esta geodésica verifica γ ⊂ S − {p ′ }. Se deduce de aquí que si q ∈ S − {p ′ },
la única geodésica del spray
γp,q (t) = expp (tw) = cos(kwkt)p +
sen(kwkt)
w
kwk
que une p con q (que es un círculo máximo que pasa por p, q) es la única curva
minimal que une p con q y en particular
d(p, q) = L(γp,q ) = kwk < π.
Por otra parte, a partir del hecho de que γp,q (1) = q, un simple despeje nos
muestra que
d(p, q) = kwk = arc cos(hp, qi).
Como S se obtiene como la clausura de S − {p ′ }, se deduce que d(p, p ′ ) = π, y
por otra parte cualquier círculo máximo que una p con q tiene longitud π, lo que
muestra que hay infinitas geodésicas minimales que unen p, p ′ en S (exceptuando
el caso dimH = 2, donde sólo hay dos de ellas).
206
9.3.5.2.
Variedades Riemannianas y pseudo-Riemannianas
El grupo de operadores unitarios
Recordemos que para la métrica invariante a izquierda dada por la norma
Frobenius en el grupo unitario, el spray métrico es exactamente el spray canónico,
luego las geodésicas son grupos a un parámetro. Recordemos también que dados
u, v ∈ U, si ku − vk < 2 existe un único z ∈ g = Aah con kzk < π y v = uez
(aquí y en este ejemplo k · k denota la norma uniforme del álgebra). Por último,
recordemos que si A es un álgebra de von Neumann (por ejemplo si A = Mn (C)),
entonces incluso cuando ku − vk = 2 existe z ∈ Aah de manera que kzk = π
y v = uez . En todo caso el conjunto de los v a los que se puede llegar con los
grupos a un parámetro que parten de v y tienen como exponente elementos de
norma uniforme menor que π, forman un abierto denso en U.
De acuerdo a la caracterización de la diferencial de la exponencial (Lema
4.1.2), si v, w ∈ A se tiene
Z1
d exp∗v (w) =
exp(v + tw) = e(1−t)v wetv dt
dt t=0
0
= ev F(adv)w = [G(adv)w] ev
con F, G : C → C las funciones enteras dadas por
F(λ) =
1 − e−λ
,
λ
G(λ) =
eλ − 1
.
λ
De la última fórmula se deduce que la diferencial es inversible si y sólo si
σ(adv) ∩ {2kπi : k ∈ Z6=0 } = ∅.
En particular, si kzk < π, entonces kadzk ≤ 2kzk < 2π con lo cual r(adz) < 2π y
se tiene que la diferencial es inversible. Luego en el abierto denso {ku − vk < 2} ⊂
U la exponencial en u dada por expu (z) = uez es un difeomorfismo y podemos
aplicar el teorema Riemanniano de minimalidad local.
Sea δ(t) = uetz con u, v, z como antes (kzk ≤ π). Notemos que, como δ̇ = δ z,
entonces L2 (δ) = kzk2 , mientras que que para la métrica de Finsler b = k · k
(dada por la norma uniforme del álgebra) se tiene Lb (δ) = kzk.
Observemos que para x ∈ Mn (C), se verifica
q
1
kxk = máx λi ≤ λ21 + · · · + λ2n = (Tr x∗ x) 2 = kxk2
√
con λi los autovalores de |x| = x∗ x. En el caso de traza infinita, si A = B2 (H)
denota los operadores de Hilbert-Schmidt (ver el Apéndice D.1.3), consideramos
el grupo unitario clásico de Lie-Banach dado por
UHS = {u ∈ U : u − 1 ∈ B2 (H)}.
9.3. Las geodésicas son localmente minimizantes
207
cuyo espacio tangente en la identidad se identifica con los operadores de HilbertSchmidt antihermitianos. Se recomienda ver el libro de Pierre de La Harpe [38]
donde se estudian análogos en B(H) (con H infinito dimensional) de los grupos
de Lie clásicos introducidos en la Sección 3.4. Evidentemente, también se tiene
kxk = máx ≤
λ∈σ(|x|)
∞
X
λ2i
i=1
!1/2
1
= Tr(x∗ x) /2 = kxk2
donde λi es el espectro (discreto) de |x|, que se acumula únicamente en el cero por ser todo operador de Hilbert-Schmidt un operador compacto en B(H).
Luego supondremos asimilado el caso de matrices como caso particular de los
operadores de Hilbert-Schmidt, aunque haya otros aspectos fundamentales de la
teoría donde hay notables diferencias, para los propósitos del próximo teorema
será correcto razonar de esta forma. La propiedad esencial en ambos casos es que
la métrica Riemanniana introducida es acotada.
Por otra parte, para un álgebra C∗ infinito dimensional pero con traza finita
τ (ver el Apéndice D.2.1), supondremos que la misma está normalizada, es decir
que τ(1) = 1. Como una traza es en particular un estado del álgebra, se verifica
kτk = τ(1) = 1, con lo cual se tiene en este caso la desigualdad inversa
1
1
kxk2 = τ(x∗ x) 2 ≤ kx∗ xk 2 = kxk.
Observemos que en este caso la métrica es sólo acotada superiormente.
El siguiente teorema reúne los resultados concernientes a geodésicas minimales en este contexto, conocido como álgebras de operadores con traza. Estos
resultados están adaptados de los trabajos [4, 7] de E. Andruchow y G. Larotonda.
Teorema 9.3.10. Sea U el grupo unitario de un álgebra de operadores con
traza con la métrica invariante a izquierda g2 dada por
hv, wig2 = hu∗ v, u∗ wi2 = Tr(u∗ v(u∗ w)∗ ) = −Tr(v0 w0 )
para v = uv0 , w = uw0 ∈ uAah = Tu U (o bien τ en lugar de Tr en el caso de
un álgebra C∗ con traza finita). Entonces
1. El spray canónico Fu (v) = vu∗ v coincide con el spray métrico.
2. Si u, v ∈ U y ku − vk < 2, existe un único z = log(u∗ v) ∈ Aah tal que
v = uez , y el grupo a un parámetro δ(t) = uetz es la única geodésica
minimal del spray que une v, u. En particular
d2 (u, v) = kzk2 = k log(u∗ v)k2 .
208
Variedades Riemannianas y pseudo-Riemannianas
3. Si el álgebra es de von Neumann finita y ku − vk = 2, existe z ∈ Aah
tal que kzk = π de manera que la curva a un parámetro con velocidad
z es una geodésica corta que une u, v. Esta geodésica no es única.
4. Si el álgebra es finita, entonces el diámetro geodésico de la variedad
Riemanniana (U, g2 ) es exactamente π.
5. Si A = B2 (H) (los operadores de Hilbert-Schmidt) entonces el diámetro
geodésico de (UHS , g2 ) es infinito, y si ku − vk = 2 siempre existe
alguna geodésica corta que los une. Esta geodésica corta no es única:
la cantidad nu,v de exponentes z que se pueden hallar que conecten
u, v depende de la multiplicidad de −2 como valor espectral de u − v,
siendo nu,v = 2 cuando la multiplicidad es 1, y nu,v = ∞ cuando la
multiplicidad es > 1.
Demostración. Que el spray canónico coincide con el spray métrico es la Observación 9.1.5. Si ku−vk < 2, u∗ v tiene un único logaritmo analítico antihermitiano
z, y como −1 ∈ σ(u − v), se tiene kzk < π. La curva δ(t) = uetz es una geodésica del spray que une u con v = uez , y expu (z) = uez es un difeomorfismo
para kzk < π. La prueba de que δ es corta (y en particular kzk2 = d2 (u, v) es
cierto) puede hallarse para operadores de Hilbert-Schmidt en el trabajo [7] de E.
Andruchow y G. Larotonda, mientras que la prueba para álgebras finitas puede
hallarse en el trabajo [4] de Andruchow.
Si el álgebra es de von Neumann, u∗ v tiene logaritmos Borelianos z (ciertamente no únicos), y si ku − vk = 2 se pueden elegir de norma kzk = π (ver la
Sección 4.4.1.1). Como d2 (u, v) = kzk2 ≤ kzk ≤ π para todo u, v, se sigue que el
diámetro geodésico es exactamente π si consideramos u = 1, v = −1, con z = πi,
1
pues kzk2 = Tr(z∗ z) 2 = π.
Si U = UHS , dado M > 0 consideramos cualquier sucesión de números reales
P
{xn } ⊂ ℓ2 que verifique sup |xn | ≤ π y
|xn |2 = M2 . Fijada una b.o.n. {en } del
espacio de Hilbert separable H, sea u = 1,
X
z=
ixn hen , ·iek .
Entonces z es un operador compacto antihermitiano que verifica kzk ≤ π. Pero
pP
|xn |2 = M, en particular z es un operador de Hilbertademás kzk2 =
z
Schmidt. Sea v = e ∈ UHS . Entonces d(1, v) = kzk2 = M lo que prueba que el
diámetro del grupo es infinito.
Si u, v ∈ UHS verifican ku − vk = 2, podemos suponer que u = 1 por la
invariancia de la métrica. Sea x operador de Hilbert-Schmidt tal que v = 1 + x.
9.3. Las geodésicas son localmente minimizantes
209
Entonces v − u = v − 1 = x es un operador de Hilbert-Schmidt con kxk = 2.
Como kv − 1k = 2 es equivalente a −1 ∈ σ(v), esto a su vez es equivalente a
−2 ∈ σ(v − 1) = σ(x) (y 2eit ∈
/ σ(x) para t 6= π pues σ(v) ⊂ S1 ). Como el
espectro de x sólo se puede acumular en cero, −2 es un punto aislado de σ(x)
(de hecho, un autovalor con multiplicidad geométrica finita). Sea p0 el proyector
asociado al autoespacio del autovalor −2, este debe ser un proyector de rango
finito. Entonces, como 1 + x = v es unitario, y x es compacto, debe ser
X
x = −2p0 +
(eiθk − 1)pk
k≥1
donde pk son proyectores disjuntos asociados a los autoespacios de autovalor eiθk
(|θk | < π) del operador v, y además {pj }j≥0 son disjuntos y suman la identidad,
P
es decir j pj ξ = ξ para todo ξ ∈ H. También se tiene
v =
=
x + 1 = 1 − 2p0 +
−2p0 +
X
X
(eiθk − 1)pk
k≥1
iθk
(e
k≥1
− 1)pk +
X
pj = −p0 +
j
X
eiθk pk .
k≥1
Como x es Hilbert-Schmidt, debe ser
X
X
∞>
|eiθk − 1|2 =
2(1 − cos(θk )).
k
k
Definimos
z = z0 + zi = πip0 +
X
iθk pk .
k
Entonces z es un operador compacto y autoadjunto, con ez = v, de hecho kzk =
π, mientras que
X
kzk22 =
|θk |2 + π2 .
Como θk → 0 (pues el espectro de x se acumula en cero) entonces existe una
constante C > 0 tal que 1 − cos(θk ) ≥ C|θk |2 para k ≥ k0 , probando que
kzk2 < ∞, es decir que z es un operador de Hilbert-Schmidt. Luego δ(t) = etz
es una geodésica corta de UHS . La multiplicidad de los posibles z tales que
ez = v se sigue del siguiente hecho: elegimos una base {ei }i=1...n del rango de
p0 , y escribimos
n
n
X
X
p0 =
ei ⊗ ei =
hei , ·iei .
i=1
i=1
210
Variedades Riemannianas y pseudo-Riemannianas
Entonces la componente z0 = πip0 de z puede cambiarse por
z0′ = πi
n
X
i=1
(−1)αi ei ⊗ ei
′
donde αi = ±1. Como e±πiei ⊗ei = −ei ⊗ ei , se tiene ez0 = −p0 para cualquier
base del rango de p0 , para cualquier elección de los αi , lo que nos dice que hay
infinitas elecciones de z posibles, luego hay infinitas curvas cortas que unen 1
con v en UHS . La única excepción es cuando n = 1, en ese caso hay sólo dos
posibles elecciones de z0′ que son ±e1 ⊗ e1 , luego hay sólo dos posibles elecciones
de z.
Observación 9.3.11. Hay un detalle importante para remarcar del teorema previo. En el caso de métricas acotadas (matrices y operadores Hilbert-Schmidt), el
teorema de minimalidad local (Teorema 9.3.4) nos dice que en el entorno de la
identidad dado por
B = {ev : v∗ = −v, kvk2 < π}
las curvas cortas que unen u ∈ B con la identidad son geodésicas (grupos a
un parámetro de la exponencial), puesto que kvk < kvk2 < π garantiza que la
exponencial es un difeomorfismo; además este entorno es óptimo desde el punto
de vista del Teorema 9.3.4, pues si admitimos que kvk2 = π, podemos hallar v
tal que exp∗v no es inversible (basta tomar v = π e ⊗ e con e ∈ H de norma
unitaria). Sin embargo el teorema previo asegura el resultado para el abierto
denso
W = {ew : w∗ = −w, kwk < π} = {u ∈ U : ku − 1k < 2},
y cabe notar que la inclusión B ⊂ W es estricta.
9.3.5.3.
El grupo de unitarios con la norma uniforme
Ahora estamos interesados en la curvas cortas del grupo unitario pero para la
métrica de Finsler b inducida por la norma uniforme, que no es una métrica
Riemanniana. Afirmamos que se trata nuevamente de los grupos a un parámetro.
Aquí U denota el grupo unitario de un espacio de Hilbert de dimensión finita o
infinita.
Teorema 9.3.12. Si δ(t) = uetz con kzk ≤ π y u, v ∈ U, entonces
Lb (δ) = kzk ≤ Lb (α) =
Z1
0
kα̇kdt
9.3. Las geodésicas son localmente minimizantes
211
para toda curva α ⊂ U admisible que una u con v, y en particular
db (u, v) = kzk.
Demostración. Observemos en primer lugar que −z2 ≥ 0 por ser z∗ = −z.
En el caso finito dimensional, tomamos el autovector de −z2 correspondiente al
autovalor kz2 k = kzk2 , y lo normalizamos para obtener ξ ∈ H unitario tal que
−z2 ξ = kzk2 ξ.
En el caso infinito dimensional, se puede hallar un autovector normizante y
unitario de la siguiente manera: tomando un estado ρ ∈ S(A) tal que ρ(−z2 ) =
kz2 k = kzk2 , construimos la representación GNS del álgebra inducida por ρ
y consideramos ξ = [1] ∈ H. Como muestra el Lema B.3.17 del Apéndice, se
verifica también −z2 · ξ = kzk2 ξ. Sea γ = δ · ξ, entonces como δ(t) es unitario
para todo t, se tiene γ ⊂ S, la esfera del espacio de Hilbert H. Observemos que
γ̇(t) = uzetz · ξ, luego si usamos k · kH para denotar la norma del espacio de
Hilbert
kγ̇(t)k2H = −hz2 etz · ξ, etz · ξi = −hz2 · ξ, ξi = kzk2 kξk2H = kzk2 ,
con lo cual LS (γ) = kzk ≤ π. Derivando nuevamente γ se tiene
γ̈(t) = uetz z2 · ξ = −kzk2 γ = −LS (γ)2 γ,
luego γ es una geodésica de la esfera con longitud menor o igual a π y por
ende minimal. Si α era cualquier otra curva uniendo u, v ∈ U, y consideramos
β(t) = α · ξ, se tiene que β debe ser por lo menos tan larga como γ, y entonces
kzk = Lb (δ) = LS (δ · ξ) ≤ LS (α · ξ) =
Z1
0
kα̇ · ξkH ≤
Z1
0
kα̇k = Lb (α).
Este resultado se debe a C. J. Atkin [14, 15], donde el autor prueba el mismo
junto con otros resultados similares para el grupo ortogonal y los grupos unitario
y ortogonal simplécticos, usando técnicas introducidas por Putnam y Wintner
en [59, 60] sobre logaritmos de operadores ortogonales en B(H). Cabe mencionar
que la prueba que presentamos es una variación de la de Atkin, introducida por
Porta y Recht en el contexto de la Grassmanniana [58]; en ese contexto, en forma
independiente, N. Salinas obtiene el mismo resultado y da una estimación de la
relación entre la distancia geodésica y la distancia lineal [65].
212
9.3.5.4.
Variedades Riemannianas y pseudo-Riemannianas
El grupo de unitarios con una norma simétrica
Un caso que contiene al de la sección previa y al de los operadores de HilbertSchmidt, es el siguiente. Dada una norma simétrica k·kI en B(H) (seguimos aquí
la notación del Apéndice D.1.2) podemos considerar la métrica en el álgebra de
Lie del grupo de operadores unitarios dada por
kvku = ku∗ vkI = kvkI
para v ∈ Tu U. Se considera en el caso infinito dimensional el grupo unitario
UI = {u ∈ U : u − 1 ∈ I}
y este resulta grupo de Lie-Banach cuya álgebra de Lie-Banach son los operadores
antihermitianos de I.
Al igual que en los casos anteriores, es clave considerar la bola de radio π
en la norma uniforme, puesto que allí la exponencial es un difeomorfismo.
Por ser la norma unitariamente invariante, el spray canónico del grupo Fu (v) =
vu∗ v es compatible con la métrica y las geodésicas son nuevamente los grupos a
un parámetro. Se tiene el siguiente teorema, cuya prueba puede hallarse en un
trabajo de J. Antezana, G. Larotonda y A. Varela [11].
Teorema 9.3.13. Si u, v = uez ∈ U con z ∈ I, consideramos la geodésica
δ(t) = uetz . Entonces
1. Si kzk ≤ π, la geodésica es minimal entre sus extremos.
2. Dados u, v ∈ UI existe z ∈ I tal que kzk ≤ π y v = uez .
3. Si la norma simétrica es estrictamente convexa (Observación 8.4.2),
para kzk < π (equivalentemente, para ku − vk < 2) esta geodésica es
única.
4. La multiplicidad de geodésicas uniendo u, v con ku−vk = 2 se computa
como en el último ítem del Teorema 9.3.10.
Este resultado es excepcional porque según veremos en la Sección 9.4, es
usual que en dimensión infinita no existan geodésicas minimales que unan puntos
suficientemente lejanos.
9.3.5.5.
La Grassmanniana
Dado un proyector autoadjunto, y un ideal simétricamente normado I ⊂
B(H) podemos considerar la Grassmanniana dada por la órbita
OI (p) = {upu∗ : u ∈ UI }.
9.4. Existencia global de geodésicas cortas
213
En el caso en que I son los operadores de Hilbert-Schmidt, esta se conoce como Grassmanniana de Sato o Grassmanniana reducida. En ese caso, la variedad fue estudiada por Z. Kovarik en [46], y los autores prueban allí que si
kupu∗ − vpv∗ k < 2, entonces la única geodésica que une estos puntos (ver 6.9.6)
es minimal para la norma de Hilbert-Schmidt. En un trabajo reciente, Andruchow y Larotonda [7] extienden este resultado a toda la Grassmanniana de Sato,
probando que si la distancia uniforme lineal es exactamente 2, existen infinitas
geodésicas cortas que unen upu∗ con vpv∗ (comparar con el Teorema 9.3.10). Se
prueba también en [7] un resultado análogo para las normas p de Schatten, con
p ≥ 2. A partir del resultado enunciado en el Teorema 9.3.13, no es difícil deducir un resultado análogo para la Grassmanniana, el cual dejamos como ejercicio
(9.iv).
Teorema 9.3.14. Sea z∗ = −z ∈ I, p un proyector autoadjunto de B(H),
δ(t) = etz pe−tz . Entonces
1. Si kzk ≤ π, la geodésica es minimal entre sus extremos cuando se la
mide con la norma k · kI .
2. Dados u ∈ UI , existe z ∈ I tal que kzk ≤ π y u = ez , y por ende dados
dos puntos p, q en OI (p) existe siempre una geodésica corta que los
une. Esta es única si kq − pk < 1 y la norma simétrica es rotunda.
3. La multiplicidad de geodésicas uniendo p, q con kp−qk = 1 se computa
como en el último ítem del Teorema 9.3.10.
9.4.
Existencia global de geodésicas cortas
En esta sección probamos que, en dimensión finita, existen geodésicas cortas
siempre que la variedad sea completa, reforzando así el teorema de Hopf-Rinow
métrico. El primer resultado en esa dirección es el siguiente teorema, de interés
independiente, con una prueba adaptada del libro de Lang [47].
Teorema 9.4.1. Sea (M, g) Riemanniana, conexa y de dimensión finita.
Supongamos que existe p ∈ M tal que D(expp ) = Tp M. Entonces para todo
q ∈ M existe una geodésica del spray corta que une q con p.
Demostración. Tomamos c suficientemente pequeño como para garantizar las
condiciones de la Proposición 9.3.5. Sea q ∈ M, si q ∈ Bc (p) el resultado queda
probado por esa proposición. Supongamos entonces que q ∈
/ Bc (p), es decir
214
Variedades Riemannianas y pseudo-Riemannianas
d(q, p) > c. Como M tiene dimensión finita y expp (Sc (0p )) = Sc (p), este último
es compacto y por ende existe al menos un punto r ∈ Sc (p) tal que
d(q, r) = d(q, Sc (p)),
es decir un punto que minimiza la distancia de q a la esfera Sc (p). Sea v ∈
Tp M, kvkp = 1 tal que expp (cv) = r. Afirmamos que γ(t) = exp(tv) es una
geodésica corta que una p con q, para t0 = d(p, q). Es decir, estamos usando
la estrategia de apuntar en la dirección correcta y luego probar que la flecha
alcanza su objetivo. En primer lugar observemos que, para cualquier curva α
que una p con q, esta debe atravesar Sc (p) al menos una vez, digamos en un
instante t1 , luego
L(γ) = L(γ[0,t1 ] ) + L(γ[t1 ,1] ) ≥ c + d(Sc (p), q) = d(p, r) + d(r, q).
Entonces d(p, q) ≥ d(p, r) + d(r, q), y como la otra desigualdad siempre vale, se
tiene d(p, q) = d(p, r) + d(r, q). Sea J ⊂ [0, d(p, q)] el conjunto de los t tales que
d(p, q) = t + d(γ(t), q).
(9.13)
Como 0 ∈ J y d es continua, J es cerrado y no vacío. Sea m = máx J, si vemos
que m = d(p, q) = t0 entonces el resultado estaría probado pues d(γ(t0 ), q) = 0
implica γ(t0 ) = q. Supongamos que no es así, es decir 0 < m < d(p, q). Sea
x = γ(m) y tomemos δ > 0 pequeño para que Sδ (x) sea difeomorfa con la esfera
del tangente en x, y tal que q ∈
/ Bδ (x). Veremos que m + δ ∈ J lo cual es absurdo
y prueba que m = d(p, q) concluyendo así la prueba del teorema. Para ver que
m + δ ∈ J, repetimos el argumendo precedente. Existe y ∈ Sδ (x) tal que
d(x, q) = d(x, y) + d(y, q) = δ + d(y, q).
Reemplazando m en la ecuación (9.13), tenemos que
d(p, q) = m + d(x, q) = m + δ + d(y, q)
Afirmamos que y = γ(m + δ), y usando la última ecuación esto probaría que
(9.13) vale para m + δ. Se tiene
d(p, y) ≥ d(p, q) − d(y, q) = m + δ,
mientras que si consideramos los segmentos geodésicos del spray que unen p
con x y x con y tienen longitud m y δ respectivamente, luego este camino dado
9.4. Existencia global de geodésicas cortas
215
por dos geodésicas una a continuación de la otra da la distancia entre p e y, y
por el tercer item del Corolario 9.2.4 se trata de una geodésica del spray. Como
coincide en el primer tramo con γ, debe tratarse de γ todo a lo largo de [0, m+δ],
probando que y = γ(m + δ).
Antes de proseguir presentamos un ejemplo para ilustrar cómo puede fallar
el resultado previo en dimensión infinita, extraído de la Tesis Doctoral de J.
McAlpin [50].
Ejemplo 9.4.2. Sea H un espacio de Hilbert de dimensión infinita, {en }n≥0 una
base ortonormal de H. Sea A ∈ B(H) el operador autoadjunto dado por
X
X
A(
xn en ) =
an xn en
n≥0
donde a0 = 1 y an = 1 + 21n para n ∈ N. Entonces es fácil ver que A es
inversible, de hecho kvk ≤ kAvk para todo v ∈ H, y además kAvk = kvk si y
sólo si v ∈ span(e0 ). Sea S ⊂ H la esfera unitaria y sea M = A(S). Entonces
M ⊂ H es subvariedad regular, a la que le damos la métrica Riemanniana como
subespacio de H. Observemos que A fija e0 , −e0 ∈ S, es decir e0 , −e0 ∈ M.
Afirmamos que no existe curva corta que una estos puntos en M. Sea β ⊂ M
que une estos puntos, sea α = A−1 β que es una curva en S que une e0 , −e0 .
Entonces β̇ = Aα̇ y si reparametrizamos α para que tenga velociadad constante
se tiene
kβ̇(t)k = kAα̇(t)k ≥ kα̇(t)k = L(α) ≥ π,
con lo cual dM (e0 , −e0 ) ≥ π. Por otra parte, se tiene la igualdad L(β) = π únicamente si kAα̇(t)k = kα̇(t)k para todo t ∈ [0, 1], puesto que de ser estrictamente
mayor en un t0 el término de la izquierda, por continuidad sería mayor en un
intervalo y entonces L(β) > π. Pero la igualdad sólo es posible si α(t) = λ(t)e0
con λ : [0, 1] → R una función C1 a trozos, con lo cual β = Aα no podría unir
e0 , −e0 en M. En resumen, cualquier curva en M que una estos puntos tiene
longitud estrictamente mayor que π. Veamos que dM (e0 , −e0 ) = π para concluir que no hay ninguna curva corta que los una. Ya tenemos una desigualdad,
probemos la otra. Sea
αn (t) = cos(πt)e0 + sen(πt)en
que es una geodésica corta que une e0 , −e0 en S. Tomemos βn = Aαn . Entonces
βn une e0 , −e0 en M y además
1
kβ˙n (t)k2 = π2 sen2 (πt) + cos2 (πt)(1 + n )2 .
2
216
Variedades Riemannianas y pseudo-Riemannianas
Luego L(βn ) → π, y se deduce que dM (e0 , −e0 ) ≤ π, luego dM (e0 , −e0 ) = π.
En dimensión finita, sin embargo, se tiene el siguiente resultado que se deduce
del Teorema de Hopf-Rinow métrico y el Teorema previo.
Corolario 9.4.3 (Hopf-Rinow en variedades Riemannianas). Sea (M, g) Riemanniana, conexa y de dimensión finita. Son equivalentes:
1. (M, dg ) es un espacio métrico completo.
2. M es geodésicamente completa.
3. Existe p ∈ M tal que D(expp ) = Tp M.
4. Todo conjunto cerrado y acotado de (M, dg ) es compacto.
En cualquiera de estos casos, para todo x, y ∈ M existe una geodésica corta
del spray que los une.
Demostración. Las implicaciones 1 ⇒ 2 ⇒ 3 las probamos en la Proposición
8.2.1, para variedades de Finsler sin restricciones de dimensión. Supongamos que
vale 3. para algún p ∈ M, sea C ⊂ M un conjunto cerrado y acotado. Existe
r > 0 tal que C ⊂ Br (p). Por el Teorema 9.4.1, para cada punto x ∈ C hay una
geodésica corta γx (t) = expp (tvx ) que comienza en p y termina en x, es decir
r > d(x, p) = L(γx ) = kvx kp .
Entonces C ⊂ expp (Br (0p )) y como M tiene dimensión finita Br (0p ) ⊂ Tp M es
compacto con lo cual C es un cerrado dentro de un compacto y en consecuencia
compacto.
Ahora supongamos que vale 4. y sea {xn } ⊂ M de Cauchy. Entonces está en
un conjunto acotado y cerrado de M, digamos en Br (xn0 ). Luego la sucesión
{xn } tiene un punto de acumulación, que puede verse fácilmente que es el límite
de la sucesión. Esto concluye la prueba de las equivalencias.
Si vale cualquiera de las hipótesis equivalentes, en particular (M, dg ) es de
métrica interior, localmente compacto y completo. Por el Teorema de HopfRinow métrico 7.2.3, sabemos que existe una curva γ continua que une x con y,
que es corta para la métrica db , es decir ℓ(γ) = db (x, y). Por la Proposición 9.3.8,
una simple reparametrización de γ nos da la geodésica del spray corta que une
x con y. También se puede argumentar notando que como M es geodésicamente
completa, se puede aplicar el Teorema 9.4.1.
9.5. Convexidad local
9.5.
217
Convexidad local
En esta sección refinamos el resultado de los entornos normales, para probar
que dado p ∈ M, para c suficientemente pequeño, en una variedad Riemanniana
(M, g), la bola Bc (p) es convexa. Las pruebas que daremos de estos resultados
se remiten a la Tesis de McAlpin del año 1965 [50], aunque los resultados son
anteriores.
Tomamos como siempre un entorno normal de p ∈ M de la forma (U, W) de
manera que G(U × BR (0)) ⊃ W × W con lo cual W ⊂ U, W ⊂ UR (p) para todo
p ∈ W. Seguimos mayormente la exposición del libro de Lang [47, VIII, §5].
En un espacio de Hilbert (de hecho, en un espacio normado estrictamente convexo), las rectas tangentes a una esfera permanecen del lado externo de
esta esfera. Este resultado tiene su análogo en variedades Riemannianas, en la
siguiente proposición. Supondremos en esta sección que la métrica g es acotada.
Proposición 9.5.1. Sea p ∈ (M, g) Riemanniana fuerte. Existe c0 > 0 tal
que si 0 < r ≤ c0 , y γ es una geodésica tangente a Sr (p) en t = t0 , entonces
γ permanece fuera de Sr (p) para t en un entorno de t0 .
Demostración. Elegimos c como en la Proposición 9.3.5 para que la exponencial
en p sea un difeomorfismo expp : Br (0) → Br (p) para 0 < r < c. Reparametrizando asumiremos que t0 = 0, y podemos escribir γq,u (s) = expq (su) con
q ∈ Sr (p), u 6= 0 ∈ Tq M. Para s cerca de cero, γ está dentro de Bc (p) luego
podemos calcular
wq,u (s) = exp−1
p (γq,u (s)) ∈ Tp M.
Sea fq,u (s) = kwq,u (s)k2p , entonces f(0) = r2 y afirmamos que es mayor que r
para s cerca de cero, si r es suficientemente pequeño. Calculamos
1/2f ′
q,u (s)
1/2f ′′ (s)
q,u
′
= hwq,u (s), wq,u
(s)ip ,
′
′′
= kwq,u
(s)k2p + hwq,u (s), wq,u
(s)ip .
′′
Sea h(q, u) = 1/2fq,u
(0), definida en TU para U entorno de p suficientemente
pequeño, y resulta una función continua (usando que la variedad es por lo menos
de clase C2 ).
Tomando r = 0, es decir q = p, la curva γ comienza en p luego wp,u (s) = su,
con lo cual fp,u (s) = s2 kuk2p lo que nos dice que h(p, u) = kuk2p > 0 así que
hp = h(p, ·) es definida positiva en Tp M. Por la continuidad de h en TM, existe
un entorno de {p} × Tp M donde hq es definida positiva, es decir h(q, u) > 0
si u 6= 0 ∈ Tq M. Tomemos c0 > 0 tal que Bc0 (p) esté dentro de ese entorno.
218
Variedades Riemannianas y pseudo-Riemannianas
Fijado r ≤ c0 y q ∈ Sr (p) = expp (Sr (0p )), llamemos ws = wq,u (s) y como γ es
tangente a Sr (p) en q, se tiene que w es tangente a Sr (0p ) en w0 . Luego
1/2f ′ (0)
= hw0 , w0′ ip = 0.
Como 1/2f ′′ (0) = h(q, u) > 0, se tiene que
d(p, γ(s))2 = f(s) > f(0) = r2
para s suficientemente pequeño.
Como corolario, se obtiene la convexidad de las bolas para radios suficientemente chicos.
Teorema 9.5.2. Sean p ∈ (M, g) y (U, W) entorno normal de p. Sea r > 0
tal que Br (p) ⊂ U. Existe c1 > 0 tal que si 0 < r ≤ c1 y β ⊂ U es la geodésica
corta que une q, q ′ ∈ Br (p), entonces β ⊂ Br (p) y en particular Br (p) ⊂ M
es convexa.
Demostración. Sea β ⊂ U, que une q, q ′ ∈ Br (p), β(t) = expq (tz) y
kzkq = d(q, q ′ ). Tomemos c pequeño tal que expp (Bc (0p )) = Bc (p) como en
la Proposición 9.3.5, sea c1 = c/2. Afirmamos que si 0 < r ≤ c1 , entonces
β ⊂ Uc (p) = Bc (p). De no ser así, existe t0 ∈ (0, 1) tal que d(β(t0 ), p) ≥ c.
Sean γq , γq ′ geodésicas cortas que emanan de p tales que
L(γq ) = d(q, p) < r,
L(γq ′ ) = d(q ′ , p) < r.
Si β∗ denota la curva β revertida, es decir β∗ (t) = β(1 − t), sean
γ1 = β|[0,t0 ] ♯ γq ,
γ2 = β∗ |[0,1−t0 ] ♯ γq ′ ,
que resultan dos curvas admisibles que emanan de p y salen de Bc (p). Por el
teorema de minimalidad local (9.3.4), L(γi ) ≥ c. Entonces
c ≤ L(β|[0,t0 ] ) + L(γq ) < L(β|[0,t0 ] ) + r
y también
c ≤ L(β|[1,t0 ] ) + L(γq ′ ) < L(β|[1,t0 ] ) + r.
Sumando estas dos desigualdades se tiene que
2c ≤ L(β) + 2r < L(β) + 2c1 = L(β) + c,
9.6. Curvatura seccional
219
es decir c < L(β). Pero esto es absurdo pues L(β) = d(q, q ′ ) ≤ d(q, p) +
d(p, q ′ ) < 2r ≤ 2c1 = c. Como β ⊂ Bc (p), podemos considerar w : [0, 1] → Tp M
dada por la expresión ws = exp−1
p β(s). Observemos que para cada s,
Uc (p) ∋ β(s) = expp (1ws )
y kws k < c < R, luego γs (t) = expp (tws ) es la única geodésica corta que une p
con β(s), con lo cual
f(s) = d(p, β(s))2 = L(γs )2 = kγ˙s (t)k2γs (t) = kws k2p .
Afirmamos que f(s) < r2 para todo s ∈ [0, 1], lo que concluiría la prueba del
teorema. De no ser así, existe s0 ∈ (0, 1) donde f alcanza su máximo absoluto,
f(s0 ) = δ ≥ r2 . Debe ser entonces f ′ (s0 ) = 0, y derivando la última ecuación en
s = s0 deducimos que hws0 , ẇs0 i = 0, es decir β es tangente a la esfera Sδ (p)
en s = s0 . Por la proposición previa, β está estrictamente fuera de Sδ (p) para s
cerca de s0 , contradiciendo la maximalidad de s0 .
9.6.
Curvatura seccional
En esta sección estudiamos la relación entre el tensor de curvatura y la métrica, que nos define la curvatura seccional de la variedad. Veremos como esta
controla la diferencial de la exponencial y los campos de Jacobi.
Dada (M, g) Riemanniana, p ∈ M y un plano bi-dimensional π ⊂ Tp M,
queremos definir una cantidad que sólo depende del plano, que puede pensarse,
ya que la exponencial en p es un difemorfismo local expp : B → Up , como la
curvatura seccional de la superficie bi-dimensional
Mπ = expp (B ∩ π) ⊂ M.
Si v, w ∈ π, el área del paralelogramo generado por v, w está dada por
q
A(v, w) = kvk2 kwk2 − hv, wi2p .
Esta cantidad es positiva y no nula si v, w son linealmente independientes por
la desigualdad de Cauchy-Schwarz. Definimos
Rp : {π ⊂ Tp M con π un 2-plano} → R
de la siguiente manera. Sean v, w ∈ π linealmente independientes. Entonces
Rp (π) = −
hRp (v, w)v, wip
.
A(v, w)2
220
Variedades Riemannianas y pseudo-Riemannianas
Lema 9.6.1. La cantidad Rp (π) no depende de la base de π que elijamos.
En particular podemos suponer que v, w son ortonormales y en ese caso
Rp (π) = −hRp (v, w)v, wip .
Demostración. Si v1 , v2 ∈ π son linealmente independientes y x, y ∈ π también
son linealmente independientes, entonces existen a1 , a2 , b1 , b2 ∈ R tales que
x = a1 v1 + a2 v2 , y = b1 v1 + b2 v2 .
Identificamos (π, h·, ·i) con R2 con el producto interno usual. Entonces
A(x, y)
= k(a1 v1 + a2 v2 ) × (b1 v1 + b2 v2 )k
= |a1 b2 − b1 a2 |kv1 × v2 k = |a1 b2 − b1 a2 |A(v1 , v2 ).
Por otra parte,
hR(x, y)x, yi =
2
X
i,j,k,l=1
ai ak bj bl hR(vi , vj )vk , vl i.
Por el Lema 9.3.1, la última expresión se anula si k = l, luego debe ser k 6= l.
Por otra parte, como R(w, z) = −R(z, w), también se anula si i = j, luego debe
ser i 6= j. Por último, la identidad de Bianchi nos permite deshacernos de los
términos cíclicos y es un ejercicio (Ejercicio 9.viii) ver que
hR(x, y)x, yi = |a1 b2 − b1 a2 |2 hR(v, w)v, wi.
En consecuencia usaremos la notación secπ para denotar la curvatura seccional de la subvariedad generada por el plano π ⊂ Tp M.
9.6.1.
Curvatura de grupos lineales y espacios homogéneos
En esta sección calculamos la curvatura seccional de los ejemplos que desarrollamos en la Sección 6.9 y en la Sección 9.1.2.
9.6.1.1.
La esfera de un espacio de Hilbert
Comenzamos con la esfera S de un espacio de Hilbert H. Se tiene para todo
x, y, z ∈ Tp S = span(p)⊥
Rp (x, y)z = hy, zix − hx, ziy.
9.6. Curvatura seccional
221
Luego si π = span(x, y) ⊂ Tp S, y suponiendo sin pérdida de generalidad que
x ⊥ y, se tiene
secπ = − hhy, xix − hx, xiy, yi = hx, xihy, yi = 1.
Es decir, la esfera tiene curvatura seccional constante = 1. No es difícil ver que
si tomamos la esfera SR ⊂ H de radio R > 0, su estructura es similar con la
diferencia de que su curvatura seccional es exactamente 1/R.
9.6.1.2.
El spray métrico del grupo de inversibles
El spray obtenido en (9.6) nos permite calcular la curvatura, apelando a la
fórmula (9.10), obteniéndose la siguiente expresión para el tensor en g = 1 (hemos usado reiteradas veces la identidad de Jacobi para simplificar la expresión):
4R1 (x, y, z)
=
[z, [x, y]] + [z, [x∗ , y∗ ]] + [z∗ , [x∗ , y]] + [z∗ , [x, y∗ ]] (9.14)
+[z, [x, y∗ ]] + [z, [x∗ , y]] − [x, [y∗ , z]] − [y, [z, x∗ ]].
En cuanto a la curvatura seccional, no aporta en principio mayor información,
al ser una expresión que es posible reescribir de muchas formas gracias a la
ciclicidad de la traza. ¿Es posible identificar subvariedades de curvatura seccional
con signo constante? Como veremos en las próximas secciones, el grupo unitario
tiene curvatura positiva mientras que los operadores positivos tienen curvatura
negativa.
9.6.1.3.
El grupo unitario
Si nos restringimos al grupo unitario o a los operadores positivos e inversibles,
el spray métrico coincide con el spray canónico F(v) = vg−1 v (g ∈ G, v ∈ A
un álgebra C∗ ). Entonces el tensor de curvatura se reduce por los cálculos del
capítulo previo a
g−1 Rg (x, y, z) = −1/4[[g−1 x, g−1 y], g−1 z].
Es fácil ver que, por ser la métrica invariante a izquierda, la curvatura es la
misma en cualquier punto del espacio homogéneo, luego podemos suponer que
g = 1, y se tiene
R1 (x, y)z = −1/4[[x, y], z].
Esta expresión también puede obtenerse apelando a (9.14), usando que x, y, z
son antihermitianos y apelando a la identidad de Jacobi.
Si x, y son ortonormales, y π = span(x, y), se tiene
secπ
=
=
−hR1 (x, y)x, yi2 = 1/4h[[x, y], x], yi2
∗
1/4Tr([[x, y], x]y
).
(9.15)
222
Variedades Riemannianas y pseudo-Riemannianas
Como x, y ∈ Aah , se tiene
secπ = −1/4Tr([[x, y], x]y) = 1/2Tr(−xyxy + x2 y2 ).
Pero
Tr(xyxy) = Tr(xy(yx)∗ ) = hxy, yxi2 ≤ kxyk2 kyxk2 ,
por la desigualdad de Cauchy-Schwarz, y por otra parte es fácil ver que
kyxk22 = kxyk22 = Tr(x2 y2 ),
se tiene nuevamente por C-S
2secπ = Tr(−xyxy + x2 y2 ) = −hxy, yxi + kxyk22 ≥ 0.
Esto nos dice que la curvatura del grupo unitario es no negativa, y de hecho es
fácil ver que para que sea nula debe ser xy = yx, pues debe valer la igualdad en la
desigualdad de Cauchy-Schwarz. Luego tenemos subvariedades planas (conocidas
como flats) para cada familia de operadors que conmutan, y por ejemplo si
estamos en dimensión finita y U es el grupo unitario de las matrices n × n, la
dimensión maximal de los flats es n, que corresponde a considerar el álgebra
abeliana maximal dada por las matrices unitarias diagonales respecto de una
base ortonormal fija. En el lenguaje de espacios simétricos, esta cantidad se
conoce como el rango del espacio. Es decir rango(U) = n donde n = dim H.
Una referencia fundamental en este contexto de espacios simétricos es el libro de
S. Helgason [40].
9.6.1.4.
Operadores positivos inversibles
Supongamos ahora que estamos en el espacio de operadores positivos e inversibles M = G+
A . Cabe aquí distinguir dos casos sutilmente distintos. El primero
compete a la discusión de las dos secciones previas, y es cuando pensamos a este
espacio como subvariedad del grupo de inversibles, con el spray métrico. En ese
caso, dados x, y, z Hermitianos, el tensor de curvatura en g = 1 se computa de
(9.14) obteniéndose
R1 (x, y)z = −7/4[[x, y], z].
Luego, con una cuenta similar a la efectuada en (9.15), recordando que con
nuestra convención sec difiere de R en un signo, obtenemos
+
2/7secGA
π
= Tr(xyxy − x2 y2 ) = hxy, yxi − kxyk22 ≤ 0
para todo π ⊂ T1 G+
A = Ah . Esta curvatura es nula si y sólo si xy = yx.
9.6. Curvatura seccional
223
El otro caso, corresponde a considerar a la variedad de operadores positivos
e inversibles con la métrica dada por
kvka = ka−1/2 va−1/2 k2 ,
según lo discutimos en la Sección 8.4.3. Aquí usamos la norma Frobenius (o la
norma de Hilbert-Schmidt, ver la Sección 9.3.5.2) para computar la norma del
+
vector trasladado; a ∈ G+
A , v ∈ Ta GA al igual que antes. Esto es,
hv, wia = hga v, wi2
donde ahora ga v = a−1 va−1 . Apelando a la ecuación (9.3), es fácil ver que en este
caso el spray coincide con el spray canónico Fa (v) = va−1 v que introdujimos en
la Sección 6.9.5.2. Luego se aplican las consideraciones allí hechas, y en particular
tenemos la expresión para la curvatura dada por
R1 (x, y)z = −1/4[[x, y], z]
y con una cuenta idéntica a la recién hecha deducimos que en este caso también
la curvatura es no positiva. Veremos (Teorema 9.7.4) que esta condición es en
general equivalente a la condición de curvatura semi-negativa en el contexto de
variedades de Finsler con spray.
Observemos que si bien en ambos casos la curvatura es no positiva, las geometrías no coinciden ya que, en el segundo caso las geodésicas son los grupos a
un parámetro, luego se describen como β(t) = aetv , así que la única geodésica
que une a, b ∈ G+
A está dada por
β(t) = a exp(t ln(a−1 b)) = a1/2 (a−1/2 ba−1/2 )t a1/2 .
Notar que esta curva está íntegramente contenida en G+
A (lo cual es esperable
pues es la geodésica de una conexión métrica definida allí). La geometría de este
caso hace que la posición relativa de G+
A en GA sea buena.
No ocurre lo mismo en el primer caso: de acuerdo a la ecuación (9.9), las
tv∗ t(v−v∗ )
e
.
geodésicas que pasan por a ∈ G+
A se describen como α(t) = ae
Notemos que por el teorema de Hopf-Rinow, como las geodésicas están definidas
para todo t ∈ R, dado b ∈ G+
A existe una de estas que una a, b en el grupo GA .
Para que esta curva sea un grupo a un parámetro aetz , debe ocurrir que z = v
(esto se deduce derivando en t = 0). Pero etx ety = et(x+y) sólo es posible si x, y
conmutan, lo cual equivale a que v sea normal; entonces v = ln(a−1 b) es normal
o equivalentemente a−1 b es normal y a su vez esto equivale a que b conmuta con
a (Ejercicio 9.xii). Dejamos también como ejercicio (9.xiii) verificar que α∗ = α
solamente en el caso especial recién mencionado, luego esta curva en general no
+
permanece dentro de G+
A , es decir GA no es geodésicamente convexa en GA
si dotamos a este último del spray métrico que viene de la métrica invariante a
izquierda.
224
Variedades Riemannianas y pseudo-Riemannianas
9.6.1.5.
La Grassmanniana
Como vimos en la Sección 9.1.1.1, el spray que introdujimos en la Grassmanniana no es otra cosa que el spray métrico inducido por la inclusión Gr(p) ⊂ Ah ,
donde consideramos a este último como espacio de Hilbert con la norma Frobenius. Recordemos entonces que (Ejemplo 6.9.6 en la Sección 6.9), dado un
proyector p se tenía la fórmula del tensor de curvatura
Rp (x, y, z) = [[x, y], z].
A partir de este, calculamos, para x ⊥ y ∈ Tp P(A), la curvatura seccional
sec(x, y) dada por
sec(x, y)
=
−hRp (x, y)x, yip = −2Tr(xyxy) + 2Tr(x2 y2 )
=
−2hxy, yxi + 2kxyk22 ≥ 0,
de manera similar al caso de los operadores unitarios y el espacio de operadores
positivos invertibles, obteniéndose sec(x, y) = 0 si y sólo si xy = yx.
9.6.2.
Isometrías y curvatura seccional
Diremos que f : (M, bM ) → (N, bN ) es una isometría local entre variedades
de Finsler si kf∗ VkN = kVkM para todo V ∈ TM y f es un difeomorfismo local.
Diremos que f es una isometría si dN (f(x), f(y)) = dM (x, y) para todo x, y ∈ M.
Proposición 9.6.2. Sea f : (M, bM ) → (N, bN ) una aplicación de clase C1
entre variedades de Finsler. Entonces:
1. Si f es una isometría local, entonces para todo x, y ∈ M se tiene
d(f(x), f(y)) ≤ d(x, y),
mientras que si x, y están suficientemente cerca se tiene la igualdad.
2. Sean M, N Riemannianas fuertes. Si f es una isometría también es
una isometría local.
Demostración. Supongamos que f es isometría local. Sean x, y ∈ M, tomemos
una curva γ ⊂ M tal que L(γ) < d(x, y) + ǫ. Sea β = f ◦ γ, que une f(x) con
f(y) en M. Entonces
d(f(x), f(y)) ≤ L(β) = L(γ) < d(x, y) + ǫ.
9.6. Curvatura seccional
225
Luego d(f(x), f(y)) ≤ d(x, y). Como f es un difeomorfismo local podemos revertir
el argumento para probar que
d(x, y) = d(f−1 f(x), f−1 f(y)) ≤ d(f(x), f(y))
si x, y están suficientemente cerca. Supongamos ahora que f es una isometría,
sea V = (p, v) ∈ TM, sea α ⊂ M una geodésica tal que α ′ (0) = V. Entonces para
t pequeño en el dominio de α se tiene
Zt
k(f ◦ α) ′ kf◦α dt ≥ d(f(α(t)), f(p)) = d(α(t), p) = Lt0 (α) = tL(α) = tkvkp
0
Rt
Luego kvkp ≤ 1t 0 k(f ◦ α) ′ kf◦α dt, y haciendo tender t → 0+ se tiene kvkp ≤
kf∗p vkf(p) . Ahora revertimos el argumento, sea β ⊂ N una geodésica tal que
β ′ (0) = f∗p v, sea α = f−1 β. Entonces
Zt
0
kα ′ kα dt ≥ d(α(t), p) = d(β(t), f(p)) = Lt0 (β) = tL(β) = tkf∗p vkf(p) ,
y nuevamente dividiendo por t y haciendo tender t a cero se tiene la desigualdad
opuesta.
9.6.2.1.
Variedades planas
Una variedad Riemanniana se dice plana cuando RM ≡ 0. En ese caso es
localmente isométrica a un espacio de Hilbert, como muestra el siguiente resultado.
Teorema 9.6.3. Sea (M, g) Riemanniana y completa. Supongamos que
R ≡ 0. Entonces localmente la diferencial de la exponencial es el transporte
paralelo y por ende una isometría, y expp : Tp M → M es un difeomorfismo
isométrico local para todo p ∈ M. Si M es simplemente conexa entonces es
isométricamente isomorfa a su espacio tangente.
Demostración. Sea γ ⊂ Br (p) una geodésica (r pequeño) con γ(0) = x, γ̇(0) =
v. Si R ≡ 0, entonces el único campo de Jacobi η ∈ Lev(γ) a lo largo de γ tal
que η(0) = 0, Dγ ′ η(0) = w ∈ Tx M está dado por η(t) = tP(γ)t0 w puesto que
Dt η = P(γ)t0 w + 0
y entonces D2t η = Dt P(γ)t0 w = 0 = R(γ̇, η)γ̇. Por otra parte, por el Teorema
6.8.4, se tiene que η(t) = (expp )∗tv tw luego la diferencial de la exponencial
226
Variedades Riemannianas y pseudo-Riemannianas
coincide con el transporte paralelo y resulta así una isometría local. Si M es
simplemente conexa, entonces podemos aplicar el Teorema de Cartan-Hadamard
(Corolario 8.5.5) para concluir que expp : Tp M → M es un difeomorfismo, y por
el primer item de la proposición previa resulta una isometría global.
9.6.2.2.
Campos de Jacobi versus curvatura
En esta proposición se hace explícita la relación entre los campos de Jacobi
a lo largo de geodésicas y la curvatura seccional de una variedad Riemanniana
(M, g), a través de las derivadas de la norma del campo.
Proposición 9.6.4. Sean (M, g) Riemanniana débil, α(t) = expp (tv) una
geodésica de M y η ∈ Lev(α) un campo de Jacobi. Sea f(t) = kηk. Entonces:
1. Para aquellos t tales que η(t) 6= 0, se tiene
f ′ (t) =
f ′′ (t) =
y
1
hDt η, ηi,
kηk
1
1
(kDt ηk2 kηk2 − hDt η, ηi2 ) +
hR(α̇, η)α̇, ηi,
3
kηk
kηk
f ′′ (t) ≥ −
1
secπ (α̇, η)A(α̇, η).
kηk
2. Si η(0) = 0 y η̇(0) = w ∈ Tp M, entonces f es derivable tres veces en el
origen, siendo
f ′ (0) = kwkp ,
f ′′ (0) = 0,
f ′′′ (0) =
1
hRp (v, w)v, wip .
kwkp
Demostración. Las expresiones de f ′ , f ′′ son inmediatas de la compatibilidad de
la métrica y la definición de campo de Jacobi. La desigualdad para f ′′ se obtiene
utilizando la definición de curvatura seccional y la desigualdad Cauchy-Schwarz:
kDt ηkkηk ≥ |hDt η, ηi|.
Las derivadas en el origen se calculan recordando que en una carta, η(t) =
tw + o(t2 ).
9.7. El teorema de Cartan
9.7.
227
El teorema de Cartan
En esta sección probamos la equivalencia entre curvatura seccional no positiva, y la propiedad curvatura semi-negativa de la diferencial de la exponencial
(Sección 8.5), obteniendo como corolario el teorema clásico de Cartan para variedades Riemannianas.
Definición 9.7.1. Sea (M, g) Riemanniana. Diremos que M tiene curvatura
seccional no positiva (secM ≤ 0) si secπ ≤ 0 para todo π que sea un 2-plano en
Tp M, para todo p ∈ M.
Corolario 9.7.2. Si (M, g) es Riemanniana débil, y secM ≤ 0, entonces
para todo p ∈ M, para todo v ∈ Dom(expp ) y para todo w ∈ Tp M, se verifica
k(expp )∗v wkexpp (v) ≥ kwkp
y además (expp )∗tv tw no se anula en (0, 1].
Demostración. Sea α(t) = expp (tv), tomamos η el único campo de Jacobi a
lo largo de α tal que η(0) = 0, Dt η(0) = w. Por el Teorema 6.8.4 que da la
identificación entre η(t)/t y la diferencial de la exponencial, tenemos que probar
que kη(t)k ≥ tkwk, y que η(t) 6= 0 para todo t ∈ (0, 1]. De no ser así, supongamos
que η se anula en tn ∈ (0, 1] con tn → 0. Entonces
w = η̇(0) = lı́m η(tn )/tn = 0
n
lo cual es absurdo. La otra posibilidad es que exista t0 > 0 que es el mínimo
de los t ∈ (0, 1] donde η se anula. Como la curvatura de M es no positiva, por
la proposición previa se tiene que en el intervalo (0, t0 ) la función f es convexa,
es decir f ′′ ≥ 0. Por otra parte, como f ′ (0) = kwkp > 0, se deduce que f es
creciente en [0, t0 ) y como f(0) = 0 se tiene un absurdo pues f no se anulaba en
(0, t0 ).
Sea h(t) = kη(t)k − tkwk para t ∈ [0, 1]. Entonces aplicando la fórmula
de la Proposición 9.6.4 en el intervalo [0, 1] tenemos que h ′ (t) = f ′ (t) − kwk,
h ′′ (t) = f ′′ (t) ≥ 0. Como h ′ (0) = f ′ (0) − kwkp = 0, h también es creciente y se
tiene la conclusión.
9.7.1.
La adjunta de la diferencial de exp
En esta sección supondremos que (M, g) es Riemanniana débil.
228
Variedades Riemannianas y pseudo-Riemannianas
Lema 9.7.3. Sea (M, g) pseudo-Riemanniana, p ∈ M y α(t) = expp (tv) con
v ∈ Dom(expp ) y q = α(1). Sea P el transporte paralelo a lo largo de α y
sea v ′ = −Pv ∈ Tq M. Entonces si w ∈ Tp M, z ∈ Tq M, se verifica
h(expp )∗v w, ziq = hw, (expq )∗v ′ zip ,
y si P∗ indica el transporte paralelo desde 1 hasta 0, entonces
hP∗ (expp )∗v w, P∗ zip = hw, (expq )∗v ′ PP∗ zip ,
luego el operador adjunto de P∗ (expp )∗v es (expq )∗v ′ P.
Demostración. Sea η el único campo de Jacobi a lo largo de α tal que η(0) = 0,
η̇(0) = w, y sea ξ el único campo de Jacobi a lo largo de α tal que ξ(1) = 0 y
ξ̇(1) = z. Derivando
g(t) = hDt η, ξi − hη, Dt ξi
se deduce que
g ′ (t) = hR(α̇, η)α̇, ξi + hDt η, Dt ξi − hDt η, Dt ξi − hη, R(α̇, ξ)α̇i = 0
por el Lema 9.3.1. Entonces g(t) = C = cte, luego g(1) = g(0), y se tiene
g(0) = hw, ξ(0)i − hη(0), Dt ξ(0)i = hw, ξ(0)ip .
puesto que η(0) = 0. Por otra parte, considerando la curva revertida α∗ (t) =
α(1 − t), el campo ξ∗ (t) = ξ(1 − t) es el único campo de Jacobi a lo largo de α∗
tal que ξ∗ (0) = 0, ξ̇∗ (0) = −Dt ξ(1) = −z, luego
ξ(0) = ξ∗ (1) = (expq )∗v ′ z,
y como
g(1) = 0 − hη(1), Dt ξ(1)i = h(expp )∗v w, ziq ,
se tiene el resultado.
9.7.2.
Curvatura no positiva
Recordemos que en el contexto de variedades de Banach-Finsler (Sección 8.5)
definimos curvatura semi-negativa via la diferencial de la exponencial (Definición
8.5.3). Probamos aquí la equivalencia en el contexto Riemanniano de esa noción
con la de curvatura seccional no positiva. Nuevamente supondremos que g es
acotada superiormente, es decir que (M, g) es Riemanniana débil.
9.7. El teorema de Cartan
229
Teorema 9.7.4. Sea (M, g) Riemanniana débil. Entonces M tiene curvatura
seccional no positiva si y sólo si es una variedad de curvatura semi-negativa.
Es decir secM ≤ 0 si y sólo si para todo p ∈ M, para todo v ∈ Dom(expp ) y
para todo w ∈ Tp M, el operador (expp )∗v : Tp M → Texpp (v) M es invertible y
se verifica
k(expp )∗v wkexpp (v) ≥ kwkp .
Demostración. Supongamos primero que M tiene curvatura seminegativa. Sea
p ∈ M, v, w ∈ Tp M. Si α(t) = expp (tv) y η es el único campo de Jacobi a lo
largo de α tal que η(0) = 0, η̇(0) = w, se tiene por hipótesis
f(t) = kη(t)kα(t) ≥ tkwkp
donde f es la función de la Proposición 9.6.4. Sea h(t) = f(t) − tkwkp , entonces
h(t) ≥ 0 en [0, 1], y por la misma proposición se tiene h(0) = h ′ (0) = h ′′ (0) = 0,
mientras que
1
h ′′′ (0) =
hRp (v, w)v, wip .
kwkp
Si fuese sec(v, w) > 0, se tendría h ′′′ (0) < 0, lo cual diría que h es estrictamente
decreciente en un entorno de cero, y esto es absurdo. Luego sec(v, w) ≤ 0, lo
que prueba que secM ≤ 0.
Ahora supongamos que secM ≤ 0. Sea η como antes, por el Corolario 9.7.2
se tiene la desigualdad de la curvatura seminegativa, resta ver que (expp )∗v es
invertible para v ∈ Dom(expp ). Componiendo con el transporte paralelo P a
lo largo de α∗ (t) = α(1 − t), se tiene que T = P(expp )∗v ∈ B(H) donde H =
Tp M es un operador acotado, inyectivo y de rango cerrado por la desigualdad
kTwk ≥ kwk para todo w ∈ H. Resta ver que Ran(T ) = H, o equivalentemente,
como el rango es cerrado, que ker(T ∗ ) = {0}. Pero por el Lema previo, T ∗ es
otra diferencial de la exponencial que por hipótesis es expansiva y por ende
inyectiva.
Tenemos el siguiente corolario, consecuencia de los resultados de la sección
8.5, que nos dice que la exponencial es un revestimiento y vale propiedad EMI
(Teorema 8.5.4 y Corolario 8.5.5).
Corolario 9.7.5 (Teorema de Cartan-Hadamard). Si (M, g) es Riemanniana
fuerte, de curvatura seccional no positiva y geodésicamente completa, entonces la exponencial expp : Tp M → M es un revestimiento para todo p ∈ M.
Si además M es simplemente conexa expp resulta un difeomorfismo.
230
9.A.
Variedades Riemannianas y pseudo-Riemannianas
Problemas
9.I. Si Γ es la forma bilineal asociada al spray métrico de una variedad Riemanniana (M, g), probar la propiedad de compatibilidad de la derivada covariante
de campos (9.1) y la propiedad de compatibilidad de la derivada covariante de
curvas levantadas (9.2) a partir de la identidad (9.4) que define localmente Γ .
9.II. Probar que si (M, g) es de dimensión n < ∞, el espacio de campos suaves
sobre M tiene dimensión n como módulo sobre C∞ (M).
9.III. Probar la fórmula de la derivada covariante para curvas levantadas (9.11)
del grupo de inversibles con su spray canónico.
9.IV. Probar el Teorema 9.3.14 sobre curvas cortas en la Grassmanniana con la
métrica dada por una norma simétrica. Sugerencia: considerar el isomorfismo
p 7→ 2p − 1 entre proyecciones y simetrías, el Teorema 9.3.13 y la Observación
4.6.1.
R1
9.V. Probar que la funcional energía E(γ) = 1/2 0 kγ̇k2γ dt no es independiente
de la parametrización de γ.
9.VI. Probar el Teorema 9.2.5 y el Corolario 9.2.6.
9.VII. Probar la segunda identidad del Lema 9.3.1,
hRp (x, y)x, zig = hRp (x, z)x, yig
para todo x, y, z ∈ Tp M, para todo p ∈ M.
9.VIII. Dado p ∈ M Riemanniana, sean ai , bi ∈ R, vi ∈ π ⊂ Tp M. Probar que,
si x = a1 v1 + a2 v2 , y = b1 v1 + b2 v2 , entonces
hR(x, y)x, yi = |a1 b2 − b1 a2 |2 hR(v, w)v, wi.
9.IX. Probar que si S es la esfera de un espacio de Hilbert con la métrica ambiente
y la conexión de Levi-Civita, entonces la diferencial de la aplicación exponencial
es un difeomorfismo (Ejemplo 9.3.9), en cada entorno {v ∈ Tp S : kvk < π}.
9.X. Sea R > 0 y H un espacio de Hilbert. Sea SR = {v ∈ H : kvk = R}. Calcular
el spray métrico de SR , sus geodésicas y probar que la curvatura seccional de SR
es exactamente 1/R.
9.XI. Probar la expresión de R1 para el grupo de inversibles de un álgebra C∗
dada en la Sección 9.6.1.2.
9.XII. Probar que si x, y ∈ A un álgebra de Banach y etx ety = et(x+y) en algún
entorno de t = 0, entonces x conmuta con y. Probar que si a, b ∈ A es un
9.A. Problemas
231
álgebra C∗ son positivos e inversibles, y a−1 b es normal, entonces a conmuta
con b. Sugerencia: probar que ab es normal y luego su espectro es real.
∗
∗
9.XIII. Probar que si α(t) = aetv et(v−v ) es una curva en A un álgebra C∗ con
a, b = α(1) positivos e inversibles, entonces α(t) = α(t)∗ si y sólo si a conmuta
con b.
9.XIV. Calcular las derivadas primera, segunda y tercera de la función f(t) = kηk,
en la notación de la Proposición 9.6.4 (con las hipótesis del segundo ítem).
¿Existe la derivada cuarta en el origen?
9.A. Problemas
233
234
Variedades Riemannianas y pseudo-Riemannianas
Parte III
Álgebras de Operadores
E
n este apéndice, vamos a presentar los resultados que utilizamos a lo
largo del texto del cálculo funcional en álgebras de operadores (sin restricciones de dimensión), así como resultados sobre funcionales continuas y normas en álgebras de operadores, para poder estudiar los ejemplos
relevantes de estructuras geométricas en espacios homogéneos del grupo de operadores inversibles.
Esencialmente, hay dos clases de álgebras que nos interesan por encima de
las demás, que son las álgebras C∗ y de von Neumann. Una es una subclase de
la otra, ambas son álgebras de Banach. Sea H un espacio de Hilbert complejo,
usemos B(H) para denotar el conjunto de todos los operadores lineales acotados
en H. Si h, i denota el producto escalar de H, y a ∈ B(H), entonces denotamos
con a∗ ∈ B(H) al único operador acotado tal que
ha∗ ψ, ηi = hψ, aηi
para todo ψ, η ∈ H. Esta es la involución usual de B(H). Tiene la siguiente
propiedad fundamental: si k · k denota la norma supremo de operadores acotados
en H, entonces
ka∗ ak = kak2
para todo a ∈ B(H). En particular se deduce de aquí que ∗ es isométrico, kx∗ k =
kxk. Observemos que como
(ab)∗ = b∗ a∗
no se trata de un automorfismo sino de un antiautomorfismo.
La topología fuerte en B(H) se define de la siguiente manera: dados an , a ∈
B(H), decimos que an → a SOT (por Strong Operator Topology) si an ξ → aξ
para todo ξ ∈ H -como vectores de H con la norma del espacio de Hilbert-. Es
decir, es la topología de convergencia puntual.
La topología débil en B(H) se define de la siguiente manera: dados an , a ∈
B(H), decimos que an → a WOT (por Weak Operator Topology) si han ξ, ηi →
haξ, ηi para todo ξ, η ∈ H.
235
Estas topologías son una más débil que la otra, en el sentido siguiente:
(an → a uniformemente ) ⇒ (an → a
SOT)
En efecto, dados ξ, η ∈ H, entonces
⇒ (an → a
WOT) .
|h(an − a)ξ, ηi| ≤ kan ξ − aξkH kηkH ≤ kan − akkξkHkηkH.
En el caso dim H = +∞ estas topologías no coinciden. Una subálgebra involutiva A ⊂ B(H) es una subálgebra sobre C tal que a∗ ∈ A cada vez que a ∈ A.
Diremos que una subálgebra involutiva A es
Un álgebra C∗ cuando A es cerrada para la topología de la norma uniforme.
Un álgebra W ∗ o álgebra de von Neumann si A es cerrada para la topología fuerte.
Se deduce que toda álgebra de von Neumann es un álgebra C∗ . En la definición de álgebra de von Neumann, se puede reemplazar la topología fuerte por la
débil.
Supongamos que H es infinito dimensional y separable. El primer ejemplo
de álgebra C∗ que no es de von Neumann es el álgebra K(H) de operadores
compactos en H, donde por un operador compacto t : H → H entendemos un
operador acotado tal que la imagen de todo conjunto acotado tiene clausura
compacta. Equivalentemente, se consigue K(H) como la clausura en norma uniforme de todos los operadores de rango finito. De hecho, si {ei } es una b.o.n. de
H y pi = ei ⊗ ei son los proyectores unidimensionales asociados, poniendo
Tn =
n
X
pi
i=1
tenemos que cada Tn ∈ K(H) (de hecho, tiene rango finito). Pero si x =
P
y = i yi ei son dos vectores cualesquiera de H, entonces
hTn x, yi =
n
X
i=1
xi yj →
X
i≥1
P
i
xi ei ,
xi yj = hx, yi
lo que prueba que Tn tiende débilmente a la identidad de H, que no es un
operador compacto.
Se pueden definir las álgebras C∗ y de von Neumann de manera abstracta
(que resulta ser equivalente a la definición como operadores en H). En el primer
apéndice introducimos las nociones necesarias para este enfoque.
Apéndice
Álgebras de Banach
S
ea A un álgebra asociativa con identidad 1 sobre C, provista de una
norma k · k que la hace un álgebra de Banach, es decir A es un
espacio de Banach y el producto no sólo es una función conjuntamente
continua, sino que además se verifica la desigualdad siguiente:
kxyk ≤ kxkkyk.
En general supondremos que la identidad del álgebra tiene norma unitaria, es
decir k1k = 1.
A.1.
Álgebras con involución
Sea ∗ : A → A una involución es decir, para todo a ∈ A, se tiene
(a∗ )∗ = a.
Notemos que ∗ es una biyección. Supongamos que es también antiautomorfismo
antilineal, es decir para todo a, b ∈ A, λ ∈ C, se tiene
(λa)∗ = λa∗
(a + b)∗ = a∗ + b∗
(ab)∗ = b∗ a∗ .
Usualmente se dice que A es un álgebra de Banach con involución. Diremos que
A es un álgebra C∗ si la involución verifica
ka∗ ak = kak2 para todo a ∈ A.
237
A
238
Álgebras de Banach
En esta presentación abstracta, un álgebra de von Neumann es una álgebra C∗
que tiene predual (como espacio de Banach). En ese caso, el predual es (salvo isomorfismos) único. Este resultado se debe a S. Sakai, la prueba puede encontrarse
en [64].
Observación A.1.1. Las álgebras de von Neumann se suelen considerar con 1,
en todo caso siempre se puede adjuntar una identidad a un álgebra C∗ de manera
estándar: tomamos la suma directa A˜ = A ⊕ C, que resulta ser un álgebra con
identidad I = (0, 1), con el producto
(a, λ) · (b, µ) = (ab + µa + λb, λµ).
Se le da la norma
k(a, λ)k =
sup
b∈A, kbk≤1
kab + λbk.
Entonces A˜ es un álgebra C∗ y además A ⊂ A˜ es un ideal maximal (en particular cerrado).
A.2.
Cálculo funcional analítico
En un álgebra de Banach B, el espectro σ(a) del elemento a ∈ B se define de
la manera habitual como el conjunto de los λ ∈ C tales que a − λ no es inversible
en B. El complemento de σ(a) es el conjunto resolvente de a, denotado ρ(a).
A.2.1.
Propiedades del espectro
Observación A.2.1. Si µ ∈ C, entonces para todo a ∈ B se tiene
σ(1 − µa) = {1 − µλ : λ ∈ σ(a)}.
Para µ = 0 la afirmación es trivial. Supondremos µ 6= 0. Si λ ∈ σ(a) entonces
1 − µa − (1 − µλ) = µ(λ − a)
lo que prueba que 1−µλ ∈ σ(1−µa). Recíprocamente, si x ∈ σ(1−µa), tomamos
λx = 1−x
µ y se tiene
a − λx = 1/µ[(1 − µa) − x]
lo que prueba que λx ∈ σ(a) y x = 1 − µλx .
Lema A.2.2. Para todo a, b ∈ B,
A.2. Cálculo funcional analítico
239
1 − ab tiene inversa a izquierda (resp. derecha) si y sólo si 1 − ba tiene
inversa a izquierda (resp. derecha).
σ(ab) ∪ {0} = σ(ba) ∪ {0}.
Demostración. El segundo resultado es consecuencia más o menos inmediata
del primero y de la observación previa, y queda como ejercicio. Para ver el primer
resultado, supongamos que c ∈ B es la inversa a derecha de 1 − ab, es decir
(1 − ab)c = 1.
Esto se puede reescribir como abc = c − 1. Se tiene que 1 + bca es la inversa a
derecha de 1 − ba:
(1 − ba)(1 + bca) =
=
1 − ba + bca − babca = 1 − ba + bca − b(c − 1)a
1 − ba + bca − bca + ba = 1.
Para la inversa a izquierda se razona de forma análoga.
A.2.1.1.
Radio espectral
El radio espectral de a ∈ B es
r(a) = máx{|λ| : λ ∈ σ(a)}.
Observemos que r puede anularse sobre elementos no nulos. Por ejemplo, si
H = C2 y
0 1
a=
,
0 0
entonces σ(a) = {0}, con lo cual r = 0, pero a 6= 0. En general, el radio espectral
de cualquier nilpotente (ak = 0 para algún k ∈ N) es nulo. La fórmula
X
x−1 =
(1 − x)n
n≥0
si k1 − xk < 1 tiene la misma prueba que en el caso de matrices. Si b es inversible
y kb − ck < kb−1 k−1 , como
k1 − b−1 ck = kb−1 (b − c)k ≤ kb−1 kkb − ck < 1,
se sigue que b−1 c es inversible y en consecuencia, c es inversible. Luego el conjunto de inversibles es un grupo abierto en B, que denotaremos con GB . Observemos
240
Álgebras de Banach
que si |λ| > kak entonces k aλ k < 1 con lo cual 1 − aλ es inversible o equivalentemente λ−a es inversible lo que nos dice que λ ∈
/ σ(a). Luego σ(a) es un conjunto
acotado, r(a) ≤ kak para todo a ∈ B.
Consideremos g(λ) = a − λ, que resulta ser una función continua g : C → B.
El conjunto
g−1 (GB ) = {λ ∈ C : a − λ es inversible}
coincide con el complemento del espectro de a, es decir ρ(a) = g−1 (GB ), lo que
prueba que la resolvente es abierta, y en consecuencia σ(a) es cerrado; como es
acotado resulta ser compacto. Veremos que es siempre no vacío. Previamente,
probamos un lema que establece que el espectro σ : B → 2C es una función
semicontinua inferiormente en el siguiente sentido:
Lema A.2.3. Sea a ∈ B tal que σ(a) ⊂ Ω con Ω ⊂ C abierto. Entonces
existe ǫ(Ω) tal que kx − ak < ǫ implica σ(x) ⊂ Ω.
Demostración. Si λ ∈
/ σ(a), entonces f(λ) = k(a − λ)−1 k es una función continua, que verifica f(λ) → 0 cuando λ → ∞ pues para λ suficientemente grande
ka/λk < 1 y entonces
k(a − λ)−1 k =
1 X
1
1
k(1 − a/λ)−1 k ≤
.
ka/λkn =
|λ|
|λ|
|λ| − kak
n≥0
En consecuencia, existe M > 0 tal que f(λ) < M para todo λ ∈ C − Ω. Sea
ǫ = 1/M, entonces si x ∈ B verifica kx − ak < ǫ y µ ∈
/ Ω, probaremos que
µ∈
/ σ(x). Se tiene que µ − a es inversible y además
k(µ − a)−1 (x − a)k < f(µ)kx − ak < 1,
con lo cual 1 − (µ − a)−1 (x − a) es inversible y entonces
µ − x = (µ − a) 1 − (µ − a)−1 (x − a)
también es inversible por ser producto de inversibles.
A.2.2.
El grupo de inversibles
Observación A.2.4. Observemos que el producto m : GB × GB → GB
m(x, y) = xy
es una función continua en cada variable, pues
k(x + h)y − xyk = khyk ≤ khkkyk.
A.2. Cálculo funcional analítico
241
Por ser una forma bilineal, resulta continua, por ende diferenciable y de hecho
analítica. Se sigue que la inversión también es analítica.
Es sencillo ver que, como g = T1 G = B, por ser el grupo un abierto en el
álgebra, entonces el corchete de Lie está dado por el conmutador usual, es decir
si v, w ∈ g = B, entonces
[v, w] = vw − wv.
Observemos que aquí los grupos a un parámetro etv están de hecho dados por la
serie de potencias usual de la exponencial, la prueba es que verifican la ecuación
diferencial correspondiente al campo invariante a izquierda
Xv (g) := gv.
Luego exp : B → GB está dada por
v 7→ ev =
X 1
vn ,
n!
n≥0
y la serie converge uniformemente en conjuntos acotados de B. Sea
log : U = {k ∈ GB : kk − 1k < 1} → B
la función analítica dada por la serie de potencias
log(k) =
X (−1)n+1
(k − 1)n .
n!
n≥0
Es fácil ver que elog(k) = k para todo k tal que kk − 1k < 1, y que log(ez ) = z
para todo z ∈ B tal que kzk < log(2). Restringida a U, la exponencial es un
isomorfismo con su imagen, y para cada g ∈ G ponemos
ϕg = log(g−1 k),
definida en el abierto gU ⊂ GB . Entonces (gU, ϕg ) es una carta en GB alrededor
de g ∈ G, y si g, h están suficientemente cercanos entonces los mapas transición
están dados por
ϕh ◦ ϕg−1 (z) = log(h−1 gez ),
lo que prueba que GB es un grupo de Lie-Banach de clase Cω .
242
A.2.3.
Álgebras de Banach
Cálculo funcional de Cauchy
Ahora introducimos el cálculo funcional con una identidad fundamental:
Lema A.2.5. Sea γ una curva simple alrededor del espectro de a, orientada
de forma positiva. Para todo n ∈ N0 , se tiene
I
1
an =
wn (w − a)−1 dw.
2πi γ
Demostración. En la resolvente de a, que como dijimos es un conjunto abierto
en el plano complejo, definimos f : ρ(a) → B como
f(λ) = (λ − a)−1 ,
que es una función continua -de hecho, analítica-. Sea ϕ ∈ B ′ una funcional
continua, consideramos la composición g = ϕ ◦ f : ρ(a) → C, que es una función
genuinamente analítica y por ende holomorfa en ρ(a). Supongamos que |λ| > kak:
entonces por la fórmula de la serie de Neumann,
X
g(λ) = ϕ((λ − a)−1 ) =
λ−1−k ϕ(ak ).
k≥0
Tomando una circunferencia ΓR ⊂ C centrada en el origen y de radio R > kak
nos aseguramos que ΓR ⊂ ρ(a) y que σ(a) ⊂ Int(ΓR ). Podemos entonces calcular,
para cualquier n ∈ N0 , la integral
I
I X
1
1
n
λ g(λ)dλ =
λn−k−1 dλϕ(ak ) = ϕ(an ),
2πi ΓR
2πi ΓR
k≥0
donde el único término que sobrevive es el correspondiente a k = n pues todos
los demás tienen primitiva (estamos usando la fórmula de los residuos). Reemplazando la curva ΓR por una curva cualquiera γ simplemente orientada que tenga
al espectro de a en su interior, tenemos que
I
1
λn g(λ)dλ = ϕ(an ).
2πi γ
pues λn g(λ) es analítica en el interior de la región encerrada por γ y ΓR . Como
esto vale para cualquier ϕ en el dual, se tiene
I
1
an =
λn f(λ)dλ.
2πi γ
A.2. Cálculo funcional analítico
243
Corolario A.2.6. Si a ∈ B, entonces
El espectro σ(a) es un compacto no vacío en el plano complejo.
El radio espectral satisface
1
1
r(x) = lı́m kxn k /n = ı́nf kxn k /n .
n→∞
n≥1
Demostración. Ya probamos que σ(a) es un conjunto compacto. Si fuera vacío,
entonces todas las integrales del lema previo serían nulas (basta componer con
una ϕ del dual y observar que λn ϕ((a − λ)−1 ) es una función entera). Esto es
absurdo, por ejemplo para n = 0 o n = 1. Si z ∈ σ(a), entonces
zn − an = (z − a)q(z, a)
nos dice que zn ∈ σ(an ), luego |zn | ≤ kan k, de donde deducimos |z| ≤ kan k1/n ,
con lo cual
|z| ≤ lı́m ı́nf kan k1/n
n→∞
y tomando supremo sobre z ∈ σ(a) se tiene
r(a) ≤ lı́m ı́nf kan k1/n .
n→∞
Por otra parte, si ponemos M(r) = máx kf(reiθ )k para r > r(a), con f la función
θ
f(λ) = (a − λ)−1 del lema anterior, tenemos por la fórmula integral que
kan k ≤ rn+1 M(r),
con lo cual lı́m sup kan k1/n ≤ r, de manera que
n→∞
lı́m sup kan k1/n ≤ r(a).
n→∞
Ahora
r(a) ≤ lı́m ı́nf kan k1/n ≤ lı́m sup kan k1/n ≤ r(a),
n→∞
n→∞
con lo cual el límite existe y coincide con r(a). Por último, de |z| ≤ kan k1/n
también se deduce que
r(a) ≤ ı́nf kan k1/n ≤ lı́m kan k1/n = r(a).
n→∞
n→∞
244
Álgebras de Banach
Esta función analítica que tuvo gran protagonismo
λ 7→ (a − λ)−1
se conoce como resolvente de a, y se suele denotar f(λ) = Ra (λ).
Consideremos, para a ∈ B, el conjunto
H(σ(a)) = {f : existe un abierto Ω ⊃ σ(a) tal que f es analítica en Ω}.
Notemos que el abierto Ω ⊂ C depende de f. Dada f ∈ H(σ(a)), consideremos
una curva simple cerrada γ : [0, 1] → Ω alrededor del espectro de a, orientada
de forma positiva, y notamos que
t 7→ f(γ(t))(a − γ(t))−1 γ ′ (t) ∈ B
es una función continua. La integral
I
Z
1 1
1
f(w)(w − a)−1 dw =
f(γ(t))(a − γ(t))−1 γ ′ (t)dt
f(a) :=
2πi γ
2πi 0
(A.1)
está bien definida como integral de una curva continua a valores en el espacio de
Banach B, y además no depende de la curva γ. Para convencernos, componemos
con una ϕ ∈ B ′ , y si γ̃ es otra curva con las mismas características, entonces
la diferencia de las integrales -que son ahora integrales de funciones a valores
en C- se puede reescribir -como es habitual- como suma de integrales de curvas
cerradas, y en este caso los integrandos quedan analíticos en los interiores, con
lo cual la diferencia es nula. Esta fórmula se conoce como la fórmula de Cauchy
del cálculo funcional analítico. Tomemos un polinomio
p(z) = αn zn + · · · + α1 z + α0
donde los αi son números reales o complejos. Entonces tiene sentido calcular
p(a) = αn an + · · · + α1 a + α0
para cualquier a ∈ B. Como es habitual, evaluar α0 en el elemento a ∈ A lo
pensamos como el elemento α0 1 ∈ A, donde 1 denota a la identidad del álgebra
A. También seguimos la costumbre de denotar α0 1 directamente como α0 .
Claramente, si γ es cualquier curva simple orientada de manera positiva
alrededor de σ(a), se tiene
I
1
p(w)(w − a)−1 dw
p(a) =
2πi γ
por el Lema A.2.5. Por otra parte, los límites de polinomios dan funciones analíticas. Un resultado que necesitamos para seguir adelante es el teorema de Runge
que recordamos a continuación (la prueba puede encontrarse en cualquier libro
de variable compleja):
A.2. Cálculo funcional analítico
245
Teorema A.2.7 (Teorema de Runge). Sea Ω ⊂ C un abierto contenido en un
compacto K. Si f : K → C es continua y analítica en Ω, existe una sucesión
de funciones racionales rn = pn /qn en K tales que rn → f uniformemente
sobre K.
Si C − K es conexo, existe una sucesión de polinomios pn = pn (z) tales
que pn → f uniformemente sobre K.
En nuestro caso, tomamos f ∈ H(σ(a)) y una curva simple γ que contiene
al espectro de a, contenida en algún entorno abierto del mismo, y consideramos
K = Int(γ), Ω = Int(γ). Si σ(a) es conexo, podemos suponer que Ω y por
ende K es conexo, y se sigue del teorema de Runge que existe una sucesión de
polinomios que aproxima a f en K, en particular en γ. Luego
Z
1
|f(w) − pn (w)|k(w − a)−1 kd|γ|
kf(a) − pn (a)k ≤
2π γ
≤ cte. máx |f(w) − pn (w)| → 0.
w∈γ
(A.2)
Esto prueba que la definición de la fórmula de Cauchy es natural para toda
f ∈ H(σ(a)). Si σ(a) no es conexo, el argumento es válido en cada componente
conexa Ki de σ(a), para funciones analíticas definidas en un abierto que contiene
a alguna de las componentes. Terminamos esta sección con un resultado conocido
como teorema espectral para funciones analíticas. El caso general queda como
ejercicio, se deduce del caso para polinomios que probamos a continuación.
Proposición A.2.8. Si p es un polinomio y a ∈ B, entonces
σ(p(a)) = p(σ(a)) = {p(λ) : λ ∈ σ(a)}.
Demostración. Supongamos primero que α ∈ σ(p(a)). Escribimos
Y
p(z) − α = cn
(z − λi )
con λi ∈ C las n raíces del polinomio p − α. Como
Y
p(a) − α = cn
(a − λi )
y p(a) − α no es inversible, al menos uno de los factores -digamos a − λ1 - es
no inversible, es decir λ1 ∈ σ(a). Ahora observemos que p(λ1 ) − α = 0, luego
α = p(λ1 ) con λ1 ∈ σ(a) lo que prueba que α ∈ p(σ(a)). Para ver la otra
inclusión, tomamos p(λ) ∈ p(σ(a)) con λ ∈ σ(a). Escribimos
p(z) = cn zn + · · · + c1 z + c0 ,
246
Álgebras de Banach
luego
p(a) − p(λ) = cn (an − λn ) + · · · + c1 (a − λ) = (a − λ)q(a, λ) = q(a, λ)(a − λ).
Como a − λ no es inversible, concluimos que p(a) − p(λ) no es inversible puesto
que de serlo, si c es su inversa entonces cq(a, λ) resultaría la inversa de a−λ.
Observación A.2.9. Si r(z) = p(z)/q(z) es una función racional en σ(a), entonces q(z) no se anula en σ(a), con lo cual q(a) es inversible lo que prueba que la
definición de
r(a) = p(a)q(a)−1
es natural usando las operaciones del álgebra de Banach (incluyendo la inversión). Luego el teorema de Runge nos dice que si f es analítica en un entorno
de σ(a), existe una sucesión rn de funciones racionales que lo aproxima, y como
tiene sentido calcular rn (a) para todo n ∈ N, se sigue de la fórmula integral de
Cauchy que
kf(a) − rn (a)k → 0
cuando n → ∞.
La prueba del siguiente teorema queda para el lector (Ejercicio A.v).
Teorema A.2.10. Dado a ∈ B, y H holomorfa en un entorno del espectro
de a, se tiene
1. El mapa Ψ : H(σ(a)) → B dado por f 7→ f(a) es un monomorfismo de
álgebras, continuo si en H(σ(a)) consideramos la topología de convergencia uniforme sobre compactos.
2. σ(f(a)) = f(σ(a)) para toda f ∈ H(σ(a)).
A.3.
Rango y radio numérico
En este apéndice estudiamos propiedades del rango y radio numérico de un
elemento de un álgebra de Banach, y su relación con el espectro. Una referencia
fundamental sobre este tema es el libro de Bonsall y Duncan [18]. Para a no nulo
en un espacio de Banach E, definimos
D(a) = {ϕ ∈ E ′ : kϕk = 1, ϕ(a) = kak}.
A.3. Rango y radio numérico
247
Observemos que por el teorema de Hahn-Banach, este conjunto es siempre no
vacío. De hecho, como
(tϕ + (1 − t)ψ)(a) = tϕ(a) + (1 − t)ψ(a)
el conjunto D(a) es un convexo. Con un argumento similar, vemos que es cerrado
en la topología ω∗ de E ′ . Luego es un compacto convexo no vacío.
Observación A.3.1. Notar que si E es un espacio de Hilbert, entonces para x 6= 0
en E la funcional
hx, ·i
ϕx =
kxk
es un elemento de D(x), y por la convexidad estricta de la bola de E, resulta
único.
Si ahora B es un álgebra de Banach con identidad 1, los elementos de D(1)
se denominan estados del álgebra.
Observación A.3.2. Si B = Mn (C) es el álgebra de matrices con la norma
uniforme, podemos considerar, para A ∈ B la descomposición polar dada por
√
A = U|A| con U matriz unitaria y |A| = A∗ A (ver la Sección B.4 para más
detalles). Entonces, si x es un autovector unitario correspondiente al máximo
autovalor de |A|, como este autovalor coincide con k |A| k = kAk, definimos
ϕA (T ) = hUx, Txi
que resulta un elemento de D(A). Notar que si la multiplicidad de kAk como
autovalor de |A| no es simple, entonces D(A) tiene más de un elemento (de hecho
infinitos). En este contexto es fácil ver entonces que
{ϕx = hx, · xi : x ∈ Cn , kxk = 1} ⊂ D(1),
dejamos como ejercicio (A.vi) probar que en realidad
D(1) = {ϕT = Tr(T · ) : Tr(T ) = 1 = kT k1 = Tr|T |}
y por el Lema B.3.12, se tiene
D(1) = {ϕT = Tr(T · ) : T ≥ 0, Tr(T ) = 1}.
Volviendo al caso general, sea S ⊂ B la esfera unitaria de un álgebra de
Banach, es decir
S = {x ∈ B : kxk = 1}.
248
Álgebras de Banach
Dados a ∈ B, definimos para x ∈ S
V(a, x) = {ϕ(ax) : ϕ ∈ D(x)} ⊂ C.
Es un conjunto no vacío, y observemos que si λ ∈ V(a, x) entonces |λ| ≤ kak.
Se define el rango numérico de a ∈ B como
V(a) = ∪x∈S V(a, x) ⊂ C.
Claramente V(a) ⊂ B(0, kak). El radio numérico de a ∈ B es
v(a) = sup{|λ| : λ ∈ V(a)} ≤ kak.
Observemos que V(a, 1) ⊂ V(a) es obvio pero además si λ ∈ V(a) entonces
existen x ∈ S, ϕ ∈ D(x) tal que λ = ϕ(ax). Definimos φ(z) = ϕ(zx) (z ∈ B).
Entonces φ ∈ B ′ pero además φ(1) = ϕ(x) = 1 y kφk = 1; es decir φ ∈ D(1).
Como
λ = ϕ(ax) = φ(a),
se deduce que λ ∈ V(a, 1). En resumen, para todo a ∈ B, V(a, 1) = V(a).
Definición A.3.3. Dado un espacio de Banach E, podemos definir, para T :
E → E lineal y acotado, el rango numérico espacial como
VE (T ) = {ξ(Tx) : x ∈ E, kxk = 1, ξ ∈ D(x)}.
Dado λ ∈ VE (T ), λ = ξ(Tx), podemos considerar ϕ(A) = ξ(Ax). Claramente
ϕ ∈ B(E) ′ , pero además es fácil ver que ϕ ∈ D(T ). Como ϕ(T ) = ξ(Tx) = λ, se
tiene la inclusión VE (T ) ⊂ V(T ) para todo T ∈ B(E). Puede probarse [18, p. 83]
que
coVE (T ) = V(T ),
y por otro lado cuando E es un espacio de Hilbert el Teorema de ToeplitzHausdorff [30] nos dice que VE (T ) es un conjunto convexo, luego para todo
operador T en un espacio de Hilbert H se tiene la igualdad entre rango numérico
y rango numérico espacial.
Observación A.3.4. ¿Qué es el rango numérico de una matriz A ∈ Mn (C)?
Por la Observación A.3.2), se trata del conjunto compacto y convexo del plano
complejo dado por
V(A) = {Tr(TA) : T ≥ 0, Tr(T ) = 1} ,
A.3. Rango y radio numérico
249
y por lo comentado en el último párrafo, también se tiene la igualdad
V(A) = {hAx, xi, kxk = 1}.
Si A es una matriz de 2 × 2, entonces V(A) es una elipse cuyos focos son los
autovalores de A [54] (cabe observar que esta elipse degenera a una línea en el
plano cuyos extremos son los dos autovalores de A cuando A es normal, ver la
próxima sección y los ejercicios).
Lema A.3.5. Si a ∈ B un álgebra de Banach, entonces
1. V(a) es un conjunto compacto, convexo y no vacío de C.
2. σ(a) ⊂ V(a) y r(a) ≤ v(a) ≤ kak.
Demostración. Sea S ′ la esfera unitaria de B ′ con la topología ω∗ y ev : S ′ → C
la evaluación ev(ϕ) = ϕ(a). Esta es una función lineal y continua. Como D(1) ⊂
S ′ es compacto convexo y no vacío, lo mismo vale para
V(a) = V(a, 1) = ev(D(1)).
Veamos 2. Si λ ∈ σ(a), entonces a − λ no tiene inversa a izquierda o no
tiene inversa a derecha. Supongamos que no tiene inversa a izquierda, entonces
J = B(a − λ) es un ideal propio (a izquierda) de B. Se tiene k1 − xk ≥ 1 para todo
x ∈ J pues la bola unitaria alrededor del uno consta de elementos inversibles.
Luego J está dentro de un hiperplano cerrado que no contiene al 1 ∈ B. Por el
teorema de Hahn-Banach, existe ϕ ∈ B ′ tal que ϕ(1) = 1 = k1k y J ⊂ ker ϕ. Es
decir ϕ ∈ D(1) y como ϕ(a − λ) = 0, ϕ(a) = λ lo que nos dice que λ ∈ V(a). Si
a−λ no tiene inversa a derecha, la prueba es idéntica. La desigualdad r(a) ≤ v(a)
es ahora evidente, y ya mencionamos que v(a) ≤ kak.
A.3.1.
El rango numérico y los grupos a un parámetro
En este teorema damos relaciones más finas entre espectro y rango numérico.
Teorema A.3.6. Si a ∈ B un álgebra de Banach, entonces
1
n∈N n
log kena k = lı́m sup 1t log keta k.
1
n∈N n
log ke−ina k = lı́m sup 1t log ke−ita k.
1. máx{Re λ : λ ∈ σ(a)} = ı́nf
2. máx{Im λ : λ ∈ σ(a)} = ı́nf
t→+∞
t→+∞
250
Álgebras de Banach
3. máx{Re λ : λ ∈ V(a)} = sup 1t log keta k = lı́m+ 1t log keta k
t→0
t>0
1
( k1
t>0 t
= ı́nf
+ tak − 1 ) = lı́m+ 1t ( k1 + tak − 1 ).
t→0
4. máx{Im λ : λ ∈ V(a)} = sup 1t log ke−ita k = lı́m+ 1t log ke−ita k
t→0
t>0
1
( k1
t>0 t
= ı́nf
− itak − 1 ) = lı́m+ 1t ( k1 − itak − 1 ).
t→0
Demostración. Veamos 1. Como σ(e ) = exp(σ(a)), se tiene
a
{|µ| : µ ∈ σ(ea )} = {eRe λ : λ ∈ σ(a)}
luego log r(ea ) = máx{Reλ : λ ∈ σ(a)}. Por otro lado
1
log kena k.
n∈N n
log r(ea ) = log ı́nf k(ea )n k1/n = ı́nf
n∈N
Sea f(t) = log keta k, f : R → R. Esta es una función continua pero además es
subaditiva pues
f(t + s) = log keta esa k ≤ log keta kkesa k = f(t) + f(s).
Ciertamente
I = ı́nf
n∈N
1
1
1
f(n) ≤ sup f(n) ≤ lı́m sup f(t) = S.
n
t→+∞ t
n∈N n
Para terminar la demostración del primer ítem, veamos que S = I. Tomemos
1
f(n) < α. Sea
α > I y elijamos n ∈ N tal que n
m = sup{f(r) : n ≤ r ≤ 2n} < ∞.
Dado k ∈ N, tomemos t ∈ [(k + 1)n, (k + 2)n] y por la subaditividad de f,
f(t) ≤ f(kn) + f(t − kn) ≤ kf(n) + m,
luego
kf(n) m
kn
m
+
<
α+ .
t
t
t
t
Si hacemos tender k → ∞, dejando que t permanezca en el intervalo dado, se
tiene kn
t ≤ 1, y deducimos que
1/t f(t)
≤
lı́m sup 1/t f(t) ≤ α,
t→+∞
A.3. Rango y radio numérico
251
lo que prueba la desigualdad que faltaba, S ≤ I. El segundo ítem se deduce del
primero, notando que σ(−ia) = −iσ(a) y entonces
máx{Re λ : λ ∈ σ(−ia)} = máx{Re λ : λ ∈ −iσ(a)} = máx{Im µ : µ ∈ σ(a)}.
Para probar el ítem 3., sea µ = máx{Re λ : λ ∈ V(a)}. Tomemos t > 0, y para
x ∈ S, ϕ ∈ D(x) entonces
ϕ((1 − ta)x) = ϕ(x) − tϕ(ax) = 1 − tλ
con λ ∈ V(a). Entonces
k(1 − ta)xk ≥ |ϕ((1 − ta)x)| ≥ Reϕ((1 − ta)x) ≥ 1 − tµ.
(A.3)
Si a = 0 la afirmación es trivial. Si tomamos 0 < t < kak−1 , se tiene 1 − tµ ≥
1+ta
1 − αkak > 0, y aplicando la desigualdad (A.3) a x = k1+tak
, obtenemos
(1 − tµ)−1 (1 + t2 ka2 k) ≥ (1 − tµ)−1 k1 − t2 a2 k ≥ k1 + tak.
Entonces
k1 + tak − 1 ≤
1t2 ka2 k
tµ + t2 ka2 k
−1=
.
1 − tµ
1 − tµ
Luego
1
µ + tka2 k
1
( k1 + tak − 1 ) ≤ ( k1 + tak − 1 ) ≤
t>0 t
t
1 − tµ
i = ı́nf
para 0 < t < kak−1 . Basta probar que µ ≤ i para obtener, tomando límite, la
primera identidad
µ = ı́nf
t>0
1
1
( k1 + tak − 1 ) = lı́m+ ( k1 + tak − 1 ).
t→0 t
t
(A.4)
Pero si ϕ ∈ D(1) entonces ϕ(a) = 1/t(ϕ(1 + ta) − 1) para todo t > 0, con lo cual
Re ϕ(a) = 1/t(Re ϕ(1 + ta) − 1) ≤ 1/t(|ϕ(1 + ta)| − 1) ≤ 1/t(k1 + tak − 1),
de donde se deduce que µ ≤ i. Ahora vamos a probar la identidad
lı́m
t→0+
1
1
log keta k = sup log keta k = µ.
t
t>0 t
Tomemos t > 0, e iteramos la ecuación (A.3) para obtener
k(1 − ta)n xk ≥ (1 − tµ)n kxk
(A.5)
252
Álgebras de Banach
para todo x ∈ B, para todo n ∈ N. Dividiendo por n! y sumando sobre n, se
deduce que
k exp(1 − ta)xk ≥ e1−tµ kxk.
Cancelando los términos exp(1) = e de ambos lados y tomando x = eta se tiene
etµ ≥ keta k para todo t > 0 con lo cual
sup
t>0
1
log keta k ≤ µ.
t
Ahora, como ke k = k1+ta+o(t2)k ≥ k1+tak−o(t2), y usando que r−1 (r−1) ≤
log(r) para todo r > 0, tenemos
ta
1
t {k1
+ tak − 1} − o(t)
1
≤ log keta k
k1 + tak − o(t2 )
t
para todo t > 0. Luego
1
t {k1
+ tak − 1} − o(t)
1
1
≤ log keta k ≤ sup log keta k ≤ µ.
k1 + tak − o(t2 )
t
t>0 t
para todo t > 0, y haciendo tender t → 0+ en el término de la izquierda y usando
(A.4), obtenemos (A.5). El cuarto ítem se deduce del tercero, de la misma manera
que el segundo se dedujo del primero.
A.3.2.
La relación entre rango numérico y espectro
Dado X ⊂ C, denotamos con co(X) a la cápsula convexa de X,
co(X) = {z ∈ C : z = tµ + (1 − t)λ,
λ, µ ∈ X, t ∈ [0, 1]}.
Como V(a) es convexo (Lema A.3.5), se deduce que co(σ(a)) ⊂ V(a).
Recordemos que x ∈ B es Hermitiano si eitx tiene norma unitaria para todo
t ∈ R (Observación 4.4.3).
Teorema A.3.7. Sea a ∈ Herm(B). Entonces:
1. kak = r(a).
2. mı́n σ(a) = mı́n V(a) y máx V(a) = máx σ(a). En particular r(a) = v(a)
y V(a) = co(σ(a)).
Demostración. Para probar el primer ítem, usamos el desarrollo en serie de
potencias de la función arc sen : [−1, 1] → [−π/2, π/2]:
X
arc sen(x) =
a k xk .
n≥0
A.3. Rango y radio numérico
253
Los ak son reales y positivos. No es difícil probar que la serie converge uniformemente en |x| < 1, y que para x = 1 es convergente y
X
π
arc sen(1) =
ak = .
2
n≥0
Sea b ∈ Herm(B) tal que r(b) < π/2. Entonces r(sen(b)) = sen(r(b)) < 1, y por
el cálculo funcional analítico,
X
b = arc sen(sen(b)) =
ak sen(b)k .
n≥0
Como sen(b) =
ib
e
−ib
−e
2i
y b es Hermitiano, resulta k sen(b)k ≤ 1, con lo cual
X
X
π
kbk ≤
ak k sen(b)kk ≤
ak = .
2
n≥0
n≥0
Para a ∈ Herm(B), si r(a) = 0, tomamos t > 0 y entonces por lo que acabamos
de probar, como r(ta) = r(a)t = 0, se tiene ktak ≤ π/2; haciendo tender
π
. Entonces r(ta) =
t → +∞ se tiene un absurdo. Sea entonces 0 < t < 2r(a)
π −
r(a)t < π/2, con lo cual tkak ≤ π/2. Haciendo tender t → 2r(a)
, se tiene
π
kak
≤
π/2,
luego
kak
≤
r(a)
y
la
otra
desigualdad
vale
siempre.
2r(a)
Para probar 2, usamos el ítem previo y el ítem 3 del Teorema A.3.6: tomamos
t > 0 tal que σ(a + t) ⊂ V(a + t) ⊂ [0, +∞) y calculamos
1
1
log keα(a+t) k ≤ sup log eαka+tk = ka + tk = r(a + t).
α>0 α
α>0 α
máx V(a + t) = sup
Como σ(a + t) ⊂ [0, +∞), se tiene r(a + t) = máx σ(a + t), luego
máx V(a + t) ≤ máx σ(a + t).
Como la otra desigualdad vale siempre en realidad tenemos
máx V(a + t) = máx σ(a + t).
Entonces de V(a) + t = V(a + t) y σ(a + t) = σ(a) + t deducimos que
máx V(a) = máx σ(a).
Ahora usamos que
mı́n V(a) =
=
mı́n V(−(−a)) = mı́n −V(−a)) = − máx V(−a)
− máx σ(−a) = mı́n −σ(−a) = mı́n σ(a).
Luego
mı́n σ(a) = mı́n V(a) ≤ máx V(a) = máx σ(a),
y como V(a) es convexo se tiene la conclusión V(a) = co(σ(a)).
254
Álgebras de Banach
A.4.
Problemas
A.I. Probar las afirmaciones de la Observación A.1.1: la unitización A˜ de un
álgebra C∗ es a su vez un álgebra C∗ y además A ⊂ A˜ es un ideal maximal.
A.II. Probar que todo ideal maximal en un álgebra C∗ es cerrado.
A.III. Si a, b ∈ B un álgebra de Banach, probar que σ(ab) ∪ {0} = σ(ba) ∪ {0}
(ver el Lema A.2.2).
A.IV. Si B es un álgebra de Banach y GB es el grupo de inversibles, dados
v, w ∈ B sean Xv , Xw los correspondientes campos invariantes a izquierda. Si
[v, w] = LXv Xw (1) indica el corchete de Lie usual del grupo, probar que [v, w] =
vw − wv. Probar además que la exponencial abstracta del grupo de Lie coincide
con la serie de potencias de la exponencial usual del álgebra.
A.V. Probar el Teorema A.2.10 del cálculo funcional analítico.
A.VI. Sea B = Mn (C) el álgebra de matrices con la norma uniforme.
1. Probar que toda funcional ϕ del dual de B está realizad por la traza, es
decir existe T ∈ Mn (C) tal que ϕ(A) = Tr(AT ).
2. Probar que kϕk = kT k1 = Tr|T |.
3. Probar que D(1) = {Tr(T ·) : Tr(T ) = 1 = Tr|T |}.
A.VII.
∗
Sea B un álgebra de Banach.
1. Probar que si A ⊂ B es una subálgebra que contiene a la identidad, entonces el rango numérico no depende del álgebra que se mire. Es decir
VB (a) = VA (a) para todo a ∈ A.
2. Un elemento n ∈ B es normal si existen h, k ∈ Herm(B) tales que n =
h + ik y hk = kh. Probar que si n es normal, entonces co(σ(n)) = V(n).
Sugerencia: aplicar la teoría de Gelfand (Lema B.3.1 y Corolario B.3.2) al
doble conmutante del álgebra conmutativa generada por 1, h, k.
Apéndice
Álgebras C∗
C
onsideraremos en este apéndice el cálculo funcional en el caso particular de un álgebra C∗ . Un elemento a ∈ A es autoadjunto o Hermitiano si a∗ = a. Un elemento n ∈ A es normal si n∗ n = nn∗ .
Todo elemento autoadjunto es normal. Comenzamos con las propiedades del
radio espectral para elementos normales.
B.1.
El radio espectral de un operador normal
Proposición B.1.1. Sea a ∈ A un elemento normal en un álgebra C∗ .
Entonces
ka2 k = kaa∗ k = ka∗ ak = kak2
y además
r(a) = kak.
Demostración. Observemos primero que, si x∗ = x, entonces
kxk2 = kx∗ xk = kx2 k.
Ahora notemos que x = aa∗ = a∗ a es Hermitiano, y también que (aa)∗ = a∗ a∗ .
Luego
kaa∗k2 = kaa∗ aa∗ k = kaaa∗a∗ k = ka2 (a∗ )2 k = ka2 (a2 )∗ k = ka2 k2 .
n
Esto nos dice que ka2 k = kaa∗k = ka∗ ak = kak2 . Iterando, obtenemos ka2 k =
n
kak2 para todo n ∈ N. Luego
n
ka2 k
1/2n
255
= kak
B
Álgebras C∗
256
y tomando límite se tiene el resultado, mediante la fórmula del radio espectral
r(a) = lı́mk kak k1/k .
B.2.
Cálculo funcional continuo
Combinando resultados previos, se deduce que si a∗ = a y f es analítica
en un entorno de σ(a), entonces el elemento f(a) es normal, y autoadjunto si
además f(R) ⊂ R. Luego
kf(a)k = máx{|f(λ)| : λ ∈ σ(a)} = kfk∞,σ(a) .
Por el Teorema de Runge (Teorema A.2.7) existe una sucesión de funciones racionales rn (z) que convergen uniformemente sobre σ(a) a la función f. Observemos
que f(a), en este contexto de álgebras C∗ puede calcularse (o incluso definirse)
como
f(a) = lı́m rn (a) ∈ A,
n
donde la convergencia es en el sentido de la norma del álgebra A. Observemos
que el límite existe pues
krn (a) − rm (a)k = k(rn − rm )(a)k = krn − rm k∞,σ(a) ,
con lo cual la sucesión rn (a) ∈ A es de Cauchy y A es un espacio de Banach.
De hecho, si f tiene una expansión analítica
X
f(z) =
αk (z − z0 )k ,
k≥0
entonces
f(a) =
X
αk (a − z0 )k
k≥0
donde la convergencia de la serie es con la norma de A. Ahora supongamos que f
es una función únicamente continua en el compacto σ(a). Enunciamos un caso
particular del teorema de Stone-Weierstrass que será de extrema utilidad. La
demostración puede verse en el libro de Reed-Simon, [62, pág. 103].
Teorema B.2.1 (Teorema de Stone-Weierstrass). Sea K ⊂ C compacto. Si
C(K) denota el álgebra de Banach de funciones continuas a valores complejos sobre K, con la topología de convergencia uniforme, entonces los polinomios en dos variables p = p(z, z) son densos en C(K).
B.2. Cálculo funcional continuo
257
Observación B.2.2. Si adoptamos la convención de que evaluando z en z = a
obtenemos a∗ , tiene sentido calcular p(a, a∗ ) para un polinomio p = p(z, z). Por
ejemplo, si
p(z, z) = 2z2 + 3z + z2 z + z3 ,
entonces
p(a, a∗ ) = 2a2 + 3a + (a∗ )2 a + (a∗ )3 .
Supongamos que a ∈ A es normal, entonces p(a) es normal también, y el álgebra
generada por a, a∗ y la identidad se identifica con los polinomios en dos variables
evaluados en a, a∗ , donde z(a) = a∗ .
Si a = a∗ , en realidad se tiene que p(z, z)|a = q(a) donde q = q(z) es otro
polinomio únicamente en la variable z. Luego si pn → f, entonces
kpn (a) − pm (a)k = kqn,m (a)k = kqn,m k∞,σ(a) = kpn − pm k∞,σ(a) → 0,
con lo cual podemos definir como antes f(a) = lı́m pn (a).
n→∞
Al álgebra C∗ (a) ⊂ A de todas las funciones continuas f ∈ C(σ(a)), evaluadas
en a, la llamamos álgebra C∗ generada por a. Observemos que es un álgebra
C∗ conmutativa, que de hecho por definición coincide con la clausura del álgebra
generada por las potencias de a y la identidad de A.
Lema B.2.3. Sean a = a∗ ∈ A, f, g ∈ C(σ(a)). Entonces:
fg(a) = f(a)g(a) = g(a)f(a), f(a) = f(a)∗ .
kf(a)k = kfk∞,σ(a) .
f(a) es inversible si y sólo si f(λ) 6= 0 para todo λ ∈ σ(a).
σ(f(a)) = f(σ(a)).
Demostración. Las afirmaciones del primer ítem son obvias para polinomios, y
se sigue que valen tomando límite. Lo mismo se puede decir del segundo ítem.
Para ver el tercer ítem, supongamos primero que f no se anula en el espectro
de a. Entonces g = 1/f es una función continua en σ(a). Como fg = 1, obtenemos
f(a)g(a) = g(a)f(a) = 1, lo que prueba que f(a) es inversible.
Recíprocamente, sea λ ∈ σ(a) tal que f(λ) = 0. Si pn es una sucesión de
polinomios que aproxima a f uniformemente en σ(a), sea n(k) tal que
|pn(k) (λ)| < 1/k.
Álgebras C∗
258
Tomamos la sucesión de polinomios qk dada por
qk (x) = pn(k) (x) − pn(k) (λ).
Como kf − qk k∞ ≤ kf − pn(k) k∞ + 1/k, esta sucesión también tiende uniformemente a f en σ(a). Como qk (λ) = 0 para todo k ∈ N, se deduce que
0 ∈ qk (σ(a)) = σ(qk (a)).
Luego ninguno de los qk (a) es inversible. Se deduce que f(a) no puede ser
inversible, pues los inversibles forman un conjunto abierto de A.
Para probar el último ítem, sea β ∈ C. Observemos que f(a) − β es inversible
si y sólo si β ∈
/ σ(f(a)), lo cual ocurre por el ítem previo si y sólo si f(λ) − β 6= 0
para todo λ ∈ σ(a), o equivalentemente si y sólo si β ∈
/ f(σ(a)).
Observación B.2.4. Si f ∈ C(σ(a)) y g ∈ C(f(σ(a))), entonces g ◦ f ∈ C(σ(a)),
y además
(g ◦ f)(a) = g(f(a)).
Esta afirmación es obvia si f, g son polinomios, y luego se deduce el caso general
pasando al límite.
B.3.
Teorema de Gelfand y la representación GNS
Observemos primero que el espacio C(X) de funciones continuas a valores
en C sobre un espacio topológico compacto X, es un álgebra C∗ abeliana, si
lo munimos de la norma supremo y la involución dada por la conjugación. El
teorema del isomorfismo de Gelfand nos da la recíproca de este resultado.
Sea a ∈ A normal, y f ∈ C(σ(a)). Por el Teorema de Stone-Weierstrass,
existe una sucesión de polinomios pn (z, z), tales que pn → f en el compacto
σ(a). Intentamos definir
f(a) = lı́m pn (a, a∗ ) ∈ A,
n
donde la convergencia es en el sentido de la norma del álgebra A, que debiera ser
un operador normal. Pero hay un obstáculo: no podemos probar directamente
que este límite existe, pues no tenemos la fórmula del espectro
σ(f(a)) = f(σ(a))
para elementos que no sean autoadjuntos. Sin embargo, la fórmula es correcta
así como propiedades idénticas a las del Lema B.2.3. En lo que resta de esta
sección veremos como se prueba esto, pasando por un teorema de Gelfand para
álgebras conmutativas que tiene interés independiente.
B.3. Teorema de Gelfand y la representación GNS
B.3.1.
259
El espacio de caracteres
Dada un álgebra de Banach abeliana A, podemos considerar homomorfismos h ∈ A ′ , es decir h(ab) = h(a)h(b), h(1) = 1, también conocidos como
caracteres. No es difícil probar (ver por ejemplo la Sección 4.4 del primer tomo
del libro de Kadison-Ringrose [45]) que todo homomorfismo a valores en C es
continuo. Ponemos
Σ = {h ∈ A ′ : h es un homomorfismo},
conocido como el espacio maximal o espacio de caracteres de A. Le damos
la topología de subespacio de A ′ , y en A ′ consideramos la topología ω∗ , que
es la topología de convergencia puntual. Recordemos que por el Teorema de
Banach-Alaoglu (ver [62, IV.21]), la bola unitaria en A ′ es ω∗ -compacta.
Lema B.3.1. Sea A un álgebra de Banach abeliana. Entonces:
1. Σ es ω∗ -compacto.
2. Si a ∈ A, entonces σ(a) = {h(a) : h ∈ Σ}.
Demostración. Como la topología es la de convergencia puntual, es fácil ver
que un punto límite de elementos en Σ es un homomorfismo, con lo cual Σ
es cerrado y por ende compacto. Si b ∈ A es inversible, y h ∈ Σ, entonces
1 = h(bb−1 ) = h(b)h(b−1 ), con lo cual b ∈
/ ker h. En particular, si a ∈ A y
h ∈ Σ, entonces a − h(a) ∈ ker h, con lo cual h(a) ∈ σ(a). Recíprocamente, dado
λ ∈ σ(a), entonces (a − λ)A es un ideal propio en A, contenido en algún ideal
maximal Aλ . Si tomamos h : A → A/Aλ ≃ C la proyección al cociente, es fácil
ver que h ∈ Σ. Por construcción h((a − λ)) = 0 con lo cual h(a) = λ.
Corolario B.3.2. Sea B un álgebra de Banach arbitraria y sean x, y ∈ B
que conmutan (xy = yx). Entonces
σ(x + y) ⊂ σ(x) + σ(y)
y
σ(xy) ⊂ σ(x)σ(y).
Demostración. Observemos que si x e y conmutan, entonces xn y = xn−1 xy =
xn−1 yx = · · · = yxn para todo n ∈ N. Con un razonamiento análogo, xn yk =
xn yyk−1 = yxn yk−1 = yxn yyk−2 = · · · = yk xn . Luego x, y generan un álgebra
de Banach conmutativa que llamaremos A. Sean
A ′ = {z ∈ B : zw = wz para todo w ∈ A},
A ′′ = (A ′ ) ′ = {a ∈ B : az = za para todo z ∈ A ′ }.
Álgebras C∗
260
Tautológicamente, A ⊂ A ′′ , y además como A es conmutativa, A ⊂ A ′ . Luego
si a ∈ A ′′ , entonces en particular a conmuta con todos los elementos de A, con
lo cual a ∈ A ′ , es decir A ′′ ⊂ A ′ . Resumiendo A ⊂ A ′′ ⊂ A ′ . Si a, b ∈ A ′′ , en
particular b ∈ A ′ y por definición de A ′′ = (A ′ ) ′ se deduce que a y b conmutan,
es decir A ′′ es un álgebra de Banach conmutativa. Afirmamos que
σA ′′ (a) = σB (a)
para todo a ∈ A. Ciertamente σA ′′ (a) ⊃ σB (a) pues A ′′ ⊂ B y una inversa en
A ′′ de a − λ sirve de inversa en B. Recíprocamente, si b ∈ A ′′ y b−1 ∈ B, es
su inversa, se tiene bw = wb para todo w ∈ A ′ , con lo cual wb−1 = b−1 w nos
dice que b−1 ∈ A ′′ . Por último, si Σ es el espacio de caracteres de A ′′ , el ítem 2
del Lema previo nos dice que
σA ′′ (a + b) = {h(a) + h(b) : h ∈ Σ} ⊂ σA ′′ (a) + σA ′′ (b),
σA ′′ (ab) = {h(a).h(b) : h ∈ Σ} ⊂ σA ′′ (a)σA ′′ (b).
B.3.2.
La transformada de Gelfand en C∗ -álgebras
b, donde
La transformada de Gelfand de a ∈ A es la asignación a 7→ a
b
b
a : A → C(Σ) está dada por a(h) = h(a), que es de hecho un homomorfismo. En
el caso en que A es un álgebra C∗ , la transformada de Gelfand es un isomorfismo isométrico. Para probarlo necesitamos algunas herramientas específicas que
condensamos en los siguientes dos resultados que tienen interés per se.
Lema B.3.3. Si A es un álgebra C∗ abeliana, y h ∈ Σ, entonces
1. h(a) ∈ R si a∗ = a.
2. h(a∗ ) = h(a) para todo a ∈ A.
3. h(a∗ a) ≥ 0 para todo a ∈ A.
4. |h(u)| = 1 si u es unitario (uu∗ = u∗ u = 1).
Demostración. Todos los ítems se deducen trivialmente del primero. Para probarlo, podemos suponer que khk = 1. Ponemos h(a) = x + iy con x, y ∈ R y
observemos que para todo t ∈ R se tiene
t2 + kak2
≥ ka2 + t2 k = k(a + it)∗ (a + it)k = ka + itk2
≥ |h(a + it)|2 = x2 + y2 + 2yt + t2 .
Si y 6= 0 se tiene una contradicción.
B.3. Teorema de Gelfand y la representación GNS
B.3.2.1.
261
Invariancia del espectro
Lema B.3.4. Si B ⊂ A es una inclusión de C∗ -álgebras, entonces para todo
a ∈ B se tiene
σB (a) = σA (a).
Demostración. Ciertamente si a −λ tiene inversa en B tendrá inversa (el mismo
elemento) en A. Luego σB (a) ⊃ σA (a). Para ver la otra inclusión, basta probar
que si b ∈ B tiene una inversa b−1 ∈ A, en realidad b−1 ∈ B. Supongamos
primero que b = b∗ . Dada f(t) = t−1 , tiene sentido entonces el cálculo funcional
f(b) efectuado en la C∗ -álgebra A. Por el teorema espectral para autoadjuntos, en
realidad debe ser f(b) ∈ B (por ejemplo porque es límite uniforme de polinomios
en b). En el caso general, dado b ∈ B, supongamos que c ∈ A es su inversa.
Entonces c∗ ∈ A es la inversa de b∗ ∈ B. Es fácil ver que cc∗ es inversible, y
además
bb∗ c∗ c = 1 = c∗ cbb∗ ,
con lo cual c∗ c es la inversa de bb∗ ∈ B. Como bb∗ es Hermitiano, se sigue por
el caso anterior que c∗ c ∈ B. Luego c = (c∗ c)b∗ ∈ B.
B.3.3.
El Teorema de Gelfand
Teorema B.3.5 (Teorema del isomorfismo de Gelfand). Sea A un álgebra C∗
abeliana, y Σ su espacio de caracteres. Entonces la transformada de Gelfand
es un ∗ -isomorfismo isométrico entre A y C(Σ).
b : A → C(Σ) es un morfismo, resulta ∗-morfismo
Demostración. Ciertamente a
por el segundo ítem del Lema B.3.3. Como σ(a) = {h(a) : h ∈ Σ}, tenemos
kb
ak∞ = máx |h(a)| = r(a) = kak,
h∈Σ
pues todo elemento de A es normal. Luego la transformada de Gelfand es un
isomorfismo isométrico con su rango, que resulta cerrado en C(Σ). Para ver que
es sobreyectiva, basta ver que la imagen es densa; esto último es una aplicación
trivial del teorema de Stone-Weierstrass.
Podemos tomar entonces, dado a ∈ A un elemento normal en un álgebra
C∗ arbitraria, el álgebra abeliana generada por a, a∗ y 1, que denotamos C∗ (a).
Es decir, clausuramos en la norma de A a los polinomios en 1, a, a∗ . Para esta
álgebra C∗ abeliana especializamos el Teorema de Gelfand. Observemos que el
Álgebras C∗
262
espectro de a como elemento de A coincide con el espectro de a como elemento
de C∗ (a), y en particular
σ(a) = {h(a) : h es un caracter de C∗ (a)}.
Lema B.3.6. Si Σ es el espacio de caracteres de C∗ (a) con a ∈ A normal, entonces la aplicación h 7→ h(a) es un homeomorfismo entre espacios
topológicos compactos, Σ ≃ σ(a).
Demostración. Que la aplicación es sobreyectiva se deduce de la observación
previa. Que es continua es evidente pues la topología de Σ es la de convergencia
puntual, luego si hn → h en Σ, entonces hn (a) → h(a) in C. Por último, para
cualquier elemento b ∈ C∗ (a), se tiene b = lı́mn pn (a, a∗ ) con pn = pn (z, z)
polinomios, luego si h1 , h2 ∈ Σ entonces
h1 (b) = lı́m h1 (pn (a, a∗ )) = lı́m pn (h1 (a), h1 (a)),
n
n
lo que prueba que h1 = h2 si h1 (a) = h2 (a).
Observemos que si
µ : C∗ (a) → C(σ(a)) = C(Σ)
es el homomorfismo dado por
µ(b)(λ) = h(b) para h ∈ Σ tal que h(a) = λ ∈ σ(a),
este no es otra cosa que la transformada de Gelfand compuesta con el isomorfismo
entre σ(a) y Σ. Hemos probado el siguiente teorema, los detalles quedan como
ejercicio:
Teorema B.3.7. Sea a ∈ A un elemento normal en un álgebra C∗ . La aplicación φ : C(σ(a)) → A dada por φ(f) = f(a) es un isomorfismo isométrico
entre C(σ(a)) y C∗ (a), que preserva la involución en el sentido que
φ(f) = f(a)∗ .
Además se tiene
σ(f(a)) = σ(φ(f)) = f(σ(a)) para toda f ∈ C(σ(a)).
φ(1) = 1.
Si id : σ(a) → σ(a) denota la función identidad, id(z) = z, entonces
φ(id) = a.
B.3. Teorema de Gelfand y la representación GNS
B.3.4.
263
Propiedades del cálculo funcional continuo
Observemos que todo elemento a∗ = a ∈ A tiene su espectro real. En efecto,
φ(id) = a = a∗ = φ(id),
lo que prueba que id = id, y esto sólo es posible si σ(a) ⊂ R. Asimismo, si
u ∈ A es unitario (es decir u∗ u = uu∗ = 1) entonces
φ(1) = 1 = φ(id)φ(id)∗ = φ(id · id) = φ(|id|2 ),
lo que prueba que |z|2 = 1 sobre σ(u), con lo cual σ(u) ⊂ S1 .
B.3.4.1.
Elementos positivos
Un elemento a ∈ A en un álgebra C∗ es positivo si a∗ = a y σ(a) ⊂ [0, +∞),
lo denotamos a ≥ 0.
Lema B.3.8. Sean a, b ∈ A. Entonces
a ≥ 0 sii a = b∗ b para algún b ∈ A.
−kak ≤ a ≤ kak para a = a∗ .
Si 0 ≤ a ≤ b entonces kak ≤ kbk.
Si a ≥ 0 entonces xax∗ ≥ 0 para todo x ∈ A.
Si a ≤ b entonces xax∗ ≤ xbx∗ para todo x ∈ A.
Demostración. Ciertamente, si b ∈ A entonces b∗ b es claramente autoadjunto
y además
σ(b∗ b) = σ(φ(id)φ(id)) = σ(φ(id · id)) = σ(φ(|id|2 )) = |id|2 (σ(a)).
Pero f(z) = |z|2 toma sólo valores reales no negativos en cualquier subconjunto
de C, lo que prueba que σ(b∗ b) ⊂ [0, +∞). Recíprocamente, si a ≥ 0 podemos
√
considerar s(x) = x definida y continua en σ(a), y tomar b = f(a) ∈ A.
Entonces b∗ = b (de hecho, b ≥ 0) y además como s2 = id se tiene
b∗ b = b2 = (s(a))2 = a.
Para ver el segundo ítem, observemos primero que kak − a es autoadjunto. Por
otro lado, σ(a) ⊂ [−kak, kak], luego
σ(kak − a) = {kak − λ : λ ∈ σ(a)} ⊂ [0, 2kak].
Álgebras C∗
264
Esto nos dice que kak − a ≥ 0, o equivalentemente que a ≤ kak. La otra
desigualdad es similar. Para ver el tercer ítem, si 0 ≤ a ≤ b entonces por el ítem
anterior 0 ≤ a ≤ b ≤ kbk. Pero esto nos dice que σ(a) ⊂ [0, kbk], de donde
se deduce que kak ≤ kbk. Para ver el cuarto ítem, denotamos a1/2 a la raíz
cuadrada positiva de a. Entonces
∗
xax∗ = xa1/2 xa1/2 ≥ 0.
El último ítem es una consecuencia trivial del anterior.
B.3.4.2.
Funciones monótonas y convexas de operadores
Una función f : I → R (con I un intervalo de R) se denomina monótona de
operadores si dados a, b positivos con espectro contenido en I, tales que a ≤ b,
se verifica f(a) ≤ f(b). Una función g se denomina convexa de operadores si
para a, b con espectro contenido en I, se verifica
g (1/2a + 1/2b) ≤ 1/2g(a) + 1/2g(b).
No toda función monótona en el sentido usual es monótona de operadores (Ejercicio B.iv). Tal vez el ejemplo más relevante de función monótona de operadores
es f(t) = ts para s ∈ [0, 1].
Teorema B.3.9 (Löwner). Sea I ⊂ R un intervalo y a, b ∈ A tales que
σ(a), σ(b) ⊂ I. Si 0 ≤ a ≤ b, entonces para todo s ∈ [0, 1] se verifica
a s ≤ bs .
Demostración. Usando un argumento con los números diádicos, basta probar el
resultado para s = 1/2 (Ejercicio B.v). Supongamos primero que b es inversible.
Entonces a ≤ b implica
b−1/2 ab−1/2 ≤ 1,
con lo cual kb−1/2 ab−1/2 k ≤ 1, y entonces
b−1/4 a1/2 b−1/4
≤ kb−1/4 a1/2 b−1/4 k ≤ ka1/2 b−1/2 k
=
=
k(a1/2 b−1/2 )∗ (a1/2 b−1/2 )k1/2
kb−1/2 ab−1/2 k1/2 ≤ 1
donde en la segunda desigualdad usamos que si xy es autoadjunto entonces
kxyk = ρ(xy) = ρ(yx) ≤ kyxk
B.3. Teorema de Gelfand y la representación GNS
265
aplicado a x = b−1/4 , y = a1/2 b−1/4 . Esto prueba que b−1/4 a1/2 b−1/4 ≤ 1
o equivalentemente a1/2 ≤ b1/2 . Si b no es inversible, dado ǫ > 0 tenemos
b ′ = b + ǫ > b ≥ a y aplicando el resultado previo a b ′ se deduce que
(b + ǫ)1/2 ≥ a1/2 ,
haciendo tender ǫ a cero se tiene la conclusión.
B.3.4.3.
Los ∗-morfismos
Un ∗-morfismo entre álgebras C∗ es un morfismo de álgebras π : A → B que
preserva la estrella, es decir
π(x∗ ) = π(x)∗
donde por supuesto la estrella de la izquierda es la de A, y estrella de la derecha
es la de B.
Lema B.3.10. Todo ∗-morfismo π : A → B entre álgebras C∗
Preserva el orden, es decir π(a∗ a) ≥ 0 para todo a ∈ A.
Es contractivo kπ(x)k ≤ kxk, en particular continuo.
Demostración. Observemos que
π(a∗ a) = π(a∗ )π(a) = π(a)∗ π(a) ≥ 0.
Ahora como x∗ x ≤ kx∗ xk = kxk2 para todo x ∈ A, luego π(kxk2 − x∗ x) ≥ 0, es
decir 0 ≤ π(x∗ x) ≤ kxk2 π(1) = kxk2 . Luego
kπ(x)k2 = kπ(x)∗ π(x)k = kπ(x∗ x)k ≤ kxk2 ,
que es lo que queríamos probar.
B.3.5.
La representación GNS
Que toda álgebra C∗ abstracta admite alguna representación como una subálgebra uniformemente cerrada de B(H) para algún espacio de Hilbert H es consecuencia de la construcción de Gelfand-Naimark-Segal (GNS), que describimos
brevemente a continuación porque la usaremos en reiteradas ocasiones.
Álgebras C∗
266
B.3.5.1.
Funcionales positivas y estados
Una funcional ρ ∈ A ′ es positiva si ρ(a∗ a) ≥ 0 para todo a ∈ A. A las
funcionales positivas de norma unitaria se les suele decir estados de A y a este
conjunto se lo denota S(A). Este es un conjunto convexo, a los extremales se los
denomina estados puros de A. Si A es una subálgebra de B(H), entonces fijado
η ∈ H, la funcional
a 7→ ρ(a) = haη, ηi
es positiva pues
ρ(a∗ a) = ha∗ aη, ηi = haη, aηi = kaηk2 ≥ 0.
Por otra parte,
|ρ(a)| = |haη, ηi| ≤ kakkηk2
mientras que ρ(1) = kηk2 lo que nos dice que kρk = kηk2 , luego ρ tiene norma
unitaria si y sólo si kηk = 1. De una manera que precisamos a continuación (ver
la representación GNS), todos los estados son de esta forma para algún espacio
de Hilbert H.
Observación B.3.11. Si ρ ∈ A ′ es positiva, entonces ρ es Hermitiana, es decir
ρ(a) ∈ R
para todo a = a∗ . Para verlo basta notar que
ρ(a) = 1/2 [ρ(kak + a) − ρ(kak − a)]
y cada término es positivo pues −kak ≤ a ≤ kak. Se sigue que
ρ(a) = ρ(a∗ )
tomando partes real e imaginaria, es decir si a = x + iy con x, y Hermitianos,
entonces
ρ(x + iy) = ρ(x) − iρ(y) = ρ(a∗ ).
Lema B.3.12. Una funcional ρ : A → C es positiva si y sólo si es acotada
y ρ(1) = kρk.
Demostración. Supongamos primero que ρ es positiva, sea a ∈ A y eiθ ∈ S1
tal que eiθ ρ(a) = |ρ(a)| ≥ 0, sea
h = Re(eiθ a) = 1/2(eiθ a + e−iθ a∗ ).
B.3. Teorema de Gelfand y la representación GNS
267
Entonces h = h∗ y por ende h ≤ khk ≤ kak, con lo cual
kakρ(1) − ρ(h) = ρ(kak − h) ≥ 0.
Pero de aquí se sigue que
|ρ(a)| = ρ(eiθ a) = ρ(eiθ a) = ρ(e−iθ a∗ ) = ρ(h) ≤ ρ(1)kak.
Luego kρk ≤ ρ(1) y ρ es acotada. La otra desigualdad vale siempre.
Supongamos ahora que ρ es acotada y que ρ(1) = kρk; claramente para
ver si ρ es positiva podemos suponer que kρk = 1. Tomemos a ≥ 0, pongamos
ρ(a) = α+iβ y veamos que α ≥ 0 y β = 0. Para s ∈ R positivo y suficientemente
pequeño, tenemos que
σ(1 − sa) = {1 − st : t ∈ σ(a)} ⊂ [0, 1]
pues σ(a) ⊂ R≥0 . Como 1 − sa es autoadjunto, k1 − sak = r(1 − sa) ≤ 1, de
donde se sigue que
0 ≤ 1 − sα ≤ |1 − sα − isβ| = |ρ(1 − sa)| ≤ k1 − sak ≤ 1
lo que nos dice que α ≥ 0. Por otra parte, si definimos Bn = a − α + inβ, para
cada n ∈ N se tiene
kBn k2 = kB∗n Bn k = k(a − α)2 + n2 β2 k ≤ ka − αk2 + n2 β2 .
Luego, si β 6= 0 se tiene una contradicción pues
(n2 + 2n + 1)β2 = |i(n + 1)β|2 = |ρ(Bn )|2 ≤ ka − αk2 + n2 β2 .
Corolario B.3.13. Si A es C∗ -álgebra, entonces
S(A) = {ρ ∈ A ′ : ρ(1) = 1 = kρk}.
Además si a = a∗ y ρ(a) ≥ 0 para todo ρ ∈ S(A), entonces a ≥ 0.
Demostración. Por el lema previo, se tiene la caracterización del espacio de
estados. Por otra parte,
{ρ ∈ A ′ : ρ(1) = 1 = kρk} = D(1),
es decir el espacio de estados coincide con las funcionales normizantes de x =
1 ∈ A (ver la Sección A.3). Luego si a∗ = a y ρ(a) ≥ 0 para todo estado ρ,
entonces V(a) ⊂ [0, +∞), así que σ(a) ⊂ [0, +∞) por el Lema A.3.5.
Álgebras C∗
268
B.3.5.2.
Estados normizantes
Lema B.3.14. Dado a ∈ A normal, existe ϕ ∈ S(A) que es normizante para
a, es decir
|ϕ(a)| = kak.
Demostración. Si a es normal, kak = r(a), luego existe λ ∈ σ(a) tal que |λ| =
kak. Tomamos h0 ∈ Σ -con Σ el espacio de caracteres del álgebra conmutativa
C∗ (a) generada por 1, a, a∗ - tal que h0 (a) = λ, y lo extendemos por HahnBanach a una funcional ϕ en todo A, de norma kϕk = 1. Ciertamente
|ϕ(a)| = |h0 (a)| = |λ| = kak.
Por otra parte, ϕ(1) = h0 (1) = 1 = kϕk, y por el lema previo ϕ es un estado.
B.3.6.
La construcción de Gelfand, Naimark y Segal
Dado a ∈ A no nulo, tomamos un estado ϕ tal que ϕ(a∗ a) > 0. Consideremos
la forma bilineal h , iϕ : A × A → C dada por
hx, yiϕ = ϕ(y∗ x)
p
para x, y ∈ A. Pongamos kxkϕ = hx, xiϕ . Como ϕ es positiva, este es un
número real positivo, y además la forma sesquilineal es definida positiva. En
particular vale la desigualdad de Cauchy-Schwarz, con la misma demostración
que se da en Rn ,
|hx, yiϕ | ≤ kxkϕ kykϕ .
Un detalle importante que usaremos en un momento es el siguiente: si tenemos
una forma bilineal simétrica β, definida positiva, entonces
|β(x, y)| = kxkβ kykβ
sólo puede ocurrir si x = λy, con λ ∈ C. Consideremos el espacio
Nϕ = {x ∈ A : kxkϕ = 0} ⊂ A.
Por la desigualdad de Cauchy-Schwarz, si x ∈ Nϕ , entonces yx, xy ∈ Nϕ para
todo y ∈ A, es decir, Nϕ es un ideal bilátero (propio pues a ∈
/ Nϕ ). Luego, si
Aϕ = A/Nϕ es el espacio cociente, la forma bilineal h, iϕ : Aϕ × Aϕ → C es
no degenerada. El espacio Aϕ es un espacio vectorial con producto interno, si
llamamos Hϕ a su completación con respecto a la norma k · kϕ , se deduce que
Hϕ es un espacio de Hilbert.
B.3. Teorema de Gelfand y la representación GNS
269
Observemos que la aplicación πa : A → B(Hϕ ) dada por x 7→ Lx , donde
Lx · η = xη para η ∈ Hϕ , es una representación del álgebra A. Es decir
πa (x + y) = πa (x) + πa (y),
πa (xy) = πa (x)πa (y)
para todo x, y ∈ A. Además es una ∗ representación, en el sentido que
πa (x∗ ) = (πa (x))∗
para todo x ∈ A. Esta última propiedad no es tan evidente pero se deduce así
hπa (x∗ )η, ξiϕ = ϕ(ξ∗ x∗ η) = ϕ((xξ)∗ η) = hη, xξiϕ = hη, πa (x)ξiϕ .
Por ser πa un ∗-morfismo, se tiene kπa (x)k ≤ kxk para todo x ∈ A, y además
πa (a) = La verifica
kLa · 1k2 = ϕ(a∗ a) > 0
con lo cual la representación es fiel.
Supongamos ahora que ϕ es normizante para a∗ a. Como
q
p
kakϕ = ϕ(a∗ a) = kak2 = kak
la representación preserva la norma de a como vector de Hϕ . Pero además, si
pensamos en el operador La = πa (a) ∈ B(Hϕ ), entonces
kLa · 1k2 = ϕ(a∗ a) = kak2 ,
con lo cual kLa k = kak.
Observación B.3.15. Si elegimos al estado ϕ puro, la representación πϕ es
irreducible. Siempre se puede encontrar un estado puro normizante para a ∈ A
normal.
Observación B.3.16. Como para cada a ∈ A se puede producir un espacio de
Hilbert H y una representación π : A → B(H) que preserva la norma de a,
podemos considerar la suma directa de las representaciones
⊕a∈A πa : A → B(⊕a∈AHa )
que resulta ser fiel. De esta manera A se representa como un álgebra de operadores en un espacio de Hilbert.
Álgebras C∗
270
B.3.6.1.
Vectores normizantes
Si a ≥ 0, podemos tomar un estado tal que ϕ(a) = kak. Repitiendo la
construcción de arriba, tenemos que
Lema B.3.17. Si a ≥ 0, existe ξ ∈ Hϕ de norma unitaria tal que La · ξ =
kakξ.
Demostración. Tomamos como ξ la clase de 1 en Hϕ , que resulta ser un vector
de norma unitaria en Hϕ pues k1kϕ = ϕ(1) = 1. Para cualquier vector ξ de
norma unitaria se tiene, por la desigualdad de Cauchy-Schwarz, que
hLa · ξ, ξiϕ ≤ kLa k = kπa (a)k ≤ kak.
Pero para esta elección particular de ξ se tiene
hLa · ξ, ξiϕ = ϕ(ξ∗ aξ) = ϕ(a) = kak.
Al valer la igualdad en C-S, debe ser La ξ = λξ, luego
λkξk2 = hλξ, ξiϕ = hLa · ξ, ξiϕ = kak
lo que prueba que λ = kak.
B.4.
Descomposición polar
Nuevamente A es un álgebra C∗ . Representando el álgebra A en un espacio
de Hilbert H, recordemos que ker(b) = ran(b∗ )⊥ y que ran(b∗ ) = ker(b)⊥ para
todo b ∈ B(H). Dado a ∈ A, podemos considerar el cálculo funcional
√
|a| := a∗ a,
que tiene sentido siempre pues a∗ a ≥ 0. Luego |a| ≥ 0, además |a| = 0 implica
que a = 0 pues la raíz cuadrada es inyectiva en positivos y a∗ a = 0 implica que
σ(a) = 0 y como a∗ a es autoadjunto, kak = r(a) = 0. Sin embargo,
|a + b| ≤ |a| + |b|
es falso (ver el Ejercicio B.ix).
Tomemos v ∈ H. Entonces
kavk2 = hav, avi = ha∗ av, vi = h|a|2 v, vi = h|a|v, |a|vi = k |a|vk2 ,
de donde se deduce que ker(a) = ker(|a|). Definimos u : ran(|a|) → ran(a) como
u|a|η := aη
B.5. Problemas
271
para |a|η ∈ ran|a|. Esta es una buena definición pues si |a|η = |a|ξ entonces
η − ξ ∈ ker(|a|) = ker(a). Extendemos a u como cero en ran(|a|)⊥ = ker(|a|),
luego u ∈ B(H). Se tiene
ku|a|ηk2 = kaηk2 = haη, aηi = ha∗ aη, ηi = h|a|2 η, ηi = h|a| · |a|η, ηi = k|a|ηk2
pues |a| es autoadjunto. Luego kuξk = kξk para ξ ∈ ran|a|, mientras que u = 0
en el complemento ortogonal. Extendemos a u para que sea una isometría de las
clausuras de los respectivos rangos,
ran(|a|) → ran(a)
para obtener un operador acotado en H = ker |a| ⊕ ran|a|. Un operador con estas
propiedades se conoce como isometría parcial. Equivalentemente, uu∗ u = u, o
bien uu∗ es un proyector, o bien u∗ u es un proyector (en ese caso el otro también
lo es). Algunas propiedades:
Todo proyector es una isometría parcial.
u∗ u se denomina proyector inicial de u.
uu∗ se denomina proyector final de u.
B.4.1.
Descomposición polar
Observemos que, escribiendo cualquier v ∈ H como v = ξ + ψ ∈ ran|a| ⊕
ker |a|, se tiene
u|a|v = u|a|ξ + u|a|ψ = u|a|ξ = aξ = aξ + aψ = av.
Es decir, a = u|a|. Esta fórmula se conoce como descomposición polar de a.
Dado un subespacio S ⊂ H, la notación PS indica el único proyector ortogonal
a (la clausura de) el subespacio S. Dejamos como ejercicio (B.x) algunos hechos
de demostración sencilla.
B.5.
Problemas
B.I. Probar la afirmación de la Observación B.2.4.
B.II. Probar que todo homomorfismo es automáticamente continuo.
B.III. Probar todos los detalles del Teorema B.3.7 sobre cálculo funcional continuo.
B.IV. Probar mediante un ejemplo en M2 (R) que f(t) = t2 no es monótona de
operadores.
Álgebras C∗
272
B.V. Probar que√f(t) = ts es monótona de operadores para s ∈ [0, 1]. Sugerencia:
use que g(t) = t es monótona de operadores y un argumento con los numeros
diádicos.
B.VI. Si ϕ ∈ S(A) es un estado, probar la desigualdad de Cauchy-Schwarz
|ϕ(a∗ b)| ≤ ϕ(a∗ a)1/2 ϕ(b∗ b)1/2
∀ a, b ∈ A.
B.VII. Probar que si el estado ϕ es puro, entonces la representación GNS inducida por ϕ es irreducible.
B.VIII. ∗ Probar que para todo a ∈ A, existe un estado puro normizante para a.
B.IX. Consideramos A = M2 (C), y las matrices
2 0
−1 1
a=
, b=
.
0 0
1 −1
Probar que |a + b| no es ≤ que |a| + |b|.
B.X. Sea a ∈ A una C∗ -álgebra. Si a = u|a| es la descomposición polar de a,
entonces
u∗ u = Pran|a| mientras que uu∗ = Pran(a) .
En general |a|u 6= u|a|.
Empezando con a∗ se tiene a = |a∗ |v donde v es otra isometría parcial.
Si a es normal, entonces |a| = |a∗ |, u = v y |a| conmuta con u.
Podemos siempre extender u a un operador unitario sin perder la propiedad
a = u|a|.
Si a = a∗ , además se tiene que u∗ = u, es decir que u es una simetría.
Observemos que σ(u) ⊂ {−1, 1}.
Si a = −a∗ , se tiene que u∗ = −u, con lo cual σ(u) ⊂ {−i, i}.
Apéndice
Álgebras de von Neumann
E
xtendemos en esta sección el cálculo funcional para operadores en
B(H), considerando funciones Borelianas en la recta. Recordemos que
un álgebra de von Neumann es un álgebra C∗ que es además cerrada
en la topología fuerte (convergencia puntual) de B(H).
C.1.
Cálculo funcional Boreliano
Dado a ∈ B(H), sea W ∗ (a) el álgebra de von Neumann generada por a y
a∗ , que es la clausura fuerte del álgebra C∗ generada por a. Resulta un álgebra
abeliana si a es normal.
En este capítulo, denotaremos con Bor(X) a las funciones Borelianas y acotadas en el espacio X.
C.1.1.
Teorema espectral
Si a es normal, dado ξ ∈ H, y una función f ∈ C(σ(a)), podemos tomar la
funcional lineal
f 7→ hf(a)ξ, ξi
que resulta ser un elemento del dual de C(σ(a)). Por el teorema de Riesz-Markov
(ver por ejemplo [62, Teorema IV.14]), existe una única medida µξ en σ(a) tal
que
Z
hξ, f(a)ξi =
f(t)dµξ (t).
σ(a)
Esta medida se llama medida espectral asociada al vector ξ. Dada una función
g ∈ Bor(C), ponemos
Z
g(t)dµξ (t)
Qg (ξ) =
σ(a)
273
C
274
Álgebras de von Neumann
Supongamos que fn , f ∈ Bor(C), y que fn (x) → f(x) puntualmente y kfn k∞ es
un conjunto acotado. Entonces
Z
[fn (t) − f(t)]dµξ (t) → 0
Qfn (ξ) − Qf (ξ) = hξ, [fn (a) − f(a)]ξi =
σ(a)
por convergencia dominada. Supongamos que las fn ∈ C(σ(a)), entonces acabamos de probar que
Qf (ξ) = lı́mhξ, fn (a)ξi.
n
Luego Qf : H → C es una forma cuadrática, y es fácil ver que proviene de una
forma bilineal continua βf : H × H → C por polarización. Por el Teorema de
Riesz, proviene de un operador acotado que llamaremos f(a), que verifica
hξ, f(a)ηi = lı́mhξ, fn (a)ηi
n
para todo ξ, η ∈ H, lo que nos dice que fn (a) → f(a) en la topología fuerte
de B(H). Si f ∈ C(σ(a)) inicialmente, entonces ciertamente f(a) coincide con
la definición anterior. Se deduce de aquí, aproximando puntualmente cualquier
función Boreliana acotada f por funciones continuas fn en σ(a), que f(a) ∈
W ∗ (a). Recíprocamente, si b ∈ W ∗ (a) entonces existe una sucesión de elementos
an ∈ C∗ (a) tales que an → b en la topología fuerte. Por el teorema de Gelfand,
hay una sucesión de funciones fn ∈ C(σ(a)) tales que an = fn (a). Esta sucesión
tiende puntualmente a una función f ∈ Bor(σ(a)), la cual extendemos por cero
fuera. Se tiene por el resultado previo que f(a) ∈ W ∗ (a), pero además por la
unicidad del límite en cada ξ ∈ H, debe ser b = f(a). No es difícil chequear que
la asignación f 7→ f(a) para f Boreliana y acotada, es en efecto un ∗-morfismo.
Hemos probado el siguiente teorema.
Teorema C.1.1. Sea a ∈ B(H) normal. Existe un único ∗-isomorfismo
Φ : Bor(σ(a)) → W ∗ (a) de manera que si id : C → C denota la función
identidad, entonces Φ(id) = a. Además
kΦ(f)k ≤ kfk∞ .
Si ab = ba entonces Φ(f)b = bΦ(f).
Si f ≥ 0, entonces Φ(f) ≥ 0.
Los tres ítems se deducen del cálculo funcional para funciones continuas,
aproximando puntualmente a la funcion Boreliana acotada f.
C.1. Cálculo funcional Boreliano
C.1.2.
275
Medida espectral
Dado a normal, consideramos el conjunto χ de funciones características de
conjuntos medibles acotados en R. Tenemos una asignación
ε : χ → W ∗ (a)
dada por ε(χI ) = χI (a). Como χI tiene su imagen en el {0, 1}, pI = ε(χI ) ≥
0. Como χ2I = χI , entonces p2I = pI . Luego la función ε toma valores en los
proyectores del álgebra. Con la convención de que ε(∅) = 0, se tiene que
Si I ∩ J tiene medida nula, entonces pI = ε(χI ) y pJ = ε(χJ ) son disjuntos
en el sentido que pI pJ = pJ = pI = 0; en general pI∩J = pI pJ .
Si σ(a) ⊂ I entonces pI = 1.
Si I = ∪n In e Ik ∩ Ij = ∅, entonces pI =
en la topología fuerte.
P
n
pIn donde la convergencia es
Una asignación de este tipo se conoce como medida espectral, o medida a
valores proyectores. En este caso se trata de la medida espectral de a. Es usual
también denotar ε(A) en vez de ε(χA ) para A ⊂ R acotado.
C.1.3.
Descomposición polar en W ∗ -algebras
Si a = u|a| es la descomposición polar de a ∈ B(H), aunque |a| está en
el álgebra C∗ (a) generada por a -por ser un cálculo funcional continuo-, no es
cierto que la isometría parcial u ∈ C∗ (a). Sin embargo, tomemos para x ≥ 0 la
sucesión de funciones continuas
1/x x ≥ 1/n
fn (x) =
n
x ≤ 1/n
Observemos que fn converge puntualmente a x−1 . Sea ε la medida espectral de
|a|, pongamos
pn = ε[0, 1/n],
qn = ε[1/n, kak]
que son dos proyectores disjuntos tales que pn → Pker|a| , qn → Pran|a| en la
topología fuerte. Además, conmutan entre sí y conmutan con |a|.
Escribimos |a|n− = pn |a|, |a|n+ = qn |a| que son positivos que conmutan con
|a| y disjuntos entre sí, luego
|a| = (pn + qn )|a| = |a|n− + |a|n+ .
En esta expresión, es sencillo calcular fn |a|, se tiene
fn |a| =
1
pn + |a|−1
n+ .
n
276
Álgebras de von Neumann
Multiplicamos por |a| para obtener |a|fn |a| = n1 |a|n− + qn , ahora multiplicamos
por u para obtener afn |a| = n1 u|a|n− + uqn . Esta expresión converge en la topología fuerte a 0 + uPran|a| = u. Luego u es límite fuerte de funciones Borelianas
en a, con lo cual u ∈ W ∗ (a), el álgebra de von Neumann generada por a. Con
un argumento similar se prueba que Pran|a| y Pker|a| = Pkera están en W ∗ (a).
Observación C.1.2. Notemos que si a es inversible, entonces |a| es inversible
con lo cual de a = u|a| se deduce que
u = a|a|−1 ∈ C∗ (a) ∩ G( A),
luego u ∈ U ∩ C∗ (a) pues
uu∗ = a|a|−1 |a|−1 a∗ = a|a|−2 a∗ = a(a∗ a)−1 a∗ = aa−1 (a∗ )−1 a∗ = 1
y u∗ u = |a|−1 a∗ a|a|−1 = |a|−1 |a|2 |a|−1 = 1.
C.2.
Problemas
C.I. Probar el Teorema C.1.1 sobre cálculo funcional Boreliano.
C.II. Probar que si a ∈ M un álgebra de von Neumann, entonces Pran|a| y
Pker|a| = Pkera están en W ∗ (a).
Apéndice
Normas en Álgebras de Operadores
D
iscutiremos en este apéndice nociones elementales de normas simétricas en álgebras de operadores. Comenzamos con el caso discreto,
que se corresponde con los operadores compactos en un espacio de Hilbert. Obtendremos generalizaciones a operadores de las clásicas desigualdades
de Hölder y Young, basadas en el cálculo de la traza de operadores compactos.
D.1.
Ideales en B(H)
A lo largo de esta sección H denotará un espacio de Hilbert complejo separable, de dimensión n donde n ∈ N ó n = ∞.
D.1.1.
Descomposición en valores singulares
Dado un √
operador a ∈ B(H), consideramos su descomposición polar a = u|a|
donde |a| = a∗ a. Supongamos que b es un operador compacto (lo cual ocurre
siempre si n 6= ∞). Si además b∗ = b, entonces b es diagonalizable, en el siguiente
sentido: existe una base ortonormal {ek } de H y una sucesión de numeros reales
λk (b) (que puede acumularse únicamente en z = 0) de manera que
X
b=
λk (b)hek , ·iek
k
donde la suma es finita si n 6= ∞ e infinita y convergente en la topología uniforme
de B(H) en el caso n = ∞. Una prueba de esto puede encontrarse en el libro de
Reed-Simon [62, Teorema VI.17]. Los números λk son el espectro no nulo de b,
y cada uno de ellos es un autovalor de b con multiplicidad geométrica finita. De
hecho, de la expresión de arriba se deduce que
bek = λk (b)ek .
277
D
278
Normas en Álgebras de Operadores
La sucesión se acumula en cero si y sólo si es infinita si y sólo si ran(b) = ∞ si
y sólo si ran(b) no es cerrado.
Observación D.1.1. Los operadores compactos K(H) forman una C∗ -algebra,
por ser la clausura en norma unifome de los operadores de rango finito. Luego si
√
a es compacto, entonces también |a| = a∗ a es compacto.
Aplicando el resultado de expansión al operador b = |a|, como σ(|a|) ⊂
[0, +∞), podemos ordenar los autovalores de forma decreciente y escribir la expresión
X
|a| =
λk (|a|)hek , ·iek .
(D.1)
k
Los números positivos µk (a) = λk (|a|) (ordenados de forma decreciente) se denominan valores singulares del operador a. Siendo que el espacio se descompone
como
H = ker |a|⊥ ⊕ ker |a| = ran|a| ⊕ ker(a),
es conveniente pensar a la base {ek } ordenada en dos partes {ek } ∪ {ek′ } donde
los {ek } son una base de ran|a| (y son los que efectivamente aparecen en la
suma) y los {ek′ } son una base de ker |a| = ker(a) (y no aparecen en la suma).
Multiplicando a izquierda (D.1) por la isometría parcial u de a, obtenemos la
expresión
X
a = u|a| =
µk (a)hek , ·iuek .
k
Observemos que, como u : ran|a| → ran(a) es una isometría, la familia {fk } con
fk = uek es en efecto una base ortonormal de ran(a) y entonces
X
a=
µk (a)hek , ·ifk .
(D.2)
k
Observación D.1.2. Los µk están únicamente determinados en el siguiente sentido: si {gk }, {hk } son bases ortonormales de ran|a| y ran(a) respectivamente, y
sk > 0 es una sucesión decreciente tal que
X
a=
sk hgk , ·ihk ,
k
entonces sk = µk (a) para todo k. En efecto, como el adjunto de hv, ·iw es hw, ·iv,
entonces se tiene
X
a∗ =
sj hhj , ·igj ,
j
luego
a∗ a =
X
j,k
sj sk hhj , hk ihgj , ·igk =
X
k
s2k hgk , ·igk ,
D.1. Ideales en B(H)
279
lo que nos dice que los s2k son los autovalores de a∗ a, que están únicamente
determinados.
Observación D.1.3. Tomando adjuntos en (D.2),
X
a∗ = |a|u∗ =
µk (a)hfk , ·iek ,
k
y como {ek } es una base ortonormal de
ran|a| = ker |a|⊥ = ker(a)⊥ = ran(a∗ ),
y {fk } es una base ortonormal de
ran(a) = ker(a∗ )⊥ = ker |a∗ |⊥ = ran|a∗ |,
entonces los µk (a) también son los números singulares de a∗ . Es decir
µk (a) = µk (a∗ )
para todo k.
D.1.1.1.
Espacios de sucesiones
Denotemos al espacio de sucesiones de números complejos que tienden a cero
con c0 , es decir
c0 = {{xn } : lı́m xn = 0}.
n
Dada una sucesión x = {xn } ∈ c , consideramos la sucesión x↓ ∈ c0 decreciente
de números positivos que se consigue reordenando los módulos |xn | de la sucesión
original, contando multiplicidades. Sea c(0) el espacio de sucesiones de números
complejos con finitos términos no nulos. Una norma φ : c(0) → R+ se dice
simétrica si φ es invariante por permutaciones y transformaciones an 7→ eiθn an
de módulo uno. Esto es si
0
φ(x) = φ(|x|) = φ(x↓ )
para toda sucesión x ∈ c(0) .
Diremos que una sucesión infinita x está en el espacio maximal sφ de φ si
φ(x) := lı́m φ(x1 , x2 , . . . , xn , 0, 0, . . .)
n→∞
existe y es finito. No es difícil ver que sφ es un espacio vectorial, y que φ
resulta una norma para sφ , de aquí en más nos referiremos con sφ a este espacio
(0)
normado. Claramente c(0) ⊂ sφ para toda φ simétrica, definimos sφ ⊂ sφ
como la clausura en sφ de c(0) y lo denominamos espacio minimal de φ. En el
(0)
caso que sφ = sφ , diremos que φ es regular.
280
Normas en Álgebras de Operadores
Observación D.1.4. Si consideramos, para p ≥ 1, la función
φ(x) = kxkp =
X
|xn |p
1/p
es simétrica y regular. Los ideales sφ son los usuales espacios ℓp . El caso p = ∞
se corresponde con la norma
φ(x) = kxk∞ = máx |xn |,
que no es regular puesto que sφ = ℓ∞ , y la sucesión x = (1, 1, 1, . . .) no es límite
en ℓ∞ de ninguna sucesión con finitos términos no nulos.
Un caso más interesante de norma simétrica no regular es el siguiente: para
p > 1, consideramos la norma de Calderón
1
φp,w (x) = sup{n−1+ p
n
n
X
x↓j }.
j=1
1
El espacio maximal asociado es ℓp,w = {x : sup n p x↓n < ∞} conocido como
n
espacio ℓp -débil. El espacio minimal es
(0)
sφ = {x ∈ ℓp,w : lı́m n1/p x↓n = 0.
n→∞
Algunas propiedades útiles de estos espacios las resumimos en el siguiente
teorema, cuya prueba puede hallarse en el libro de ideales de traza de B. Simon
[66, Teorema 1.16].
Teorema D.1.5. Sea φ una norma simétrica en c(0) . Entonces,
1. Si xn → 0, entonces φ(x) = φ(x↓ ).
Pn
Pn
2. Si xn , yn → 0 y j=1 y↓ ≤ j=1 x↓ para todo n ∈ N, entonces φ(y) ≤
φ(x).
3. Si φ(1, 0, 0, . . .) = c, entonces para todo x ∈ sφ se tiene
ckxk∞ ≤ φ(x) ≤ ckxk1 .
(0)
4. Los espacios sφ , sφ son completos.
5. Si sφ = sψ como conjuntos, entonces φ y ψ son normas equivalentes.
6. Si φ no es equivalente a k · k∞ , entonces sφ ⊂ c0 .
D.1. Ideales en B(H)
D.1.2.
281
Ideales de operadores compactos
Comenzamos la sección con algunos resultados debidos a Calkin que caracterizan ideales biláteros de B(H). Denotemos con K(H) a los operadores compactos
y con B(H)0 a los operadores de rango finito. Seguimos de cerca el libro de Simon
[66].
Teorema D.1.6. Sea I ⊂ B(H) un ideal bilátero, con H separable y complejo. Entonces
1. Si existe a ∈ I que es no compacto, entonces I = B(H).
2. Si I es propio entonces I ⊂ K(H).
3. Si a, b son compactos con b ∈ I y µk (a) ≤ µk (b) para todo k, entonces
a ∈ I.
4. a ∈ I si y sólo si a∗ ∈ I.
5. Si I =
6 0 entonces B(H)0 ⊂ I.
6. Si I es cerrado en la norma uniforme, entonces I es cero, es todo
B(H) o es el ideal de operadores compactos K(H).
Demostración. Si a ∈ I es no compacto, también lo es |a| = u∗ a. Para t > 0,
sea
Pt = ε[t, ∞)
donde ε es la medida espectral de |a| (sección C.1.2). Observemos que at =
|a|Pt + (1 − Pt ) es un operador acotado e inversible, pues tiene su espectro en
[t, ∞). Entonces, como 1 = at a−1
t , multiplicando por Pt a la derecha se tiene
−1
Pt = a−1
t at Pt = at |a|Pt ∈ I
para todo t > 0 por ser I un ideal bilátero. Por otra parte, existe s > 0 tal que Ps
es infinito-dimensional, ya que en caso contrario |a| = lı́m |a|P1/n en norma uniforn
me y |a| resultaría compacto. Como Ps ∈ I es un proyector infinito-dimensional,
existe una isometría V : H → ran(Ps ), y entonces
1 = V ∗ Ps V ∈ I,
luego I = B(H). Se deduce de aquí que si I es un ideal propio, debe estar dentro
de los operadores compactos. Sean a = u|a|, b = v|b| compactos,
X
X
|a| =
µi (a)hei , ·iei , |b| =
µj (b)hfj , ·ifj ,
i∈I
j∈J
282
Normas en Álgebras de Operadores
con {ei } una base de ran|a| y {fj } una base de ran|b|. La hipótesis µk (a) ≤ µk (b)
para todo k presupone que ran|a| y ran|b| tienen la misma dimensión, es decir
I = J, luego existe una isometría w : ran|a| → ran|b| que se extiende (como
cero en ker(a) = ran|a|⊥ ) a una isometría parcial w ∈ B(H), podemos incluso
suponer que wek = fk para todo k. Luego
X
|b| =
µk (b)hwek , ·iwek ,
k
y multiplicando por w∗ se tiene
w∗ |b| =
X
k
µk (b)hwek , ·iek .
Por otra parte, en cada ξ ∈ H se verifica
X
X
w∗ |b|wξ =
µk (b)hwek , wξiek =
µk (a)hw∗ wek , ξiek
k
=
X
k
µk (a)hek , ξiek ,
k
luego
w∗ |b|w =
X
k
µk (b)hek , ·iek =
X
k
hek , ·iµk (b)ek .
Consideramos el operador c ∈ B(ran|a|) dado por
cek =
µk (a)
ek ,
µk (b)
que es una contracción, y lo extendemos al complemento ortogonal como cero,
obteniéndose así una contracción c ∈ B(H). Entonces
X
X
cw∗ |b|w =
hek , ·iµk (b)cek =
hek , ·iµk (a)ek = |a|,
k
k
es decir |a| = cw∗ |b|w. Si b ∈ I entonces |b| = v∗ b ∈ I lo que prueba que |a| ∈ I,
y de allí a = u|a| ∈ I. Como µk (a) = µk (a∗ ) para todo k, se deduce del ítem
previo que a ∈ I si y sólo si a∗ ∈ I. Si I =
6 0, sea a = u|a| ∈ I con
X
|a| =
µi (a)hei , ·iei ,
i∈I
y sea {ei }i∈I ∪ {ej }j∈J una base de H = ran|a| ⊕ ker(a). Si b = hes , ·iel con
s, l ∈ J ∪ I, entonces µ1 (b) = 1 y µk (b) = 0 para todo k > 1. Multiplicando |a|
D.1. Ideales en B(H)
283
por un número positivo conveniente se tiene µk (b) ≤ µk (a) para todo k, luego
b ∈ I por el ítem previo. Como todo operador de rango finito se escribe como
combinación lineal finita de operadores elementales del tipo de b, se tiene que
B(H)0 ⊂ I. El último ítem es consecuencia trivial del item anterior y del hecho
de que la clausura uniforme de B(H)0 es exactamente K(H).
Definición D.1.7. Fijemos una base ortonormal {ek } en H. Dado un ideal propio I ⊂ B(H), definimos s(I) como el conjunto de todas las sucesiones x ∈ c0
tales que al reordenarlas forman los valores singulares de algún operador a ∈ I.
Es decir
X ↓
s(I) = {x ∈ c0 :
xk hek , ·iek ∈ I}.
Recíprocamente, dado un espacio de sucesiones s ⊂ c0 , definimos J(s) como la
familia de operadores compactos con valores singulares en s, es decir si µ(a)
denota la sucesión {µk (a)}, entonces
J(s) = {a ∈ B(H) : µ(a) ∈ s}.
Diremos que s ⊂ c0 es un espacio de Calkin si, dadas x, y ∈ c0 con y ∈ s y
x↓n ≤ y↓n para todo n ∈ N implica x ∈ s.
Por el segundo y el sexto ítem del Teorema D.1.5, dada una norma φ : c(0) →
(0)
R+ simétrica, si φ no es equivalente a k · k∞ , entonces sφ , sφ son espacios de
Calkin.
Una norma k · kI : B(H) → R ∪ {+∞} con la propiedad
kxyzkI ≤ kxkkykI kzk
para todo x, y, z ∈ B(H) se dice simétrica. En particular toda norma simétrica
es unitariamente invariante, es decir
kuyvkI = kykI
para todo u, v ∈ U(H). Definimos
I = {a ∈ B(H) : kakI < ∞},
que resulta ser un ideal bilátero, que denominamos ideal simétricamente normado. Por el teorema de Calkin, este ideal es trivial, es todo o es un ideal propio
de operadores compactos que contiene a todos los operadores de rango finito
B(H)0 ⊂ I ⊂ K(H).
284
Normas en Álgebras de Operadores
En este último caso, definimos
I (0) = B(H)0 ⊂ I,
donde la clausura está tomada con la norma k · kI . Diremos que la norma es
regular cuando I (0) = I. Dada φ : c(0) → R+ simétrica, definimos
Iφ = J(sφ ),
(0)
(0)
Iφ = J(sφ ).
Para a ∈ Iφ , definimos k · kφ : K(H) → R ∪ {+∞} como
kakφ = φ(µ(a)).
Recíprocamente, dada una norma simétrica k · kI : B(H) → R ∪ {+∞}, definimos
φ : c(0) → R+ como
X ↓
φI (x) = k
xk hek , ·iek kI .
El siguiente teorema condensa todas las propiedades que usaremos de los
ideales simétricos normados y su relación con sucesiones de Calkin y normas
simétricas en sucesiones. Su prueba puede encontrarse en [66, Teoremas 2.5-2.8].
Teorema D.1.8. Sean H un espacio de Hilbert complejo y separable, {ek }
una base ortonormal, I ∈ B(H) un ideal bilátero propio. Entonces
1. s(I) es un espacio de Calkin y J(s(I)) = I.
2. Si s ⊂ c0 es un espacio de Calkin entonces J(s) es un ideal bilátero y
s(J(s)) = s.
3. Dada φ : c(0) → R+ simétrica, la función k · kφ : Iφ → R+ es una
norma simétrica.
(0)
(0)
4. Los espacios Iφ = J(sφ ), Iφ = J(sφ ) son completos con esta norma,
(0)
y Iφ es la clausura en la norma k · kφ de los operadores de rango
finito.
(0)
5. Para todo a = u|a| ∈ Iφ , la descomposición
a=
X
k
µk (a)hek , ·iuek
es convergente en la norma k · kφ .
D.1. Ideales en B(H)
285
6. Si I es simétricamente normado, y
X ↓
φI (x) = k
xk hek , ·iek kI ,
entonces φ es una norma simétrica en sucesiones, con
s(I) ⊂ sφI .
(0)
Si I era completo entonces sφI ⊂ s(I) ⊂ sφI .
7. Con la notación del ítem previo, se tiene k · kφI = k · kI sobre los
operadores de rango finito y
I ⊂ IφI .
(0)
Si I era completo entonces IφI ⊂ I ⊂ IφI .
8. Desigualdad de Hölder: sean φ1 , φ2 , φ3 normas simétricas en c(0) , con
la propiedad de que si x ∈ s2 , y ∈ s3 , entonces xy = (xn yn )n es una
sucesión de s1 y además
φ1 (xy) ≤ φ2 (x)φ3 (y).
Entonces si a ∈ I2 , b ∈ I3 , se tiene ab ∈ I1 y
kabkφ1 ≤ kakφ2 kbkφ3 .
(0)
Además si a ∈ I2
D.1.3.
(0)
(0)
o bien b ∈ I3 , entonces ab ∈ I3 .
Operadores compactos de Schatten
Para p ≥ 1, se definen los ideales p-Schatten, que denotaremos con Bp (H)
como
Bp (H) := J(ℓp ),
es decir son aquellos operadores compactos cuyos valores singulares están en la
clase ℓp de sucesiones. Denotamos
sX
kakp = ks(a)kp = p
sk (a)p ,
k
la norma k · kp se conoce como norma p de Schatten. El espacio B1 (H) se conoce
como espacio de operadores de traza o espacio de operadores nucleares.
286
Normas en Álgebras de Operadores
Fijada una base ortonormal {en } del espacio H, y para a ∈ B1 (H), definimos
la traza de a como
X
Tr(a) :=
haen , en i.
n
Veamos que esta cantidad es finita (de hecho, que la serie es absolutamente
convergente) y no depende de la base elegida. Si
X
a=
sk (a)hfk , ·iufk
k
es la descomposición en valores singulares de a = u|a|, con {fk } ∪ {fk′ } base de
H = ran|a| ⊕ ker(a),
podemos escribir, para cada n ∈ N,
X
X
en =
hen , fk ifk +
hen , fk′ ifk′ .
k
k
Luego
aen =
X
k
con lo cual
hen , fk iu|a|fk +
X
|haen , en i| ≤
k
hen , fk′ iu|a|fk′ =
X
k
X
k
hen , fk isk (a)ufk + 0,
sk (a)|hen , fk i| |hufk , en i|.
Sumando sobre n y usando la desigualdad de Cauchy-Schwarz, se deduce que,
como kfk k = kufk k = 1,
X
X
X
X
|haen , en i| ≤
sk (a)
|hen , fk i| |hufk , en i| ≤
sk (a) = kak1 .
n
n
k
k
lo que prueba que la suma converge absolutamente, y además que
|Tr(a)| ≤ kak1 .
Como la suma converge absolutamente, podemos intercambiar el orden de las
sumas en
X
XX
haen , en i =
sk (a)hen , fk ihufk , en i
n
n
=
X
k
=
X
k
=
X
k
k
sk (a)
X
n
*
hen , fk ihufk , en i
sk (a) ufk ,
X
n
sk (a)hufk , fk i,
+
hen , fk ien i
D.1. Ideales en B(H)
287
lo que prueba que la traza no depende de la base ortonormal con la que comenzamos y que se puede calcular como
X
Tr(a) =
sk (a)hufk , fk i.
k
Se tiene entonces que Tr es una funcional lineal acotada en B1 (H), es decir
Tr ∈ B1 (H) ′ . Entonces
X
Tr(b) =
sk (b)
k
para b = u|b| compacto con
b=
X
k
sk (b)hfk , ·iufk ,
y Tr(b) es finita si y sólo si b ∈ B1 (H).
Corolario D.1.9. Sea p ≥ 1. Si a = u|a| ∈ Bp (H), entonces |a|p ∈ B1 (H) y
podemos definir su norma k · kp como
1
kakp = (Tr|a|p ) p .
Demostración. En primer lugar observemos que a ∈ Bp (H) si y sólo si |a| =
u∗ a ∈ Bp (H). Luego, que si
X
|a| =
sk (a)hfk , ·ifk
k
es la descomposición en valores singulares de |a|, entonces
X
|a|p =
sk (a)p hfk , ·ifk
k
puesto que los proyectores fk ⊗ fk = hfk , ·ifk son disjuntos. Como {sk (a)p } ∈ ℓ1 ,
el operador |a|p tiene traza finita, es decir |a|p ∈ B1 . Por último
X
Tr|a|p =
sk (a)p = kakp
p.
k
D.1.4.
Desigualdad de Hölder, dualidades, norma Frobenius
Aplicando el último ítem del Teorema D.1.8 a estas clases de operadores,
y usando la desigualdad clásica de Young para sucesiones, se tiene el siguiente
corolario.
288
Normas en Álgebras de Operadores
Corolario D.1.10 (Desigualdad de Young para operadores). Si 1/p + 1/q =
1/r, y a ∈ Bp (H), b ∈ Bq (H), entonces ab ∈ Br (H) y además
kabkr ≤ kakp kbkq .
En particular, si r = 1 se tiene la desigualdad de Hölder para operadores
compactos,
kabk1 ≤ kakp kbkq .
Además, como ab ∈ B1 , se tiene
|Tr(ab)| ≤ kabk1 ≤ kakp kbkq ,
y también si a ∈ B1 y b es sólo acotado
|Tr(ab)| ≤ kabk1 ≤ kak1 kbk.
A partir de aquí no es difícil probar (Ejercicio D.i), usando las dualidades de
espacios de sucesiones, que la traza realiza las siguientes dualidades: para 1 <
p < ∞ se tiene
Bp (H) ′ = Bq (H),
K(H) ′ = B1 (H),
B1 (H) ′ = B(H).
En particular B2 (H) es un espacio de Hilbert con el producto interno
ha, bi = Re Tr(ab∗ ) = 1/2[Tr(ab∗ ) + Tr(ba∗ )],
denominado espacio de operadores de Hilbert-Schmidt. En dimensión finita la
norma
1
kak2 = Tr(a∗ a) 2
que proviene del producto interno de la traza se suele denominar norma Frobenius para matrices.
D.1.5.
El teorema de Lidskii y la propiedad cíclica de la traza
De prueba mucho más compleja, es el resultado de gran utilidad que dice que
Tr es en efecto una traza:
Tr(ab) = Tr(ba)
para todo a, b ∈ B(H), en el sentido que un lado es finito si y sólo si el otro lo
es, y en ese caso los dos lados son iguales. Una prueba posible pasa por el hecho
siguiente, también de difícil prueba [66, Teorema 3.7]: si λk (a) son los valores no
nulos del espectro de a contados con multiplicidad, entonces para a ∈ B1 (H) la
serie de los λk es convergente y además
X
Tr(a) =
λk (a).
k
De aquí se deduce la ciclicidad de la traza, pues σ(ab)∪{0} = σ(ba)∪{0} y además
cada autovalor no nulo tiene la misma multiplicidad si ab, ba son compactos.
D.2. Normas simétricas en álgebras C∗
D.2.
289
Normas simétricas en álgebras C∗
Copiando la noción de norma simétrica en B(H), y dada una C∗ -álgebra, consideramos una norma simétrica k · kI : A → R+ ∪ {∞}, esto es una norma (que
posiblemente toma el valor +∞ en elementos de A) con la propiedad adicional
siguiente: si
I = {a ∈ A : kakI < ∞}
denota el conjunto de elementos con norma finita, entonces
kxyzkI ≤ kxkkykI kzk
para todo x, z ∈ A, y ∈ I. Se deduce de aquí (Ejercicio D.ii) que I es un ideal
bilátero en A, y que kx∗ kI = kxkI para todo x ∈ A.
D.2.1.
Álgebras con traza finita
Un caso particular que nos concierne es el que sigue. Si τ es un estado de A
con la propiedad adicional τ(ab) = τ(ba) para todo a, b ∈ A, diremos que τ es
una traza finita en A. Si para x ≥ 0 y no nulo se verifica τ(x) > 0, diremos que
la traza es fiel. Supondremos que τ está normalizado o equivalentemente que
τ(1) = 1. En presencia de una traza finita y fiel, podemos introducir análogos a
las normas p de matrices de la siguiente manera: para 1 ≤ p < ∞ consideramos
1/p
kxkp = τ(|x|p )
para x ∈ A.
Observación D.2.1. Para todo x ∈ A y todo p ≥ 1,
kxkp ≤ kxk.
En efecto, basta probar el resultado para p =
k
n
∈ Q, y en ese caso
1
1
1
p
n k
n k
n k
kxkp
p = τ(|x| ) = τ((|x| ) ) ≤ k(|x| ) k ≤ k|x| k ,
y por otro lado como 0 ≤ |x| ≤ kxk y
1
n
1
∈ [0, 1], se tiene por el Teorema B.3.9
1
0 ≤ |x| n ≤ kxk n
1
1
p
de donde se sigue que k|x| n k ≤ kxk n , y así kxkp
p ≤ kxk .
Veamos ahora la desigualdad de Hölder. Como preliminar presentamos un
teorema debido a Hadamard conocido como teorema de las tres líneas.
290
Normas en Álgebras de Operadores
Teorema D.2.2. Sea f : S → X una función continua y acotada, con S =
{z ∈ C : 0 ≤ Re z ≤ 1} y X un espacio de Banach. Supongamos que f es
analítica en S0 y que para y ∈ R se verifica
|f(iy)| ≤ M0 ,
|f(1 + iy)| ≤ M1
para ciertas constantes M0 , M1 > 0. Entonces para todo z ∈ S, se verifica
z
z
|f(z)| ≤ M1−Re
MRe
.
1
0
Demostración. Dada ϕ ∈ X ′ , consideramos g = ϕ ◦ f que es una función continua y acotada en S, analítica en el sentido usual en S0 . Reemplazando f por
f(z)M1−z
Mz1 , basta probar el caso M0 = M1 = 1, y aquí tenemos que probar
0
que |f(z)| ≤ 1 en la banda S; por el teorema de Hahn-Banach, basta probar que
|g(z)| ≤ 1 en la banda. Si g(z) → 0 cuando z → ∞, entonces la conclusión se sigue del principio del módulo máximo usual para funciones de variable compleja.
En caso contrario, consideramos
2
gn (z) = g(z)ez
/n −1/n
e
,
y como g es acotada en S, se sigue que gn → 0 cuando z → ∞ en la banda,
luego |gn (z)| ≤ 1 para z ∈ S pues |gn | ≤ 1 en el borde. Como esto vale para todo
2
n ∈ N, se tiene la conclusión tomando límite en n puesto que ez /n e−1/n → 1
cuando n → ∞.
Teorema D.2.3 (Desigualdad de Hölder). Si a, b ∈ A, entonces
kabk1 ≤ kakp kbkq
para p ≥ 1 y 1/p + 1/q = 1.
Demostración. Basta probar que kabk1 ≤ 1 para kakp = kbkq = 1. Suponemos
A representada en un espacio de Hilbert. Consideramos la descomposición polar
de a, b y ab, dada por a = u|a|, b = v|b|, ab = w|ab|. Luego
kabk1 = τ|ab| = τ(w∗ ab) = τ(w∗ u|a| v|b|) = τ(|a| v|b|w∗u).
Dado ǫ > 0, sea Fǫ : C → C la función entera dada por
Fǫ (z) = τ([ǫ + |a|p ]z v[ǫ + |b|q ]1−z w∗ u).
D.2. Normas simétricas en álgebras C∗
291
Si z = x + iy con 0 ≤ x ≤ 1 entonces
|Fǫ (z)|
≤ k[ǫ + |a|p ]z v[ǫ + |b|q ]1−z w∗ uk ≤ k[ǫ + |a|p ]z kkǫ + |b|q ]1−z k
=
k[ǫ + |a|p ]x kk[ǫ + |b|q ]1−x k
puesto que v, w∗ , u son isometrías parciales, mientras que (ǫ + |a|p ) > 0 luego
(ǫ + |a|p )iy es unitario para y ∈ R, y lo mismo vale para b. Recordemos que
para c ∈ A+ se verifica c ≤ kck, luego si s ∈ [0, 1] se tiene cs ≤ kcks con lo cual
k[ǫ + |a|p ]x k ≤ kǫ + |a|p kx ≤ (ǫ + kakp )x ≤ ǫ + kakp
q 1−x
puesto que ǫ + kakp ≥ ǫ + kakp
k≤
p = ǫ + 1 > 1. Similarmente k[ǫ + |b| ]
ǫ + kbkq, luego Fǫ es acotada en Re z ∈ [0, 1]. Por otra parte, para y ∈ R se tiene
|F(iy)|
=
|τ([ǫ + |a|p ]iy v[ǫ + |b|q ][ǫ + |b|q ]−iy w∗ u)|
≤ ǫk[ǫ + |a|p ]iy v[ǫ + |b|q ]−iy w∗ uk
+|τ(w∗ u[ǫ + |a|p ]iy v[ǫ + |b|q ]−iy |b|q )k
≤ ǫ + τ(|b|q ) = ǫ + 1,
puesto que todos los operadores involucrados salvo |b|q son unitarios o isometrías
parciales (en el segundo término usamos |τ(c)| ≤ τ|c| para todo c ∈ A, hecho que
dejamos como ejercicio (D.iii)). Con un cómputo similar, se tiene
|Fǫ (1 + iy)| ≤ ǫ + 1,
luego por el teorema de las tres líneas de Hadamard (Teorema D.2.2) se sigue
que
|Fǫ (z)| ≤ (1 + ǫ)z (1 + ǫ)1−z = 1 + ǫ
para todo z tal que 0 ≤ Re z ≤ 1, y en particular
kabk1 = lı́m+ Fǫ (1/p) ≤ 1 + ǫ
ǫ→0
lo que prueba que kabk1 ≤ 1.
Dejamos como ejercicio (D.v) la verificación de que, para p ≥ 1, la norma p
se trata en efecto de una norma en A (es decir que se verifica la desigualdad de
Minkowski). La misma es consecuencia inmediata de la desigualdad de Hölder
que acabamos de probar.
Las normas p resultan normas simétricas: si se tiene x, y, z ∈ A, entonces
por la desigualdad de Young (ejercicio D.iv),
kxyzkp ≤ kxkkyzkp ≤ kxkkykpkzk.
292
Normas en Álgebras de Operadores
Una propiedad importante adicional de las normas p de una traza finita es
que se comportan como las normas p de un espacio de medida finita, en el
siguiente sentido.
Proposición D.2.4. Si τ es una traza finita, entonces para todo x ∈ A y
todo kxk ≥ ǫ > 0 se verifican:
1. Existe e2 = e∗ = e ∈ W ∗ (x) tal que |x|e ≥ (kxk − ǫ)e.
2. kxk = lı́m kxkp .
p→∞
Demostración. Podemos suponer que kxk = 1, sea H el espacio de Hilbert
asociado a L, que es la representación GNS de C∗ (x) dada por la traza τ (Sección
B.3.6). Esta representación es fiel y consideramos W ∗ (x) ⊂ B(H) la clausura en
la topología débil de LC∗ (x) ⊂ B(H). Observemos que τ pasa a LC∗ (x) de manera
natural, pues τ̃(La ) = τ(a) está bien definido y da una traza fiel y finita. Por
otra parte, dado b = ω − lı́m bn ∈ W ∗ (x) con bn ∈ C∗ (x), extendemos la traza
n
τ de la siguiente manera τ(b) = lı́mn τ(bn ). Esta definición no depende de la
sucesión bn pues
τ(bn ) = τ(Lbn [1][1]) = hLbn [1], [1]i → hLb [1], [1]i = τ(b).
Sea ε : [0, 1] → W ∗ (x) la medida espectral de |x| (Sección C.1.3), definimos
e = ε[1 − ǫ, 1]. Entonces e ∈ W ∗ (x) es un proyector autoadjunto y además, como
χ[1−ǫ,1]id[0,1] = id[1−ǫ,1] ≥ χ[1−ǫ,1] (1 − ǫ),
por el tercer ítem del Teorema C.1.1 se sigue que
e|x| ≥ (1 − ǫ)e.
Respecto de la segunda afirmación, por el resultado obtenido en la primera y la
desigualdad de Hölder, tenemos
1
τ(e)(kxk − ǫ) ≤ τ(|x|e) ≤ kxkp kekq = kxkp τ(e) q ,
es decir
1
τ(e) p (kxk − ǫ) ≤ kxkp .
Tomando límite superior para p → ∞, se tiene
kxk − ǫ ≤ lı́m sup kxkp ≤ kxk
p→∞
por la Observación D.2.1, luego el límite superior coincide con kxk, y como lo
mismo es cierto para el límite inferior, se sigue que existe el límite y coincide
con kxk.
D.3. Problemas
293
Observación D.2.5. Usualmente estos espacios normados no son completos
(salvo en el caso en el que A tiene dimensión finita). Por la desigualdad de
Young, si t ≥ s ≥ 1, se tiene
kxk1 ≤ kxks ≤ kxkt ≤ kxk
luego si Ls = Ls (A, τ) denota la completación de A con la norma s, se verifica
A ⊂ Lt ⊂ Ls ⊂ L1 ,
y no es difícil ver que la traza implementa las dualidades
L1′ = A,
Lq = Lp′
para p ≥ 1 y 1/p + 1/q = 1. Estos espacios de Banach, que no son más álgebras,
se denominan Lp no conmutativos, y en general se considera a un álgebra finita
como el análogo no conmutativo de un espacio de medida finita, por eso se suelen
denominar a estos espacios de medidad no conmutativa.
D.3.
Problemas
D.I. Usando las dualidades de espacios de sucesiones, probar que la traza realiza
las siguientes dualidades: para 1 < p < ∞ se tiene
Bp (H) ′ = Bq (H),
K(H) ′ = B1 (H),
B1 (H) ′ = B(H).
D.II. Si k · kI es una norma simétrica en una C∗ -álgebra A, probar que I es
un ideal bilátero en A, y que kx∗ kI = kxkI para todo x ∈ A. Sugerencia:
probar primero que la norma es unitariamente invariante y luego considerar la
descomposición polar de x.
D.III. Si τ es una traza finita en un álgebra C∗ , probar que para todo x ∈ A, se
verifica |τ(x)| ≤ τ|x|.
D.IV. Probar la desigualdad de Young, kabkr ≤ kakp kbkq para p, q, r ≥ 1
tales que 1/p + 1/q = 1/r + 1.
D.V. Probar la desigualdad de Minkowski
ka + bkp ≤ kakp + kbkp
para p ≥ 1 y a, b ∈ A (ver el Ejercicio 1.iii), con lo cual las normas p son en
efecto normas en A.
D.VI. Probar que para todo x ∈ A y todo p ≥ 1 se verifican
294
Normas en Álgebras de Operadores
kxk1 = máx{|τ(xu)| : u ∈ W ∗ (x) isometría parcial},
kxkq = máx{|τ(xy)| : y ∈ W ∗ (x), kykp ≤ 1},
donde como siempre 1/p + 1/q = 1.
D.VII. Probar las afirmaciones de la Observación D.2.5.
Bibliografía
[1]
A. A. Albert, B. Muckenhoupt. On matrices of trace zeros. Michigan Math.
J. 4 (1957), 1–3.
[2]
W. Ambrose, R. S. Palais, I. M. Singer. Sprays. An. Acad. Brasil. Ci. 32
(1960), 163–178.
[3]
J. An, K.-H. Neeb. An implicit function theorem for Banach spaces and
some applications. Math. Z. 262 (2009), no. 3, 627–643.
[4]
E. Andruchow. Short geodesics of unitaries in the L2 metric. Canad. Math.
Bull. 48 (2005), no. 3, 340–354.
[5]
E. Andruchow, E. Chiumiento, G. Larotonda. Homogeneous manifolds
from noncommutative measure spaces. J. Math. Anal. Appl. 365, (2010),
no. 2, 541–558.
[6]
E. Andruchow, G. Corach, D. Stojanoff. Geometry of oblique projections.
Studia Math. 137 (1999), no. 1, 61–79.
[7]
E. Andruchow, G. Larotonda. Hopf-Rinow theorem in the Sato Grassmannian. J. Funct. Anal. 255 (2008), no. 7, 1692–1712.
[8]
E. Andruchow, G. Larotonda, L. Recht. Finsler geometry and actions of the
p-Schatten unitary groups. Trans. Amer. Math. Soc. 362 (2010), 319-344.
[9]
E. Andruchow, G. Larotonda, L. Recht. A. Varela. The left invariant metric
on the general linear group. arxiv preprint (2011).
[10] E. Andruchow, D. Stojanoff. Geometry of unitary orbits. J. Operator
Theory 26 (1991), no. 1, 25–41.
[11] J. Antezana, G. Larotonda, A. Varela. Optimal paths for symmetric actions
in the unitary group. Preprint (2011) arXiv:1107.2439v1 [math.DG].
[12] T. M. Apostol. Mathematical analysis. Second edition. Addison-Wesley
Publishing Co., Reading, Mass.-London-Don Mills, Ont., 1974.
295
296
Bibliografía
[13] V. I. Arnol’d. Mathematical Methods of Classical Mechanics. Translated
from the Russian by K. Vogtmann and A. Weinstein. Second edition. Graduate Texts in Mathematics, 60. Springer-Verlag, New York, 1989.
[14] C. J. Atkin. The Finsler geometry of groups of isometries of Hilbert space.
J. Austral. Math. Soc. Ser. A 42 (1987), no. 2, 196–222.
[15] C. J. Atkin. The Finsler geometry of certain covering groups of operator
groups. Hokkaido Math. J. 18 (1989), no. 1, 45–77.
[16] D. Bao, S.-S Chern, Z. Shen. An introduction to Riemann-Finsler geometry. Graduate Texts in Mathematics, 200. Springer-Verlag, New York,
2000.
[17] D. Beltiţă. Smooth homogeneous structures in operator theory. Chapman
& Hall/CRC Monographs and Surveys in Pure and Applied Mathematics,
137. Chapman & Hall/CRC, Boca Raton, FL, 2006.
[18] F. F. Bonsall, J. Duncan. Numerical ranges of operators on normed spaces
and of elements of normed algebras. London Mathematical Society Lecture
Note Series, 2 Cambridge University Press, London-New York, 1971.
[19] N. Bourbaki. Lie groups and Lie algebras. Chapters 7–9. Translated from
the 1975 and 1982 French originals by Andrew Pressley. Elements of Mathematics (Berlin). Springer-Verlag, Berlin, 2005.
[20] A. Brown, C. Pearcy. Structure of commutators of operators. Ann. of Math.
(2) 82 (1965), 112–127.
[21] M. P. do Carmo. Geometría Diferencial de Curvas y Superficies. Alianza
Universidad Textos, 1990.
[22] E. Cartan. Leçons sur la géométrie des espaces de Riemann. (French) [Lessons on the geometry of Riemann spaces] Reprint of the second (1946)
edition. Les Grands Classiques Gauthier-Villars. [Gauthier-Villars Great
Classics] Éditions Jacques Gabay, Sceaux, 1988.
[23] K. Y. Chung. Subspaces and graphs. Proc. Amer. Math. Soc. 119 (1993),
no. 1, 141–146.
[24] S. Cohn-Vossen, Existenz kürzester Wege. (English) C. R. (Dokl.) Acad.
Sci. URSS, n. Ser. 1935, No.3, 339–342 (1935).
[25] G. Corach, A. Maestripieri. Geometry of positive operators and Uhlmann’s
approach to the geometric phase. Rep. Math. Phys. 47 (2001), no. 2, 287–
299.
Bibliografía
297
[26] G. Corach, A. Maestripieri, D. Stojanoff. Orbits of positive operators from
a differentiable viewpoint. Positivity 8 (2004), no. 1, 31–48.
[27] G. Corach, H. Porta, L. Recht. The geometry of spaces of projections in
C∗ -algebras. Adv. Math. 101 (1993), no. 1, 59–77.
[28] G. Corach, H. Porta, L. Recht. The geometry of the space of selfadjoint
invertible elements in a C∗ -algebra. Integral Equations Operator Theory
16 (1993), no. 3, 333–359.
[29] K. R. Davidson. C∗ -algebras by Example. Fields Institute Monographs, 6.
American Mathematical Society, Providence, RI, 1996.
[30] C. Davis. The Toeplitz-Hausdorff theorem explained. Canad. Math. Bull.
14 (1971), 245–246.
[31] C. T. J. Dodson, G.N. Galanis, E. Vassiliou. Isomorphism classes for Banach vector bundle structures of second tangents. Math. Proc. Cambridge
Philos. Soc. 141 (2006), no. 3, 489–496.
[32] C. E. Durán, L.E. Mata-Lorenzo, L. Recht. Metric geometry in homogeneous spaces of the unitary group of a C∗ -algebra. I. Minimal curves. Adv.
Math. 184 (2004), no. 2, 342–366.
[33] C. E. Durán, L.E. Mata-Lorenzo, L. Recht. Metric geometry in homogeneous spaces of the unitary group of a C∗ -algebra. II. Geodesics joining fixed
endpoints. Integral Equations Operator Theory 53 (2005), no. 1, 33–50.
[34] E. B. Dynkin. Calculation of the coefficients in the Campbell-Hausdorff
formula. (Russian) Doklady Akad. Nauk SSSR (N.S.) 57, (1947). 323–326.1
[35] H. Glöckner, K.-H. Neeb. Banach-Lie quotients, enlargibility, and universal complexifications. [Banach-Lie quotients, enlargeability, and universal
complexifications] J. Reine Angew. Math. 560 (2003), 1–28.
[36] M. Gromov. Metric structures for Riemannian and non-Riemannian spaces. Based on the 1981 French original. With appendices by M. Katz, P.
Pansu and S. Semmes. Translated from the French by Sean Michael Bates.
Reprint of the 2001 English edition. Modern Birkhäuser Classics. Birkhäuser Boston, Inc., Boston, MA, 2007.
[37] J. Hadamard. Les surfaces à courbures opposées et leurs lignes géodésiques.
(French) Jorn. de Math. (5) 4 (1898), 27-73 .
traducción al inglés se halla en Selected papers of E. B. Dynkin with commentary.
Edited by A. A. Yushkevich, G. M. Seitz and A. L. Onishchik. American Mathematical Society,
Providence, RI; International Press, Cambridge, MA, 2000
1 Una
298
Bibliografía
[38] P. de la Harpe. Classical Banach-Lie algebras and Banach-Lie groups
of operators in Hilbert space. Lecture Notes in Mathematics, Vol. 285.
Springer-Verlag, Berlin-New York, 1972.
[39] L. A. Harris, W. Linear algebraic groups in infinite dimensions. Illinois J.
Math. 21 (1977), no. 3, 666–674.
[40] S. Helgason. Differential geometry, Lie groups, and symmetric spaces. Corrected reprint of the 1978 original. Graduate Studies in Mathematics, 34.
American Mathematical Society, Providence, RI, 2001.
[41] K. H. Hofmann, Karl H. Théorie directe des groupes de Lie. I. (French)
Séminaire P. Dubreil (27e année: 1973/74), Algèbre, Fasc. 1, Exp. No. 1,
24 pp. Secrétariat Mathématique, Paris, 1975.
[42] J. P. Holmes. Idempotents in differentiable semigroups. J. Math. Anal.
Appl. 162 (1991), no. 1, 255–267.
[43] J. P. Holmes. The structure of the set of idempotents in a Banach algebra.
Illinois J. Math. 36 (1992), no. 1, 102–115.
[44] H. Hopf, W. Rinow, W. Ueber den Begriff der vollständigen differentialgeometrischen Fläche. (German) Comment. Math. Helv. 3 (1931), no. 1,
209–225.
[45] R. V. Kadison, J. R. Ringrose. Fundamentals of the theory of operator
algebras. Vol. I. Elementary theory. Reprint of the 1983 original. Graduate
Studies in Mathematics, 15. American Mathematical Society, Providence,
RI, 1997.
[46] Z. V. Kovarik. Manifolds of linear involutions. Linear Algebra Appl. 24
(1979), 271–287.
[47] S. Lang. Differential and Riemannian manifolds. Third edition. Graduate
Texts in Mathematics, 160. Springer-Verlag, New York, 1995.
[48] A. R. Larotonda. Notas sobre variedades diferenciables. Notas de Geometría y Topología, 1. Universidad Nacional del Sur, Instituto de Matemática,
Bahía Blanca, 1980.
[49] M. Martin, N. Salinas. Differential geometry of generalized Grassmann manifolds in C∗ -algebras. Operator theory and boundary eigenvalue problems
(Vienna, 1993), 206–243, Oper. Theory Adv. Appl., 80, Birkhäuser, Basel,
1995.
Bibliografía
299
[50] J. McAlpin. Infinite dimensional manifolds and Morse theory. Thesis, Columbia University, 1965 (unpublished).
[51] J. Milnor. Morse theory. Based on lecture notes by M. Spivak and R.
Wells. Annals of Mathematics Studies, No. 51 Princeton University Press,
Princeton, N.J., 1963.
[52] G. A. Muñoz. Complexifications of polynomials and multilinear maps on
real Banach spaces. Function spaces (Poznan, 1998), 389–406, Lecture Notes in Pure and Appl. Math., 213, Dekker, New York, 2000.
[53] J.R. Munkres. Topology: a first course. Prentice-Hall, Inc., Englewood
Cliffs, N.J., 1975.
[54] F.D. Murnaghan. On the field of values of a complex matrix. Proc. Nat.
Acad. Sci. USA, 18 (1932), 246–248.
[55] B. Y. Levin. Lectures on Entire Functions. Translations of Mathematical
Monographs Vol. 160, AMS Providence, Rhode Island, 1996.
[56] K.-H. Neeb. A Cartan-Hadamard theorem for Banach-Finsler manifolds.
Proceedings of the Conference on Geometric and Combinatorial Group
Theory, Part II (Haifa, 2000). Geom. Dedicata 95 (2002), 115–156.
[57] K.-H. Neeb. Towards a Lie theory of locally convex groups. Jpn. J. Math.
1 (2006), no. 2, 291–468.
[58] H. Porta, L. Recht. Minimality of geodesics in Grassmann manifolds. Proc.
Amer. Math. Soc. 100 (1987), no. 3, 464–466.
[59] C. R. Putnam, A. Wintner. The connectedness of the orthogonal group in
Hilbert space. Proc. Nat. Acad. Sci. U. S. A. 37, (1951). 110–112.
[60] C. R. Putnam, A. Wintner. The orthogonal group in Hilbert space. Amer.
J. Math. 74, (1952). 52–78.
[61] I. Raeburn. The relationship between a commutative Banach algebra and
its maximal ideal space. J. Funct. Anal. 25 (1977), no. 4, 366–390.
[62] M. Reed, B. Simon. Methods of modern mathematical physics. I. Functional analysis. Academic Press, New York-London, 1972.
[63] W. Rudin. Functional analysis. McGraw-Hill Series in Higher Mathematics.
McGraw-Hill Book Co., New York-Düsseldorf-Johannesburg, 1973.
[64] S. Sakai. C∗ -algebras and W ∗ -algebras. Ergebnisse der Mathematik und
ihrer Grenzgebiete, Band 60. Springer-Verlag, New York-Heidelberg, 1971.
300
Bibliografía
[65] N. Salinas. The Grassmann manifold of a C∗ -algebra, and Hermitian holomorphic bundles. Special classes of linear operators and other topics (Bucharest, 1986), 267–289, Oper. Theory Adv. Appl., 28, Birkhäuser, Basel,
1988.
[66] B. Simon. Trace ideals and their applications. Second edition. Mathematical Surveys and Monographs, 120. American Mathematical Society, Providence, RI, 2005.
[67] H. Upmeier. Symmetric Banach manifolds and Jordan C∗ -algebras. NorthHolland Mathematics Studies, 104. Notas de Matemática [Mathematical
Notes], 96. North-Holland Publishing Co., Amsterdam, 1985.
[68] H. Weyl. The Classical Groups. Their Invariants and Representations.
Princeton University Press, Princeton, N.J., 1939.
Índice alfabético
acción de un grupo, 48
álgebra
C∗ , 255
de Banach, 237
de Lie-Banach, 42
de un subgrupo, 71
de operadores, 235
de von Neumann, 273
atlas diferenciable, 21
conexión, 119
afín, 122
de Koszul, 122
cono positivo, 84
convexa
bola Riemanniana, 217
función de operadores, 264
convexidad geodésica, 223
coordenadas polares, 199
corchete de Lie, 33, 36
curva
admisible, 194
auto-paralela, 128
densa en el toro, 39
curva densa en el toro, 47
curvatura, 130
de la esfera, 135
de la Grassmanniana, 144
del grupo lineal, 139
seccional, 219
semi-negativa, 228
curvatura seccional
de la esfera, 220
de la Grassmanniana, 224
de los operadores positivos inversibles, 222
del grupo unitario, 221, 222
del spray métrico en el grupo
lineal, 221
nula, 225
semi-negativa, 228
Baker-Campbell-Hausdorff
serie de, 67
cálculo de variaciones, 193
cálculo funcional, 54, 242, 256, 273
campo
f-relacionado, 39
invariante, 42
vectorial, 32
campos de Jacobi, 131
de la Grassmanniana, 144
en el grupo lineal
con el spray canónico, 140
en la esfera, 135
en operadores positivos, 142
versus curvatura seccional, 226
versus diferencial de exp, 134
Cartan
descomposición de, 86
Cartan-Hadamard
Teorema de, 181
301
302
Índice alfabético
versus campos de Jacobi, 226
derivaciones, 38
derivada covariante, 122, 127
de la Grassmanniana, 144
del spray canónico
en el grupo lineal, 138
del spray métrico
del grupo lineal, 193
en operadores positivos, 142
derivada de Levi-Civita, 186
del grupo unitario, 193
del spray métrico del grupo lineal, 193
en la esfera, 135
en la Grassmanniana, 189
derivada de Lie, 36
descomposición de Cartan, 86
descomposición polar, 270, 275
desigualdad
de Hölder, 287
de Minkowski, 293
de Young, 293
diferencial
de orden superior, 7
de una función entre variedades, 26
primera, 5
diferencial de la exponencial
adjunta de la, 227
del grupo lineal, 65
en operadores positivos, 83
versus campos de Jacobi, 134
distancia rectificable, 149
Dynkin
fórmula de, 69
EMI en operadores positivos, 181
entorno normal, 118
esfera
campos de Jacobi en la, 135
como superficie de nivel, 31
corchete de Lie en la, 34
curvas cortas en la, 204
curvatura de la, 135
curvatura seccional de la, 220
derivada de Levi-Civita en la,
135
exponencial de la, 135
fibrado TTS, 100
geodésicas en la, 135
radio de inyectividad, 204
spray en la, 135
spray no cuadrático en la, 137
transporte paralelo, 135
espacio de caracteres, 259
espacio de estados, 266
espacio de métrica interior, 153
espacio homogéneo, 48, 49
espacios de medida Lp no conmutativos, 293
espacios de sucesiones, 279
espectro, 238
exponencial
de la Grassmanniana, 144
de un grupo de Lie, 43
del spray, 116
diferencial de, 65
en la esfera, 135
en operadores positivos, 142
factorización, 66
naturalidad de la, 46
fórmulas variacionales, 196
fibrado TTM, 97
de una superficie de nivel, 102
del grupo unitario, 140
en la esfera, 100
en la Grassmanniana, 143
flip canónico, 104
fibrado vertical VTM y VTM∗ , 99
flip canónico, 104
Índice alfabético
Frobenius
Teorema de, 37
función
analítica, 11
cociente, 50
convexa de operadores, 264
de matrices, 54
monótona de operadores, 264
reglada, 9
funcional
energía, 162
longitud, 162
positiva, 266
Gauss
Lema de, 199
Gelfand
transformada de, 260
Gelfand-Naimark-Segal
representación de, 268
geodésicamente convexo, 223
geodésicas
corta, 156
de la Grassmanniana, 144
del grupo unitario, 192
del spray, 115
del spray canónico del grupo lineal, 138
del spray canónico en operadores positivos, 142
del spray métrico del grupo lineal, 191
en la esfera, 135
geodésicas cortas
en el grupo unitario, 206
con la norma uniforme, 210
métrica Frobenius, 207
norma simétrica, 212
en la esfera, 204
en la Grassmanniana, 212
303
existencia global
en dimensión finita, 213
no existencia en dimensión infinita, 215
Grassmanniana, 89
campos de Jacobi en la, 144
como superficie de nivel, 143
curvatura de la, 144
curvatura seccional de la, 224
de matrices, 58
derivada covariante en la, 144
derivada de Levi-Civita en la,
189
exponencial de la, 144
geodésicas de la, 144
spray métrico en la, 144, 189
transporte paralelo en la, 144
grupo
a un parámetro, 138
a un parámetro, 43
de inversibles de un álgebra, 64
de isometrías, 77
de Lie, 41
general lineal, 53, 64
lineal, 52
ortogonal, 56
simpléctico, 56
unitario, 54, 80, 81
grupo lineal, 63
campos de Jacobi
del spray canónico, 140
curvatura
del spray canónico, 139
curvatura seccional
del spray métrico, 221
derivada covariante
del spray canónico, 138
del spray métrico, 193
derivada de Levi-Civita, 193
diferencial de la exponencial, 65
espectro, 65
304
estructura diferenciable, 240
geodésicas, 138
del spray métrico, 191
métrica invariante, 172
métrica Riemanniana invariante, 191
métricas cociente, 172
representaciones, 65
spray canónico, 138
spray métrico, 191
subgrupo algebraico del, 74
transporte paralelo
del spray canónico, 139
grupo unitario
como superficie de nivel, 140
curvatura seccional, 222
curvatura seccional del, 221
derivada de Levi-Civita en el,
193
fibrado TTM, 140
geodésicas, 192
geodésicas cortas
con la métrica uniforme, 210
métrica Frobenius, 207
métrica invariante, 212
geodésicas cortas en el, 206
radio de inyectividad del, 206
spray canónico, 140
Hopf-Rinow
Teorema de, 157
ideal de operadores compactos, 281
identidad de Jacobi, 33
integral
de una curva, 9
de una función reglada, 9
involución, 237
isometría, 224
isotropía, 48
Jacobi
Índice alfabético
campo de, 131
identidad de, 33
jets, 107
Lema
de Gauss, 199
levantada
canónica, 27
de un curva, 27
de una curva, 128
Lie-Trotter
fórmulas de, 70
logaritmos
de operadores unitarios, 81
longitud
de una curva rectificable, 150
métrica
de Finsler, 161, 163
acotada, 163, 168
débil, 163
fuerte, 163
invariante, 171
métrica invariante
en el grupo lineal, 172, 191
matrices
p-codiagonales, 58
p-diagonales, 58
positivas, 59
medida espectral, 275
naturalidad de la exponencial, 46
norma
estrictamente convexa, 176
Frobenius, 287
rotunda, 176
simétrica, 283
unitariamente invariante, 283
en operadores positivos, 173
operador
bilineal, 7
Índice alfabético
cuadrático, 7
de Schatten, 285
Hermitiano, 78
lineal, 3
normal, 255
p-codiagonal, 58
p-diagonal, 58
positivo, 83, 263
unitario, 81
operadores positivos, 59
campos de Jacobi en, 142
curvatura seccional, 222
derivada covariante, 142
exponencial en los, 142
geodésicas, 142
métricas simétricas, 173
propiedad expansiva de la exponencial, 174
spray canónico en, 141
transporte paralelo, 142
órbita, 50
coadjunta, 87
de un operador autoadjunto,
88
de un proyector, 89
de similaridad, 88
orden de una función entera, 66
polinomio
de Taylor, 11
homogéneo, 12
primera variación, 196
propiedad creciente de la métrica
en operadores positivos, 181
propiedad expansiva de la métrica
en variedades de Riemann, 227
proyector
del fibrado doble tangente, 98
radio de inyectividad
de la esfera, 204
305
del grupo unitario, 206
radio espectral, 255
radio numérico, 246
rango numérico, 246
reparametrización normal, 152
representación GNS, 265
representación adjunta, 44
representaciones
L y R, 64
símbolos de Christoffel, 126
sección continua, 50
spray, 110, 114
afín o cuadrático, 116
spray canónico, 124
del grupo de inversibles, 138
del grupo unitario, 140
en operadores positivos, 141
spray métrico, 190
de la Grassmanniana, 144, 189
del grupo lineal, 191
subgrupo
algebraico, 74
analítico, 46, 71
de Lie-Banach, 46, 71
de un grupo de Lie, 71
subvariedad
de un espacio de Banach, 31
de una variedad diferenciable,
27
embebida, 29
regular, 29
tangente
espacio, 23
fibrado, 24
Taylor
fórmula, 11
tensor
de curvatura, 130
Teorema
306
de Ascoli, 157
de Banach-Shauder, 4
de Banach-Steinhaus, 5
de Cartan
en variedades de Finsler, 177
Riemanniano, 227
de Cartan-Hadamard, 229
de Frobenius, 37, 47, 71, 74
de Gelfand, 258, 261
de Hahn-Banach, 4
de Hopf-Rinow, 203, 213
en espacios de métrica interior, 157
en variedades de Finsler, 168
variedad de Riemann, 216
de la función abierta, 4
de la función implícita, 14, 16
de la función inversa, 13
del gráfico cerrado, 5
del valor medio, 10
espectral, 274
topología
débil, 235
fuerte, 235
transformada de Gelfand, 260
transporte paralelo, 128
de la Grassmanniana, 144
del spray canónico del grupo lineal, 139
en la esfera, 135
en operadores positivos, 142
traza finita y fiel, 289
unitización, 238
valores singulares, 277
variedad
de Cartan-Hadamard, 183
de Finsler, 163
débil, 164
de dimensión finita, 165
Índice alfabético
fuerte, 164, 168
de Finsler con spray, 169
Riemanniana, 186
variedad Riemanniana
débil, 202
variedades localmente planas, 225
vector normizante, 270
Índice de símbolos
AC operadores p-codiagonales de A. 90
AD operadores p-diagonales de A. 90
Ah operadores Hermitianos de A. 80
Aah operadores anti Hermitianos de A. 90
Adg isomorfismo adjunto. 41
a∗ adjunto del elemento a. 235, 237
adv (w) = [v, w] representación adjunta. 44
A(v, w) área del paralelogramo generado por v, w. 219
b métrica de Finsler. 161
BCH(v, w) serie de Baker-Campbell-Hausdorff de v, w. 67, 69
B2 (H) operadores de Hilbert-Schmidt. 190, 206
B(E) operadores acotados de E en E. 4
B(E, F) operadores acotados de E en F. 3
B 2 (E × E; F) = B 2 (E2 ; F) operadores bilineales. 6
B(H) operadores acotados del espacio de Hilbert H. 87
B(H)0 operadores de rango finito en H. 190, 281
Bor(X) funciones Borelianas acotadas en el espacio X. 273
Bp (H) operadores compactos de Schatten. 285
c(0) sucesiones con finitos términos no nulos. 279
307
308
Índice de símbolos
c0 sucesiones que tienden a cero. 279
C∗ (a) álgebra C∗ generada por a. 257
C(X) funciones continuas de X en el cuerpo k. 258
C(σ(a)) funciones continuas en el espectro de a. 257
D(a) funcionales normizantes de a,ver también S(A). 78, 246
db distancia inducida por la métrica b. 162
dℓ distancia inducida por la longitud rectificable ℓ. 153
Dfv ó f∗v diferencial de f en v. 5
Dt derivada covariante. 128
Dα ′ β derivada covariante. 127
Eb (α) energía de la curva suave α. 162
Ep proyector con rango Tp M. 125, 188
E ′ = B(E, k) dual topológico de E. 4
ǫp = 2p − 1 simetría inducida por el proyector p. 90, 189
ηv,w campo de Jacobi con η(0) = v, Dη(0) = w. 132
G+
A elementos positivos e inversibles de A. 83
GA grupo de inversibles del álgebra A. 64
b transformada de Gelfand de a. 260
a
GL(E) operadores lineales inversibles de E. 44
GL(n, C) grupo general lineal. 53
gp métrica Riemanniana computada en p ∈ M. 186
Grk (n) Grassmanniana de dimensión k en Rn . 58
Gr(p) Grassmanniana dada por la órbita unitaria del proyector p. 89
H espacio de Hilbert. 31
Herm(A) operadores Hermitianos del álgebra A. 78
H(σ(a)) funciones holomorfas en un entorno del espectro de a. 244
Índice de símbolos
309
I ideal bilátero en un álgebra de operadores. 281, 283, 289
J(s) ideal de operadores dado por el espacio de sucesiones s. 283
K(H) operadores compactos en el espacio de Hilbert H. 190, 278
Lb (α) longitud de la curva suave α respecto de la métrica b. 162
ℓ(γ) longitud rectificable de γ. 149
LX Y derivada de Lie de Y en la dirección de X. 36
[X, Y] corchete de Lie. 36
log logaritmo analítico. 241
Mn (C) matrices complejas de n × n. 52
Mn (C)ah matrices anti Hermitianas de n × n. 55
∇ conexión de Koszul, ver también Dα ′ β. 122
O(x) órbita de x por la acción de un grupo. 48, 50
Pab (α) transporte paralelo a lo largo de α. 128
πM proyección al punto base del fibrado TM → M. 98
π∗ = (πM )∗ diferencial de la proyección al punto base del fibrado TM → M. 98
π = πTM proyección al punto base del fibrado T (TM) → TM. 98
P(A) proyectores autoadjuntos del álgebra A. 90
R tensor de curvatura. 130
R transformación de curvatura. 130, 198
Rp (π) curvatura seccional del plano π en Tp M. 219
r(a) radio espectral de a. 239
R espacio de las curvas rectificables. 150
S(A) espacio de estados de A. 266
secπ curvatura seccional a lo largo del plano tangente π. 220
sφ espacio maximal de la norma simétrica φ. 279
(0)
sφ
espacio minimal de la norma simétrica φ. 279
310
Índice de símbolos
s(I) espacio de sucesiones que deconstruye el ideal de operadores I. 283
Σ espacio de caracteres, espacio maximal. 259
σA (z) espectro de z relativo al álgebra A. 64
σ(a) espectro de a. 238
v ⊗ w tensor elemental. 136
TM ⊕ TM producto fibrado, suma de Whitney. 99
Tr traza del álgebra. 189, 190, 286
τ traza finita y fiel del álgebra. 207, 289
TTM = T (TM) fibrado doble tangente. 97
UA grupo de isometrias del álgebra A. 77
UHS grupo unitario de Hilbert-Schmidt. 206
U(n, C) = U grupo unitario. 54
V(a) rango numérico de a. 78, 248
VTM fibrado vertical inducido por la proyección al punto base πTM . 99
VTM∗ fibrado vertical inducido por la proyección π∗ . 99
W ∗ (a) álgebra de von Neumann generada por a. 273
x↓ reordenamiento decreciente de la sucesión x. 279
Índice de símbolos
.
311
312
.
Índice de símbolos