Download Relatividad de Galileo - Curso de Relatividad Especial

Document related concepts

Transformación de Lorentz wikipedia , lookup

Invariancia galileana wikipedia , lookup

Postulados de la Relatividad Especial wikipedia , lookup

Principio de covariancia wikipedia , lookup

Transcript
CURSO DE RELATIVIDAD ESPECIAL
Hugo A. Fernández – [email protected]
Universidad Tecnológica Nacional - República Argentina
http://www.fisica-relatividad.com.ar
Enfoque del curso
El presente curso de Relatividad Especial está dirigido a alumnos universitarios que
están en la etapa de formación básica. Se presupone que ya tienen conocimientos de
Mecánica de Newton, Electricidad y Magnetismo, y Cálculo Diferencial, pero no han
cursado Mecánica Analítica ni Cálculo Tensorial.
En consecuencia, no se presentará la Teoría de Relatividad Especial en el espacio de
Minkowski (formulación tensorial), ni se usarán herramientas propias de la mecánica
analítica en general, salvo en ciertos temas particulares que serán incluidos en una
carpeta intitulada “Temas Especiales”.
No piense el lector que este enfoque representa una pérdida conceptual de la teoría.
En algunos aspectos podrá ser más laborioso para obtener conclusiones, pero el
contenido profundo y completo de la teoría puede ser descrito totalmente con este
formalismo.
Es opinión del autor que la Teoría de Relatividad Especial debe ser incorporada en la
enseñanza secundaria, para lo cual este curso puede ser valioso para la elaboración
de la bibliografía adecuada en ese nivel.
Bibliografía
La siguiente bibliografía es la recomendada para profundizar el estudio de la teoría.
1. "The Theory of Relativity", C. Möller, Oxford, 1952.
2. "Curso de Teoría de la Relatividad y de la Gravitación", A. Logunov, URSS,
Moscú, 1998.
3. "Theory of Relativity", W. Pauli, Pergamon Press, New York, 1958.
Nota importante
En los últimos veinte años se ha generado una discusión en torno al uso de la masa
relativista. En particular, los físicos e investigadores que trabajan en partículas
elementales suelen rechazar el uso de dicha magnitud relativista, por lo cual hay una
tendencia general a evitar su inclusión en artículos de investigación.
Lo contradictorio de esta postura es que para evitar el uso de la masa relativista se
debe modificar la definición de la cantidad de movimiento y limitar la validez del
Principio de Equivalencia entre masa y energía. Todo ello puede hacerse válido pero
resulta más complicado y, sin duda alguna, es un capricho.
Esta postura arbitraria no tiene fundamentos ya que el uso adecuado de la masa
relativista no implica error alguno, ni conceptual ni de cálculo. Más aún, en cualquier
formulación teórica la variación de la masa con la velocidad (masa relativista) surge
naturalmente para la conservación de la cantidad de movimiento (sin modificar su
definición) y da validez general al Principio de Equivalencia entre masa y energía.
En la Carpeta de Temas Especiales se incorporarán trabajos inéditos con desarrollos
que muestran la necesidad y utilidad conceptual de la masa relativista.
Queda claro que en este curso usaremos masa relativista y la definición clásica de
cantidad de movimiento.
Introducción
En 1905 Albert Einstein (1879-1955), que era un empleado técnico de una oficina de
patentes en Suiza, publicó en una revista científica alemana el trabajo denominado
“Sobre la electrodinámica de los cuerpos en movimiento”.
En este singular y extraordinario artículo se plantea la inconsistencia de resultados
obtenidos con las ecuaciones de Maxwell en la resolución de conocidos problemas
electromagnéticos para cuerpos en movimiento.
La solución propuesta para dilucidar esa cuestión consistió en una revisión completa y
la modificación profunda de los conceptos más básicos del conocimiento, el espacio y
el tiempo, y resultó la formulación inicial de la Teoría de Relatividad Especial.
Estos cambios conceptuales resultan como consecuencia del desarrollo de la Teoría,
elaborada para sistemas inerciales, a partir de dos Postulados basados en hechos
experimentales. Uno establece que cualquier fenómeno natural responde a la misma
ley en todos los sistemas inerciales, y el otro postula la constancia de la velocidad de
la luz en el vacío para todos los observadores.
El primer postulado establece la imposibilidad de distinguir entre el reposo y el
movimiento rectilíneo uniforme, en el sentido que son estados de movimiento naturales
equivalentes, haciendo inconsistente la existencia de un sistema de referencia
absoluto, y además provee la herramienta operativa fundamental para encontrar y
validar todas las leyes relativistas.
El segundo postulado afecta directamente a la Teoría de Relatividad de Galileo,
publicada en 1637 y aceptada como una formulación de validez universal, con
consecuencias directas en la mecánica de Newton, madre de todas las teorías físicas
existentes.
La Teoría formulada en ese trabajo científico es de una belleza inusual en la Física
Teórica, particularmente por la sencillez del cálculo requerido y sus consecuencias en
los conceptos más arraigados en el conocimiento del momento. Esta simpleza en el
cálculo no es representativa de las grandes dificultades conceptuales que encierra su
estudio, que requiere modificar el concepto previamente adquirido sobre el espacio y
el tiempo.
En el año 1916 Einstein presentó la Teoría de Relatividad General, luego del fracaso
por incorporar el campo gravitatorio en la Relatividad Especial. Este tema será tratado
posteriormente.
La formulación y desarrollo de la Relatividad General conducen a una ecuación
tensorial de segundo orden no lineal, para el campo gravitatorio, sin lograrse una
solución general de la misma. A pesar de ello su aplicación en casos particulares dio
resultados y predicciones de tanta importancia (conocidos como curvatura de la luz,
corrimiento al rojo y desplazamiento del perihelio de Mercurio), que práctica y
lamentablemente se abandonaron otras líneas de investigación del campo gravitatorio.
La Teoría General de Relatividad de Albert Einstein, que esencialmente es una teoría
de gravitación, ha sido el modelo seguido por varias Teorías Cosmológicas actuales.
No obstante, en los últimos años resultados experimentales no compatibles con las
predicciones teóricas han generado una incipiente resistencia a este modelo físicomatemático. En este sentido es interesante reconocer la existencia de otras teorías
competitivas, entre las que se destaca la Teoría Relativista de Gravitación (2002) del
notable físico ruso Anatoly Alekseyevich Logunov.
El presente trabajo sobre la Teoría de Relatividad Especial está concebido como
un enfoque físico para la enseñanza en un primer nivel universitario, prestando
especial atención al orden y la forma en que deben ser tratados los distintos temas,
que en muchos casos difieren de la bibliografía usual.
Por razones didácticas varios aspectos son tratados de manera distinta al enfoque
original, incluyendo discusiones conceptuales y deducciones propias.
Los temas a tratar serán:
1 – Sistemas Inerciales
2 – Relatividad de Galileo
3 – Postulados de la Teoría de Relatividad Especial. Fundamentación
4 – Transformaciones de Lorentz
5 – Simultaneidad. Causalidad
6 – Contracción Espacial y Dilatación Temporal
7 – Cinemática Relativista. Efecto Doppler
8 – Cantidad de movimiento. Masa Relativista
9 – Dinámica Relativista. Fuerzas
10 – Trabajo y Energía
11 – Principio de Equivalencia entre Masa y Energía
12 – Complementos de Energía
13 – Masa Propia y Potencia
Este orden en la formulación de la teoría es beneficioso pues, como veremos, evita
elaborar argumentaciones complicadas usando varillas, relojes, haces luminosos y
espejos, como suele figurar en la bibliografía convencional, incluido el genial trabajo
original de Einstein, en un intento de elaborar conceptos nuevos sobre el espacio y
el tiempo.
Sistemas Inerciales
La descripción del movimiento de un cuerpo requiere ineludiblemente la introducción
de un sistema de coordenadas espaciales que permitan identificar unívocamente cada
punto del espacio físico de interés, y una coordenada temporal que permita determinar
el orden cronológico de sucesos en cualquier punto del espacio. A este conjunto de
coordenadas espacio-temporal se lo denomina sistema de referencia.
El número de coordenadas espaciales necesarias dependerá de los vínculos del
sistema físico. Por ejemplo, cuando el movimiento esté limitado a una superficie, tal
como sucede con objetos sobre una mesa, bastará con 2 coordenadas espaciales.
Históricamente, hasta el advenimiento de la Teoría de Relatividad Especial, se aceptó
que la coordenada temporal era la misma para todos los sistemas de referencia
posibles, lo que la hacía independiente de la posición y del estado de movimiento
relativo entre diferentes sistemas de referencia.
Por otro lado, la descripción de los fenómenos (leyes) y el valor de las magnitudes
involucradas resultaban diferentes dependiendo del sistema de referencia elegido,
dando lugar a distintos grados de dificultad.
Fue la obra de Galileo (“Diálogos acerca de Dos Nuevas Ciencias”) la que permitió
asumir la existencia de un grupo particular de sistemas de referencia, llamados
inerciales o galileanos, en los que los fenómenos mecánicos sucedían de la misma
manera y las leyes tomaban la forma matemática más simple posible.
Galileo estableció, a través de sus notables observaciones sobre reposo y movimiento
rectilíneo uniforme de cuerpos libres de fuerza, que eran dos estados de movimiento
equivalentes, relativos al observador.
Supongamos tener dos cuerpos, uno en reposo y el segundo en movimiento rectilíneo
uniforme, respecto de un observador O. Para otro observador O' que se moviera con
la misma velocidad del segundo objeto, éste estaría en reposo y el primero, que
supusimos en reposo, ahora tendría un movimiento rectilíneo uniforme.
Además, postuló que en estos privilegiados sistemas se cumplía que los fenómenos
mecánicos sucedían de la misma forma, respondiendo a las mismas (idénticas) leyes,
por lo cual no era posible distinguir mediante experiencias mecánicas cual de ellos
estaba en reposo y cual en movimiento.
Isaac Newton le dio forma a estos conceptos a través del “Principio de Inercia”, cuyo
significado profundo es postular la equivalencia entre sistemas inerciales.
Existen dos definiciones de sistemas inerciales de uso cotidiano que son aceptadas en
forma recurrente. La primera de ellas (históricamente) es la que establece que
cualquier sistema de referencia que esté en reposo respecto de las estrellas fijas es un
sistema inercial. La segunda postula que un sistema inercial es aquel en el que las
leyes de la física adoptan la forma más simple posible. Ambas definiciones adolecen
de inconsistencias y/o falta de rigor científico.
Analicemos brevemente ambas definiciones tratando de establecer si son operativas y
funcionales.
La primera hace mención de estrellas fijas. Obviamente esto es una reminiscencia del
modelo del éter y el sistema absoluto, que tuvo vigencia hasta el inicio del siglo XX.
Asumiremos como estrellas fijas a aquellas que están tan alejadas que su
movimiento relativo se hace imperceptible a simple vista, es decir que la distancia
aparente entre ellas permanece invariable.
En este caso la definición resulta adecuada para los sistemas de referencia que rotan
respecto de ellas, dado que todos ellos son no inerciales pues aparecen fuerzas,
denominadas ficticias (centrífuga y coriolis), que provocan que no se cumpla ninguno
de los tres Principios de la Mecánica de Newton.
Sin embargo, la definición falla si se trata de discriminar entre dos sistemas de
referencia que, sin rotar respecto de las estrellas alejadas, tienen aceleración relativa
rectilínea entre ellos, pues la posición aparente de las estrellas alejadas no sufre
alteración perceptible, salvo que las velocidad relativa entre los sistemas de referencia
sea muy elevada o cercana a la velocidad de la luz, en cuyo caso se detectarán
modificaciones de posición de las estrellas alejadas.
En resumen, con esta definición no es posible determinar (operativamente) si un
sistema es inercial o no.
La otra definición hace referencia a un concepto subjetivo, tal cual es lo de la forma
más simple posible. Este mero hecho hace que la definición no sea precisa aunque,
desde un punto de vista didáctico, tal vez sea la más recomendable si se la expone
adecuadamente.
En general la “simpleza” que adoptan las leyes depende del fenómeno particular al
cual se apliquen. Nótese, por ejemplo en fuerzas centrales, el clásico problema de dos
cuerpos que se atraen. Por conservación de momento angular el movimiento de
ambos cuerpos sucede en un plano. Si usamos un sistema de referencia (no inercial)
que rota con una adecuada velocidad angular y con su origen en el centro de masa del
sistema de dos cuerpos, se obtiene un problema unidimensional de una única masa en
un campo de fuerzas centrales, mucho “más simple” de resolver y analizar (véase
Goldstein.”Mecánica Clásica”, Cap. III).
Una definición más precisa es la siguiente: sistema de referencia inercial es todo
sistema que esté en reposo o con movimiento rectilíneo uniforme respecto de un
objeto material sobre el cual no actúa fuerza alguna, cualquiera sea su posición
en el espacio. La dificultad (insalvable) de esta definición está en la imposibilidad
física de disponer de un cuerpo libre de interacciones.
Al no contar con una definición que operativamente permita determinar sin
ambigüedad si un dado sistema de referencia es inercial o no, debe considerarse que
la existencia de sistemas de referencia inerciales es una abstracción que no puede ser
demostrada experimentalmente.
El Principio de Inercia fue elaborado en una época en que se asumía que las
interacciones entre cuerpos eran por contacto o por “acciones a distancia”, a velocidad
infinita. No estaba desarrollada la Teoría electromagnética de Maxwell ni la noción de
campo como un ente físico real.
Los experimentos sobre fricción realizados por Galileo mostraron que si una esfera se
hacía rodar sobre una tabla horizontal ella llegaría más lejos si las superficies estaban
pulidas y lustradas.
Por ello Galileo, contradiciendo las ideas aristotélicas, aseveró que la fricción era la
que frenaba a la esfera, que si no hubiera rozamiento no sería necesario estar
empujándola para mantener su velocidad y el cuerpo seguiría con movimiento
rectilíneo uniforme eternamente. Pero en este caso tendríamos un movimiento sin que
hubiera una acción aplicada en la dirección del movimiento, condición idéntica a la de
los cuerpos en reposo.
Si a estos conceptos le agregamos sus disquisiciones sobre cómo suceden los
fenómenos mecánicos (caída de los cuerpos) sobre un barco que se desplaza
suavemente en línea recta y sin aceleraciones, obtenemos el significado del Principio
de Inercia, esto es que los sistemas inerciales son equivalentes y que no hay manera
mecánica de distinguir cual de los dos está en reposo o en movimiento. Todas las
leyes de la mecánica tienen la misma forma en dichos sistemas y las magnitudes
involucradas, cuyo valor puede ser distinto en dos sistemas inerciales, se relacionan a
través de las Transformaciones de Galileo.
Actualmente el Principio de Inercia tiene una significación más general en virtud del
conocimiento que se agregó durante 400 años. En primer lugar Einstein lo extendió a
todos los fenómenos, es decir que todas las leyes de la física tienen la misma forma
en los sistemas inerciales. Además, luego de la incorporación de la acción a través de
campos, debida a Maxwell, y la constancia de la velocidad de la luz en el vacío para
todos los sistemas inerciales, se modificó la relación entre estos sistemas que ahora
se vinculan con las Transformaciones de Lorentz.
Los sistemas inerciales pueden ser considerados una proposición arbitraria y artificial
generada por el desconocimiento sobre las leyes que cumplen las interacciones de
tipo gravitatorio. Si se dispusiera de un modelo matemático que describiera al campo
gravitatorio en un sistema inercial y se conocieran los campos que generan los objetos
materiales en movimiento, las fuerzas inerciales tales como la centrífuga y la de
coriolis, que aparecen en los sistemas de referencia que rotan respecto de las estrellas
alejadas, podrían ser tratados como efectos provocados por la rotación de la materia.
Corresponde aclarar que el último enfoque está en contradicción aparente con la
Teoría General de Relatividad pues en ella la gravitación está íntimamente ligada con
el espacio y el tiempo, relación que se pierde al tratar al campo gravitatorio como un
campo clásico como el eléctrico.
No obstante, no debemos olvidar que las teorías son modelos elaborados para
describir la realidad lo mejor posible, que serán reemplazados por modelos
superiores.
Por último, cabe preguntarse si el concepto de equivalencia de sistemas inerciales no
puede generalizarse a todos los sistemas de referencia, incluso los acelerados,
postulando que dos sistemas son equivalentes si el movimiento relativo entre ellos es
a velocidad constante, y en ellos las leyes conservan la forma asumiendo que los
sistemas se relacionan a través de las Transformaciones de Lorentz (u otras
adecuadas).
Para ello debería disponerse de las ecuaciones (leyes) que corresponden a las
distintas interacciones y los campos correspondientes, incluidos los gravitatorios,
válidas en un sistema y que conserven la forma ante Transformaciones de Lorentz.
Lamentablemente tenemos una descripción completa sólo para el caso
electromagnético (ecuaciones de Maxwell).
La idea resulta muy interesante pues, si fuera consistente, permitiría aplicar la física
relativista de la Teoría de Relatividad Especial en cualquier sistema de referencia.
Relatividad de Galileo
La primera Teoría de Relatividad fue desarrollada por Galileo Galilei (1564-1642),
creador del método científico, como resultado de sus estudios sobre movimiento de
cuerpos, rozamiento y caída libre.
En sus obras “Diálogo sobre los principales sistemas del mundo" (1632) y “Diálogos
acerca de Dos Nuevas Ciencias” (1636), dio las características de los sistemas de
referencia inerciales o “galileanos”, con una notable descripción de experimentos y su
interpretación para dos observadores en movimiento relativo, uno de ellos sobre un
barco que se desplaza suavemente (sin aceleración), y el otro en tierra firme.
Las conclusiones obtenidas permiten postular en sistemas inerciales la equivalencia
entre reposo y movimiento rectilíneo uniforme para dos observadores en movimiento
relativo, sentando las bases del Principio de Inercia.
Asimismo, enunció la relatividad de las trayectorias y de las velocidades de objetos
respecto del observador. Veamos como se desarrolla esta Teoría.
Caída de los cuerpos
La primera demostración rigurosa sobre que todos los cuerpos caen con la misma
aceleración la dio Galileo mediante un razonamiento por el absurdo.
Supongamos tener dos cuerpos de distinto peso, material y forma, que los dejamos
caer partiendo del reposo en un sistema inercial. De acuerdo a las ideas aristotélicas
el más pesado caería más rápido, como muestra la figura.
Ahora realicemos la misma experiencia pero agregando un nuevo cuerpo formado por
dos objetos idénticos a los iniciales, ligados entre si (pegados). Para este nuevo objeto
durante su caída el de mayor peso está siendo frenado por el pequeño, que cae más
despacio, mientras que el pequeño está siendo acelerado por el grande, que cae más
rápido. En consecuencia el nuevo cuerpo caerá ubicado entre los cuerpos originales,
resultando una contradicción pues es el más pesado. La única solución lógica posible
es que todos caigan igual.
Resuelto el tema anterior, Galileo encaró descubrir la ley de caída, es decir encontrar
la función que permita relacionar la posición con el tiempo durante la caída.
Para ello, siendo Profesor en la Universidad de Pisa (1589), diseñó un modelo
experimental que contemplaba obtener un conjunto de pares de datos
correspondientes a posición y tiempo, que obtendría soltando objetos desde los
distintos pisos de la Torre de Pisa. La dificultad principal resultó la medición del tiempo
de caída, que era obtenida con el pulso de un abate. Los resultados no eran precisos
ni repetitivos y no permitieron obtener la ley.
Luego del fracaso inicial decidió determinar los tiempos utilizando una “clepsidra”, que
es un recipiente con agua que tiene una canilla de salida (tapón cónico de madera). El
proceso de medición de tiempos consistía en abrir la canilla cuando soltaba el cuerpo
y cerrarla cuando el objeto llegaba al piso. La masa del volumen de agua recogida lo
determinaba con una balanza y era proporcional al tiempo transcurrido.
Lamentablemente, este método tampoco resultó lo suficientemente preciso para
asegurar un comportamiento, por lo cual Galileo concluyó que la dificultad central de
este proyecto era la rapidez con que caían los cuerpos.
Era necesario entonces retrasar la caída de los cuerpos, es decir lograr que caigan
más despacio. Luego de unos importantes estudios sobre fricción, con esferas de
madera sobre una tabla lustrada, desarrolló el “plano inclinado” como dispositivo para
retrasar la rapidez de la caída de los cuerpos. No resulta pretencioso asegurar que el
Plano Inclinado de Galileo fue el primer acelerador de partículas en la historia, y el
más importante.
Con este avance experimental obtuvo un conjunto de pares (x,t) que permiten hacer
un gráfico de puntos (x,t) y ajustarle un polinomio, resultando que una parábola es
adecuada para dicho ajuste. La ley obtenida por Galileo fue:
Siendo e el espacio recorrido en un tiempo t, con aceleración constante a.
Nota
Sugiero al lector que analice porqué el polinomio de ajuste no puede ser de grado
impar.
Es muy interesante describir, de acuerdo con datos históricos, algunos aspectos sobre
cómo Galileo obtuvo la ley de caída de los cuerpos con el plano inclinado (actividades
realizadas en la Universidad de Padua a partir de 1592).
Si bien este dispositivo permite retardar la caída disminuyendo al ángulo que el plano
forma con la horizontal, dicho ángulo no podía ser muy chico pues, en ese caso, el
rozamiento se haría importante y no podría despreciarse.
Por otro lado, la determinación de los intervalos no era simple, ya que la clepsidra no
brindaba la precisión suficiente y los datos de pruebas repetidas presentaban gran
variabilidad, no resultando adecuado para el objetivo propuesto.
Aunque resulte increíble, Galileo decidió usar un péndulo para medir los tiempos..., y
una metodología genial.
Determinar con precisión lapsos breves con un péndulo suena a disparate, a menos
que dichos lapsos se inicien y terminen exactamente coincidentes con la bolita del
péndulo en un extremo de la oscilación, pues ello es una condición fácilmente
distinguible y precisa.
Por ejemplo, si con el péndulo oscilando se suelta la esfera en el plano inclinado (inicio
de la caída) exactamente en el instante en que la oscilación cambia de sentido, y
luego se logra que la caída de la esfera concluya con el péndulo en idéntica posición al
cabo de un período completo, el error de medición se minimiza.
Luego se repite el método para dos períodos, y así sucesivamente.
Obviamente, se deben seleccionar los espacios recorridos en el plano inclinado para
que se cumpla la condición anterior, para 1, 2, 3,..., n oscilaciones. Para ello Galileo
usó un tope móvil de madera y ajustó su posición correcta del final de la caída que
corresponda, con el sonido del choque entre la esfera y el tope, coincidente con la
posición del péndulo en un extremo de la oscilación.
Así obtuvo la ley de caída de los cuerpos, que inicialmente se llamó la “Ley de los
números impares”, debido a que los espacios recorridos en cada oscilación del
péndulo tenían esa sucesión numérica (ver figura).
Dado que la suma de los n primeros términos de la sucesión de números impares es
n2, se obtiene que el espacio recorrido es directamente proporcional al cuadrado del
tiempo.
Transformaciones de Galileo
Sean dos sistemas de referencia inerciales (O y O’). Llamaremos V (en mayúscula) a
la velocidad relativa entre ellos, v (en minúscula) la velocidad de un objeto respecto de
O, y v’ la velocidad respecto de O’. Las coordenadas espaciales x,y,z se refieren al
sistema de O, siendo x’,y’,z’ las correspondientes al sistema del observador O’.
En general, todas las variables no primadas corresponderán al sistema O y las
primadas al O’.
Supongamos que en el instante inicial ambos sistemas coinciden. Para una mejor
visualización los esquemas tendrán al sistema O´debajo del O, y por simplicidad
supondremos arbitrariamente que el O está en reposo y el O´con velocidad constante
V en la dirección del eje x.
Supongamos un objeto en reposo en O. Para un observador fijo en O’ este objeto se
mueve con velocidad v' = -V , con movimiento rectilíneo uniforme según el eje x’.
La posición del objeto para O’ irá variando según la relación x' = x-V t , pues V es
constante.
En general, la relación funcional entre las coordenadas de ambos sistemas, conocidas
como Transformaciones de Galileo, serán:
La coordenada temporal es la misma en ambos sistemas.
Estas transformaciones son la base conceptual que fundamentan la “Dinámica del
punto material”, desarrollada por Newton.
Relatividad de las trayectorias
Se deja caer un objeto partiendo del reposo y con coordenadas iniciales (x0 ,y0 ,0), en
el sistema O.
Su trayectoria es rectilínea en dicho sistema, como muestra la figura, y se pretende
determinar cómo es para un observador en O’.
En el sistema O el movimiento del cuerpo cumple con
En el sistema O’ la trayectoria estará dada en forma paramétrica.
Resolviendo este sistema de dos ecuaciones se obtiene la forma explícita
Esta es la ecuación de una parábola invertida como muestra el siguiente gráfico.
La conclusión es que la trayectoria de un objeto es relativa al sistema de referencia.
Lo que es una caída libre rectilínea para un observador será un arco de parábola para
otro en movimiento respecto del primero.
Un ejemplo interesante y cotidiano lo ofrece la lluvia. Asumamos que está lloviendo y
no hay viento. Para un observador “en reposo” la lluvia cae verticalmente, mientras
que para un observador en movimiento con velocidad constante las trayectorias de las
gotas de agua son rectas inclinadas como muestra la figura.
Se deja planteado demostrar que las trayectorias para O’ no son arcos de parábola
debido a que las gotas no caen en caída libre (MRUV) sino a velocidad constante por
la fricción con el aire.
Teorema de adición de velocidades
Este importante Teorema fue demostrado por Galileo en una época en que aún no se
conocían las derivadas.
El problema consiste en determinar, para un mismo objeto, como se relacionan las
velocidades que le miden dos observadores inerciales en movimiento relativo. Su
demostración es muy simple y sus consecuencias eran muy conocidas pues se lo
aplicaba cotidianamente. Por ejemplo, para subirse a un carro en movimiento lo mejor
es correr hasta ponerse en reposo respecto del carro.
La importancia de este Teorema radica en que Galileo mostró matemáticamente su
validez en todos los sistemas inerciales.
Con las Transformaciones de Galileo podemos relacionar fácilmente las velocidades
de un mismo objeto medidas desde O y O’, resultando:
Teorema de Adición de velocidades
Es decir:
La conclusión es que la velocidad de un móvil es diferente para dos observadores en
movimiento relativo.
Las aceleraciones son absolutas
Siendo la aceleración de un punto material la derivada de su velocidad respecto del
tiempo, resulta muy simple encontrar qué valor tendrá en dos sistemas inerciales en
movimiento relativo. Derivando la expresión obtenida en el Teorema de adición de
velocidades, obtenemos:
La aceleración de un punto material es absoluta, es decir que su valor es el mismo
medido en cualquier sistema de referencia inercial.
Este resultado junto a la invariancia de la masa de un punto material fundamenta la
aseveración de que mediante experimentos mecánicos no hay posibilidad alguna de
determinar cual sistema está en reposo y cual en movimiento, pues las magnitudes
Fuerza, Masa y Aceleración son absolutas.
Postulados de la Teoría de Relatividad.
Fundamentación
Supongamos tener una fuente luminosa en reposo respecto de un observador O1 en
un sistema inercial, y otros dos observadores en movimiento relativo constante
respecto del primero, tal que el O2 se acerca y el O3 se aleja, como muestra la figura.
Los tres observadores miden la velocidad de la luz proveniente de S.
Asumiendo que están en el vacío el observador O1 mide c (300.000 Km/seg).
De acuerdo a la Teoría de Relatividad de Galileo, aplicando el teorema de adición de
velocidades, el observador O2 debería medir c+V, y el O3 mediría c-V.
Una serie de experimentos ópticos muy precisos, realizados con un interferómetro por
los investigadores norteamericanos Michelson y Morley, dieron reiteradamente como
resultado que los tres observadores miden la misma velocidad C.
Ante este hecho se plantean dos soluciones posibles:
1 – La medición está mal realizada.
2 – Las transformaciones de Galileo son incorrectas.
Resulta obvio que los científicos especialistas de la época se inclinaron masivamente
por la opción 1, pues la otra implica la invalidez del soporte de la mecánica de Newton.
Uno de los intentos más elaborado que tuvo aceptación parcial fue hecho por H.
Lorentz (1853-1928), que propuso que dado que cualquier equipamiento que se use
para medir velocidad debe inexorablemente medir espacio y tiempo, el movimiento
relativo entre observadores, respecto del "éter" en un sistema de referencia "absoluto",
provocaba modificaciones físicas en sus respectivos equipos, tales que los espacios
recorridos y los tiempos empleados se determinaban con error. Completó sus
argumentos fundamentándolos con su Teoría del electrón (publicada un tiempo
después) y haciendo el cálculo de las modificaciones espaciales y temporales que
debía sufrir el dispositivo, encontrando las relaciones de espacio y tiempo en función
de la velocidad del observador respecto de la fuente. Estas leyes se conocieron como
“Transformaciones de Lorentz”.
No todos los científicos compartían esta postura. Existe una anécdota atribuida al gran
físico matemático francés Henri Poincaré (1854-1912), que habría dicho: “Es más
probable que sea un error de cuenta cada vez que la hicieron, que sea cierta la
propuesta de Lorentz de errores inteligentes”.
En el año 1900 Poincaré hace conocer su análisis sobre la proposición de Lorentz,
indicando que "si la Teoría de Lorentz es correcta habría que abandonar
probablemente algunos principios de la mecánica newtoniana". Agrega: "la teoría del
electrón no sólo viola el principio de acción y reacción sino la conservación del
momento" (Berkson, 1981). Esto último es la principal e insalvable inconsistencia pues
la conservación del momento era (y sigue siendo) un principio universal. Sobre este
tema volveremos más adelante.
Albert Einstein, que aparentemente desconocía las Transformaciones de
Lorentz, eligió la opción 2.
En su trabajo científico "Sobre la Electrodinámica de Cuerpos en Movimiento", luego
rebautizado como Teoría de Relatividad (por sugerencia de Max Planck), dedujo las
transformaciones espacio temporales que vinculaban a dos sistemas inerciales, que
paradójicamente resultaron ser las Transformaciones de Lorentz, aunque con una
interpretación absolutamente diferente.
En su trabajo original Einstein hace inicialmente un análisis sobre simultaneidad de
eventos y lo vincula con la medición de distancias y tiempos, detallando un método
adecuado para sincronizar relojes en distintos puntos de un sistema inercial, válido
bajo condiciones de isotropía y homogeneidad del espacio y uniformidad del tiempo.
Por razones didácticas un análisis sobre espacio y tiempo lo trataremos por separado
en este mismo capítulo.
Aceptemos, por el momento, que en un sistema inercial la métrica está establecida y el
tiempo está sincronizado. Un objeto en reposo mide lo mismo en cualquier posición del
espacio y orientación del objeto (homogeneidad e isotropía), y un evento o fenómeno
bajo las mismas condiciones tarda lo mismo en cualquier lugar y momento en que
ocurra (uniformidad).
Los postulados de La Teoría de Relatividad Especial enunciados por Einstein son:
1. Principio de Relatividad
Las leyes que describen los cambios de los sistemas físicos no resultan
afectadas si estos cambios de estado están referidos a uno u otro de dos
sistemas de coordenadas en traslación con movimiento uniforme.
2. Principio de invariancia de la velocidad de la luz
Cualquier rayo de luz se mueve en el sistema estacionario con velocidad
"c", tanto si el rayo es emitido por un cuerpo en reposo o en movimiento.
El primer postulado está indicando que en todos los sistemas inerciales todos los
fenómenos ocurren de la misma forma, es decir que tienen el mismo comportamiento,
por lo cual todos los sistemas inerciales resultan absolutamente equivalentes e
indistinguibles.
No hay posibilidad alguna de determinar cual está en reposo o en movimiento. Sin
duda, este enunciado hace innecesario e incluso contradictorio la existencia de un
sistema de referencia absoluto. Asimismo, incorpora implícitamente el Principio de
Inercia.
No debe confundirse lo anterior con que una magnitud física tomará el mismo valor en
todos los sistemas inerciales, pues una magnitud no es una ley. Supongamos, por
ejemplo, un fenómeno eléctrico simple, una carga puntual en reposo en el origen de
coordenadas de un sistema inercial.
En este sistema un observador medirá un campo eléctrico E estacionario y un campo
magnético B=0, dado que no hay corrientes ni imanes. Otro observador en movimiento
relativo constante medirá un campo eléctrico E’ que no es estacionario, pues para este
observador la carga se está moviendo, y un campo magnético B’ distinto de cero
debido a que la carga que está en movimiento es una corriente.
O sea, las magnitudes involucradas tienen diferente valor para dos observadores en
movimiento relativo. Sin embargo, las leyes (Ecuaciones de Maxwell) que describen el
fenómeno son las mismas en los dos sistemas.
Su aplicación en cada uno de los sistemas dará el resultado correcto, siendo diferente
en cada sistema los valores de las magnitudes que intervienen.
El segundo Postulado acepta la constancia de la velocidad de la luz como un Principio
Universal, sustentado en resultados experimentales, resultando la clave para vincular
dos sistemas inerciales ya que permite encontrar las transformaciones de
coordenadas necesarias para que la velocidad de la luz sea la misma en ambos
sistemas.
Espacio y Tiempo
La Teoría de Relatividad no es un modelo sobre el movimiento de los cuerpos, o de la
Mecánica o del Electromagnetismo, ni sobre alguna disciplina particular de la Física.
Es una teoría sobre el espacio y el tiempo, que trata sobre sus propiedades y de qué
manera ellas inciden y regulan las leyes sobre el comportamiento de los fenómenos
naturales.
Tratemos de describir brevemente algunos aspectos de interés sobre la evolución que
sufrieron estos conceptos básicos fundamentales.
La experiencia mostró que el espacio físico (tridimensional) posee una simetría
particular por la cual el tamaño y la forma de los objetos materiales en reposo respecto
de un observador no dependen de la posición ni de la orientación del objeto.
Este simple hecho permite determinar empíricamente una unidad de medida espacial
e introducir el concepto de distancia, requisito necesario para reconocer la geometría
correspondiente al espacio, que resultó la euclídea, válida para todo observador.
Estas propiedades se conocen hoy como homogeneidad e isotropía del espacio.
Análogamente, por observación de los fenómenos naturales periódicos se asumió que
el tiempo físico, concepto que permite ordenar la ocurrencia de sucesos (“antes” y
“después”), era una magnitud unidimensional mensurable que admite una definición
similar a la de distancia, llamada intervalo o duración. La experiencia mostró también
que el tiempo físico poseía una simetría particular por la cual la duración de un dado
evento causal, bajo idénticas condiciones, no dependía del lugar de ocurrencia ni del
instante de inicio.
Esta propiedad actualmente se denomina uniformidad del tiempo.
Hasta fines del siglo XIX se suponía que el espacio y el tiempo eran magnitudes
independientes con valores absolutos, por lo cual toda medición de distancia o de
intervalo era idéntica para todo observador. Nuestro Universo era tridimensional, de
geometría euclídea, y solamente su evolución requería el análisis temporal, sin que
ello incidiera en las propiedades del espacio.
La métrica del espacio (euclídeo tridimensional) era invariante, condición que puede
expresarse en coordenadas cartesianas mediante:
ds2 = dx2 + dy2 + dz2
Invariante
Esta interpretación, aceptada durante más de dos milenios, puede ser entendida con
un ejemplo cotidiano. Supongamos tener una dada secuencia de fotos de un móvil,
obtenidas a intervalos conocidos y cámara fija, tal que el movimiento del objeto puede
estudiarse por comparación y así conocer la evolución del fenómeno dinámico.
Cada foto será distinta pero ellas siguen siendo bidimensionales, su métrica espacial
es la misma (y su escala se conserva).
Los trabajos de Lorentz y Poincaré, aparecidos alrededor del año 1900, mostraron que
las “distancias” e “intervalos”, medidos sobre un mismo fenómeno por observadores en
movimiento relativo, daban resultados distintos y dependientes de la velocidad entre
observadores. La geometría espacial seguía siendo euclídea para cada observador
(para cuerpos en reposo) pero las distancias y los intervalos medidos no eran idénticos
(nacía la relatividad post Galileo), es decir que la métrica euclídea tridimensional no
era invariante.
Con el advenimiento de la Teoría de Relatividad de Einstein (1905) quedó claramente
establecido que para todo observador inercial el espacio y el tiempo conservaban las
históricas propiedades, pero sus métricas (espacial y temporal) diferían entre sistemas
de referencia con movimiento relativo constante. Las transformaciones de Lorentz eran
las relaciones funcionales que vinculaban dos sistemas de referencia inerciales.
Sin embargo, inicialmente no se entendió que esta relación funcional (Lorentz) entre
sistemas de referencia inerciales implicaba algo mucho más profundo: el Universo era
esencialmente de cuatro dimensiones.
Este descubrimiento se debió a Minkowski (1908) quien se percató que la pérdida de
invariancia de la métrica euclídea espacial era debida a la relación existente entre el
espacio y el tiempo, por lo cual la métrica correcta debía contener al tiempo.
La adecuada métrica invariante en cuatro dimensiones se deduce fácilmente de las
Transformaciones de Lorentz, resultando:
ds2 = c2dt2 – (dx2+dy2+dz2)
Invariante
Debido a los signos distintos de las partes espacial y temporal en el segundo miembro,
esta métrica se denominó seudo euclídea a propuesta de Klein y Hilbert.
Importantes estudios contemporáneos han mostrado que las propiedades de simetría
del espacio y el tiempo, representadas mediante su métrica en un espacio de cuatro
dimensiones (y su invariancia), son suficientes para fundamentar la Teoría de
Relatividad Especial, sin necesidad de recurrir a los postulados propuestos por
Einstein.
Específicamente se ha demostrado que si aceptamos que los fenómenos que ocurren
en nuestro Universo responden a una métrica cuadridimensional seudo euclídea del
espacio-tiempo, entonces el Principio de Relatividad y la existencia de una velocidad
tope y absoluta pueden ser obtenidos como consecuencias.
De acuerdo con el notable físico ruso A. Logunov, la Teoría de Relatividad queda
rigurosamente establecida postulando que los fenómenos físicos suceden en un
espacio cuadridimensional cuya geometría es seudo euclídea.
Consecuencias
Esta formulación moderna de la Relatividad Especial (Logunov, 1996) reviste una
extraordinaria importancia ya que establece rigurosamente que las condiciones de
validez de la teoría dependen única y exclusivamente de las propiedades del espacio y
el tiempo asignadas. No es necesario postular la constancia de la velocidad de la luz ni
el Principio de Relatividad.
Es fundamental resaltar que la homogeneidad e isotropía del espacio, la uniformidad
del tiempo, y la métrica seudo euclídea invariante, que convalidan la Teoría Especial
de Relatividad, son exactamente los mismos postulados que fundamentan los
llamados Principios Universales de conservación (Teorema de Emmy Noether, 1915),
por lo cual todas las leyes válidas en esta teoría poseen la misma jerarquía que las
leyes de conservación de la energía, de la cantidad de movimiento y del momento
angular.
En consecuencia, el extraordinario descubrimiento hecho por A. Logunov nos pone
frente a una integración histórica de las leyes relativistas de la Física y los Principios
Universales, generando una situación crítica, ya que el incumplimiento de cualquiera
de estas leyes relativistas que signifique invalidar sus fundamentos obligará a revisar
todo el conjunto, pues todas ellas se derivan de los mismos postulados básicos.
Asimismo, la existencia de una velocidad máxima posible, única y absoluta, obtenida
como consecuencia de asumir una geometría seudo euclídea del espacio-tiempo y su
métrica invariante, clarifica que cualquier modelo teórico que proponga otra alternativa,
tal como atribuir velocidades máximas diferentes a la gravedad y al electromagnetismo
(T. van Flandern, "The speed of gravity - What the experiments say", 1998; S.
Kopeikin, "Bi-metric theory of gravity", 2006, etc.), poseerá una métrica espacio
temporal diferente a la seudo euclídea.
Dado que la forma matemática de una ley tiene implícita la geometría utilizada, las
leyes que describen el comportamiento de los fenómenos serán distintas en marcos
teóricos que usen diferentes métricas.
Destaquemos la evidente incompatibilidad entre las teorías General y Especial, debida
a que las propiedades establecidas en cada caso para el espacio y el tiempo son
contradictorias y antagónicas entre sí. Ante la presencia de masa ambas teorías tienen
métricas espacio temporales distintas, lo que implica que los fenómenos se interpretan
de manera distinta y, por supuesto, responden a leyes diferentes.
Como vemos, existe una profunda sutil diferencia entre cambiar de sistema de
referencia espacio temporal, procedimiento usual, útil y lícito, a modificar sus
propiedades cambiando la métrica.
No debemos extrañarnos, entonces, que en la Teoría General de Relatividad no se
cumplan ni los Principios Universales ni la Relatividad Especial, dado que la métrica
(espacio curvo) es dependiente de la distribución de materia. Más aún, ninguna ley
relativista en el espacio de Minkowski es válida en la Teoría General, y ello incluye al
Electromagnetismo de Maxwell.
En este sentido digamos que hay una discusión centenaria respecto de la validez de la
mal denominada Paradoja de Born, sobre que un electrón en movimiento hiperbólico
no irradia en el espacio curvo de la Teoría General y sí lo hace en el espacio de
Minkowski.
Este tema puede ser profundizado con los siguientes trabajos:
1. “Curso de Teoría de la Relatividad y de la Gravitación”, A. Logunov, Lecciones
1 y 2, 1998.
2. "Relativity without light", N. Mermin, Am. J. Phys. 52 (2), 1984.
3. "Special Relativity in the 21st century", S. Cacciatori, V. Gorini, A.
Kamenshchik, 2008.
4. "The Theory of Relativity - Galileo's Child", Mitchell J. Feigenbaum, 2008.
Transformaciones de Lorentz
Los Postulados de Einstein no son consistentes con las Transformaciones de Galileo,
ya que la constancia de la velocidad de la luz para todos los observadores inerciales
resulta incompatible con el Teorema de adición de velocidades de Galileo.
Considerando que la medición de velocidades implica medir espacio recorrido y tiempo
empleado, no debemos anticipar o prejuzgar características espaciales y/o temporales
para las transformaciones de coordenadas entre sistemas inerciales.
Resulta interesante remarcar que el primer desarrollo lógico como continuación
inmediata de la Teoría cuyos Postulados acabamos de ver, sería encontrar, si es
posible, las Transformaciones que satisfacen ese requerimiento. Debe tenerse muy
presente que las transformaciones que vinculan a los sistemas inerciales serán la base
fundamental y soporte de todas las leyes físicas, dado que las leyes deberán
conservar su forma ante esas transformaciones.
Además, dado que las transformaciones buscadas son relaciones funcionales entre las
coordenadas (espacio y tiempo) de dos sistemas inerciales cualesquiera, veremos que
su análisis e interpretación permitirán obtener un mayor conocimiento sobre estos dos
conceptos fundamentales.
Consecuentemente, corresponde establecer las hipótesis necesarias para encontrar
tales transformaciones para dos sistemas inerciales en movimiento relativo, y que
posean la propiedad de que en los sistemas el valor de la velocidad de la luz en el
vacío sea el mismo.
Existen varias deducciones distintas de estas transformaciones de coordenadas en la
bibliografía específica, con distintos grados de dificultad y enfoque. De acuerdo a mi
larga experiencia docente, cualquiera de estas deducciones resulta muy complicada al
alumno tipo.
Al respecto, he desarrollado una demostración que, en mi opinión y por razones
didácticas, resulta ser la más simple sin perder rigor o generalidad, que veremos a
continuación.
Hipótesis (fundamentadas por experimentos)
En todo sistema inercial se cumple:
1. El espacio es isótropo y homogéneo.
2. El tiempo es uniforme.
3. La velocidad de la luz en el vacío es absoluta y vale 300000 Km/seg (Postulado
de Einstein).
Las primeras dos hipótesis garantizan que el tamaño de un objeto ideal rígido en
reposo sea el mismo en cualquier posición y orientación del espacio, y que la duración
de un fenómeno bajo idénticas condiciones sea independiente del momento y lugar en
que ocurre.
Estas hipótesis, que deberían ser elevadas a la categoría de postulados universales,
están fundamentadas en 400 años de experiencias. Su importancia se hace notoria
con los siguientes razonamientos: 1) si un objeto conserva su tamaño ello permite
definir una unidad de longitud; 2) si la duración de un determinado fenómeno causal no
depende del instante inicial del mismo, podremos definir una unidad de tiempo.
Estas dos propiedades del espacio y el tiempo son las que definen la "métrica" del
sistema de referencia.
Ello nos limita a que las transformaciones de coordenadas (x,y,z,t) entre dos sistemas
inerciales deben ser lineales, pues de lo contrario se perdería la homogeneidad y/o la
uniformidad.
Aclaremos un poco más esta última aseveración.
Las transformaciones de coordenadas que permiten pasar de un sistema de referencia
(x,y,z,t) a otro (x’,y’,z’,t’) están dadas por 4 relaciones funcionales, que en el caso más
general pueden expresarse por:
x’=f1(x,y,z,t)
y’=f2(x,y,z,t)
z’=f3(x,y,z,t)
t’=f4(x,y,z,t)
Tratemos de analizar cómo deben ser estas funciones para que el espacio y el tiempo
posean los mismos atributos en ambos sistemas.
Supongamos que la función x’=f1(x,y,z,t) es la siguiente relación cuadrática: x’=a.x2,
siendo a una constante.
En este caso un objeto rígido de longitud L=x2-x1 en el sistema O, cuyo tamaño es el
mismo en cualquier posición sobre el eje x, en el sistema O’ tendrá una longitud dada
por L’=(x’2-x’1)= a(x22 - x12), cuyo valor depende de la posición en que esté ubicado
sobre el eje x. Nótese que si desplazo el objeto en la dirección del eje x’ su longitud
cambia. Es decir que en el sistema primado el espacio no es homogéneo.
El mismo análisis puede hacerse con las otras coordenadas, llegando a la conclusión
de que la única manera de mantener similares propiedades del espacio y el tiempo en
ambos sistemas es que las transformaciones sean lineales, cuya expresión más
general para la coordenada x' es:
x’= a1 x+a2 y+a3 z+a4 t+a5
Nota
Muchas de estas constantes podrán anularse con la elección particular de ambos
sistemas. Por ejemplo, si establecemos que en el instante t=t'=0 los sistemas
coinciden, los términos independientes (a5) se anularán.
Sean dos sistemas de referencia inerciales (O y O’), inicialmente coincidentes.
Llamaremos V (en mayúscula) a la velocidad relativa entre ellos. Cuando exista un
objeto en movimiento, será v (en minúscula) su velocidad medida en el sistema O, y v’
su velocidad respecto de O’.
Las coordenadas (x,y,z,t) se refieren al sistema de O y las coordenadas (x’,y’,z’,t’) son
las correspondientes al sistema O’.
En general, todas las variables no primadas corresponderán al sistema O y las
primadas al O’.
Supongamos que en el instante inicial ambos sistemas coinciden. Para una mejor
visualización los esquemas tendrán al sistema O’ debajo del O.
Por simplicidad supondremos arbitrariamente que el O está en reposo y el O’ con
velocidad constante V en la dirección del eje x, como muestra la figura.
Esta selección de movimiento relativo según el eje x hace que las coordenadas (y’; z’)
sean idénticas a las (y; z), de acuerdo con las hipótesis establecidas.
Las transformaciones lineales de coordenadas para relacionar ambos sistemas son de
la forma:
Mediante un cálculo simple podemos hallar la relación de velocidades (de un objeto)
entre sistemas, obteniendo:
Siendo a1; a2; a3; a4 constantes arbitrarias que determinaremos mediante cuatro (4)
experimentos pensados.
Experimento 1 - Objeto en reposo en O
Para un observador en O’ este objeto se mueve con velocidad v´=-V, con movimiento
rectilíneo uniforme según el eje x’.
Experimento 2 - Objeto con vx = V en O
Para un observador fijo en O’ este objeto está en reposo.
Experimento 3 – Un haz de luz se propaga según el eje x en O
En ambos sistemas la velocidad medida resulta c.
Experimento 4 – Un haz de luz se propaga según el eje y en O
En ambos sistemas la velocidad medida resulta c.
Halladas las constantes quedan determinadas las transformaciones de coordenadas
que vinculan ambos sistemas, resultando ser las Transformaciones de Lorentz, pero
con diferente significado, ya que son las transformaciones lineales que relacionan la
métrica de dos sistemas de referencia inerciales.
Tienen la propiedad de que la velocidad de la luz resulta la misma (c) en todos los
sistemas inerciales. Esta deducción tiene la ventaja que utiliza como argumento
principal la constancia de la velocidad de la luz y el Teorema de Pitágoras.
Las mismas nos permiten pasar del sistema O al O’. Si quisiéramos encontrar las
transformaciones que permiten pasar del O’ al O bastaría con despejar las variables
(x, y, z, t) en función de (x’, y’, z’, t’).
Transformaciones de Lorentz
Estas transformaciones no son generales pues corresponden al caso particular en que
la velocidad relativa entre sistemas es colineal con el eje x. Algunos temas particulares
requieren que la dirección de la velocidad entre sistemas de referencia inerciales sea
cualquiera. En este caso las Transformaciones de Lorentz generales son más
complicadas, resultando una expresión simple si se usan las coordenadas tangencial y
transversal a la velocidad V, respectivamente (Pauli, “Theory of Relativity”, pág. 10):
Importante:
Nótese que si la velocidad relativa entre sistemas es mayor que c se obtienen valores
imaginarios de espacio y tiempo, perdiendo su significado físico. Asimismo, hacer la
velocidad del sistema igual a c genera una indeterminación pues el denominador se
anula en las Transformaciones de x y t.
En consecuencia, asignar a un sistema de referencia inercial una velocidad
relativa V mayor o igual a la velocidad de la luz carece de significado y no puede
ser tratado en el marco de esta Teoría.
Se podría pensar erróneamente que esto último conforma una limitación de validez de
la Teoría de Relatividad Especial. Si se analiza cuidadosamente se concluye que
proponer una velocidad invariante tiene como consecuencia que dicha velocidad (c) es
una cota máxima para un espacio-tiempo real, pues fija el dominio del parámetro V tal
que -c < V < c. En consecuencia, proposiciones tales como fijar un sistema de
referencia a un haz de luz o a un fotón en el vacío, es un error conceptual.
Algunas otras importantes conclusiones podemos obtener de un primer análisis.

Las Transformaciones de Lorentz convergen a las de Galileo si V << c.
Esto resulta importante pues nos permite asegurar que la mecánica clásica es
valedera para velocidades bajas respecto de la de la luz.
Cuando V es mucho menor que c el tiempo resulta absoluto (t'=t).
La experiencia posterior a la Teoría de Relatividad nos ha mostrado que todas
las leyes relativistas convergen a las leyes clásicas correspondientes cuando
las velocidades involucradas son mucho menor que c, lo que se tradujo en el
Principio de Correspondencia.
El Principio de Correspondencia establece como condición necesaria de
validez que todas las leyes relativistas tiendan a las clásicas cuando V/c tiende
a cero, proveyendo una importante herramienta operativa para el desarrollo de
leyes relativistas en cualquier línea de trabajo.

Tiempo y espacio están vinculados.
Como veremos luego en forma más detallada, esta relación funcional permitirá
mostrar que la evolución temporal es diferente entre sistemas inerciales en
movimiento relativo. Este hecho genera uno de los cambios conceptuales
necesarios más importante, que trataré de explicar con un experimento
pensado.
Supongamos tener un péndulo oscilando con pequeñas amplitudes. El sistema
cuelga de un clavo en reposo respecto a nuestro sistema. El movimiento
resulta periódico y su período T medido es constante, dependiendo de la
longitud del hilo (l) y de la aceleración de la gravedad (g). Su expresión
matemática es:
Ahora imaginemos otro péndulo oscilando, de igual longitud de hilo, que pasa
frente a nosotros con velocidad V constante. Midiendo adecuadamente el
(pseudo) período del péndulo en movimiento encontramos, como
demostraremos más adelante, que oscila más lentamente que el nuestro.
Medir adecuadamente significa tener en cuenta que la posición inicial y la final
de una oscilación del péndulo móvil son distintas para nosotros y que,
cualquiera sea la técnica de medición usada, corregiremos efectos aparentes,
tales como retrasos debido a la velocidad de la luz, paralaje, etc.
Más aún, dado que la longitud de los péndulos es la misma (y'=y) debemos
asumir que la aceleración de la gravedad es diferente en los sistemas en
movimiento relativo.
Antes de la Teoría de Relatividad Especial medir implicaba tener un instrumento de
medición y un objeto. Ahora medir involucra también al observador.
Todo parece indicar que "casi" todas las magnitudes físicas (sus valores) son relativas
al sistema de referencia, como resultado de que los sistemas en movimiento relativo
tienen métricas espacio temporales distintas.
Las magnitudes que tienen carácter absoluto, además de la velocidad de la luz en el
vacío, son pocas y se especula que juegan un papel fundamental en la estructura de
nuestro universo. Para hallar estas magnitudes supuestamente "claves", es necesario
disponer de modelos teóricos relativistas de los distintos tipos de interacciones. En
particular, las ecuaciones de Maxwell cumplen este requisito, lo que permitió deducir
que la carga es un invariante. Un electrón tendrá el mismo valor de carga eléctrica en
cualquier sistema de referencia inercial.
Como veremos más adelante en detalle, ésta creencia más la formulación de la Teoría
de Relatividad en un espacio de cuatro dimensiones (Minkowski), influyó en muchos
especialistas generando una diferencia de criterios importante respecto de la masa,
aún no resuelta.
En el ítem siguiente veremos otro caso de invariancia como consecuencia de las
Transformaciones de Lorentz, que conforma una propiedad fundamental de la métrica
de los sistemas inerciales.
Invariancia del Intervalo
Se define suceso al conjunto (x, y, z, t) que determinan el punto en el espacio y el
instante en que ocurre. Los sucesos pertenecen a un espacio (matemático)
tetradimensional donde cada punto, llamado punto del universo, representa un
suceso. El movimiento de una partícula puntual en este espacio será una curva
denominada curva de universo.
Tomemos ahora dos sucesos (x1, y1, z1, t1) y (x2, y2, z2, t2). El cuadrado de la distancia
espacial entre los sucesos está dada por:
Llamaremos Intervalo al valor S obtenido de la relación
Con las Transformaciones de Lorentz podemos calcular sin dificultad el intervalo de
estos dos sucesos medidos por dos observadores inerciales cualesquiera, resultando:
Llegamos a una conclusión muy importante:
El intervalo entre sucesos es igual en todos los sistemas inerciales.
Queda planteado demostrar que dos sucesos pueden ser causales sólo si S es real.
Se propone también, a modo de ejercicio usando cálculo diferencial, que se demuestre
con las Transformaciones de Lorentz que el intervalo elemental es un invariante.
ds2 = c2dt2 – (dx2+dy2+dz2)
Invariante
Discusión
Las Transformaciones de Lorentz fueron desarrolladas en el año 1900 como un
avance para establecer las leyes del electromagnetismo para sistemas inerciales en
movimiento relativo. Lorentz mostró (parcialmente) que estas Transformaciones
dejaban invariantes las ecuaciones de Maxwell, sin lograr una interpretación
conceptual.
La propuesta de Lorentz mantenía implícitamente la validez de las Transformaciones
de Galileo, la métrica espacial y la coordenada temporal eran absolutas en los
sistemas inerciales, asumiendo que por alguna razón física, que relacionaba con las
interacciones electromagnéticas, los objetos modificaban su tamaño y los relojes
alteraban su marcha, provocando una "aparente" constancia de la velocidad de la luz.
Las propiedades del espacio y el tiempo no eran alteradas (espacio-tiempo absoluto).
Estas interpretaciones, tanto para el electromagnetismo como para la invariancia de la
velocidad de la luz, tenía serias e irreconciliables inconsistencias generadas
principalmente por su interpretación dentro de un marco espacio temporal absoluto
(teoría del éter).
La deducción elaborada por Einstein se apoyaba en resultados experimentales
(Postulados) y no requería conjeturas auxiliares, tales como sistema de referencia
absoluto, arrastre del éter, deformación de objetos, o mal funcionamiento de relojes.
Pero este premio no era gratis, había que cambiar el concepto establecido sobre el
espacio y el tiempo.
Analizando las Transformaciones de Lorentz bajo la óptica de Einstein lo primero que
hay que destacar es que las coordenadas (x, y, z, t) representan un punto del espacio
y un instante, correspondientes a un sistema inercial O, y que las coordenadas (x', y',
z', t') representan ese punto del espacio y ese instante, pero correspondientes a un
sistema inercial O' que se mueve respecto del primero.
No son coordenadas particulares de un evento, ni la posición de un objeto o el instante
inicial de un fenómeno. Son coordenadas que dan la métrica espacio-temporal del
sistema correspondiente.
Es decir que las transformaciones relacionan las métricas del espacio y el tiempo entre
dos sistemas inerciales.
La interpretación de las Transformaciones de Lorentz como relación entre las
métricas espacio temporales de los sistemas inerciales debe ser considerada
como uno de los avances más importantes del conocimiento universal.
La gran revolución conceptual la genera (principalmente) que t' no es igual a t, como
era en el marco galileano, sino que está relacionada también con la posición.
Aclaremos un poco más este tema. Cuando decimos que el tiempo t es uniforme
estamos indicando que la evolución temporal de los fenómenos causales es constante
en el sistema O. Un dado proceso, como la caída de una piedra o el crecimiento
celular, transcurre en el mismo lapso bajo idénticas condiciones, cualquiera sea el
momento en que se inicie el proceso.
Además, al indicar que t es la coordenada temporal del sistema O hemos asumido
arbitrariamente que el sistema está sincronizado, y en un instante cualquiera
tenemos el mismo valor temporal en cualquier punto del espacio.
Lo mismo vale para el sistema O', con su coordenada t' uniforme y sincronizada. La
gran novedad aparece cuando vinculamos ambas coordenadas (t', t) con las
transformaciones de Lorentz. Solamente hay coincidencia en el origen en el instante
inicial (t'=t=0) porque así lo establecimos en la deducción de dichas transformaciones,
concluyendo que para que la velocidad de la luz sea invariante tenemos que aceptar
que los sistemas inerciales en movimiento relativo tienen diferente evolución temporal
y distinta métrica espacial, y que esas diferencias dependen de la velocidad relativa
entre ellos.
La dependencia de la coordenada temporal de un sistema con el tiempo y la posición
del otro sistema provoca pérdida de sincronización en el sistema móvil pues no da un
mismo valor t' para puntos (x) diferentes. Es decir que el sincronismo, que requiere fijar
el valor temporal simultáneamente en todo punto del espacio, es relativo al sistema.
Dicho más claramente, cada observador O y O' ve sincronizado su sistema, en el cual
está en reposo, y sin sincronismo el sistema móvil.
Si ahora consideramos un fenómeno, como por ejemplo la caída de un cuerpo, habrá
una posición inicial y una final para cada sistema de referencia, con trayectoria y
duración distintas para dos observadores en movimiento relativo constante. Será
necesario analizar en detalle las mediciones espaciales y temporales de los
fenómenos físicos.
Simultaneidad
Dos eventos son simultáneos cuando suceden en el mismo instante.
Supongamos que un observador O en un sistema de referencia inercial detecta dos
sucesos ocurridos en (x1, y1, z1, t1) y (x2, y2, z2, t2) respectivamente. Para que estos
sucesos sean simultáneos debe cumplirse:
t1 = t2
Si ahora pretendemos saber como registra estos mismos sucesos un observador O’
que se mueve respecto de O con velocidad V constante, bastará con determinar los
valores (x’, y’, z’, t’) de cada uno de ellos mediante las Transformaciones de Lorentz.
Ello nos permite calcular la diferencia t’2 - t’1 resultando:
Estos sucesos serán simultáneos para O’ si t’1 = t’2, condición que sólo se cumple en el
caso x1 = x2.
Se deja planteado demostrar que si dos eventos que suceden en distintos puntos (x),
son simultáneos para un observador O, siempre es posible encontrar dos sistemas de
referencia inerciales en los cuales el orden de los sucesos está invertido.
Con esto queda demostrado que la simultaneidad es relativa al sistema de referencia,
siendo absoluta en el caso en que los eventos sucedan en el mismo punto (choque).
Esta es la razón por la cual un observador inercial O comprueba que otro sistema O’
en movimiento relativo no presenta su tiempo t’ sincronizado.
También la simultaneidad de sucesos adquiere carácter absoluto en el caso de dos
eventos que ocurren sobre un plano perpendicular a la velocidad V relativa entre los
observadores O y O’, sin necesidad de que haya choque. Es decir que dos pelotas que
golpean a diferente altura contra una pared simultáneamente para un observador en
reposo respecto de la pared, también serán sucesos simultáneos para cualquier
observador que se mueva perpendicularmente a la pared con velocidad constante.
Analicemos ahora un caso interesante. Supongamos que ocurre un proceso “causal”
como sería por ejemplo lanzar una piedra en el instante t1 y romper un vidrio en t2.
Un fenómeno causal presenta las siguientes características: contiene siempre dos
sucesos que, si ocurren en distintos puntos del espacio, están separados
cronológicamente, y el orden de los eventos no puede invertirse.
Demostraremos que todo fenómeno causal es absoluto.
Para ello debe cumplirse (t’2 - t’1) > 0 para todo observador.
Sea (t2 – t1) la diferencia de tiempos entre el lanzamiento de la piedra en x1 y la rotura
del vidrio en x2. Calculemos que diferencia temporal le mide un observador O’ en
movimiento relativo.
Para que (t’2 - t’1) > 0 debe ser
Dividiendo por (t2 – t1) obtenemos
Siendo la variación espacial (x2 - x1) sobre la temporal (t2 – t1) el valor de la velocidad
media del objeto, que en nuestro caso corresponde a la piedra en su viaje hacia el
vidrio, será:
Dado que el segundo término del primer miembro es menor que 1 pues las
velocidades del observador y de la piedra siempre son menores que la velocidad de la
luz, la desigualdad es valedera y queda demostrado que un fenómeno causal es
absoluto.
Causalidad y Determinismo
No se tiene conocimiento del origen ni el momento histórico en que se incorpora en la
humanidad el concepto de causalidad, en el sentido de que cualquier cambio del
estado de un sistema está provocado por una causa anterior.
Más aún, el entrenamiento de animales domésticos ha demostrado que este concepto
está incorporado en los ejemplares adultos, y se especula que todas las especies
animales adquieren su conocimiento durante la gestación y en la primera etapa de su
vida, como consecuencia de la repetibilidad de los fenómenos naturales, teniendo
incidencia en su comportamiento particular e incluso con el “sentido” de preservación
de la especie.
La causalidad en su acepción básica más general es un concepto fundamentado en la
observación de procesos o fenómenos que reúnen las siguientes características:
1. Siempre que ocurre un fenómeno se pueden encontrar dos eventos
distinguibles (A y B), que están separados cronológicamente y cumplen:
2. Asignemos que A sea el primer suceso. Siempre que ocurre A, luego sucede B,
y se conserva el orden de los sucesos.
En este caso se postula que A y B son causa (A) y efecto (B). Además, si reiteramos el
fenómeno y se repite de forma idéntica para la observación, entonces se dice que el
proceso es “causal” y “uniforme”.
La aceptación de la existencia de procesos causales uniformes es el soporte lógico de
la definición rigurosa de “tiempo”. Se puede definir la magnitud tiempo (objetivo) como
aquella que permite establecer el orden en la ocurrencia de sucesos.
Resulta evidente que, por tratarse de sucesos numerables, la magnitud es escalar.
Los procesos causales uniformes, que bajo las mismas condiciones tienen la
propiedad de repetirse en forma idéntica, permiten establecer una unidad de medida,
proveyendo una métrica temporal, estableciendo cuantitativamente el pasado y el
futuro, y dándole al tiempo la propiedad de magnitud mensurable.
La consideración usual del tiempo como “coordenada unidimensional continua”, dentro
de la física clásica, es una abstracción no demostrada, sustentada principalmente por
la mecánica de Newton y el éxito de los modelos teóricos posteriores desarrollados. Es
decir, que este atributo matemático (continuidad) debe ser postulado y su validez
limitada al modelo teórico correspondiente. La física cuántica actual plantea modelos
con la posibilidad de que la magnitud tiempo sea discreta.
Resulta evidente que la estrecha e indisoluble relación entre la magnitud tiempo y el
concepto de causalidad incidió en el desarrollo científico, cuya consecuencia principal
fue la postulación del Principio de Causalidad, aceptada como una ley inviolable de la
naturaleza, desde principios del siglo XIX. El Principio de Causalidad postula que
todo efecto debe tener siempre una causa.
Asimismo, en ese siglo se completó la falsa interpretación de “causalidad lineal” que, a
grandes rasgos, afirma que los efectos de un dado proceso resultan ser las causas de
otros efectos futuros, por lo cual los fenómenos naturales pueden interpretarse como
una sucesión ininterrumpida de procesos causales. Esta línea de pensamiento más la
infundada creencia de una relación biunívoca entre causa y efecto desembocaron en
el “determinismo” a ultranza, del matemático P. Laplace (1749 - 1827).
Los fenómenos naturales muestran infinidad de procesos causales periódicos, cuya
ocurrencia repetida generó mitos y creencias en la conciencia popular (“el destino está
escrito”), que fueron incentivados por el determinismo mecanicista de Laplace, el que
propone que si se tiene el conocimiento completo del estado de un sistema en un
momento dado, sería formalmente posible conocer el estado del sistema en cualquier
momento futuro.
Esta postura radical hizo que determinismo y causalidad fueran confundidos e, incluso,
considerados la misma cosa. Como veremos en este mismo capítulo, la causalidad es
una ley inviolable, el determinismo no lo es. En consecuencia, cualquier ley, teoría o
modelo físico debe cumplir con el Principio de Causalidad y puede no ser determinista.
El enfoque matemático de la causalidad, en mi opinión el más profundo, útil y preciso,
se debe al genial matemático estadounidense Norbert Wiener (1894 - 1964), conocido
como padre de la cibernética por su libro “Cibernética o el Control y Comunicación en
animales y máquinas“, publicado en 1948.
En el introduce la noción de “circularidad” mediante un concepto utilizado en la teoría
de control, el feedback (retroalimetación), con el cual interpreta la causalidad como la
respuesta de todo sistema cuando es perturbado, y su reiteración (circularidad) en la
búsqueda de un estado de equilibrio.
Wiener estableció que el Principio de Causalidad es consecuencia de una "simetría"
particular en los procesos de la naturaleza (circulares en el tiempo), por lo cual este
Principio actualmente es considerado Universal y, a los efectos de que se entienda su
importancia, de la misma jerarquía que los Principios de conservación de la energía,
de la cantidad de movimiento y del momento angular.
Asimismo, mostró la falsedad de la causalidad lineal y estableció para los sistemas
lineales, es decir aquellos que pueden ser representados por ecuaciones diferenciales
lineales, la condición matemática que debe cumplir una función dependiente del
tiempo para ser causal. La deducción de la condición de Paley-Wiener puede verse en
el libro de A. Papoulis, “The Fourier Integral and its Applications”.
Contracción espacial y Dilatación temporal
Hemos establecido a través de las Transformaciones de Lorentz que las métricas de
dos sistemas inerciales en movimiento relativo son diferentes.
En consecuencia, debemos analizar qué pasa con el tamaño de los objetos y la
duración de los fenómenos, cuando están o suceden en movimiento respecto de
nosotros.
Por convención pondremos un subíndice 0 a todas las magnitudes que midamos en
reposo respecto nuestro, y las llamaremos propias. Por ejemplo, una longitud propia
será la que midamos en reposo respecto del objeto.
Contracción de longitudes
Un observador inercial mide el largo (longitud propia) de un objeto en reposo,
determinando las coordenadas espaciales de sus extremos según indica la figura,
resultando l0 = x2 – x1.
Se pretende determinar qué longitud le mediría otro observador O’ en movimiento
relativo con velocidad constante.
Debemos eliminar o corregir las ilusiones ópticas producidas por la velocidad finita de
la luz.
Por ejemplo, si quisiéramos determinar la longitud de un objeto en movimiento
sacándole una foto cuando se está acercando o alejando, tendríamos que corregir las
medidas obtenidas pues una foto, en esas condiciones, dará un tamaño aparente
(ilusión óptica). Se propone al lector que muestre que la foto dará un tamaño mayor
cuando se acerca y menor cuando se aleja.
Como el objeto está en movimiento para el observador O´ debemos ser cuidadosos y
adoptar un criterio de medición adecuado, como sería determinar ambas coordenadas
“simultáneamente” en el sistema O’, lo que implica t’1 = t’2.
Luego debemos comparar la longitud l’ = x’2 – x’1 con la longitud propia mediante las
Transformaciones de Lorentz.
Aquí aparece algo interesante para la resolución de problemas. Considerando que las
Transformaciones de Lorentz directas o inversas son conceptualmente la misma cosa,
podemos elegir usar las que nos convengan.
En nuestro caso usaremos las inversas porque ello simplifica los cálculos debido a que
t’1 = t’2, resultando:
Despejando l’ obtenemos:
Conclusión
La longitud de un objeto en movimiento es menor que cuando el mismo objeto está en
reposo pues V/c es siempre menor que 1.
No debe entenderse esto como un efecto óptico o aparente, sino como el tamaño del
objeto medido en movimiento, que resulta tanto menor cuanto más rápido se mueva
respecto del observador.
Ésta es una adecuada ocasión para discutir a qué se llama realidad en física.
En primer lugar digamos que la Física como ciencia intenta explicar cómo suceden las
cosas y no porqué suceden. Todo lo que estamos elaborando y todas las teorías ya
desarrolladas son modelos que procuran describir el comportamiento de los distintos
fenómenos naturales lo mejor posible, pero los modelos no son el fenómeno. Esta
postura es la científica y quedó plasmado desde el inicio mismo del método científico,
creado por Galileo, cuando distinguió que la filosofía natural no incluye los mitos.
El gran físico-matemático argentino Jorge Staricco, en la introducción del magistral
curso de Mecánica que dio en la Facultad de Ingeniería de la Universidad de Buenos
Aires en 1965, al cual asistí como alumno, dijo: la importancia de la Ley de atracción
universal enunciada por Newton no es la relación funcional entre la fuerza y la
distancia, que por otro lado hubiera sido resuelta por Cavendish un ratito después,
sino cómo la introdujo: Todo pasa como si existiera una fuerza…
Ahora permítanme que haga una pregunta directa sobre realidad:
¿Existe la fuerza de gravedad?
Recordemos que con el conocimiento funcional de la fuerza gravitatoria Newton
demostró las Leyes de Kepler. Todo parece indicar que dudar de la existencia de la
fuerza de gravedad es demencial.
En el año 1916 apareció otra Teoría que postulaba que la fuerza gravitatoria no existe,
que las masas no se atraen pero tienen la propiedad de alterar la métrica espacio
temporal. Con ella también se demostraron las Leyes de Kepler. Su autor fue Albert
Einstein y la Teoría es la de Relatividad General.
Al no tener una respuesta lógica única, el concepto de realidad en la física se modificó
durante el siglo XX, principalmente por el desarrollo de la Mecánica Cuántica y la
Teoría de Relatividad, de tal manera que su interpretación fuera única.
El concepto de realidad es un tema filosófico que depende de la línea de pensamiento
particular.
Realidad, para la ciencia, es lo que muestran las mediciones y es válida solamente en
el marco de la teoría correspondiente, cuya bondad y alcance no depende de las
creencias del lector.
En consecuencia, digamos que todo pasa como si el tamaño “real” de un objeto fuera
mayor cuando está en reposo que cuando está en movimiento, pues eso es lo que se
mide. En el marco de la Teoría de Relatividad Especial los objetos en movimiento
tienen un tamaño menor que en reposo.
Dilatación temporal
Un observador inercial mide la duración (tiempo propio) de dos sucesos que ocurren
en un punto fijo (x0; y0; z0), como por ejemplo prender una lámpara en el instante t1 y
apagarla en t2, estando en reposo respecto de la lámpara.
Esta duración resulta T0 = t2 – t1, y se pretende determinar qué valor T’ le medirá otro
observador O’ en movimiento relativo con velocidad constante.
En este caso usaremos las Transformaciones directas porque ello simplifica los
cálculos debido a que x1 = x2 = x0 resultando:
Resulta evidente que T’ > T0 pues la velocidad relativa V debe ser menor que c
Conclusión
Cualquier lapso medido (t2 – t1) de dos sucesos es relativo al sistema de referencia.
Asimismo, se demuestra que el tiempo propio de cualquier fenómeno es el menor
valor posible de la duración de dicho evento.
Dado que este razonamiento es válido para todos los fenómenos naturales, todo
observador verá que los procesos transcurren más lentamente cuando suceden en
movimiento respecto de él, y este hecho será tanto más pronunciado cuanto mayor
sea la velocidad relativa entre el sistema donde ocurre el fenómeno y el observador.
Nota
Hemos calculado la contracción de la longitud de un objeto y la dilatación temporal de
un reloj, ambos en reposo en el sistema O. Por supuesto que si estuvieran en reposo
en el sistema O’ obtendríamos idénticas conclusiones simétricas pues todos los
sistemas inerciales son equivalentes.
Tiempo propio
Cuando un cuerpo o sistema físico se mueve arbitrariamente, el tiempo propio de un
proceso que ocurra en dicho objeto debe calcularse asumiendo que se tiene un reloj
fijo en el objeto.
Un sistema de referencia fijo a un cuerpo que se mueve arbitrariamente puede no ser
inercial, por lo cual en general no podremos aplicar las Transformaciones de Lorentz
para comparar las métricas.
Sin embargo, si aceptamos que la aceleración no tiene influencia en la evolución
temporal en dicho sistema no inercial, veremos que es posible calcular el tiempo
propio buscado.
Destaquemos que esta suposición no tiene respaldo teórico alguno (ver Möller “The
Theory of Relativity”, pág. 49) y no es verificada por determinaciones experimentales
incuestionables (GPS), por lo cual este tema será tratado en detalle por separado.
Lo que sigue es el tratamiento usual del tema en la bibliografía clásica tradicional, sin
que ello implique que sea correcto rigurosamente.
De acuerdo con la suposición históricamente aceptada podemos asumir que en cada
instante hay un sistema inercial cuya velocidad relativa coincide con la velocidad del
cuerpo o sistema físico, lo que permitirá calcular el tiempo propio como la suma de las
variaciones infinitesimales (dt’) en dicho sistema.
Las Transformaciones de Lorentz que hemos deducido oportunamente no son
generales puesto que hemos puesto arbitrariamente la velocidad relativa entre
sistemas coincidente con el eje x. Dado que esta condición no se cumplirá para un
movimiento arbitrario, debemos usar las Transformaciones de Lorentz generales,
cuya expresión para la coordenada temporal es:
Teniendo en cuenta que el proceso cuyo tiempo propio estamos midiendo está sobre
el objeto en movimiento y que la velocidad del cuerpo corresponderá en cada instante
a la velocidad del sistema inercial que le fijemos, será v=V. En consecuencia,
diferenciando la expresión anterior llegamos a:
El tiempo elemental dt’ que medirá un reloj fijo al objeto será menor que el
correspondiente dt que medimos en nuestro sistema inercial. Integrando obtenemos el
tiempo propio mediante:
Es importante destacar que en esta expresión la velocidad corresponde a la del objeto
y puede ser función del tiempo dependiendo del movimiento que realice el objeto.
Además, dado que el integrando es siempre menor que 1, el tiempo propio siempre es
el menor valor posible, cualquiera sea el movimiento del objeto.
Debe tenerse en cuenta que no podemos comparar las métricas entre sistemas pues
solamente requerimos que uno sea inercial, sino que hallamos la expresión general
para el cálculo de tiempo propio de un objeto, cualquiera sea su movimiento, a través
de mediciones temporales hechas desde el sistema inercial.
Veamos un ejemplo simple:
Un objeto rota alrededor de un observador inercial con movimiento circular uniforme.
Se sincronizan dos relojes en t=t’=0, uno (t’) fijo al objeto y el otro (t) en el sistema
inercial. Al cabo de una vuelta se comparan los tiempos resultando que el reloj fijo al
cuerpo atrasó. El cálculo es simple pues el módulo de la velocidad v es constante.
Este atraso (cualitativo) no es relativo al sistema, es absoluto, y ello ocurrirá sobre
cualquier reloj acelerado respecto de uno inercial.
Una vez comprendido el concepto (histórico) de tiempo propio y la forma de calcularlo,
la maltratada "Paradoja de los gemelos" deja de ser un misterio y puede ser
analizada sin dificultad. Recomiendo su análisis aunque advierto que este tratamiento
es incompleto pues no considera los efectos temporales debidos a la aceleración.
Nota
Las correcciones temporales que se programan en el Sistema de Posicionamiento
Global (GPS) para mantener el sincronismo entre satélites dedicados y la
Tierra, suelen describirse como efectos debidos al "cambio temporal" de la Relatividad
Especial y al "retraso temporal" causado por el campo gravitatorio, predicho por la
Teoría General.
En mi opinión esta manera de enfocar el tema esconde el error cometido en este
tema dentro de la Teoría de Relatividad Especial, cual es asumir que las aceleraciones
no tienen influencia en la marcha de los relojes.
Cinemática relativista. Efecto Doppler
La cinemática relativista no presenta gran dificultad en la parte operativa debido a que
los cálculos son similares a los que se realizan en cinemática clásica. Si un dado
problema de movimiento de un cuerpo es complicado en el modelo relativista, también
lo es en la mecánica newtoniana.
No sucede lo mismo desde el punto de vista conceptual cuando se pretende comparar
un determinado movimiento de un cuerpo desde dos sistemas de referencia inerciales
en movimiento relativo. La razón de que ello ocurra es que en cinemática relativista la
velocidad de la luz es un valor finito.
La primera gran dificultad está con la posición de un punto material que se desplaza
respecto de un observador inercial. Lo “vemos” en un punto del espacio pero sabemos
que está en otro, debido al tiempo que tardó en llegarnos la información. Es decir que
tenemos dos panoramas posibles: el “aparente”, que es el que vemos, y el que llaman
“real”, que sería el que corresponde a la supuesta posición calculada, teniendo en
cuenta el tiempo que tarda en llegarnos la información. En realidad el que conocemos
con certeza es el aparente, que es el que medimos.
La mayoría de los cálculos se hacen con las posiciones que denominamos reales, en
razón de que las Transformaciones de Lorentz relacionan la métrica espacio temporal
de dos sistemas inerciales sin contemplar lo que mediría un observador que no tuvo
en cuenta las correcciones relacionadas con la velocidad de la luz.
Este hecho parece resolver la cuestión estableciendo un criterio para la descripción de
los movimientos, haciendo referencia siempre a posiciones reales.
Sin embargo, veremos que ello resulta inadecuado en determinados casos.
En la dinámica relativista las interacciones entre cuerpos materiales ocurren a través
de campos cuya descripción corresponde a la posición aparente de los cuerpos y no a
las posiciones reales, debido a que los campos se propagan también a velocidad finita,
que asumimos idéntica a la de la luz. En consecuencia, si suponemos conocidas las
posiciones reales, debemos calcular las aparentes para obtener el resultado correcto.
En electromagnetismo las interacciones entre partículas cargadas en movimiento se
calculan utilizando los “potenciales retardados”, que son funciones relacionadas con el
campo que corresponde a las posiciones aparentes, resolviendo el planteo anterior, y
ello podemos hacerlo porque disponemos de las ecuaciones de Maxwell.
En los otros tipos de interacciones (fuerzas gravitatorias y nucleares), no tenemos las
ecuaciones de campo válidas en sistemas inerciales, simplemente porque no hemos
logrado desarrollar aún un modelo teórico adecuado, por lo cual ni siquiera sabemos si
es posible obtener la expresión teórica de los potenciales retardados
correspondientes.
En particular, los problemas que presentan interacciones gravitatorias suelen tratarse
con la Ley de Newton en el marco de la Relatividad General, aunque en rigor dicha ley
es válida solamente para cuerpos en reposo.
Otro aspecto complicado, que extrañamente la bibliografía usual no trata, se refiere a
la posición real de un objeto en movimiento respecto de dos sistemas inerciales.
Analicemos un caso particular:
Dos observadores inerciales O y O’ están en movimiento relativo. Supongamos que
sus sistemas de referencia están alineados y sus orígenes de coordenadas espaciales
coinciden en el instante t=t’=0. Cada observador tiene sincronizado su sistema, lo que
significa que en un instante cualquiera su coordenada temporal tiene el mismo valor en
todo el espacio, pero ambos observan que en el otro sistema de referencia el tiempo
indicado por el otro observador tiene valores distintos en diferentes puntos del espacio,
es decir que no está sincronizado.
Asumamos arbitrariamente que O está en reposo y O’ en movimiento uniforme según
el eje x, con velocidad V respecto de O, y que tenemos un cuerpo que se mueve con
velocidad v respecto de O, según muestra la figura. Sea x0 la coordenada x del cuerpo
en el instante t=0.
Se pretende saber cuál es la posición x’ del objeto para O’ en el instante t’=0.
Usando las Transformaciones de Lorentz obtenemos lo que mediría O’:
Nótese que la posición del objeto en nuestro caso está determinada para t’0 < 0, es
decir que O’ no obtiene la posición del objeto (x’0) cuando ambos sistemas están
coincidentes en el espacio, sino un rato antes (t’0) de que O’ se cruce con O.
En consecuencia, para determinar la posición que ambos observadores le miden a un
objeto en movimiento en el instante t=t’=0, en que ambos sistemas son coincidentes,
debemos conocer el movimiento completo en alguno de los dos sistemas, es decir su
trayectoria y tipo de movimiento, que nos permita calcular dónde estará en el otro.
Veamos un caso simple.
Si el objeto se mueve con velocidad v constante podemos hacer el cálculo de cuánto
avanzaría respecto de O’ hasta que los sistemas coincidan, y así obtener la posición
x’t’=0 que le mediría O’ en t’=0, resultando:
Siendo v’ la velocidad del objeto medida por O’, cuyo cálculo se mostrará luego con el
teorema de adición de velocidades.
En el segundo miembro de la igualdad, el último término representa lo que avanzó el
objeto. Esta expresión puede ponerse de la siguiente forma:
Si el cuerpo está en reposo respecto de O, la velocidad v’ medida por O’ será -V, y la
coordenada x’0 valdrá:
Este resultado muestra el efecto de la contracción de longitudes ya visto.
De éste análisis obtenemos una consecuencia muy importante para el estudio de los
sistemas de muchos cuerpos no estacionarios, como por ejemplo el Universo.
Supongamos que en un sistema inercial queremos obtener la configuración dinámica
de un determinado conjunto de cuerpos puntuales en movimiento. Para ello debemos
conocer simultáneamente la posición y la velocidad de cada uno de los puntos
materiales.
Si ahora deseamos saber qué configuración se obtendría en otro sistema inercial en
movimiento relativo, deberemos hacer correcciones que contemplen le pérdida de
sincronismo entre sistemas.
Nota
En el apartado de Temas Especiales se adjunta un desarrollo original (no publicado)
que demuestra que la expansión del Universo es absoluta, es decir que en todos los
sistemas inerciales las galaxias se alejan de un punto (centro), y en todos ellos se
cumple la forma de la Ley de Hubble (velocidad proporcional a la distancia).
Teorema de adición de velocidades
Dado un cuerpo que se mueve con velocidad v respecto de un sistema inercial O, se
pretende determinar qué velocidad le mide otro observador O’ en movimiento relativo
uniforme. En la figura, por razones didácticas, se indica solamente la componente en
la dirección x.
Usando las Transformaciones de Lorentz podemos calcular las velocidades medidas
por un observador O’.
Se destacan las siguientes particularidades:
1. Para velocidades del objeto (v) y del sistema (V) mucho menores que c se
obtienen las relaciones de Galileo.
2. Las velocidades transversales (vy; vz) dependen de la velocidad según x.
3. Si el objeto fuera luz en el vacío, los dos sistemas medirían lo mismo (c).
El cálculo de las aceleraciones se deja planteado como ejercicio, destacando que
se obtienen con el mismo procedimiento empleado y que la aceleración no resulta una
magnitud absoluta (como sucede en la mecánica clásica).
Efecto Doppler
La frecuencia de una onda emitida por una fuente resulta diferente si dicha fuente está
en reposo o en movimiento relativo al observador, aumenta cuando la fuente se acerca
y disminuye cuando se aleja.
El fenómeno fue descrito y explicado teóricamente en forma clásica (no relativista) por
el físico y matemático austríaco Christian Doppler (1803-1853) en el año 1842, en
una monografía sobre espectroscopía en estrellas binarias.
La ley original obtenida relaciona la frecuencia de una onda luminosa con la velocidad
relativa entre el observador y la fuente de las ondas, y no es consistente con la teoría
de relatividad (desarrollada posteriormente) pues se fundamenta en las
Transformaciones de Galileo. La formulación relativista rigurosa del fenómeno fue
elaborada por Einstein en su principal publicación de 1905.
El efecto es de naturaleza ondulatoria y su estudio aparentemente resulta complejo en
virtud de que intervienen tres actores: la fuente de ondas, la onda que se propaga y el
observador. Sin embargo, veremos que el fenómeno puede ser explicado como un
efecto relativista sobre la propagación ondulatoria.
Por razones prácticas, en general sólo nos interesará el punto de vista del observador,
es decir la frecuencia que un observador inercial le mide a una onda emitida por una
fuente móvil, y su relación con la frecuencia propia y velocidad instantánea de dicha
fuente.
Los procesos ondulatorios fueron convenientemente explicados por el
matemático francés D’Alembert (1717-1783), cuyos aportes en el planteo y solución de
ecuaciones diferenciales a derivadas parciales le permitieron elaborar la teoría
matemática de las ondas en 1747, estableciendo su famosa “ecuación de ondas”:
Toda solución Ф(x,y,z,t) de esta ecuación es una onda cuya velocidad de propagación
es v. Asimismo, si una función no satisface esta ecuación no puede ser asignada a un
fenómeno ondulatorio. La solución más simple posible, conocida como “onda
armónica simple”, que se propaga en el sentido positivo de las x, corresponde a la
expresión:
Al respecto, aunque en este curso se asume que el lector conoce la teoría de ondas,
es conveniente recordar algunas particularidades:

x (dirección de propagación) es un punto del espacio y t un instante de tiempo.

Al argumento (kx-w t) se lo denomina fase y debe ser un número adimensional,
es decir sin unidades.
En consecuencia, k (número de onda) tiene unidades de 1/longitud y w
(frecuencia angular) de 1/tiempo.

El sentido de propagación queda determinado por el signo de los 2 términos de
la fase. Si son distintos la onda se propaga en el sentido creciente de x; si son
iguales será en sentido opuesto.

La función verifica la ecuación de ondas si se cumple v=w/k.

A es la amplitud máxima de la onda. Sus unidades quedarán determinadas por
el tipo de onda que se trate. Por ejemplo, si es una onda sonora, A podrá tener
unidades de presión.

En ambos sistemas inerciales la onda tiene la misma forma funcional pues la
ecuación de ondas es relativista.
Se deja planteado demostrar que dicha ecuación conserva su forma ante
Transformaciones de Lorentz.
Primero mostraremos que la frecuencia de una onda, cualquiera sea su naturaleza, es
una magnitud relativa al sistema de referencia.
Supongamos tener dos observadores inerciales en movimiento relativo, como muestra
la figura, que miden la frecuencia y la velocidad de una onda armónica simple que se
propaga de izquierda a derecha en la dirección del eje x.
Aplicando las Transformaciones de Lorentz podemos encontrar la correspondiente
expresión en el sistema primado:
En el sistema en movimiento se cumple:
Comparando con la relación anterior se obtiene:
Para evitar confusiones llamaremos vP a la velocidad de propagación.
Reemplazando k = w / vP obtenemos la relación buscada:
Si se trata de ondas luminosas en el vacío la velocidad de propagación es la misma en
ambos sistemas de referencia pues la luz se propaga con la misma velocidad c en
todos los sistemas inerciales. En este caso tenemos:
Fácilmente puede verse que w’ < w si el sistema primado se mueve en la dirección de
propagación, y w’ > w si es en sentido contrario (V<0).
Este resultado muestra que la frecuencia de una onda es una magnitud relativa al
observador, y ello es independiente del movimiento de la fuente de ondas.
En rigor, la frecuencia de cualquier sistema o proceso físico periódico resulta ser una
magnitud relativa al sistema de referencia en el que se mide. Dos observadores con
distinto estado de movimiento medirán distinta frecuencia de un mismo proceso
periódico.
Por supuesto que si la fuente se encuentra en reposo en uno de los dos sistemas de
referencia, el observador en dicho sistema medirá la misma frecuencia de la onda y de
la fuente (frecuencia propia), mientras que el observador en movimiento medirá
distintas frecuencias no coincidentes, tanto de la fuente en movimiento como de la
onda. La conclusión global será que la frecuencia de una onda aumenta si la fuente
se mueve hacia el observador, disminuye si se aleja, y en estos casos no coincide
con la frecuencia de la fuente en movimiento.
Finalmente, siendo w0 la frecuencia propia y (Vf ) la velocidad de la fuente de ondas,
que arbitrariamente definimos positiva si la fuente se aleja al observador y negativa si
se acerca, la relación funcional entre la frecuencia medida (w) y la velocidad de la
fuente (Vf ), estará dada por:
Esto último parece estar en contradicción con el hecho aceptado por el cual la
frecuencia de una onda debe ser la misma que la de la fuente que la produce, cosa
que solo sucede para un observador en reposo respecto de la fuente periódica.
La explicación de esta aparente contradicción es sutil pero simple. Nótese que la
forma en que se miden las frecuencias de la fuente y de la onda es diferente: la
correspondiente a la onda se mide en un punto fijo (reposo) respecto del observador,
mientras que la de la fuente se mide en movimiento.
La frecuencia de un sistema periódico, medida por un observador en movimiento
relativo, se modifica de acuerdo a la ley de “dilatación temporal”:
Siendo T0 el período propio del sistema periódico y T el “pseudo” período que le mide
el observador inercial al sistema periódico en movimiento, que resulta siempre mayor
que el período propio e independiente del sentido de la velocidad del sistema físico.
Por otro lado, una onda es un proceso espacio temporal y su frecuencia se determina
como la inversa del tiempo que tarda en pasar una longitud de onda por un punto fijo
respecto del observador.
Efecto Doppler Transversal
Se denomina así al cambio de frecuencia de una onda que ocurre cuando la fuente de
ondas se mueve en dirección transversal a la recta que une la fuente y el observador.
Este efecto, predicho por Einstein, fue detectado experimentalmente en 1938.
La explicación relativista es muy simple: la fuente que se mueve transversalmente está
sujeta a la “dilatación temporal”, por lo cual su frecuencia se modifica de acuerdo a la
última relación vista y coincide con la frecuencia de la onda medida debido a que la
fuente no se aleja ni se acerca del observador:
Siendo w0 la frecuencia propia de la fuente, w la frecuencia (de la onda y de la fuente)
medida por el observador, y V la velocidad transversal de la fuente. Nótese que
el efecto Doppler transversal siempre da corrimiento al rojo (w < w0).
Este planteo último y el tratamiento anterior pueden inducir al error de creer que
el efecto Doppler tangencial y transversal son dos fenómenos distintos, cuando
en realidad se trata de un único efecto: el cambio de frecuencia de una onda
debido al movimiento relativo entre la fuente y el observador.
En el planteo inicial por razones didácticas se propuso arbitrariamente que la onda se
propagaba según el eje x, para luego tratar en forma independiente el caso de una
fuente con movimiento transversal.
Si hubiéramos analizado los cambios que se producirían sobre una onda cuando la
fuente se mueve en cualquier dirección, obtendríamos una única relación general
válida para el Doppler transversal y longitudinal respectivamente. Esto lo haremos a
continuación.
Tratamiento general del efecto Doppler luminoso (enfoque ondulatorio)
Nos interesa determinar la frecuencia medida por un observador inercial de una onda
emitida por una fuente móvil con velocidad vs, en relación a la frecuencia propia de la
fuente (en reposo).
Supongamos tener una fuente de ondas monocromática en reposo en un sistema
inercial y un observador O en el punto A, como muestra la figura.
El observador medirá la misma frecuencia a la onda y a la fuente (w0).
Para evitar confusiones llamaremos ux y uy a las componentes de la velocidad (c) de
propagación de la onda.
A los efectos de estudiar solamente el cambio de frecuencia que medirá un observador
O’ en movimiento respecto de O, la onda (con simetría esférica) que llega al punto A
puede ser considerada una onda escalar plana (fuente alejada). La dirección de
propagación queda determinada por los cosenos directores del vector velocidad de
propagación (c). La expresión matemática es de la forma:
Para un observador O’ con velocidad V respecto de O, la fuente de ondas se mueve
con vS = -V, formando un ángulo con la dirección de propagación. Podemos calcular la
función de la onda para O’ aplicando las Transformaciones de Lorentz.
En el sistema primado la función de onda tendrá la misma forma matemática, aunque
sus parámetros pueden tomar valores distintos que en el sistema O.
Ahora podemos dar la expresión general del efecto Doppler (tangencial y transversal)
y una regla para evitar posibles errores de signos.
Si establecemos arbitrariamente que la velocidad de la fuente VS sea positiva si se
aleja del observador y negativa si se acerca, y el coseno del ángulo lo
tomamos siempre positivo, la frecuencia que éste le mide está dada por:
Dado que
, siendo e el versor con la dirección y sentido de
propagación de la luz, la relación anterior puede expresarse (Möller, "The Theory of
Relativity", pág 62):
Nota
Este efecto también puede ser tratado desde el punto de vista corpuscular,
considerando a la luz formada por fotones con cantidad de movimiento y energía.
En este caso se puede realizar el mismo tipo de análisis anterior y determinar cómo se
modifica la energía del fotón, llegando al mismo resultado final del efecto Doppler.
Se propone al lector que haga el cálculo utilizando las transformaciones de Lorentz de
la cantidad de movimiento y la energía (E/c), que tienen la misma forma que las del
espacio y el tiempo respectivamente.
Cantidad de movimiento
En Mecánica Clásica la forma más usual de introducir la cantidad de movimiento es
mediante su definición como el producto de la masa de un cuerpo material por su
velocidad, para luego analizar su relación con la ley de Newton a través del teorema
del impulso y la variación de la cantidad de movimiento.
No obstante, luego del desarrollo de la Física Moderna, esta manera de hacerlo no
resultó la más conveniente para abordar esta magnitud fundamental.
El defecto principal es que esta forma esconde el concepto inherente a la magnitud,
que resulta ser una propiedad de cualquier ente físico con o sin masa, necesaria para
describir las interacciones.
Los modelos actuales consideran que no sólo los cuerpos masivos poseen cantidad de
movimiento, también resulta ser un atributo de los campos y los fotones.
Para abordar el tema con un enfoque más moderno primero se deben analizar las
interacciones en sus diferentes manifestaciones de acuerdo a los modelos clásicos
convencionales:

La primera, que resulta clásica en mecánica racional, es considerar el choque
entre cuerpos materiales, aceptando implícitamente que entre ellos no hay
fuerzas atractivas o repulsivas, siendo fortuito el encuentro. Aquí aparece la
cuestión sobre choque elástico perfecto y choque plástico con pérdida de
energía.

El siguiente tipo, campo-partícula sin pérdida de energía (choque elástico),
resulta de considerar que cada partícula posee un campo asociado capaz de
interactuar con la otra, modificando sus trayectorias, velocidades y energías.
Un ejemplo típico es el estudio de fuerzas centrales en mecánica analítica.
En este modelo se considera que los campos actúan instantáneamente, es
decir a velocidad infinita, perdiendo su significado como ente físico real, para
ser un formalismo auxiliar que simplifica su análisis. En esta categoría están la
Ley de Coulomb y la Ley de gravitación universal de Newton.

El caso de interacción campo-partícula con pérdida de energía resulta más
complejo pues aparece un tercer participante, un fotón con la energía disipada.
Un ejemplo importante e ilustrativo que permite explicar el espectro continuo de
emisión de rayos x, es el estudio de la radiación de frenado que ocurre con
electrones rápidos obligados a cambiar bruscamente de dirección por acción
del campo eléctrico de un núcleo atómico, con pérdida de energía por emisión
de radiación (fotón de radiación x).

La interacción radiación-materia es el caso más ilustrativo de la limitación de
la definición usual de la cantidad de movimiento (p=mv). El efecto Compton,
que ocurre entre fotones de rayos x o rayos gamma con electrones cuasi libres,
es explicado convenientemente si el fotón posee una cantidad de movimiento
cuyo módulo está dado por:
p
h 
, siendo h la constante de Planck y v la frecuencia.
c
El fotón y la partícula material modifican sus trayectorias, cantidades de
movimiento y energías como resultado de una interacción.
Los cuatro casos descriptos tienen en común la transferencia de energía durante la
interacción y/o cambios de dirección del movimiento. A los efectos de poder predecir
las consecuencias de una interacción de acuerdo a lo mostrado por la experiencia, es
necesario hacer extensivo el concepto de cantidad de movimiento a todos los entes
físicos capaces de transferir energía, siendo una magnitud vectorial con dirección y
sentido de la velocidad de la partícula y cuyo comportamiento responde a leyes de
conservación.
Esta magnitud, que nos permitirá calcular el estado final de los participantes luego de
una interacción, resulta ser:


1. Para partículas masivas p  m  v

2. Para fotones en el vacío p 
h  
c
c2
Las leyes de conservación postuladas como Principios, necesarias para el análisis de
las interacciones entre partículas en un sistema aislado (sin fuerzas exteriores), sean
partículas masivas o no, son:
1. El Principio de conservación de la energía
2. El Principio de conservación de la cantidad de movimiento
3. El Principio de conservación del momento angular
La gran matemática Emmy Noether (1882-1935) demostró en 1915 que estos
Principios son propiedades de leyes de simetría del espacio y el tiempo. Una
demostración de estos "Principios" en el marco de la mecánica analítica puede verse
en el libro 1 de Landau-Lifshitz "Curso abreviado de Física Teórica". Se demuestra
que:
1. La conservación de la energía sale de la uniformidad del tiempo.
2. La conservación de la cantidad de movimiento es consecuencia de la
homogeneidad del espacio.
3. La conservación del momento angular resulta de la isotropía del espacio.
Vamos a dedicarle atención al de la conservación de la cantidad de movimiento.
En el apartado que sigue incorporo una demostración propia, válida para sistemas
inerciales en el marco de la mecánica newtoniana.
Conservación de la cantidad de movimiento (no relativista).
La isotropía y la homogeneidad espacial requieren que las transformaciones de
coordenadas entre sistemas inerciales sean lineales.
La uniformidad del tiempo y la suposición de que su evolución es la misma en todos
los sistemas inerciales hace que la coordenada temporal sea absoluta.
Estas propiedades del espacio y el tiempo permiten deducir fácilmente las
Transformaciones de Galileo. Veamos su desarrollo:
Sean dos sistemas inerciales O y O’ en movimiento relativo con velocidad V según el
eje x, coincidentes en el instante t=0.
Las transformaciones lineales son
x’ = a1 x + a2 t
y’ = y
z’ = z
Consideremos un objeto en reposo en O en la coordenada x. Para cualquier
observador de O’ el objeto se mueve con velocidad v’x’ = - V
Derivando obtenemos:
v’x’ = - V = a1 vx + a2 = a2
a2 = -V
Consideremos ahora un objeto con velocidad V en O. Para el observador O’ el objeto
está en reposo respecto de él.
Derivando obtenemos:
v’x’ = 0 = a1 vx + a2 = a1 V – V
a1 = 1
Reemplazando resultan las Transformaciones de Galileo
x’ = x - V t
y’ = y
z’ = z
Mostraremos ahora que el Principio de conservación de la cantidad de movimiento se
obtiene como consecuencia de las Transformaciones de Galileo.
Estas transformaciones tienen una propiedad muy interesante: la diferencia de dos
velocidades cualesquiera, sean de un objeto o de cuerpos diferentes y en el mismo
instante o en instantes distintos, es la misma para todo observador inercial, es decir
que es absoluta. Ello se debe a que las velocidades medidas por dos observadores
inerciales están relacionadas por:
v’x’ = vx – V
v’y’ = vy
v’z’ = vz
Nótese que cuando se calcula la diferencia entre dos velocidades se simplifica la
velocidad V, con lo cual se hace independiente de la velocidad relativa entre sistemas.
Ahora analicemos el caso de una interacción entre dos cuerpos.
Consideremos dos partículas (1 y 2) que interactúan. Midiendo su velocidad antes (a)
y después (d) de la interacción podemos plantear las siguientes relaciones absolutas,
válidas para las tres componentes:
v1d – v1a = cte = k1
v2a – v2d = cte = k2
Si las partículas son masivas, con masas m1 y m2 respectivamente, puede
determinarse la relación k1 / k2 en concordancia con la definición de masa relativa de
Mach (1838-1916).
Se define como masa inercial relativa entre dos partículas que interactúan, a la
relación de los módulos de las aceleraciones medias sufridas en la interacción.
m21 = m2 / m1 = a1 / a2
Siendo la aceleración media la diferencia de velocidades dividida el tiempo de
interacción, que es el mismo para ambas partículas, resulta:
m21 = m2 / m1 = a1 / a2 = Δv1 / Δv2 = k1 / k2
En consecuencia, reemplazando obtenemos el Principio de conservación de la
cantidad de movimiento.
m1 v1a + m2 v2a = m1 v1d + m2 v2d
Nota
Un aspecto interesante es que la demostración es aplicable a todo tipo de partículas,
incluyendo aquellas cuya masa propia sea nula (fotones). Sin embargo, si
consideramos válida la definición de masa dada por Mach, toda partícula con la
capacidad de interactuar tiene masa asociada. Este hecho genera un nuevo dilema,
pues en el caso de fotones se acepta que no son masivos (masa propia nula). Más
adelante, en dinámica relativista, veremos que este tema admite distintos tratamientos
y es actualmente un motivo de discusión.
Conservación de la cantidad de movimiento en Relatividad Especial.
Masa relativista.
El Principio de Relatividad establece que las leyes válidas de la física deben ser
invariantes ante transformaciones de Lorentz, esto es que conserven su forma en todo
sistema inercial.
Las leyes describen comportamientos mediante ecuaciones que relacionan
magnitudes, las cuales pueden tomar valores distintos respecto de diferentes
sistemas, es decir ser relativas al sistema de referencia.
En consecuencia, el Principio de Relatividad nos brinda una herramienta muy
importante para la formulación y/o verificación de leyes.
El procedimiento es el siguiente: definidas las magnitudes involucradas en una ley
clásica, válida en un sistema inercial, se aplican las transformaciones de Lorentz y se
determina cómo deben modificarse dichas magnitudes para que la ley conserve su
forma. Luego, usando el Principio de Correspondencia, se verifica que la ley relativista
se transforme en la clásica para c tendiendo a infinito.
Finalmente, se analiza la conveniencia que dicha formulación tiene frente a otras
opciones posibles.
Puede suceder que existan diferentes opciones para obtener una dada ley. De hecho
ese fue el caso cuando se intentó establecer le ley fundamental de la mecánica
relativista. Einstein utilizó inicialmente la Ley de Newton expresada mediante F=ma.
La forma en que se transforman la Fuerza y la aceleración cuando se pasa de uno a
otro sistema de referencia es diferente, y esa diferencia es distinta según se trate de
las componentes paralelas a la velocidad relativa entre sistemas o transversales a ella.
En consecuencia, si se pretende que la ley de Newton así expresada (F=ma) sea
relativista, la masa debe tomar valores distintos según sea una dirección paralela a su
velocidad o transversal a ella.
Esta pérdida de isotropía de la masa no resultó “atractiva” conceptualmente, y se
resolvió proponiendo F=dp/dt como ley de la mecánica, pues esta forma de expresar
la Ley de Newton conserva su forma ante Transformaciones de Lorentz, sin que la
masa pierda su isotropía.
Si aceptamos como definición de cantidad de movimiento p=mv, siendo m la masa,
debemos determinar cómo se modifican las magnitudes involucradas para que la ley
de conservación de la cantidad de movimiento sea válida en todos los sistemas de
referencia inerciales.
La modificación de las velocidades ya fue resuelta con el teorema de adición de
velocidades, por lo cual nos queda por determinar cómo debería modificarse la masa
para que la Ley tenga la misma forma en todos los sistemas inerciales.
Existen diversas maneras de encarar el tema. La mayoría (sino todos) de los enfoques
existentes en la extensa bibliografía sobre Relatividad Especial lo analizan mediante
choque entre dos partículas, ya sea elástico con cambio de dirección o inelástico. Al
respecto, desarrollé una demostración que se distingue por su simpleza y porque no
requiere choque entre partículas. Veamos su desarrollo:
Dos partículas idénticas se mueven según muestra el esquema. Por isotropía
espacial sus masas deben ser iguales.
En estas condiciones el centro de masa del sistema permanece en reposo y su
cantidad de movimiento es nula. Al sistema de referencia en el cual el centro de masa
está en reposo se lo denomina Sistema de centro de masa (o inercia).
Dado que es un planteo unidimensional (x;x’) no indicaremos los subíndices de los
ejes.
Para otro observador que se mueva con velocidad V = v, la partícula 1 está en reposo
y el centro de masa posee una velocidad v’CM = -v. A este sistema de referencia en el
cual una partícula está en reposo se lo denomina Sistema de Laboratorio.
La cantidad de movimiento en el Sistema de Laboratorio es:
Siendo m’ la masa de la partícula 2, con velocidad v’2 y m0 la masa de la partícula 1,
en reposo. Aquí la condición de simetría no corresponde pues las partículas tienen
distinto estado de movimiento.
Despejando obtenemos:
Aplicando las transformaciones de las velocidades podemos calcular v’2
Resolviendo esta ecuación algebraica podemos hallar v’CM en función de v’2. Por
tratarse de una ecuación de segundo grado tendrá dos soluciones, pero una sola con
significado físico (pues v'CM < v'2 ). Con la condición de que el módulo de la velocidad
del centro de masa debe ser menor que el de la velocidad de la partícula 2,
obtenemos:
Reemplazando en la expresión de la masa y operando obtenemos:
Siendo m0 la masa de la partícula 1, en reposo, y m’ la masa de la partícula 2 en
movimiento.
Dado que las partículas son idénticas en reposo, podemos generalizar la expresión
anterior y aplicarla para una partícula en movimiento.
Esta masa variable con la velocidad, junto al Principio de Equivalencia entre masa y
energía, dieron lugar a la definición de masa relativista. Volveremos a tratar el tema
luego del estudio sobre energía relativista.
Es muy importante destacar dos cosas:
1. En la expresión anterior no aparece explícitamente la velocidad relativa entre
sistemas de referencia.
La masa relativista expresa el valor de la masa en función de la velocidad que
posee respecto de cada observador inercial. La inercia de un cuerpo material
es relativa al observador y depende de su velocidad.
2. Hemos supuesto que la masa propia de la partícula m0 es invariante, es decir
que toma el mismo valor en cualquier sistema de referencia inercial. Ello no es
arbitrario pues si así no fuera los sistemas inerciales no serían equivalentes ya
que habría una forma de distinguirlos.
Operando la última expresión y usando la definición clásica de cantidad de movimiento
(p=mv), obtenemos:
Siendo m la masa relativista y m0 la masa en reposo que, rigurosamente, debería
llamarse masa propia.
La formulación de la Relatividad en un espacio de 4 dimensiones (Minkowski, 18641909) dio lugar, en los últimos 20 años, a que especialistas reconocidos tuvieran
extensas, caprichosas e innecesarias discusiones, sobre la conveniencia o no de
utilizar la masa relativista.
En el caso en que se quiera evitar el uso de masa relativista debe redefinirse la
cantidad de movimiento (ver la expresión siguiente).
Finalmente llegamos a la conclusión que la cantidad de movimiento es válida en el
marco de la Relatividad Especial si en cualquier sistema de referencia inercial queda
determinada por la relación:
Siendo m0 la masa en reposo y v la velocidad de la partícula en dicho sistema.
Esta definición de cantidad de movimiento es compatible con p=mv sólo si aceptamos
que la masa varía con la velocidad. Por ello resulta conveniente, cuando se traten
relaciones o leyes que involucren a la masa, indicar a la masa en reposo con el
subíndice 0.
En este Curso utilizaremos m en el sentido de masa relativista y m0 para la masa en
reposo, manteniendo la definición “newtoniana” de la cantidad de movimiento.
Luego de este análisis es fácil mostrar para una interacción entre dos partículas en un
sistema aislado, que el Principio de conservación de la cantidad de movimiento se
cumple en todos los sistemas de referencia inerciales.
Nota
De acuerdo con la definición clásica de cantidad de movimiento (p=mv) debemos
aceptar que esta Ley de conservación resulta válida si aceptamos que la masa de un
cuerpo depende de su velocidad (más rigurosamente de su contenido energético).
El concepto de masa establecido por la mecánica clásica es que su valor es una
medida de su inercia, es decir la tendencia a conservar su velocidad. Aceptar que la
inercia de un cuerpo material aumenta con la velocidad, hecho que fue confirmado
experimentalmente, tiene otras implicancias muy profundas.
Tal vez la más importante sea su relación con la masa gravitatoria.
El estudio de caída libre relativista da resultados diferentes si el campo gravitatorio se
aplica sobre la masa relativista (caso correcto) o sobre la masa en reposo.
En la carpeta Temas Especiales se trata la “Caída libre relativista”, con ambos
tratamientos.
Dinámica relativista
La Teoría Mecánica puede ser formulada de manera axiomática de varias maneras, lo
que históricamente dio lugar a diferentes enfoques (Newton, Lagrange, Poincaré,
Einstein). Sin embargo, todos ellos tienen en común que sus postulados básicos, de
una u otra forma, se fundamentan en los mismos tres aspectos distintivos del
comportamiento de la naturaleza, que son:
1. Cómo suceden los fenómenos para observadores distintos (relatividad).
2. Cómo responden cuerpos distintos ante un mismo requerimiento (causalidad).
3. Cómo se comportan los cuerpos entre sí (interacciones).
Para Newton (1643-1727) la formulación es con sus tres leyes (Principios), que en
conjunto responden exactamente a cada uno de los puntos anteriores, y es de validez
limitada a sistemas de referencia inerciales.
Este enfoque no requiere de ningún otro postulado básico, que alguna bibliografía
redundantemente incorpora, como por ejemplo el llamado Principio de independencia
de los movimientos, que resulta una consecuencia matemática del carácter vectorial
de las magnitudes (velocidad, aceleración, fuerza).
Muchos autores, particularmente los correspondientes a la denominada “escuela
americana” (Sears, Ingard y Kraushaar, Feynman), no suelen analizar en profundidad
la fundamentación de la Mecánica, y tratan al Principio de Inercia (primera ley) como si
estuviera contenido en la segunda ley de Newton, despreciando o ignorando un
aspecto fundamental del enunciado, por el cual la primera ley es un Principio.
Como veremos, esta paupérrima interpretación induce a cometer dos errores graves:
no comprender el significado del Primer Principio y creer que un Principio es
demostrable.
Veamos más en detalle el tema en cuestión.
La primera ley de Newton establece que "Si sobre un cuerpo no actúa fuerza alguna
éste permanece en su estado de reposo o de movimiento rectilíneo uniforme (MRU)".
No hay duda que el mismo describe explícitamente la ley de inercia de los cuerpos,
desarrollada por Galileo.
Sin embargo, un aspecto muy significativo de este enunciado es que implícitamente
contiene el Principio de Relatividad de los movimientos, ya que trata a ambos estados
(reposo y MRU) como estados naturales equivalentes (ver A. Sommerfeld, "Lectures
on Theoretical Physics - Mechanics"). Este simple hecho tiene varias consecuencias
importantes:

Relaciona a observadores inerciales en movimiento relativo, pues un cuerpo en
reposo para un observador se moverá con MRU para el otro.

Incorpora las transformaciones de Galileo, ya que son las únicas que
satisfacen la equivalencia entre reposo y MRU conservando el carácter
absoluto del tiempo.

Generaliza la teoría a todos los sistemas inerciales conteniendo, en
consecuencia, el Principio de Relatividad de Galileo.
En mi opinión, postular la equivalencia entre el reposo y el MRU es el aspecto clave de
este enunciado y le da entidad de Principio a la primera ley de Newton.
Si el objetivo de la primera ley tan sólo fuera establecer que la velocidad es constante
cuando no hay fuerzas aplicadas, ello ya estaría contenido en la segunda ley y no
haría falta referirse al estado de reposo (V=0) pues éste sería un caso particular.
Obviamente, con esta interpretación parcial la primera ley de Newton no tendría razón
de ser.
Probablemente esta interpretación incompleta del Principio de Inercia tenga su origen
en la forma en que fuera enunciado por Newton, quién debió desterrar las ideas
aristotélicas propias de esa época, por las cuales se asumía que para que un cuerpo
se mueva hay que estar empujándolo.
Aunque este Curso de Relatividad no requiere el conocimiento de Mecánica Analítica
(Euler, Lagrange, Hamilton), señalemos que su formulación se basa en un Principio
extremal que resulta válido en cualquier sistema de referencia (inercial o no), mientras
que las interacciones se tratan asumiendo que pueden ser descritas por funciones
continuas que cumplen ciertos requisitos. Este enfoque es más general que el
newtoniano y su estudio es necesario para la fundamentación y desarrollo de la
Mecánica Cuántica.
Siguiendo las ideas de Poincaré y Einstein, la teoría de la mecánica, ya sea clásica o
relativista, puede fundamentarse en las propiedades de simetría del espacio y del
tiempo, y en el Principio de Relatividad, indicando con esto último que las leyes de la
mecánica son las mismas en todos los sistemas inerciales.
La homogeneidad e isotropía del espacio y la uniformidad del tiempo, aceptados como
postulados válidos para los sistemas inerciales, permiten deducir como teorema las
transformaciones de coordenadas que correspondan, las de Galileo (mecánica clásica)
si asumimos que el tiempo es absoluto, o las de Lorentz (mecánica relativista) si
aceptamos que la velocidad de la luz en el vacío es la misma para todos los
observadores inerciales (ver Transformaciones de Lorentz).
En este enfoque la segunda ley de Newton ya no es un Principio, es la definición de
fuerza.
Resumiendo, los axiomas de la teoría mecánica bajo este encuadre son:



Principio de Relatividad.
Homogeneidad e isotropía del espacio.
Uniformidad del tiempo.
Válidos para todo observador inercial.
Nota importante
Estudios más profundos sobre las propiedades del espacio y el tiempo, iniciados por
Poincaré (1904) y Minkowski (1908), y continuados por N. Mermin ("Relativity without
light", Am. J. Phys. 52 (2), February 1984) y A. Logunov (1998), permitieron mostrar
que la Teoría de Relatividad queda rigurosamente establecida postulando que los
fenómenos físicos suceden en un espacio cuadridimensional cuya geometría es
pseudo euclídea.
Al fijar la métrica no es necesario incorporar el Principio de Relatividad ni la constancia
(absoluta) de la velocidad de la luz, pues ello se obtiene como consecuencia.
Un análisis completo puede verse en el extraordinario libro de A. Logunov ("Curso de
Teoría de la Relatividad y de la Gravitación", lecciones 1 y 2).
La condición de invariancia de la velocidad de la luz en el vacío provocó la revisión de
los conceptos sobre el espacio y el tiempo, modificando la formulación de la mecánica
desde sus cimientos. Las Transformaciones de Lorentz ocuparon el lugar de las de
Galileo y el Principio de Relatividad brindó la herramienta para la formulación de leyes
relativistas.
Una ley clásica resulta relativista sólo si conserva su forma en los sistemas inerciales.
Como vimos, esto condiciona a las variables físicas que intervienen en ella pues, ante
transformaciones de Lorentz, deben modificarse de tal manera que la expresión de la
ley sea la misma.
Pedir que las leyes conserven su forma no es un nuevo requisito. Cuando en
mecánica clásica decimos que las leyes de Newton son válidas en todos los sistemas
inerciales es exactamente decir que conservan su forma ante transformaciones de
Galileo. Tal vez esto no era tan notorio en la mecánica clásica debido a que la fuerza,
la masa y la aceleración son magnitudes invariantes ante transformaciones de Galileo,
es decir, no modifican su valor al cambiar de un sistema inercial a otro inercial.
Lo nuevo en Relatividad Especial es el grupo de transformaciones que utilizamos
(Lorentz), cuya aplicación usualmente provoca que las magnitudes involucradas en
una ley sean relativas al sistema de referencia. En consecuencia, corresponde ser
muy cuidadoso en la definición de las mismas.
M as a
El concepto básico que asumiremos es que la masa de un cuerpo, partícula o ente
físico capaz de interactuar con otro, es una medida de su inercia, y su definición
debe ser compatible con la conservación de la cantidad de movimiento, tema ya
tratado.
Llamaremos partículas masivas a toda partícula que posea masa en reposo distinta de
cero. Por razones históricas, las radiaciones (campos y fotones) se denominan
arbitrariamente no masivas pues no poseen masa propia, aunque sí poseen masa
relativista si se adopta p=mv como definición de cantidad de movimiento.

Como veremos oportunamente, la masa inercial de un cuerpo depende de su
contenido energético, por lo cual el concepto de masa como cantidad de
materia no resulta muy adecuado en esta formulación.

La definición de Newton, como la constante de proporcionalidad entre la fuerza
y la aceleración, que se mide con una balanza, hay que descartarla totalmente
pues la fuerza y la aceleración no resultan colineales en mecánica relativista.
Dado que ésta definición es utilizada por algunos pocos autores, digamos que
en ese caso la masa deja de ser una magnitud escalar pues toma valores
distintos según la dirección que se trate.

Una definición adecuada parece ser la de Maupertuis (m=p/v): la masa inercial
es el cociente entre los módulos de la cantidad de movimiento y de la velocidad
de la partícula. Esta definición fue analizada por el matemático Hermann Weyl
(1885-1955) y puede adaptarse para partículas no masivas (fotones). Tiene el
inconveniente que requiere previamente la definición de la cantidad de
movimiento.

La definición operativa de Mach de masa relativa, utilizada en un apartado
anterior, tiene una restricción formal menor, su definición no puede aplicarse a
un sistema de más de dos cuerpos. Sin embargo, resulta una opción atractiva y
es posible adecuarla incluso para partículas no masivas (fotones). En todos los
casos las mediciones se deben realizar antes y después de la interacción.
Nosotros vamos a mantener el concepto de masa como una medida de la inercia.
Nota
Un análisis más profundo nos demuestra que el fenómeno de inercia de los cuerpos
tiene dos causas de distinta naturaleza: la masa relativista, que es una propiedad del
cuerpo, y la imposibilidad de superar la velocidad de la luz, que es una consecuencia
de las propiedades del espacio y del tiempo.
Por el momento, para partículas masivas, adoptaremos la definición de masa de
Mach. Esta magnitud es relativa al sistema de referencia, y queda determinada por la
expresión de masa relativista, ya vista en el apartado anterior.
Para partículas no masivas (fotones) aceptemos por ahora que su masa inercial está
dada por:
El caso de masa inercial distribuida sobre un campo de radiación electromagnética es
más complejo y requiere el conocimiento del vector de Poynting, por lo cual no será
tratado en este curso inicial.
Luego, cuando veamos energía y el Principio de equivalencia entre masa y
energía, daremos una definición precisa, más amplia y general, aplicable en
todos los casos.
Cantidad de movimiento
Definimos como cantidad de movimiento a la magnitud vectorial p=mv, siendo m la
masa inercial.
Fuerza
La mecánica relativista puede formalmente proponerse partiendo de la definición de
fuerza a través de la relación vectorial:
Siendo p=mv la cantidad de movimiento, con m la masa inercial que es la masa
relativista, recientemente vista.
Considerando que ésta ley debe conservar su forma ante Transformaciones de
Lorentz, se pueden obtener las fórmulas de transformación de las tres (3)
componentes de la fuerza, resultando expresiones complicadas (ver Möller, “The
Theory of Relativity”), debido a que la fuerza y la aceleración pueden no ser paralelas.
Desarrollando la expresión anterior obtenemos:
Resulta evidente que la fuerza y la aceleración no son colineales en general.
Ésta característica es una de las principales diferencias con la mecánica clásica y es la
razón por lo que se dice que la fuerza es “conceptualmente” diferente en relatividad a
la aceptada en la mecánica newtoniana.
Asimismo, corresponde reiterar que la expresión F=ma no es válida pues no es
equivalente a la definición de fuerza que hemos adoptado y no debería ser utilizada.
El Teorema del Impulso y la variación de la cantidad de movimiento sale naturalmente
de la definición de fuerza.
Resulta claro que si no hay fuerzas exteriores aplicadas se cumple la conservación de
la cantidad de movimiento.
Permítanme ahora tratar una relación muy importante, derivada de la definición de
fuerza, cuya demostración será dada luego de tratar el tema de energía relativista. Ella
es:
Siendo v la velocidad de la partícula. Si descomponemos esta relación vectorial en dos
componentes, transversal y tangencial a la velocidad, obtenemos:
Esta última expresión muestra claramente que si la velocidad de una partícula tiende a
la velocidad de la luz (c), la aceleración en la dirección del movimiento tiende a cero
(0), cualquiera sea el valor de la fuerza aplicada. En consecuencia, ningún cuerpo
material puede alcanzar la velocidad de la luz en un tiempo finito.
Ahora supongamos que tenemos una partícula (fotón) que se desplaza a la velocidad
de la luz, sobre la cual actúa una fuerza.
Las expresiones vistas muestran claramente que la aceleración tangencial siempre
será nula, por lo cual no es posible modificar el módulo de su velocidad (c). Sólo
es posible modificar su dirección pues la aceleración transversal puede no ser
nula. Como veremos, la masa relativista del fotón es mf = hv/c2.
En la carpeta Temas Especiales se tratará el tema “Curvatura de la luz en Relatividad
Especial".
Por otro lado, si reemplazamos la masa relativista y despejamos F, resulta:
Estas expresiones han dado lugar a que algunos autores que usan solamente la masa
en reposo consideren, erróneamente, que la partícula posee una inercia “longitudinal”
diferente de la “transversal”. Obviamente el error consiste en aceptar como válida la
expresión F=ma. En la formulación planteada en este curso la masa que mide la
inercia es la masa relativista, que es isótropa.
Conclusiones




Ningún cuerpo material puede alcanzar la velocidad de la luz en el vacío.
Ninguna radiación puede modificar el módulo de su velocidad en el vacío.
Las radiaciones poseen masa inercial m>0 y masa propia nula.
Fuerza y aceleración no son colineales en general.
Nota
Un fotón puede ser considerado una partícula pues reúne las tres características
necesarias:
1. Posee energía (hv).
2. Posee cantidad de movimiento (hv/c).
3. Posee estructura (campo, longitud de coherencia).
Trabajo y Energía
Comenzaremos el estudio sobre energía tratando el caso de una partícula (puntual) de
masa propia m0, en estado libre en un sistema inercial. Cuando aplicamos una fuerza
externa ello provocará un cambio de su cantidad de movimiento que podemos calcular
con el Teorema del Impulso, como vimos en el apartado anterior.
Ahora vamos a profundizar el estudio de las modificaciones dinámicas que sufre la
partícula sobre la que actúa una fuerza externa, a través del Trabajo (W) que realiza la
fuerza aplicada. El trabajo elemental de una fuerza se define como:
Usando la definición de fuerza obtenemos:
Recordando la expresión de la masa relativista, tenemos:
En consecuencia, despejando m v dv, quedará
Reemplazando en la ecuación del trabajo elemental dW, queda una expresión muy
sencilla:
Resulta evidente que el trabajo elemental realizado se tradujo en una variación de su
masa relativista. Dado que la misma sólo depende de la velocidad, es inmediato ver
que la variación de la masa se debe a la variación de la velocidad de la partícula.
El Trabajo de la Fuerza a lo largo de un camino quedará expresado por:
Siendo m1 y m2 la masa de la partícula en el punto inicial y final, respectivamente.
Reemplazando la masa relativista queda:
En mecánica clásica el trabajo realizado por la fuerza es igual a la variación de la
energía cinética de la partícula (Teorema de las fuerzas vivas). Veamos si el cálculo
relativista es compatible con dicho Teorema, como debería ser de acuerdo al Principio
de Correspondencia. Para ello debemos analizar qué sucede cuando
.
Debemos ser cuidadosos como hacemos este análisis, pues si tomamos límite
para
, resulta W=0. En la aproximación hemos tirado el agua de la tina con el
bebé (v) y el patito (c), es decir que directamente eliminamos las velocidades.
Para evitar esto último desarrollemos en serie de McLaurin (1698 - 1746) la siguiente
expresión genérica:
Haciendo cálculos y quedándonos con la aproximación de primer orden, tenemos:
Reemplazando en la ecuación original y operando, se obtiene el resultado esperado.
En consecuencia, para una partícula sobre la cual aplicamos una fuerza a lo largo de
un camino, el Trabajo de la fuerza es igual a la variación de su energía cinética, y
ella está implícitamente incorporada en la variación de la masa relativista.
Nótese que la trayectoria, la masa y la posición son relativas al sistema de referencia.
En consecuencia, el trabajo de una fuerza será también una magnitud relativa al
sistema de referencia.
Ahora veamos cómo se calcula la energía cinética que posee una partícula. Si en la
posición inicial la partícula está en reposo, entonces el trabajo (W) de la fuerza será
igual a la energía cinética final. Es decir:
Fuerza relativista
En el apartado anterior (el de dinámica) definimos la fuerza por la relación F=dp/dt.
Desarrollando esta expresión tenemos:
Utilizando la expresión dW=c2dm se obtiene:
Despejando se llega a la importante relación
Esta expresión tiene varias consecuencias destacables, ya vistas:
1. Demuestra que ningún cuerpo material puede alcanzar la velocidad de la
luz en el vacío (ver apartado anterior).
2. Demuestra que ninguna radiación o partícula no masiva puede modificar el
módulo de su velocidad (ver apartado anterior).
3. Muestra la inconsistencia relativista de la Ley de Newton si la misma es
expresada por F=ma (ver apartado anterior).
Principio de Equivalencia entre Masa y Energía
En un breve trabajo (septiembre de 1905) intitulado “¿Depende la inercia de un cuerpo
de su contenido energético?”, Einstein concluye que si un cuerpo irradia luz de energía
L, la masa del cuerpo debe disminuir en L/c2, proponiendo una forma de verificación
utilizando un elemento radiactivo (Radio). Esta publicación científica condujo a la más
célebre fórmula en la historia de la ciencia, conocida como Principio de equivalencia
entre masa y energía.
E = m c2
Esta relación es considerada un Principio debido a que no tiene una demostración
general y se comprobó que es válida universalmente para toda forma de energía. La
demostración vista en el apartado anterior solamente vincula la variación de la energía
cinética con el incremento de masa de una partícula puntual, equivalente al Teorema
de las fuerzas vivas de la mecánica de Newton.
La energía total relativista (E) es una propiedad de todo sistema físico, masivo o no
masivo, cuyo valor aumenta (disminuye) cuando se le entrega (quita) energía por
cualquier proceso, y toma el valor cero sólo cuando el sistema se aniquila
(desaparece). En consecuencia, para un determinado sistema de referencia inercial,
su valor depende del estado del sistema físico y sólo será constante si el sistema físico
está aislado. Resulta evidente, además, que la magnitud Energía total es relativa al
sistema de referencia.
Calentar un sistema macroscópico, darle cuerda a un reloj, aumentar la velocidad de
una partícula, o la absorción de radiación por parte de un gas, son distintos ejemplos
de procesos que provocan un incremento de la inercia (masa) del sistema que se trate,
que cumple con:
Siendo
la energía entregada al sistema en el proceso. La magnitud que mide la
inercia es la masa relativista.
Por supuesto que si el sistema pierde energía por algún proceso cualquiera (radiación,
enfriamiento, etc.), el sistema disminuye su masa de acuerdo con la misma relación.
Para una partícula puntual, que asumimos sin estructura, el único proceso de
transferencia de energía que se considera posible es el trabajo mecánico (fuerza
aplicada), producto de una interacción campo-partícula, cumpliéndose la relación
dE = dW = F.ds = v.dp.
En este caso se considera que toda la energía entregada se transforma en cinética
(ver capítulo anterior), variando la masa relativista sin modificar la masa propia. Esta
suposición es la única razón por la cual la masa propia resulta constante.
Corresponde aclarar que las partículas reales, incluso las fundamentales, podrían no
ser puntuales (y tener estructura). En este caso sólo podemos asegurar que la masa
propia permanece constante sólo si la partícula está libre de interacciones externas.
Por otro lado, si una partícula real está sometida a una interacción tiene fuerzas
aplicadas, aspecto que Poincaré analizó para el caso del electrón (tensiones de
Poincaré), que muy probablemente modifiquen su morfología y configuración espacial.
En consecuencia, en el marco de la Teoría Especial de Relatividad, no es posible
asegurar la constancia de la masa propia de una partícula acelerada.
Este Principio establece nuevos conceptos que deben destacarse:
1. La energía relativista E representa la energía total que se podría obtener (en
forma de radiación) si lográramos convertir toda la masa relativista en energía,
tal como sucede en el fenómeno conocido como "aniquilación de pares". Por
primera vez se dispone de un cálculo de energía total válido para cualquier
sistema físico, cuyo valor tiene significado físico. Se hace notar que las
magnitudes tales como Energía interna (Termodinámica), Energía potencial
(Campos conservativos), Energía mecánica (Mecánica clásica), están definidas
a menos de una constante arbitraria y su valor numérico no tiene significado
físico.
2. La energía total de una partícula en reposo, “almacenada” en su masa propia,
está dada por E=m0 c2.
Los mecanismos de conversión de masa en energía radiante y viceversa,
fueron estudiados durante la primera mitad del siglo XX, principalmente con el
formalismo de la Teoría Cuántica de Campos (iniciada en la década del 20),
actualmente en desarrollo.
3. El Principio permite dar una definición de masa (relativista) compatible con
partículas no masivas, es decir sin masa propia (fotones), generando una
coherencia lógica, general y sin limitaciones, con la definición de cantidad de
movimiento propuesta (p=mv).
Se define como masa de cualquier sistema físico, sea puntual o extenso,
masivo o no masivo (masa propia nula), al escalar obtenido del cociente entre
la Energía total E del sistema y el cuadrado de la velocidad de la luz en el
vacío.
Su expresión matemática es:
m = E/c2
En consecuencia, podemos dar una definición precisa para la cantidad de
movimiento, válida para partículas masivas y no masivas:
p = E/c2 v, siendo E la energía total
En el apartado Temas Especiales se tratará la aplicación de este concepto en
el artículo “Curvatura de la luz en Relatividad Especial”.
4. Los Principios de conservación de la masa y de la energía, que se formularon
de manera independiente para sistemas aislados, ahora se relacionan en un
único Principio pues masa y energía están relacionadas por el Principio de
Equivalencia entre masa y energía.
En consecuencia, el Principio de Equivalencia podría (y debería) ser formulado de la
siguiente manera:
El contenido total de energía de un ente físico cualquiera es igual a su masa
relativista multiplicada por el cuadrado de la velocidad de la luz
Nota
Muchos autores, especialmente los dedicados a la física de partículas, proponen su
validez solamente para cuerpos en reposo, con argumentos poco convincentes que
resultan ser los mismos por los cuales tampoco aceptan la masa relativista. Lo más
inexplicable es que luego usan los conceptos que rechazan.
En su trabajo original de tres carillas, Einstein analiza la emisión de radiación y la
variación de la masa en la forma usual del formalismo de la teoría, es decir desde el
punto de vista de dos observadores inerciales, uno en reposo respecto del cuerpo y el
otro en movimiento con velocidad constante.
Proponer que esa demostración es sólo válida para cuerpos en reposo es falso, sin
criterio y ridículo.
Creación y Aniquilación de pares
Este singular fenómeno no se conocía en el inicio de la Teoría de Relatividad y su
descubrimiento se debió justamente a dicha teoría. En 1928 el ingeniero electricista
(luego matemático y posteriormente doctor en física) Paul Dirac (1902-1984) predijo la
existencia de antimateria al relacionar la mecánica cuántica con la relatividad.
El positrón (e+), que es la antipartícula del electrón (e-) y posee sus mismas
propiedades salvo la carga, que es positiva, fue observado por primera vez por
Anderson en 1932.
La creación de pares es el proceso por el cual una partícula (masiva o no), de energía
suficiente y bajo ciertas condiciones, crea dos o más partículas diferentes.
Este fenómeno es típico en los aceleradores de partículas, en las reacciones
nucleares y en la radiación cósmica.
Nos interesa tratar el caso de creación de pares obtenidos de fotones de alta energía.
La cantidad de movimiento de un fotón es distinta de cero cualquiera sea el sistema de
referencia que se elija, mientras que para dos partículas masivas, en el particular
sistema de su centro de masa, resulta nula.
En consecuencia, teniendo en cuenta que en ausencia de fuerzas exteriores la
conservación de la cantidad de movimiento debe ser válida en todos los sistemas
inerciales, la creación de pares a partir de un fotón aislado no es viable. Debe
recordarse que en este marco teórico la velocidad relativa entre sistemas inerciales (V)
siempre es menor que c.
Para fotones, la ocurrencia del fenómeno indefectiblemente requiere que el fotón
interactúe con algún otro ente físico real, dado que esta condición es consistente con
el Principio de conservación de la cantidad de movimiento.
A modo de ejemplo vamos a describir la fenomenología de un caso característico, en
el sistema de referencia en el que el agente perturbador esté en reposo luego de la
interacción:
Si un fotón de alta energía (gamma) es perturbado (se desconoce cómo es el proceso
disparador del fenómeno) por un núcleo, el fotón se aniquila y se crean dos o más
partículas masivas. El caso más frecuente es la creación de un electrón y un positrón.
La energía de un electrón (positrón) en reposo es E0 = m0 c2 = 0.511 Mev.
En consecuencia, para la creación de un par electrón-positrón la energía del fotón
debe ser mayor que 1.022 Mev.
Si el fotón es más energético (Efotón > 1.022 Mev) las partículas creadas tendrán
también energía cinética (en general idéntica), cumpliéndose las leyes de
conservación de la energía y de la cantidad de movimiento. Cuanto mayor sea la
energía del fotón madre, mayor será la energía cinética de las partículas creadas.
Por conservación del momento angular el fotón gamma inicial, el electrón y el positrón,
tienen sus velocidades en un mismo plano. Suponiendo que el plano es el (x,y) y que
la dirección inicial del fotón es coincidente con el eje x, tenemos:
Este fenómeno, que es tratado en la Teoría Cuántica de Campos (QFT), ha tenido
diferentes interpretaciones (Fock, Feynman, Stueckelberg), particularmente en el
tratamiento cuántico. En todas ellas se cumplen las relaciones relativistas antes y
después del proceso, pero no necesariamente durante el mismo, lo cual puede ser
considerado una limitación del modelo teórico utilizado (QFT).
En las relaciones anteriores no se ha tenido en cuenta la energía de enlace entre
electrón y positrón que se atraen, pues se considera que es despreciable frente a la
energía del fotón madre aunque, como veremos, esto es seriamente discutible.
Analicemos algunas dificultades del modelo teórico desde el punto de vista
relativista. Por el Principio de conservación de la carga, que postula la conservación de
la carga total del universo, las dos partículas deben crearse simultáneamente y ello
sólo es posible si los eventos ocurren en el mismo punto (ver el capítulo de
simultaneidad). Si la aniquilación del fotón y la creación del par ocurren en un mismo
punto, la energía necesaria para separarlas se hace infinita por la atracción eléctrica
entre electrón y positrón, y no se cumple la conservación de la energía.
En el tratamiento cuántico Feynman utilizó el Principio de Incerteza (no se conserva la
energía durante el tiempo del proceso de creación ni está definida la posición de cada
partícula), y la postulación de fotones "virtuales" con velocidades mayores que c para
no violar el principio de causalidad, con lo cual el modelo se ajustó muy bien a los
resultados experimentales.
No obstante y dadas las transgresiones relativistas, considero que no sabemos mucho
sobre el proceso real.
Se ha confirmado experimentalmente que una vez creado un positrón su condición
más probable es que se vincule con un electrón formando un sistema metaestable
excitado, llamado “positronio”, con niveles de energía, y cuya vida media es del orden
de 10-7seg. Aparentemente no tiene un nivel fundamental estable.
Durante este lapso el positronio (en reposo) decae emitiendo fotones poco energéticos
(como cualquier átomo excitado), y finalmente se aniquila en dos fotones gamma
idénticos de 0.511 Mev de energía, emitidos en oposición (1800), requisito necesario
para la conservación de la cantidad de movimiento.
Nótese que a pesar de que la energía del fotón inicial es mayor que la necesaria para
crear el par electrón-positrón, luego de su aniquilación obtenemos dos fotones gamma
idénticos y de energía exactamente igual a la energía en reposo de cada partícula. El
exceso de energía del fotón inicial se consumió luego de la creación del positronio en
estado excitado, por decaimiento del mismo con emisión de fotones de baja energía.
Sin embargo, hay un caso muy importante en el que el par electrón-positrón no forma
el positronio. Si las partículas chocan con velocidades diferentes, ambas cercanas a
las de la luz, como puede suceder en experimentos en aceleradores (CERN), éstas se
aniquilarán “al vuelo” sin formar un estado metaestable previo. En ese caso, los dos
fotones gamma resultantes de la aniquilación serán idénticos, podrán formar ángulos
distintos de 180º en sus trayectorias de salida y serán más energéticos (Ef > 0.511
Mev). Este hecho experimental muestra la conversión total de la masa relativista
en radiación.
En este caso para cada fotón gamma emitido se cumple:
Los superíndices e- y e+ son usados para evitar que se confunda la masa relativista
con la masa propia.
Relación entre Energía y Cantidad de movimiento
La equivalencia entre masa y energía puede ser expresada en relación a la cantidad
de movimiento.
Esta expresión corresponde a un invariante importante que trataremos a continuación.
La masa en reposo de una partícula libre debe ser la misma en cualquier sistema de
referencia, pues de lo contrario los sistemas inerciales no serían equivalentes ya que
podrían ser distinguibles. Lo mismo sucede con la longitud propia de un objeto o el
tiempo propio de un fenómeno.
En consecuencia, para dos observadores inerciales tendremos:
Este invariante es similar al del “Intervalo” tratado en el apartado de Transformaciones
de Lorentz.
Nota
Su demostración en el espacio de Minkowski es elegante y simple, basada en que la
cantidad de movimiento se transforma como las coordenadas (x, y, z) y la energía
como el tiempo.
La masa en reposo
En el ítem anterior hemos tratado el caso de la constancia de la masa en reposo para
una partícula libre. Veremos que esto no es general y que la masa en reposo puede
ser modificada bajo ciertas condiciones. Previamente hagamos algunas aclaraciones
para evitar que los amantes de la bella formulación geométrica de la Relatividad se
suiciden en masa. Los invariantes obtenidos en ese modelo son rigurosos
matemáticamente, tal como sucede con la masa propia (m0), y ello es consecuencia de
cómo se transforman las "variables" relacionadas (E,p). La masa propia resulta
entonces un invariante que es constante simplemente porque hemos establecido que,
para una partícula puntual, la única modificación posible cuando le entregamos
energía es que cambie solo su cantidad de movimiento.
En consecuencia, aunque poco probable, si encontráramos algún mecanismo de
transferencia de energía que no modificara su velocidad, sería inevitable que cambie
la masa propia de una partícula puntual.
En primer lugar digamos que existen otros procesos (no aplicables a partículas
puntuales), además del trabajo mecánico ya visto, capaces de transferir energía
(calentamiento, deformación, fricción, absorción, etc). Por ejemplo, si el cuerpo
material es un sistema macroscópico en reposo, podemos entregarle o quitarle
energía (Q) por intercambio de calor.
Dado que este mecanismo puede ser hecho sin necesidad de modificar su velocidad,
debemos concluir que tiene que modificarse su masa en reposo, que en el caso en
que se le entregue energía será:
Si el sistema pierde energía bastará con cambiar el signo en la relación anterior y la
masa propia final será menor.
Para un sistema macroscópico, la masa en reposo del mismo es función de la
temperatura.
En general, si a un sistema físico, sea puntual o extenso, podemos entregarle o
quitarle energía sin modificar su velocidad, el sistema cambiará su energía total, su
masa relativista y su masa propia, de acuerdo con el Principio de Equivalencia entre
masa y energía.
En la carpeta Temas Especiales se agregarán dos trabajos: “El Corrimiento al Rojo en
Relatividad Especial”, y “El Efecto Mössbauer en Relatividad Especial”, vinculados con
la variación de la masa de un sistema.
De acuerdo al Principio de equivalencia entre masa y energía, cualquier sistema físico
formado por componentes que interactúan entre sí debe tener una masa diferente a la
suma de las masas de sus componentes en estado libre (no vinculado).
Analicemos el caso más simple posible, que consiste en un sistema formado por dos
partículas que se atraen, y supongamos que inicialmente están juntas y en reposo.
Para separarlas debemos realizar un trabajo mínimo (W), cuyo valor representa la
energía que se debe entregar al sistema para desvincular las partículas y que ellas
queden en reposo. Si se le entrega más energía que la necesaria (W), las partículas
libres (no vinculadas) tendrán energía cinética.
En consecuencia, el sistema con las partículas “pegadas” posee menos energía que el
mismo sistema de dos partículas cuando ellas no están vinculadas. En general, si el
sistema y las partículas (idénticas) están en reposo, en su condición de mínima
energía (pegadas), su energía será:
Siendo m0 la masa propia de cada partícula y W el trabajo necesario para
desvincularlas (separarlas).
Es evidente que la masa del sistema es menor que la suma de las masas de sus
componentes ( m0  2m0 ).
S
Cuando el sistema no está vinculado (partículas libres en reposo), su masa será 2m0.
Queda planteado mostrar que si las partículas del sistema se repelen, la masa del
mismo será mayor cuando estén “pegados” sus componentes.
Ahora veamos el caso del átomo de Hidrógeno, formado por un electrón y un protón.
La energía de ionización es 13.5984 eV, que representa la energía mínima que debo
suministrarle al átomo para desvincular su electrón. Esta energía es muy pequeña
para que pueda detectarse la diferencia de masa entre el átomo en estado
fundamental y la suma de las masas de sus dos componentes.
De acuerdo a lo visto, la masa del átomo de Hidrógeno en estado fundamental debe
ser menor que la suma de las masas del protón y el electrón. Hagamos las cuentas:





Masa del protón: 1.6726 × 10-27 kg
Masa del electrón: 9.11 x 10-31 kg
Masa del electrón + Masa del protón: 1.673511 × 10-27 kg
Masa del H (est. Fund.): mp+me – 13.5984 eV/c2 = 1.673510976 × 10-27 kg
Diferencia de masa: 2.4 x 10-35 kg
Nótese que la diferencia de masa es 100 millones de veces menor que la masa
del sistema.
Considerando que todos los átomos de la Tabla periódica tienen energías de vínculo
de electrones del mismo orden que la del Hidrógeno, la diferencia de masa por el
enlace con sus electrones no será significativa.
Sin embargo, en el átomo hay energías de vínculo muchísimo más grandes, que son
las que ligan a las partículas del núcleo atómico (nucleones), relacionadas con las
fuerzas nucleares, que trataremos a continuación.
Defecto de masa
Se denomina defecto de masa a la diferencia de masa de un núcleo atómico, medida
experimentalmente (masa del sistema), y la que corresponde a su número atómico
(suma de las masas de sus componentes). Esto es exactamente lo que acabamos de
analizar en el ítem anterior pero, en este caso, con fuerzas de ligadura muchísimo más
grandes.
Veamos un caso real, el Deuterio (isótopo del Hidrógeno) ionizado, cuyo núcleo está
formado por un protón y un neutrón. Los valores de las masas correspondientes son:



Masa protón: 1.0073 u
Masa neutrón: 1.0087 u
Masa Deuterio: 2.0136 u
Defecto de masa: (mp+mn) - mD = 0.0024 u
u = uma (unidad de masa atómica) = 1.66053886x10-27 kg
La energía correspondiente a un uma es de 931.5 Mev.
La energía de ligadura del Deuterio es 2.23 MeV.
En este caso la diferencia de masa es 1000 veces menor que la masa del sistema.
Si se compara con el caso anterior (átomo de Hidrógeno) se puede obtener una idea
cualitativa de la magnitud de las fuerzas nucleares respecto de las electromagnéticas.
No obstante, el Deuterio es un núcleo poco ligado si se lo compara con otros.
Las mediciones de defecto de masa de los distintos átomos tienen mucha importancia
dentro de la Física Nuclear y en el estudio de las reacciones nucleares, como así
también en la Astrofísica, en los modelos sobre la evolución de las estrellas.
Este último ítem (defecto de masa) puede resultar interesante o no, pues se trata
simplemente de información sobre datos reales medidos. Sin embargo, destaco que
para los fines de este curso, lo realmente importante es que verifican el Principio de
Equivalencia y la variación de la masa propia del sistema.
Relatividad de la energía
Es evidente que la energía de un sistema físico es una magnitud relativa al sistema de
referencia. Tomemos, por ejemplo, la energía total de una partícula libre, de masa
propia m0 y velocidad constante v, cuya expresión está dada por
Para dos observadores inerciales en movimiento relativo la única magnitud que tiene
distinto valor en la expresión anterior es la velocidad de la partícula.
Nota
En este marco teórico toda magnitud propia de un cuerpo en movimiento uniforme es
invariante. De lo contrario los sistemas inerciales serían distinguibles, invalidando el
Principio de Relatividad.
No debe interpretarse que la masa propia no pueda variar ante determinados
procesos, sino que ante Transformaciones de Lorentz la masa propia es la misma para
todos los observadores inerciales.
Hallemos la ley de transformación de la energía para dos sistemas inerciales, usando
el teorema de adición de velocidades.
Operando el radicando del denominador en el segundo miembro se obtiene la
siguiente igualdad
Reemplazando en la expresión de la energía obtenemos
Esta expresión es válida sólo si la velocidad relativa (V) entre sistemas inerciales está
según el eje x. En el caso general la ley de transformación es:
La transformación inversa la obtenemos reemplazando V por -V, quedando:
Complementos de Energía - Los Campos Vectoriales
En el desarrollo de este capítulo haremos uso de herramientas matemáticas propias
del análisis vectorial, cuyo conocimiento resulta indispensable para comprender el
comportamiento de los campos físicos vectoriales, tales como el electromagnético y el
gravitatorio. Si el lector no maneja estas herramientas deberá “creer” las conclusiones
pero no debería saltear este ítem.
En el apartado Temas Especiales hay un capítulo extenso sobre las ecuaciones de
Maxwell (que son relativistas de nacimiento), que requieren este conocimiento.
Un posible y adecuado tratamiento de los fenómenos se logra cuando disponemos de
un modelo matemático consistente con los comportamientos observados.
Para ello es común definir magnitudes asociadas al fenómeno, algunas de las cuales
pueden depender de la posición y/o el tiempo, dando lugar a relaciones funcionales o
campos matemáticos, de distinta dificultad y naturaleza. Un objetivo concreto de la
Física es obtener las leyes que cumplen esos campos, usualmente expresadas con
ecuaciones diferenciales, y hallar su solución matemática compatible con la geometría
y las condiciones de contorno del problema particular dado.
Estos campos suelen ser escalares, vectoriales o tensoriales, dependiendo ello de la
variable considerada y las características del sistema en cuestión.
Por ejemplo, la temperatura de la atmósfera puede ser representada por un campo
escalar T(x,y,z,t), el campo eléctrico asociado a un cuerpo cargado se describe con un
campo vectorial E(x,y,z,t), y las deformaciones de un sólido deformable sometido a
presiones externas pueden ser calculadas por un campo tensorial Dij de segundo
orden, con componentes que son funciones del espacio y del tiempo.
En este capítulo trataremos sobre campos escalares y vectoriales, prestando especial
atención a estos últimos.
Suele indicarse que las propiedades de un campo vectorial quedan totalmente
establecidas si conocemos su divergencia y su rotor. Tratemos de comprender el
significado de esta aseveración.
Divergencia
Recordemos que la divergencia de un campo vectorial es una función escalar que
permite relacionar a un campo vectorial con las “fuentes” y “sumideros” del mismo.
Diremos que en todo punto (x,y,z) donde la divergencia da un resultado positivo hay
fuente del campo, si da negativo hay sumidero, y si es nulo puede existir el campo
pero no “nace“ ni “muere“ en dicho punto.
En general no se conoce el campo A pero sí su divergencia (fuentes y sumideros).
Procediendo de manera inversa podría suponerse que si conocemos las fuentes y
sumideros de un campo podríamos determinar unívocamente la forma funcional del
mismo mediante la solución de la ecuación diferencial de la divergencia. Ello no es
correcto pues quedaría determinado a menos de otra función vectorial cualquiera de
divergencia nula.
Podemos señalar algunos aspectos interesantes relacionados con la divergencia.

Todo campo de divergencia nula en todo el espacio tiene líneas de corriente
(también llamadas líneas de fuerza) cerradas. Tal es el caso del campo
magnético B(x,y,z,t).
Campo magnético de una corriente filiforme.

Todo campo uniforme (constante) en todo el espacio tiene divergencia nula.

Es fácil mostrar que el único campo radial con simetría esférica que tiene
divergencia nula en todo el espacio (excepto en el origen), varía como 1/r2.
Este comportamiento corresponde tanto al campo eléctrico de una carga puntual en el
origen como al campo gravitatorio de una masa puntual en el origen, que para cuerpos
en reposo en interacciones campo-partícula conducen a la ley de Coulomb y a la ley
de Newton de gravitación universal, respectivamente.
En el origen el campo no está definido (singularidad).
Para el caso eléctrico las cargas positivas son las fuentes donde “nace” el campo y las
negativas los sumideros donde “muere”, mientras que en el gravitatorio las masas son
siempre sumideros (la constante es negativa).
Rotor
El rotor de un campo vectorial da otra función vectorial (pseudovector). Por definición
es:
Las líneas de corriente del rotor de un campo vectorial son siempre cerradas, lo que
significa que su divergencia es nula. Se deja al lector mostrar que la divergencia del
rotor de un campo vectorial es siempre nula (sugerencia: use el Teorema de Schwartz
de la igualdad de las derivadas cruzadas).
Alguna bibliografía suele destacar como importante utilidad del rotor la relación que
dicho cálculo tiene con la descripción de “torbellinos”, en particular cuando se trata de
un campo de velocidades de un fluido.
Sin negar que tal relación exista (de ella salió la denominación de rotor) es mi opinión
que esta interpretación no es relevante y esconde la importancia conceptual que tiene
esta operación.
Cuando el rotor se aplica a un campo físico asociado a interacciones, el aspecto más
fundamental del mismo es que su cálculo permite reconocer si dicho campo admite o
no una función escalar potencial, tal que su gradiente determina al campo.
En efecto, si en todo punto del espacio se cumple:
Cuando el rotor es nulo diremos que el campo es conservativo, caso que trataremos
en detalle más adelante en este capítulo.
En general no conocemos ni A(x,y,z,t) ni R(x,y,z,t), pero en algunos casos es
posible saber por consideraciones físicas si es conservativo (o no).
Esto implica disponer de tres ecuaciones diferenciales a derivadas parciales de primer
orden, una para cada componente del rotor, cuya solución no es suficiente para
determinar unívocamente el campo vectorial A(x,y,z,t), pues queda determinado a
menos de otro campo vectorial de rotor nulo.
Vemos entonces que conocer sólo la divergencia o el rotor de un campo vectorial no
es suficiente para hallar dicho campo vectorial. En cambio, puede mostrarse que si
conocemos ambos el campo A queda determinado (unicidad de la solución).
Para hallar la ecuación que relaciona al campo vectorial con su divergencia y su rotor
usaremos una identidad vectorial.
La última relación representa tres ecuaciones diferenciales a derivadas parciales, de
segundo orden, cuya solución formal determina el campo A unívocamente.
Nótese que en el caso en que el campo sea conservativo su rotor es nulo resultando la
ecuación de Poisson vectorial (tres ecuaciones). Como veremos, el planteo se
simplifica pues existe una función potencial escalar, quedando finalmente una única
ecuación de Poisson.
Nota
En física tienen notable importancia aquellos campos que están relacionados con las
interacciones entre sistemas y, en consecuencia, tienen relación funcional con los
intercambios de energía. Por ello deben ser compatibles con la Teoría de Relatividad
Especial y con el Principio de Causalidad, por lo cual ante procesos no estacionarios
los campos deben cumplir también con la ecuación de ondas (velocidad finita de
propagación).
Campos conservativos
I - Mecánica clásica
Teorema de conservación de la energía mecánica
Se dice que un campo vectorial F es conservativo si se cumple que la circulación de
dicho campo a lo largo de cualquier curva cerrada es cero.
Si el campo F es un campo de fuerzas, la expresión anterior equivale a calcular el
trabajo W realizado por la fuerza a lo largo del camino cerrado C, resultando nulo
cualquiera sea el camino elegido. Como veremos, si el trabajo W es nulo para toda
curva cerrada entonces se puede definir la Energía Potencial de una partícula en
presencia de dicho campo de fuerzas, y definir la magnitud “Energía Mecánica”, que
resulta constante para dicho sistema, siendo esto último el origen de la denominación
“conservativo”.
Para que esa integral curvilínea (“circulación de F”) sea nula para cualquier camino C,
su integrando debe ser un diferencial exacto (Pfaffiano).
Desarrollando el producto escalar y el diferencial total, obtenemos:
Resulta evidente que F puede ser puesto como el gradiente de la función escalar
 ( x, y , z ) , llamada función potencial.
Hasta aquí hemos mostrado que si un campo vectorial es conservativo siempre tiene
una función potencial tal que su gradiente nos da el campo.
Discutiremos algunos aspectos que no suelen tratarse en la bibliografía técnica.
1. El primero es respecto de la información que poseen un campo vectorial y uno
escalar.
Un campo vectorial nos da tres (3) datos en cada punto (módulo, dirección y
sentido), mientras que un campo escalar sólo da un (1) número. ¿Cómo es
posible que el campo escalar tenga toda la información del campo vectorial?
Si se observa la igualdad resulta claro que la información del campo vectorial
está incorporada en la forma de la función escalar y no en su valor en un punto,
y que esa información se obtiene a través de las derivadas con la operación
gradiente.
2. El segundo aspecto se refiere a la existencia y al Teorema de unicidad de la
función potencial. Si un campo vectorial es conservativo siempre existe una
función potencial y es única a menos de una constante arbitraria (que al derivar
se anula). En consecuencia, el valor numérico de la función potencial en un
punto del espacio no tiene significado físico, pero sí la diferencia de valores de
la función potencial entre dos puntos del espacio.
Si el campo no es conservativo no existe función potencial.
Si ahora calculamos el trabajo W sobre una partícula entre dos puntos cualesquiera
(curva C abierta), obtenemos:
Recordando que el trabajo W es igual a la variación de la Energía Cinética, quedará:
Si ahora definimos Energía Potencial (EP) de una partícula (en presencia de un
campo de fuerzas conservativo), a la función potencial del campo cambiada de signo,
tenemos EP   .
Nótese que la Energía Potencial queda determinada a menos de una constante, pues
la función potencial tiene la misma indeterminación. Asimismo, el valor numérico de la
Energía Potencial carece de significado físico, pero sí lo tiene la diferencia de valores
de la Energía Potencial entre dos puntos del espacio. Reordenando, queda:
Dado que los puntos 1 y 2 son dos puntos cualesquiera del espacio, llegamos a la
conclusión que para una partícula en presencia de un campo conservativo, la suma de
su energía cinética y su energía potencial es un valor constante.
Se define como Energía Mecánica de una partícula a la suma de su Energía Cinética
y su Energía Potencial.
El desarrollo que acabamos de ver es el Teorema de conservación de la Energía, cuyo
enunciado es:
En todo sistema inercial aislado, si las fuerzas son conservativas, la Energía
Mecánica es una constante.
Notas importantes
1. El valor numérico de la Energía Mecánica carece de significado físico. Se deja
al lector que analice esta aseveración. Solamente le indico que la utilidad del
Teorema de Conservación de la Energía Mecánica reside en que sea aplicado
en dos puntos separados.
2. Asimismo, muestre que la Energía Potencial no puede depender del tiempo.
No obstante, es común encontrar en la bibliografía expresiones sobre la
función potencial dependiente del tiempo para sistemas no conservativos
(reales). Ello es correcto y no se refiere al tema visto en este capítulo. Será
tratado en el apartado que se agregará sobre Ecuaciones de Maxwell.
3. Los campos físicos de los procesos reales no son conservativos. Si bien esto
es una especulación, el conocimiento actual lo confirma. El tema se tratará en
la carpeta de Temas Especiales, analizando las condiciones que debe cumplir
un campo físico vectorial para ser relativista.
4. Para saber si un campo vectorial es conservativo basta con calcular su rotor.
Veamos cómo se vincula el rotor de un campo con que sea conservativo.
Con el Teorema de Stokes, que relaciona la circulación de un campo vectorial
con el flujo del rotor de dicho campo a través de cualquier superficie que tenga
por borde a la curva C, se puede demostrar que la circulación de un campo
vectorial (en una curva cerrada) es nula si el campo tiene rotor nulo en todo el
espacio. Matemáticamente es:
Si el rotor es nulo en todo el espacio, el campo es conservativo.
II - Mecánica relativista
Se puede demostrar que las propiedades de un campo vectorial quedan totalmente
determinadas si se conocen su divergencia y su rotor. La divergencia es una operación
que relaciona al campo con las “fuentes y sumideros” del mismo. Hemos visto que el
rotor nos dice si el campo es conservativo o no.
Ahora mostraremos que la condición de un campo de ser conservativo no es una ley
relativista, es decir que es una característica solamente válida en un dado sistema de
referencia (lo mismo sucede en el caso no relativista).
Para ello analicemos el siguiente ejemplo:
Sea un sistema formado por una carga puntual en reposo en el origen de coordenadas
de un sistema inercial.
El campo eléctrico correspondiente es conservativo, con rotor nulo en todo el espacio,
excepto en el origen donde no está definido. Su función potencial es fácilmente
calculable y no depende del tiempo.
Otro observador inercial O’ en movimiento relativo verá una carga puntal moviéndose
con velocidad constante. En cada punto del sistema primado tendremos un campo
eléctrico y un campo magnético, ambos dependientes del tiempo, que cumplen con
las ecuaciones de Maxwell. Matemáticamente describiremos esta situación en ambos
sistemas de referencia:
Es evidente que en el sistema primado el campo no es conservativo pues su rotor no
se anula.
Teorema de conservación de la energía (caso relativista)
Hemos mostrado en forma general que si un campo de fuerzas tiene rotor nulo
entonces es conservativo y existe la función energía potencial. En este caso se
cumple:
Siendo F la fuerza sobre una partícula y EP la energía potencial.
También demostramos (en un apartado anterior) que dw = F.ds = c2dm, y lo
interpretamos como la variación infinitesimal de la energía cinética de una partícula.
Vinculando las relaciones obtenemos:
Integrando esta expresión para dos puntos del espacio, quedará:
La última igualdad es la expresión matemática del Teorema de conservación de la
energía, cuyo enunciado es:
En todo sistema inercial aislado, si las fuerzas son conservativas, la suma de la
energía total (mc2) y la energía potencial es una constante.
Nótese que para el caso de una partícula cuya masa en reposo es un
invariante, si restamos la constante m0 c2 en ambos miembros, el Teorema sigue
siendo válido. En este caso el enunciado es el mismo que en Mecánica clásica (no
relativista):
En todo sistema inercial aislado, si las fuerzas son conservativas, la suma de la
energía cinética y la energía potencial es una constante.
En mi conocimiento, este importante Teorema extrañamente no figura en la bibliografía
específica, aunque es utilizado con mucha frecuencia.
Veamos un ejemplo (Cullwick – “Electromagnetism and Relativity”, pág. 79):
Un electrón inicialmente en reposo es acelerado por un campo electrostático, sin
irradiar. Se pide la variación de la masa del electrón luego de ser acelerado por una
diferencia de potencial. Las características del problema son:




El campo electrostático es conservativo.

El campo eléctrico E está dado por E  V


La fuerza es F  qE  V . Como q < 0 (electrón) el movimiento será hacia
donde crece el potencial.
La energía potencial está dada por la relación EP  qV x; y; z   C1 , siendo
V(x,y,z) la función potencial del campo eléctrico y C1 una constante arbitraria.
Aplicando el Teorema de conservación de la energía obtenemos:
Asumiendo que en el punto 1 estaba en reposo y despejando, se obtiene:
Su velocidad puede hallarse de la expresión de masa relativista
Se deja planteado como ejercicio demostrar que el trabajo eléctrico es igual a la
variación de energía cinética del electrón.
Campos no conservativos
Un campo de fuerzas no es conservativo si su rotor es distinto de cero, lo que es
equivalente a decir que la energía del sistema no permanecerá constante si el móvil
realiza cualquier trayectoria cerrada. En efecto, si el rotor no es nulo, aplicando el
Teorema de Stokes tenemos:
En este caso no vale el Teorema de conservación de la energía ni existe Energía
Potencial del sistema.
La experiencia nos muestra que muchas veces son reconocibles los mecanismos que
causan que un campo de fuerzas no sea conservativo. Entre ellos se distinguen los
siguientes tres procesos que provocan pérdidas irreversibles de energía del sistema:
rozamiento, deformación plástica y/o radiación térmica.
En estos casos es posible asumir que el campo de fuerzas puede ser expresado como
la suma de uno conservativo y otro no conservativo, quedando
Corresponde señalar que la energía disipada en general no es calculable mediante la
integral curvilínea (circulación) de una función analítica, tal como fue indicada en la
expresión anterior.
Cuando las fuerzas presentes no son conservativas el Teorema de conservación de la
energía no es aplicable.
No obstante, por razones empíricas se acepta que la energía total de un sistema,
incluyendo la energía disipada, permanece constante.
Esta afirmación, no demostrable teóricamente, constituye el Principio de
conservación de la energía.
Masa Propia y Potencia
Se define como masa propia (m0) de un sistema físico masivo al valor que ella toma
cuando es medida en reposo. Para un cuerpo en movimiento su masa (relativista)
resulta distinta a su masa propia y puede determinarse midiendo su cantidad de
movimiento (p=mv). La relación entre la masa propia y la relativista está dada por la
siguiente relación:
Esta última expresión es consecuencia de la ley de conservación de la cantidad de
movimiento, que a su vez resulta de aceptar la homogeneidad del espacio. Si esta
relación entre masa propia y relativista tuviera alguna limitación deberíamos cuestionar
las propiedades de simetría del espacio-tiempo aceptadas, y con ello la validez de la
Teoría Especial de Relatividad. En consecuencia, en este marco teórico todo ente
físico cuya velocidad sea c deberá tener masa propia nula pues, de lo contrario, la
relación aludida no es válida (indefinición matemática).
Las propiedades de simetría del espacio-tiempo tienen como consecuencia que toda
magnitud “propia” debe ser invariante ante Transformaciones de Lorentz, pues de lo
contrario los sistemas inerciales serían distinguibles.
Se concluye entonces que la masa propia tendrá el mismo valor en todo sistema de
referencia inercial.
Debe notarse que la invariancia relativista de la masa propia no implica que no pueda
variar su valor en el tiempo, tal como sucede en los sistemas físicos reales durante
una interacción.
Asimismo, la longitud propia de una varilla, que es invariante ante Transformaciones
de Lorentz, resulta distinta si la caliento o enfrío. La invariancia describe que el valor
instantáneo de una magnitud “propia” es el mismo para todo observador inercial, sin
que ello signifique que sea constante en el tiempo.
La formulación de Minkowski de la Relatividad Especial (1907) trata sobre las
propiedades que asignamos al espacio (homogeneidad e isotropía) y al tiempo
(uniformidad), de acuerdo con el comportamiento observado de los fenómenos
naturales, y las relaciones funcionales que esas magnitudes fundamentales cumplen
en los sistemas inerciales.
Este modelo matemático, escrito en un espacio de Riemann de 4 dimensiones,
denominado Espacio de Minkowski, provee un método analítico que fue fundamental
para toda la Física Relativista.
En su aplicación a la Mecánica y por razones matemáticas, Minkowski sostuvo que la
masa propia debía ser un invariante (de Lorentz) no dependiente del tiempo. Aunque
no es objetivo de este curso plantear la Relatividad en lenguaje tensorial, resulta
conveniente describir algunos aspectos contradictorios de esta formulación inicial que,
en mi opinión, condujeron a malas interpretaciones posteriores.
Minkowski, usando cuadrivectores, propuso varias formas distintas (equivalentes)
como ley fundamental del movimiento (ley tensorial, que representa cuatro ecuaciones
escalares):
Sin necesidad de un análisis o explicación extensa de esta ley, invariante por
construcción, señalemos que ui es el cuadrivector velocidad, que fi es el cuadrivector
fuerza, y que en todas las ecuaciones propuestas la masa o densidad propia están
fuera de la derivada temporal.
El hecho de que haya utilizado la densidad propia sugiere además la pretensión de
que este modelo sea válido para sistemas no puntuales.
Desde el siglo XVII sabemos que la fuerza está relacionada con la variación de la
cantidad de movimiento y que en el caso en que m sea constante, como supuso
Newton para un “punto material”, se puede expresar como:
Aparentemente, el matemático Minkowski siguiendo estas ideas asumió que la masa
propia era invariante y constante en el tiempo, sin contemplar que ello conduce a
resultados incorrectos si las interacciones involucran cambios de energía diferentes a
los del trabajo mecánico sobre el centro de masa del sistema, tales como absorción o
emisión de radiación, efecto Joule, cambios de estado, procesos termodinámicos con
intercambio de calor, compresiones, rozamiento, deformación plástica, etc.
Poincaré, Einstein y Abraham (y seguramente otros físicos) hicieron notar que la
propuesta inicial de Minkowski era incorrecta y que su uso en sistemas reales
conducía a resultados inaceptables. De acuerdo al enfoque físico de la Relatividad de
Einstein (1905) y al Principio de Equivalencia (1907), la masa propia no podía
permanecer constante durante una interacción.
Abraham en 1909 demostró que la correcta formulación tensorial de la ecuación
invariante de movimiento, expresada a continuación, debe considerar variable a la
masa propia del sistema, poniendo orden en el modelo tensorial de la Mecánica
Relativista.
Asimismo, Pauli y Möller más tarde mostraron que si la masa propia de un sistema
macroscópico se considera constante durante una interacción, la Termodinámica
Relativista deja de ser válida desde sus fundamentos.
Este tema puede verse con más detalle en el tratado de Pauli (“Special Theory of
Relativity”, Cap. 3 – pág. 108) y en el libro de Möller (“The Theory of Relativity”, Cap. 4
– pág. 106).
Aparentemente ello no fue incorporado convenientemente por parte de otros
especialistas pues, salvo raras excepciones, la bibliografía y trabajos científicos,
usualmente referidos a la física de partículas, tratan a la masa propia como si fuera un
invariante constante en el tiempo en todos los casos, incluso algunos de manera
explícita a pesar de los innumerables ejemplos que contradicen dicha postura, y
modifican por conveniencia las leyes de acuerdo al problema.
Esta mala práctica tuvo consecuencias académicas lamentables, como rechazar la
masa relativista como una propiedad fundamental de los sistemas físicos,
desvirtuando el concepto relativista de inercia, o limitar el Principio de Equivalencia
entre masa y energía sosteniendo insólitamente que sólo es válido para cuerpos en
reposo (y ciertas formas de energía), o redefinir la cantidad de movimiento para
acomodar la teoría a sus torpezas.
En definitiva, un conjunto de arbitrariedades innecesarias y perjudiciales, sobre todo
para la enseñanza de la Relatividad, que costará años revertir.
Veamos cómo debe ser tratado el tema de la masa propia de manera simple.
Se define como masa propia de un sistema físico al valor de su masa medida en
reposo en un sistema de referencia inercial.
Mostraremos que la masa propia de sistemas no puntuales necesariamente debe
variar durante las interacciones si aceptamos válido el Principio de conservación de la
energía.
Prestaremos mucha atención a cualquier magnitud relacionada con cambios de
energía de un sistema físico, tal como la potencia, debido a que ello sucede en
presencia de procesos causales, que denominamos interacciones.
La magnitud que mide la variación temporal del contenido de energía de un sistema
físico es la potencia. Se define como potencia instantánea a la relación:
De acuerdo con el Principio de Equivalencia entre masa y energía, el contenido de
energía de un sistema físico es directamente proporcional a su masa relativista,
resultando:
Veamos ahora como relacionar la variación de la masa relativista de un sistema físico
con los efectos de una interacción cualquiera. Por simplicidad supondremos que no
hay rotación.
Para ello usaremos el teorema que vincula el trabajo de la fuerza total aplicada al
centro de masa del sistema y la variación de la energía cinética que le provoca.
Hemos asumido que la masa propia m0 de un sistema físico real puede variar durante
una interacción (ver Möller “The Theory of Relativity”, pág. 106).
Al respecto, veamos un caso particular muy ilustrativo.

Sea un átomo excitado en reposo que vuelve a su estado fundamental con
emisión de un fotón. La energía del átomo excitado antes de la emisión es:
La masa del átomo es la masa propia pues inicialmente está en reposo. El superíndice
indica su estado excitado.
Con la emisión del fotón el átomo vuelve a su estado fundamental y adquiere
movimiento uniforme en sentido contrario al del fotón emitido, que asumimos
propagándose en sentido negativo de las x, cumpliéndose la conservación de la
cantidad de movimiento del sistema. Dado que el problema es unidimensional no
indicaremos componentes según los ejes del sistema de referencia.
Además, por conservación de la energía, se cumple que la energía del átomo excitado
antes de la emisión es igual a la suma de la energía del átomo en estado fundamental
y en movimiento uniforme, más la energía del fotón emitido.
La masa relativista del átomo en estado fundamental tiene movimiento uniforme y
cumple con:
Siendo m0 la masa propia del átomo en estado fundamental.
Operando obtenemos:
Queda demostrado que la masa propia de un átomo excitado es mayor que
cuando está en su estado fundamental, y con ello que la masa propia no es una
constante, aunque sea un invariante de Lorentz.
Por supuesto, es inmediato obtener (ver balance energético anterior) que el exceso de
masa del átomo excitado es exactamente la masa relativista del fotón posteriormente
emitido.
Calculemos ahora cuanto aumenta la masa propia de un átomo excitado en las
condiciones establecidas, respecto de su masa propia en estado fundamental.
Nótese que el aumento de masa propia del átomo excitado es exactamente la masa
que corresponde a la energía cinética adquirida por el átomo, luego de la emisión, más
la del fotón emitido.
Nota
Este tipo de análisis es aplicado de manera sistemática en el reconocimiento de
productos de reacciones nucleares.
En consecuencia, la potencia instantánea de un sistema (no puntual) será:
El trabajo mecánico elemental sobre un cuerpo masivo es dW = F.ds , siendo F la
fuerza total aplicada (en su centro de masa), que debe incluir la reacción de radiación
en el caso en que el sistema irradie de manera anisótropa.
La variación de energía por unidad de tiempo debida al trabajo mecánico es:
La variación de energía por unidad de tiempo debida a procesos que no realizan
trabajo mecánico sobre el centro de masa del sistema es:
Veamos otros dos ejemplos que tratan con cambios de la masa propia del sistema.
1 – Enfriamiento o calentamiento de un cuerpo en reposo.
Sea dQ/dt la potencia calórica (o frigorífica) instantánea del sistema, es decir la
cantidad de calor (en Joules) intercambiada por unidad de tiempo.
Por el Principio de Equivalencia entre masa y energía, la variación de la masa del
sistema estará dada por:
Dado que el sistema permanece en reposo en todo momento, no hay trabajo
mecánico, y su masa es (por definición) la masa propia del sistema, que resulta
función de la temperatura.
La potencia instantánea del sistema será:
Como demostraremos, luego de estos ejemplos, esta Potencia instantánea es
absoluta, es decir que todo observador inercial medirá el mismo valor de potencia
calórica o frigorífica instantánea.
2 – Energía radiante y pérdida de masa del Sol
Para un observador terrestre y para intervalos temporales breves (un segundo en
nuestro caso) el sol puede ser considerado en reposo en un sistema inercial.
Se ha estimado en 3.65 x 1023 kW la energía radiante total del Sol emitida por unidad
de tiempo.
De acuerdo con el Principio de Equivalencia entre masa y energía, cada segundo el
sol pierde 4.05 millones de toneladas, disminuyendo su masa propia. El cálculo simple
es:
La interpretación elaborada en este ejemplo (pérdida de masa propia) es utilizada en
la teoría de evolución estelar dando resultados consistentes con la observación.
Nota
Estos dos ejemplos muestran que en los sistemas físicos reales, si las interacciones
no modifican su cantidad de movimiento, la variación de su masa propia es
indispensable para el cumplimiento del Principio de conservación de la energía.
La potencia instantánea, en su expresión más general, está dada por:
(1)
Relatividad de la Potencia
Usaremos las transformaciones relativistas generales de Lorentz para la energía y el
tiempo, obtenidas para dos observadores inerciales (O,O’) con velocidad relativa V
(constante).
Siendo p=mv la cantidad de movimiento del sistema físico, medida por O.
La potencia instantánea cumplirá con:
Siendo a la aceleración del sistema físico, medida por O.
La última expresión (2) debe ser analizada en detalle pues permite obtener
conclusiones importantes sobre las características de las interacciones.
1 – Potencia Radiante
Si consideramos el sistema físico en un sistema aislado (sin campo gravitatorio),
formado sólo por radiación, es inmediato ver que la potencia radiante (instantánea) en
cada punto del espacio es la misma para todo observador inercial (P‘=P), pues la
aceleración (a) de la radiación es siempre nula.
En presencia de un campo gravitatorio externo (con interacción campo-fotón), ello no
se cumple pues hay aceleración transversal a la velocidad (c), salvo que la acción del
campo tenga la misma dirección que la velocidad de la radiación.
2 – Interacciones con fuerza total aplicada nula
No se modifica la cantidad de movimiento del centro de masa del sistema, tal como
ocurre en compresiones o expansiones isótropas, procesos térmicos de intercambio
de calor con simetría esférica, emisión electromagnética de dipolo radiante en reposo,
etc.
En todos estos casos la aceleración a es nula, resultando P’ = P.
Es decir que durante la interacción la potencia instantánea del sistema es la misma
para todo observador inercial.
Nota
Este resultado es consistente con el caso anterior pues, si un cuerpo en reposo irradia,
la energía que pierde por unidad de tiempo debe ser igual a la potencia radiada, por el
Principio de conservación de la energía.
Ambas potencias instantáneas son absolutas, por lo cual este proceso existe para todo
observador y no puede ser eliminado con la elección de un sistema de referencia
particular, siendo esto último una característica de todos los fenómenos causales.
Por supuesto, la energía ganada o perdida por el sistema en un dado lapso es relativa
al sistema de referencia debido a que la evolución temporal es distinta en diferentes
sistemas inerciales.
Supongamos que el sistema físico está en reposo (v = 0) para el observador O y sufre
un incremento dE sin modificar su estado de reposo. En ese caso para un observador
O’ que se mueve con velocidad V, el incremento será:
3 – Observador inercial comóvil (instantáneo) con el sistema físico
Primero destaquemos que si un sistema físico está acelerado, un observador inercial
sólo estará comóvil con su centro de masa en un instante único, cuando V = v, es
decir que para mantenerse comóvil con el objeto acelerado se requieren infinitos
sistemas inerciales.
La expresión (2), que relaciona la potencia instantánea de un mismo proceso medida
por dos observadores inerciales distintos, puede ponerse en función de la Fuerza total
aplicada.
Para el observador inercial comóvil instantáneo se cumple V = v, quedando:
Reemplazando P por su expresión general (1) obtenemos:
Durante una interacción aparecen fuerzas aplicadas no nulas, por lo cual un sistema
físico no puntual debe sufrir modificaciones geométricas y dinámicas que alteran su
contenido de energía total y también su masa propia.
La explicación de ello es que los procesos causales tienen un inicio y, dado que las
fuerzas aplicadas no se transmiten a velocidad infinita a todos los puntos del sistema,
aparecerán tensiones que alteran el sistema modificando su geometría y masa propia.
Lo importante, desde un punto de vista teórico, no es el valor de la modificación de la
masa propia, que puede ser muy pequeña o incluso despreciable, sino la existencia de
ella.
Dado que la masa propia de un sistema físico no puntual necesariamente debe
modificarse durante una interacción, se concluye que todo observador comóvil podría
medir potencia no nula de un sistema físico real, al menos en algún instante del
proceso, y su valor dependerá de la variación temporal instantánea de la masa propia
del sistema.
Podría plantearse que este último resultado no es aceptable físicamente porque la
masa propia podría agotarse completamente si se le saca energía durante un tiempo
suficiente.
Si el sistema está acelerado el planteo no es correcto ya que para un único observador
la ley es válida sólo en un instante, por lo cual no es lícito sacar conclusiones que
requieren “integrar” la ley en el tiempo. Nótese que en este caso un observador
comóvil durante un tiempo finito corresponde a infinitos sistemas inerciales distintos, lo
que equivale a decir que para un único sistema inercial hay trabajo mecánico pues el
móvil posee aceleración y, en consecuencia, cambio de la masa propia.
Si el sistema físico está en reposo o con movimiento uniforme, como podría suceder
con un cuerpo calentándose o enfriándose, el planteo tiene respuesta inmediata. Su
masa propia aumentará mientras sea posible entregarle energía y disminuirá si la
pierde, aunque en este último caso la experiencia y el Teorema de Nernst nos
muestran que esas interacciones en sistemas macroscópicos no pueden mantenerse
indefinidamente, por lo cual la masa propia alcanzará un valor mínimo no nulo.
Finalmente digamos que estas conclusiones (1, 2 y 3) invalidan la falsa creencia de
que un electrón con aceleración propia constante (en movimiento hiperbólico) no
irradia y que por ello el observador comóvil no detecta radiación (ver “La Paradoja de
Born”).
En consecuencia, si un sistema irradia ello sucederá para todo observador, sea o no
inercial.