Download Técnicas basadas en la resonancia de plasmones superficiales
Document related concepts
Transcript
UNIVERSIDAD NACIONAL DE GENERAL SAN MARTÍN COMISIÓN NACIONAL DE ENERGÍA ATÓMICA INSTITUTO DE TECNOLOGÍA “Prof. Jorge A. Sabato” Técnicas basadas en la resonancia de plasmones superficiales. Detección y estudio de reacciones de hibridización de ADN en superficies. Por Fernando D. Stefani Director de Trabajo Prof. Dr. Wolfgang Knoll Tutora: Dra. Ana María Llois Trabajo de seminario – Ingeniería en Materiales República Argentina 2001 Contenido Introducción General………………………………………………………………………………… 2 Capítulo 1: Plasmones superficiales 1.1 – Introducción....................................................................................................................... 1.2 – Plasmones......................................................................................................................... 1.3 – Plasmones Superficiales en una Interfase........................................................................ 1.4 – Excitación de Plasmones Superficiales............................................................................. 1.5 – Plasmones Superficiales en Sistemas Multicapas............................................................ 4 4 8 12 16 Capítulo 2: Técnicas basadas en la resonancia de plasmones superficiales 2.1– Introducción........................................................................................................................ 2.2– Espectroscopia por resonancia de plasmones superficiales (SPR)................................... 2.3– Espectroscopia de fluorescencia por plasmones superficiales (SPFS)............................. 2.4– Microscopía por resonancia de plasmones superficiales (SPM)........................................ 2.5– Microscopía de fluorescencia por resonancia de plasmones superficiales (SPFM).......... 18 18 20 27 29 Capítulo 3: Hibridización de ADN 3.1 – Introducción....................................................................................................................... 3.3 – Ácido desoxiribonucleico................................................................................................... 3.3 – Hibridización y desnaturalización...................................................................................... 3.4 – Detección y secuenciado de ADN..................................................................................... 30 30 33 35 Capítulo 4: Detección y estudio de reacciones superficiales de hibridización 4.1 – Introducción....................................................................................................................... 4.2 – Superficies sensoras........................................................................................................ 4.3 – Modelo cinético................................................................................................................. 37 37 42 Capítulo 5: Esquemas de detección y resultados 5.1 – Introducción....................................................................................................................... 5.2 – Detección mediante SPR.................................................................................................. 5.3 – Detección mediante SPFS................................................................................................ 45 45 46 Capítulo 6: Resumen y conclusiones..................................................................................... 56 Apéndice I: Fundamentos Teóricos........................................................................................ 59 Apéndice II: Movimiento de los electrones en un metal según la Teoría de Drude........... 74 Agradecimientos....................................................................................................................... 76 Referencias................................................................................................................................ 77 1 Introducción General Hasta el día de hoy, miles de lesiones genéticas como mutaciones o deleciones han sido identificadas como las responsables de enfermedades humanas, entre ellas varios tipos de cáncer [18]. Por lo tanto, el análisis de secuencias genéticas tiene gran importancia para el diagnóstico, monitoreo y terapia de este tipo de enfermedades. Por otro lado, movilizados por el proyecto Genoma Humano (comenzado en 1990), un gran número de investigadores se dedica actualmente a determinar los genomas de diferentes organismos. Por estas razones, resulta necesario el desarrollo de métodos rápidos, eficientes y sensibles capaces de procesar muestras de ADN de manera conveniente. La mayoría de los esfuerzos se dirigen actualmente hacia el desarrollo de esquemas superficiales de detección, ya que estos permiten la posterior fabricación de sensores y chips multi-spot para detección y secuenciado automáticos. En general, estos esquemas se basan en la detección de reacciones de hibridización entre un oligonucleótido inmovilizado en la superficie, denominado catcher, y una cadena de ADN en solución denominada target. Las técnicas basadas en la resonancia de plasmones superficiales proveen una alternativa atractiva a este respecto. La espectroscopía por resonancia de plasmones (SPR) se ha convertido en una herramienta ampliamente aceptada para la caracterización de interfases, películas delgadas y procesos cinéticos en superficies; en particular, reacciones de hibridización. Varios instrumentos comerciales de SPR se encuentran disponibles en la actualidad. Por otro lado, se ha desarrollado recientemente la espectroscopía de fluorescencia por resonancia de plasmones (SPFS). Esta técnica también puede utilizarse para el estudio de reacciones superficiales de hibridización, y a pesar de que impone la necesidad de contar con targets fluorescentes, es interesante por su gran sensibilidad. Este trabajo de seminario ha tenido como objetivo realizar un estudio comparativo de arquitecturas superficiales y esquemas de detección aplicados al estudio de reacciones de hibridización de ADN en superficies. En el presente trabajo se explicarán los principios de funcionamiento de estas técnicas, se presentarán algunas de las arquitecturas supramoleculares utilizadas para inmovilizar a los catchers, se mostrarán algunos de los posibles esquemas de detección, se expondrán los resultados más notables y se propondrán experimentos para el futuro. En el primer capítulo se trata la física de los plasmones y en el segundo las técnicas basadas las técnicas de detección de eventos basadas en la excitación de plasmones superficiales, se describen los principios de operación, las potencialidades y limitaciones de cada una. El capítulo tres está dedicado a describir las principales características de las moléculas de ADN, cuyo conocimiento es necesario para comprender la posterior discusión. El cuarto capítulo trata el tema de las superficies sensoras empleadas en cada técnica y el modelo cinético utilizado 2 para el estudio de las hibridizaciones. En el capítulo cinco se describen los experimentos realizados, se exponen resultados conclusiones y se proponen experimentos para el futuro. Finalmente en el capítulo sexto se resumen los conceptos más importantes. Este trabajo fue realizado durante una pasantía de cinco meses en el Instituto Max Planck para la Investigación de Polímeros (Max Planck Institut für Polymerforschung; Mainz, Alemania). En dicho instituto se trabajó dentro del departamento de Ciencia de Materiales bajo la dirección del Prof. Dr. Wolfgang Knoll. 3 CAPÍTULO 1: PLASMONES SUPERFICIALES 1.1 – Introducción El fenómeno de los plasmones superficiales se conoce desde hace unos 25 años. En la actualidad, su teoría es bien conocida y pueden encontrarse un número de publicaciones que discuten sus propiedades en detalle [1][2][3]. En este capítulo se explica qué son los plasmones, se analizan sus características y métodos de excitación. 1.2 – Plasmones Los plasmones son oscilaciones colectivas de los electrones de conducción de un metal. Tal vez el modelo teórico más simple para estudiar a los metales es el propuesto por Drude. La teoría de Drude considera a los electrones de conducción de un metal como a un gas homogéneo de electrones inmerso en un potencial positivo uniforme impuesto por los iones inmóviles de la red cristalina. Lo interesante es que este modelo tan simple permite predecir de manera bastante aceptable la conductividad eléctrica y térmica de los metales, y además predice la existencia de plasmones. A continuación se muestra el tratamiento de la conductividad alterna según la teoría de Drude, y se verá cómo la misma predice la existencia de los plasmones son predichos. Para calcular cómo se induce una corriente en un metal debido a un campo eléctrico variable, conviene escribir el campo de la siguiente manera: ( E (t ) = Re E (ω )e −i ω t ) (1) La ecuación de movimiento para la cantidad de movimiento por electrón es: dp p = − eE dt τ * (2) Se busca una solución estacionaria de la forma: ( p (t ) = Re p (ω )e −i ω t ) (3) Reemplazando las formas complejas de p y E en la ecuación (2), que debe cumplirse tanto para la parte real como imaginaria, se encuentra: * Por razones de claridad no se deduce aquí la ecuación (2) pero puede encontrarse la deducción en el apéndice I. Vale aclarar sin embargo que e es la carga del electrón y τ es el tiempo de relajación, es decir, el tiempo promedio que un electrón puede viajar sin sufrir una colisión son un ion. 4 − i ω p (ω ) = − p (ω ) − eE (ω ) τ (4) La densidad de corriente no es más que j = − n ep / m , donde n es la densidad volumétrica de electrones y m es la masa del electrón, sale inmediatamente que: ( j(t ) = Re j(ω )e −i ω t j(ω ) = n ep (ω ) m (n e = 2 ) ) / m E (ω ) 1/ τ − i ω (5) Este resultado es comúnmente escrito como: j(ω ) = σ (ω ) E (ω ) (6) donde σ(ω) es la conductividad de corriente alterna o la conductividad dependiente de la frecuencia: σ (ω ) = σ0 1 − i ωτ σ0 = n e2 τ m (7) La aplicación más importante de este resultado es el estudio de la propagación de radiación electromagnética en un metal. Puede parecer que las suposiciones hechas por el modelo de Drude hacen a este resultado inaplicable para dicho caso, debido a que: 1) En una onda electromagnética, el campo eléctrico E va acompañado por un campo magnético H perpendicular de la misma magnitud, que no fue incluido en la ecuación de movimiento (2) 2) En una onda electromagnética, los campos no sólo varían en el tiempo sino también en el espacio, mientras que la ecuación de movimiento (2) fue deducida asumiendo una fuerza espacialmente uniforme (ver apéndice I) La primera complicación puede ser ignorada porque incluir el efecto del campo magnético agrega un término adicional − ep (ω ) mc × H *, el cual es v/c veces más pequeño que el término con En donde v es la velocidad promedio de los electrones. Incluso para una densidad de corriente tan grande como 1A/mm2, v=j/ne es solamente 0.1cm/s. Entonces, el término magnético es típicamente 10-10 del término eléctrico y puede ser ignorado siempre. El segundo punto presenta cuestiones más serias. La ecuación de movimiento (2) se deduce asumiendo que en cualquier instante, la misma fuerza actúa sobre cada electrón, lo cual no es cierto si el campo varía con la posición. De todos modos, la densidad de corriente * A partir de la Ley de Lorentz: 1 F = e E + v × H c 5 en un punto r está totalmente determinada por lo que el campo ha hecho sobre cada electrón en el punto r desde su última colisión. Esta colisión, en la gran mayoría de los casos, tiene lugar no más allá de unos cuantos caminos libres medios desde el punto r. Entonces, si el campo no varía apreciablemente en distancias del orden del camino libre medio electrónico, j(r,t) puede calcularse correctamente, considerando que el campo en todo el espacio está dado por su valor en el punto r, E(r,t). En consecuencia, el siguiente resultado j(r ,ω ) = σ (ω ) E (r ,ω ) (8) es válido siempre y cuando la longitud de onda λ del campo sea grande en comparación con el camino libre medio electrónico l. Para metales, esto es usualmente válido en el rango del visible (λ del orden de 103nm)*. A continuación se asumirá que la longitud de onda es grande en comparación con el camino libre medio. Las ecuaciones de Maxwell en presencia de una densidad de corriente j se escriben†: ∇⋅D = 0 (9.a) ∇⋅B = 0 (9.b) 1 ∂B =0 c ∂t (9.c) 1 ∂D 4 π = j c ∂t c (9.d) ∇×E + ∇×H − Se busca una solución con una dependencia temporal e-iωt. En un metal se puede escribir j en términos de E según (6), lo cual combinado con las ecuaciones de Maxwell da como resultado: ∇ × (∇ × E ) = −∇ 2 E = iω i ω 4 πσ iω ∇×H = E− E c c c c (10) o bien, − ∇ 2E = ω2 4 π i σ 1 + E ω c2 (11) que tiene la forma usual de una ecuación de onda: * Cuándo esta condición no se satisface es necesario tartar el problema con las llamadas toerías no-locales (nonlocal theories), de mayor complejidad. † Aquí se considera una onda electromagnética en la cual no hay densidad de carga inducida. Más adelante se tomará el caso de oscilaciones en la densidad de carga; los plasmones. 6 − ∇ 2E = ω2 ε (ω ) E c2 con una constante dieléctrica compleja dada por: ε (ω ) = 1 + 4πiσ c (12) Para frecuencias suficientemente altas tales que ωτ >>1, la combinación de (12) y (7) da como resultado en un primera aproximación: ε (ω ) = 1 + ω p2 ω2 (13) donde ωp se conoce como la frecuencia de plasma y está dada por: ω p2 = 4 πn e 2 m (14) Una consecuencia importante de (13) es que el gas de electrones puede sostener oscilaciones de densidad de carga. Es decir una perturbación en la cual la densidad de carga eléctrica tiene una dependencia temporal e-iωt. De la ecuación de continuidad: ∇⋅ j = − ∂ρ ⇒ ∇ ⋅ j(ω ) = i ωρ (ω ) ∂t (15) y de la Ley de Gauss: ∇ ⋅ E (ω ) = 4 π ρ (ω ) (16) Teniendo en cuenta la ecuación (8): i ωρ (ω ) = 4 π σ (ω )ρ (ω ) (17) 4 π i σ (ω ) (18) Esto tiene una solución y es: 1+ ω =0 La ecuación (18) es precisamente la condición que se encontró anteriormente para la propagación de radiación. En este caso muestra la condición que la frecuencia debe cumplir para que una onda de densidad de carga se propague. La naturaleza de estas oscilaciones de densidad de carga, conocidas como oscilaciones de plasma o plasmones, puede entenderse en términos de un modelo muy simple. Imagínese que todo el gas de electrones es desplazado una distancia d con respecto a los iones positivos fijos. La carga superficial producida da lugar a un campo eléctrico de magnitud 4πρ*, donde ρ* es la carga por unidad de área en cada extremo (ver figura 1.1). 7 _____ _ _ _ρ*=-nde __ E=2πρ∗+2πρ∗=4πnde d +++++ ρ∗=+nde +++++ Figura 1.1: modelo para la comprensión de las oscilaciones de plasma o plasmones. Entonces, el gas de (N) electrones como un todo obedecerá la ecuación de movimiento: Nmd!! = − Ne 4 π ρ* = − Ne(4 πn ed ) = −4 πn e 2 Nd (19) que da como resultado una oscilación a la frecuencia de plasma. 1.3 – Plasmones Superficiales en una Interfase A continuación se trata el caso particular plasmones superficiales en una interfase; se analizan sus características y métodos de excitación con un haz luminoso. Considérese que dicha interfase se ubica en el plano XY, y que separa dos espacios semi-infinitos de materiales 1 y 2, cuyas propiedades ópticas están caracterizadas por sus constantes dieléctricas complejas ε1(ω) y ε2(ω), respectivamente (ver figura 1.2) . x y Figura 1.2: sistema de referencia z ε1(ω) ε2(ω) en una interfase entre dos medios de constantes dieléctricas ε1 y ε2 En este tratamiento se ignorarán materiales magnéticos, es decir que se tomará µ=1 en todos los desarrollos. Los plasmones superficiales sólo pueden ser excitados en la mencionada interfase si el campo eléctrico tiene una componente normal a la superficie tal que puede inducir una carga superficial ρ*. Para que eso sea posible el desplazamiento eléctrico debe verificar: z ⋅ (D 2 − D1 ) = 4 πρ* (20) Luz S-polarizada propagándose a lo largo de la dirección X, sólo tiene componentes de campo eléctrico paralelas a la dirección y; es decir, una onda TE tiene un campo eléctrico E=(0; Ey; 0), y por lo tanto son incapaces de excitar plasmones superficiales. Tales modos sólo 8 pueden ser excitados por luz P-polarizada, es decir ondas TM con campo eléctrico E=(Ex; 0; Ez), o equivalentemente, H=(0; Hy; 0). Las ondas electromagnéticas superficiales tendrán la forma: medio 1 A1 = A10 e i (k 1x−ω t ) = A10 e i (k x1x + k z1z −ω t ) (21.a) medio 2 A 2 = A 20 e i (k 2 x −ω t ) = A 20 e i (k x 2 x−k z 2 z −ω t ) (21.b) Dónde A puede representar tanto al vector eléctrico E coma al vector magnético H; kx1 y kx2 son las componentes en x de los vectores de onda en los medios 1 y 2, kz1 y kz2 son los valores absolutos de las componentes del vector de onda según la dirección z y ω es la frecuencia angular. Por supuesto que ambos campos deben cumplir las ecuaciones de Maxwell (9). Las condiciones de contorno electromagnéticas imponen que en la interfase: E1x = E 2 x (22) H1y = H 2 y (23) y De la ecuación (22) sale inmediatamente que kx1=kx2=kx. Además, aplicando la ecuación de Maxwell (9.d), con j=0 ya que no hay flujo neto de cargas, a los campos E y H dados por (21), se llega a que: k1z H y = ω ε1 E x c (24) kxH y = − ω ε1 E1z c (25) ω ε 2 Ex c (26) ω ε 2 E2 z c (27) k2z H y = − kxH y = − Las ecuaciones (24) y (26) llegan a la única solución no trivial cuando: k1z ε =− 1 k2z ε2 (28) Aplicando las ecuaciones de Maxwell (9.c) a los campos E y H se obtiene: − k x E1z + k1z E x = ω Hy c (29) − k x E2 z − k 2 z E x = ω Hy c (30) 9 La ecuación (26) muestra que los plasmones superficiales sólo pueden ser excitados en una interfase entre dos medios con constantes dieléctricas de signo opuesto. Para un material en contacto con un dieléctrico de constante dieléctrica positiva εd, esta condición puede ser satisfecha para toda una variedad de excitaciones elementales, siempre y cuando sus características como oscilador resulten, al menos en un rango espectral estrecho, en una constante dieléctrica negativa. Dentro de ciertos límites, este puede ser el caso de fonones o excitones. El acoplamiento de estas excitaciones a un campo electromagnético produce los llamados phonon surface polariton, o exciton surface polariton, respectivamente. En nuestro caso interesa el acoplamiento de un campo electromagnético con las oscilaciones colectivas de plasma de los electrones de conducción de un metal en la interfase entre un metal con constante dieléctrica εm= ε’m + i ε”m y un dieléctrico de constante dieléctrica εd= ε’d + i ε”d. Estas excitaciones se denominan surface plasmon polaritons, o directamente surface plasmons: plasmones superficiales. A partir de ahora se utilizarán los subíndices m en lugar de 1 y d en lugar de 2; tan solo para especificar un medio dieléctrico y otro metálico en lugar de medios genéricos 1 y 2. Operando con las ecuaciones (26), (27) y (30) se obtiene: 2 ω k x 2 + k dz 2 = ε d c 2 k x + k mz 2 (31.a) 2 ω = εm c (31.b) o bien 2 k dz ω = εd − kx2 c k mz ω = εm − kx2 c (32.a) 2 (32.b) que junto con la ecuación (28) permite obtener la relación de dispersión de los plasmones superficiales en una interfase metal / dieléctrico: kx = ω c εm⋅ εd εm + εd (33) En este punto es conveniente detenerse a destacar un par de detalles: 1- Usualmente se trata a ω como real. Dado que εm es compleja, kx es también complejo, es decir kx= k’x + ik”x. Como consecuencia de esto, los plasmones superficiales que se propaguen por una interfase metal / dieléctrico exhibirán una longitud de propagación finita Lx, 10 dada por Lx=1/k”x. Este decaimiento tiene una gran importancia ya que determina la resolución lateral de las técnicas basadas en la resonancia de plasmones superficiales. 2- En el rango espectral de interés se tiene que: εm⋅ εd ≥ εd εm + εd (34) lo cual tiene dos importantes consecuencias. La primera se deduce de la ecuación (32.a). Al insertar la ecuación (34) se obtiene una componente z del vector de onda en el dieléctrico puramente imaginaria. De las ecuaciones de onda (21) puede verse que esto significa que los plasmones superficiales constituyen una onda evanescente no-radiativa que se encuentra unida a la interfase y que su amplitud, la cual es máxima en dicha superficie (z=0), decae exponencialmente hacia el interior del dieléctrico [9](figura 1.3). La longitud de penetración típica es del orden de unos cientos nanómetros; esta especificidad superficial es lo que hace que este campo óptico sea tan interesante para la caracterización de nanoestructuras superficiales. Figura 1.3: campo eléctrico evanescente asociado a los plasmones superficiales en una interfase metal/dieléctrico [9] . La segunda consecuencia de la ecuación (34) es que el vector de onda de un fotón libre que se propaga en el dieléctrico kf, kf = ω ⋅ εd c (35) es siempre menor que el vector de onda de un plasmón superficial ksp propagándose en una interfase entre ese mismo medio y un metal (figura 1.4). 11 kf ksp Figura 1.4: componentes X de los vectores de x θi z onda de un fotón incidente desde un dieléctrico Dieléctrico y los plasmones superficiales que se propagan Metal Dieléctrico entre ese mismo dieléctrico y un metal. 1.4 – Excitación de Plasmones Superficiales Para el acoplamiento de los fotones con los plasmones superficiales sólo interesa la componente x de los vectores de onda de los fotones. Esto significa que para una reflexión simple de fotones en una interfase plana, variando el ángulo de incidencia, uno puede pasar de tener kfx=kf.sinθi nulo para incidencia normal, al vector de onda completo kf para incidencia rasante (figura 1.4). Sin embargo, la ecuación (34) dice que esto no es suficiente para excitar los plasmones superficiales ya que el vector de onda de los fotones es siempre menor que el de los plasmones. En la figura 1.5 se representa gráficamente esta situación. Se puede ver que la curva de dispersión de los plasmones está siempre por debajo de la curva de dispersión de los fotones propagándose en el dieléctrico. Esto indica que es imposible que estos fotones se acoplen a los plasmones superficiales. ω ω= c kf εd ω= c kf εp Figura 1.5: relaciones de dispersión ω=c kf εm + εd εm⋅ εd ωi para fotones incidentes desde un dieléctrico d (recta violeta), un prisma p de índice de refracción mayor (recta azul punteada) y plasmones superficiales en una interfase entre un metal m y el dieléctrico d. ksp k Una manera de solucionar este problema experimentalmente es mediante la configuración de Kretschmann[5]*. Esta consiste en hacer incidir fotones a través de un prisma dieléctrico p, * Existen también otros métodos de acoplamiento, como por ejemplo el propuesto por Otto [4] y el acoplamiento por gratings[1]. 12 de índice de refracción mayor ( εp > ) ε d . La curva de dispersión de estos fotones se muestra también en la figura 1.5 con una línea punteada. El vector de onda de estos fotones es, dentro de ciertos límites de frecuencia, mayor que el vector de onda de los plasmones superficiales. En este caso, los fotones pueden excitar plasmones superficiales si inciden con el ángulo adecuado (figura 1.6) kf θsp x z Prisma Metal Dieléctrico ksp Figura 1.6: componentes X de los vectores de onda de un fotón incidente desde un prisma y los plasmones superficiales que se propagan entre un metal y un dieléctrico de índice de refracción menor al del prisma. Experimentalmente, este acoplamiento resonante puede observarse midiendo la intensidad reflejada, o mejor aún la reflectividad, en función del ángulo de incidencia. Se observará un pronunciado mínimo en la reflectividad cuando el ángulo de incidencia es tal que se verifica la condición de resonancia. k spx = ω εm⋅ εd ω = ε p sin θ sp = k fx c εm + εd c (36) De la condición de resonancia (36) puede calcularse el ángulo de incidencia correspondiente al acoplamiento de los fotones incidentes con los plasmones superficiales. Dicho ángulo se denomina θsp (figura 1.6) θ sp = arcsin εm⋅ εd (ε m + ε d ) ⋅ ε p (37) En la figura 1.7 se muestra una curva de reflexión interna total en un prisma de LaSFN9 (ε=3.403) y una curva de reflectividad medida para un film de 50 nm de Au evaporado sobre un prisma de LaSFN9. Vale la pena comparar ambas curvas y destacar algunas de las características más notables de la curva de resonancia de plasmones: 1) Para ángulo de incidencia menores que el ángulo crítico de reflexión total θc, puede verse que la reflectividad es mucho mayor. Esto se debe a que el film metálico actúa parcialmente como espejo 13 A pesar de lo marcado en 1), el θc puede todavía distinguirse con claridad. Esto 2) es de importante utilidad para la calibración de los equipos de medición como se verá más adelante. Para ángulos de incidencia mayores que θc la reflectividad es menor que en el 3) caso de reflexión interna total debido a cierta absorción en el metal y se mantiene prácticamente constante hasta que se aproxima el ángulo de acoplamiento con los plasmones superficiales θsp, donde la reflectividad comienza a disminuir hasta valores muy bajos. 1,0 1,0 0,8 Reflectividad Reflectividad 0,8 0,6 0,4 0,2 0,6 0,4 0,2 0,0 0,0 45 θ 50 c 55 θ [°] 60 45 θ 50 c 55 θ [°] θ 60 65 SP Figura 1.7: curvas de reflectividad para un prisma de LaSFN9 (ε=3,4039) y para un film de Au (ε =-12,3 + i 1,29) de 50nm evaporado sobre un prisma de LaSFN9. Como se expuso anteriormente, los plasmones superficiales generan un campo óptico en la interfase metal / dieléctrico que tiene su máxima intensidad en la interfase y decae exponencialmente hacia el interior del dieléctrico. Esto sucede también en el caso de reflexión interna total (ver apéndice I.4). Una diferencia muy importante en este caso es que debido al proceso de resonancia establecido entre el campo electromagnético incidente y los plasmones, la intensidad del campo evanescente en la superficie se ve notablemente amplificada. Por ejemplo, en la figura 1.8, se muestran los casos de un film de Au y de un film de Ag, ambos de 50 nm de espesor; el factor de amplificación es de aproximadamente 16 en el caso del Au, y de 50 en el caso de la Ag. Las curvas mostradas en la figura 1.8 fueron calculadas resolviendo las ecuaciones de Fresnel para los sistemas mencionados. Todas las características ópticas de estos sistemas pueden ser descriptas mediante la resolución de 14 dichas ecuaciones, las cuales quedan determinadas por las constantes dieléctricas y los espesores de las capas involucradas*. De la comparación de las curvas expuestas en la figura 1.8 puede notarse directamente que el mínimo es mucho más agudo en el caso de la Ag. Esto se debe a que la Ag es un metal apreciablemente más transparente que el Au (ε”Ag < ε”Au)† Este es el comportamiento típico de un proceso de resonancia, si los plasmones actuasen como resonadores perfectos, el mínimo debería ser perfectamente agudo; es decir, en el caso ficticio de un metal sin pérdidas (ε”=0), el ancho mitad del mínimo debería ser nulo. 1,0 1,0 50 50 0,8 0,8 10 0 45 50 55 60 2 0,6 30 2 ES / Ein 0,4 20 Reflectividad 2 ES / Ein 2 0,6 30 0,4 20 0,2 10 0,0 65 0 Reflectividad 40 40 0,2 45 θ [°] 50 55 0,0 60 θ [°] Figura 1.8: reflectividad e intensidad del campo eléctrico relativa en la superficie (z=0), para 50nm Au (derecha; εAu= -12+ i 1,29) y para 50nm de Ag (izquierda; εAg= -17+ i 0,5). Otra particularidad es que los máximos de intensidad no coinciden con los mínimos de reflectividad. La razón una vez más está en el carácter resonante de los plasmones superficiales. Cuando se atraviesa la resonancia, el campo sufre un cambio de fase de 180°, como en cualquier resonador. En el caso ficticio de un metal sin pérdidas, dicho cambio de fase sucede puntualmente en el ángulo de resonancia θsp. En cambio, en un caso real (cómo en un resonador amortiguado), el cambio de fase sucede más gradualmente, y será más difuso cuánto mayores sean las pérdidas. Ahora, lo que se observa en la reflexión es la superposición coherente de una onda parcial reflejada directamente por la interfase metal / dieléctrico, y una fracción del modo superficial re-irradiada vía el prisma. Entonces, el mínimo * † Y por supuesto toda la información concerniente al campo incidente. εAg= -17+ i0,5; εAu= -12+ i1,29. 15 en reflectividad que se observa se debe a la interferencia destructiva entre dos ondas parciales que difieren en fase por 180°. Esta interferencia se produce justo después del ángulo de máxima intensidad de los plasmones superficiales. Una vez más, a mayores pérdidas, más difuso será el cambio de fase, y mayor la diferencia entre las posiciones angulares del máximo de intensidad y el mínimo de reflectividad. 1.5 – Plasmones Superficiales en Sistemas Multicapas Como ya se expuso en más de una oportunidad, los plasmones superficiales tienen asociado un campo electromagnético superficial evanescente que tiene su máxima intensidad en la superficie y decae exponencialmente hacia el interior del dieléctrico. La longitud de decaimiento depende de la longitud de onda del campo incidente y de las propiedades ópticas del metal; para longitudes de onda usuales* y filmes de metales nobles, su valor es del orden de los 200nm. Por este motivo, cualquier cambio en las propiedades ópticas del dieléctrico, dentro de los 200nm aproximadamente, alterará las condiciones de excitación de los plasmones superficiales. Esta característica es la que permite detectar por ejemplo la adsorción de una nueva capa dieléctrica mediante el monitoreo del ángulo de resonancia. Considérese ahora el mismo sistema que en la sección anterior, prisma / metal / dieléctrico, pero insertando una nueva capa de dieléctrico sobre el metal. Supongamos que el nuevo dieléctrico tiene una constante dieléctrica εa mayor que la del medio dieléctrico original (εa>εd). En este caso, el índice de refracción efectivo con el que interactúan los plasmones superficiales es mayor. Esto es equivalente a correr la curva de dispersión de los plasmones superficiales hacia vectores de onda mayores. La figura 1.9 muestra este corrimiento; la curva correspondiente a ωsp es la relación de dispersión de los plasmones en el sistema original, y la curva ωsp´ en el sistema con la nueva capa dieléctrica. En consecuencia, a una dada frecuencia, el vector de onda de los plasmones superficiales será mayor y se necesitará un ángulo de incidencia mayor para excitar dichos modos. De este simple razonamiento uno puede concluir que las condiciones de excitación de los plasmones superficiales dependerán del índice de refracción efectivo del medio en contacto con el metal, dentro de una distancia del orden de los 200nm a partir de la interfase. Entonces, si una capa uniforme dieléctrica se adsorbiera sobre el metal, uno podría, dado el espesor de dicha capa, calcular el índice de refracción o viceversa. Es importante recalcar que estas magnitudes no pueden medirse independientemente con una técnica como esta. Es más, si la capa dieléctrica no es uniforme, entrará en juego también la fracción de área cubierta por el dieléctrico. * En el espectro visible e IR cercano. Típicamente: 630nm (Láser de HeNe) 16 ω ωd(k) Figura 1.9: relaciones de dispersión para fotones ωp(k) incidentes desde un dieléctrico d (recta violeta), ωsp(k) ωsp’(k) un prisma p de índice de refracción mayor (recta azul punteada), plasmones superficiales en una interfase entre un metal m y el dieléctrico d ωi (verde; ωsp) y plasmones en una interfase igual a la anterior pero con una capa extra (rojo; ωsp’) ksp ksp’ k La reflectividad de un sistema multicapa puede calcularse teóricamente con las constantes dieléctricas y los espesores de cada capa como dato. Estos cálculos de reflectividad se llevan a cabo considerando la distribución de los campos, la reflexión y transmisión en cada capa. El formalismo matemático que extiende los resultados obtenidos en la sección 1.3 se denomina método de la matriz de transferencia (Transfer Matrix Method) y es la base del programa de computación Winspall utilizado para el análisis de las mediciones realizadas en este trabajo. Una descripción detallada del método matemático puede encontrarse en [6]. 17 CAPÍTULO 2: TÉCNICAS BASADAS EN LA RESONANCIA DE PLASMONES SUPERFICIALES 2.1– Introducción En este capítulo se presentarán tres técnicas basadas en la excitación de plasmones superficiales que son de gran utilidad para caracterizar películas delgadas y estudiar procesos cinéticos en superficies: - Espectroscopía por resonancia de plasmones superficiales (SPR). Surface plasmon resonance spectroscopy - Espectroscopía de fluorescencia por plasmones superficiales (SPFS) Surface plasmon field enhanced fluorescence spectroscopy - Microscopía por resonancia de plasmones superficiales (SPM) Surface plasmon microscopy - Microscopía de fluorescencia por resonancia de plasmones superficiales (SPFM) Surface plasmon fluorescence microscopy Se expondrán las potencialidades y limitaciones de estas técnicas en general y se explicará cómo se aplicaron estas técnicas en este trabajo en particular. 2.2– Espectroscopía por resonancia de plasmones superficiales (SPR) Como se ha explicado en el capítulo 1, las condiciones de excitación de plasmones superficiales dependen de las propiedades dieléctricas del medio en un rango de 200nm. Más específicamente, si se considera un sistema multicapa, el ángulo de incidencia para la excitación de plasmones superficiales depende del espesor óptico (índice de refracción y espesor) de las capas involucradas. Recordando la ecuación (38) del capítulo 1: ∆ θ sp ∝ ∆n ⋅ ∆d (1) Entonces, conocidas las condiciones de excitación de plasmones superficiales, se puede obtener el espesor (efectivo) dado el índice de refracción, o viceversa. Lo antedicho es justamente la base de la espectroscopía por resonancia de plasmones superficiales: detectar cambios superficiales en una interfase mediante el monitoreo de las condiciones de excitación de los plasmones superficiales. Esto da origen a dos modos de medición (figura 2.1): 1- Barrido: consiste en la medición de la reflectividad en función del ángulo de incidencia, lo que permite obtener la posición angular del mínimo de reflectividad θsp. Midiendo el corrimiento de θsp producido por la adsorción de una capa dieléctrica, y 18 teniendo como dato el índice de refracción de la misma, puede calcularse el espesor o viceversa. Para ello se ajustan las curvas experimentales a través del software Winspall2.0 que se basa en el método de la matriz de transferencia; dicho software fue desarrollado en nuestro grupo. 2- Cinético: el objetivo es monitorear el crecimiento de una película o el avance de un proceso de adsorción superficial. Consiste en posicionar el detector a un ángulo de incidencia determinado y registrar el aumento de la reflectividad en función del tiempo. Este aumento se debe a que a medida que la masa depositada sobre la superficie aumenta, el acoplamiento de los plasmones superficiales se produce a ángulos de incidencia mayores. El ángulo se elige preferentemente a la derecha del mínimo de reflectividad porque en esa zona las pendientes de las curvas de reflectividad antes y después (de la formación de la película o adsorción de las moléculas) son prácticamente paralelas, y en consecuencia el aumento en la reflectividad es directamente proporcional al corrimiento del mínimo (el cual es a su vez proporcional al espesor o la masa adsorbidas sobre la superficie; ecuación (1)). Reflectividad Modo de Barrido Modo Cinético 1,0 1,0 0,8 0,8 0,6 0,6 0,4 0,4 0,2 0,2 0,0 0,0 40 45 50 55 θ [°] 60 65 70 0 10 20 30 40 50 60 Tiempo [min] Figura 2.1: modos de operación de la espectroscopía por resonancia de plasmones (SPR) La espectroscopía por excitación de plasmones (SPR) se ha convertido en una herramienta analítica ampliamente aceptada para la caracterización de interfases y films delgados y para el estudio de procesos cinéticos superficiales, como por ejemplo reacciones de inmovilización 19 en interfases. Una variedad de instrumentos comerciales basados en esta técnica están actualmente disponibles* y son ampliamente utilizados. La mayor ventaja del SPR es que permite trabajar con muestras no marcadas, ya que es la simple presencia de las moléculas de analito en la interfase, o más precisamente el contraste óptico que estas moléculas producen lo que se detecta. Por ejemplo, la formación de una capa monomolecular de Streptavidina, una proteína tetramérica de masa molecular 60000 g/mol, con un empaquetamiento lateral máximo del 60%, produce un desplazamiento del ángulo de resonancia de plasmones (θsp) de 0,5° que corresponde a una capa de d= 4nm (asumiendo un n=1,45). El mínimo espesor detectable (determinado por el índice de refracción y la menor división del goniómetro) es en este caso de 0,1-0,2 nm, lo cual brinda una relación señal/ruido suficientemente alta como para realizar un análisis cinético detallado y obtener con precisión constantes cinéticas y de afinidad. Además, las curvas medidas pueden ajustarse muy satisfactoria 2.3– Espectroscopía de fluorescencia por plasmones superficiales (SPFS) Si se quieren detectar capas muy diluidas lateralmente o analitos de bajo peso molecular, la técnica SPR es ineficaz. En estos casos se generan capas efectivas muy finas que producen un desplazamiento angular demasiado pequeño como para ser detectado. Estas limitaciones de detección han inducido el uso de muestras marcadas (fluorescentes) para incrementar la señal de los eventos en la interfase. A continuación se explicarán los conceptos básicos referidos al uso del campo óptico evanescente generado por los plasmones superficiales para la excitación de fluoróforos cercanos a la interfase [8]. Como se explicó en el capítulo anterior, lo plasmones superficiales tienen asociado un campo óptico evanescente que penetra en el dieléctrico y decae exponencialmente dentro de él. Esta especificidad superficial hace que este campo electromagnético sea de gran interés para el estudio de fenómenos superficiales, pero no es una característica única del campo asociado a los plasmones superficiales; en condiciones de reflexión interna total (Apéndice I.8), también se produce un campo electromagnético evanescente cuya amplitud es máxima en la interfase y decae exponencialmente dentro del medio. En ambos casos la longitud de decaimiento es del orden de la inversa del vector de onda incidente. La diferencia principal entre estos dos campos es la amplificación de la intensidad en la interfase, es decir la relación entre la intensidad incidente y la intensidad en la superficie, Es2/Ei2. Este factor de amplificación es 4 para el caso de reflexión interna total, cuando se incide con el ángulo crítico (ver apéndice I.8). Para el caso de resonancia de plasmones superficiales, la máxima * Biacore, Texas Instruments. 20 intensidad se encuentra cerca del mínimo de reflectividad (cómo se explicó en el capítulo 1) y el factor de amplificación depende de las propiedades dieléctricas del metal: para Au es aproximadamente 16, y para Ag 50 (Figura 2.2). 1,0 50 0,8 2 ES / Ein 2 0,6 30 0,4 20 Reflectividad 40 θ H2O 0,2 10 0 0,0 45 θ 50 c 55 60 θ [°] 1,0 50 0,8 30 2 ES / Ein 2 0,6 0,4 20 Reflectividad 40 θ Au H2O 0,2 10 0 45 50 55 60 0,0 65 θ [°] 1,0 50 0,8 30 2 ES / Ein 2 0,6 0,4 20 Reflectividad 40 θ Ag H2O 0,2 10 0 45 50 55 0,0 60 θ [°] Figura 2.2: cálculos de reflectividad e intensidad de campo en la interfase (normalizada a la intensidad incidente) en función del ángulo de incidencia, para un sistema multicapa: prima (ε =3,4039), (a) H2O, (b) 50nm Au/H2O y (c) 50nm Ag/H2O. La longitud de onda del haz incidente es de 630nm. 21 Esta mayor intensidad de campo es muy favorable para SPFS ya que la intensidad de la fluorescencia emitida por un cromóforo aumenta con la intensidad del campo excitante (y con la probabilidad de decaimiento radiativo desde el nivel excitado al nivel base*). Por esta razón cuando es posible se utilizan films de Ag, aunque en muchos casos se prefiere Au por su estabilidad química†. El próximo punto que merece atención es el comportamiento de un cromóforo emitiendo en las cercanías de una superficie metálica. Dependiendo de la distancia del cromóforo al metal, diferentes mecanismos de disipación se hacen predominantes (Figura 2.3). Si el cromóforo se encuentra muy cerca de la superficie metálica, la energía almacenada en el cromóforo durante la excitación se disipa en el metal en forma de calor. Este proceso noradiativo de relajación se llama quenching‡ y reduce notablemente el tiempo de decaimiento (vida media del estado excitado) y la intensidad de la fluorescencia emitida. Para distancias de separación intermedias, los cromóforos excitados pueden emitir acoplándose con estados plasmónicos del metal. Se encontró que una distancia de separación óptima para este mecanismo es de unos 20nm [12]. Naturalmente, parte de la energía de excitación se disipa en la molécula fluorescente en forma de modos vibracionales. Por lo tanto, los plasmones acoplados de esta manera están corridos hacia el rojo con respecto al campo de excitación, y en consecuencia emiten en un cono a ángulos ligeramente menores [13]. A distancias más grandes, la emisión radiativa de los cromóforos no se ve modificada por la presencia del metal, a excepción de efecto despreciables de interferencia entre el campo emitido y el reflejado por la superficie metálica que actúa como espejo. Todo lo antedicho se puede resumir matemáticamente en la siguiente ecuación [11]: 4 Id d0 = 1 + I∞ d −1 (2) En la cual I∞ es la intensidad de fluorescencia emitida por un cromóforo a una distancia infinita de la superficie del metal, es decir en ausencia de cualquier metal. Id es la intensidad emitida a una distancia d y d0 es el llamado radio de Förster, que da la distancia a la cual la intensidad de fluorescencia es la mitad de la correspondiente a una separación infinita. Valores típicos del radio de Förster son 7 u 8 nm. * Se asume que la longitud de onda de excitación está dentro del rango de absorción del cromóforo. Además, como generalmente se trabajará con sistemas estratificados en una interfase sólido / líquido, se considera el comportamiento de un arreglo plano de cromóforos. † Otra razón por la cual se puede preferir Au es para poder usar intensidades de láser que brinden una buena relación señal / ruido sin saturar el fotomultiplicador. ‡ Se denomina quenching de fluorescencia a cualquier proceso que disminuya la intensidad y/o vida media de un cromoforo. Estos procesos pueden ser por ejemplo, transferencia de energía (como el poceso mencionado arriba), formación de complejos, reacciones del estado excitado o colisiones (dynamic quenching). 22 Plasmones Superficiales Disipación Radiación Prisma (εp) Figura 2.3: mecanismos de disipación de la energía almacenada en lo cromóforos Metal (εm) excitados [8]. Cromóforo Agua (εd) Por supuesto que si se trata de un cromóforo excitado por el campo evanescente de plasmones superficiales, no se observará fluorescencia si el cromóforo se encuentra más allá de la distancia de decaimiento del campo de los plasmones, la cual está en el rango de los 200nm. Entonces, cuando se trata de detectar fluorescencia proveniente de un cromóforo excitado por el campo óptico de plasmones superficiales, la distancia óptima del cromóforo a la superficie estará determinada por el compromiso que imponen los mecanismos de relajación y la intensidad del campo excitante. En la figura 2.4 se esquematiza la situación. La línea llena representa la intensidad del campo óptico de los plasmones superficiales (para un film de 50nm de Au) normalizada con la intensidad del campo incidente y la línea punteada representa la intensidad de fluorescencia dada por la ecuación (2) con un radio de Förster de 10nm. Prisma Metal Agua 16 14 E 2s E i2 12 10 1 8 6 4 2 0 -100 0 100 200 300 400 Intensidad de Fluorescencia 18 Figura 2.4: perfiles de la intensidad del campo eléctrico Id I∞ producido por los plasmones superficiales y de la emisión de un fluoróforo en las cercanías de un metal. 0 Posición [nm] 23 Como se puede ver en la figura 2.4, todo el proceso de quenching se lleva a cabo en una distancia de entre 10 y 15 nm, mientras que el decaimiento del campo evanescente de los plasmones superficiales se produce en distancias de los cientos de nm. Esto significa que cromóforos ubicados a una distancia de un radio de Förster, sufrirán una pérdida de intensidad de fluorescencia de un factor 2, pero todavía se encuentra dentro de la zona de campo excitante altamente amplificado por modos resonantes de los plasmones superficiales. Eso significa que si se diseña adecuadamente la arquitectura superficial para la detección de analitos fluorescentes, puede ganarse mucho en sensibilidad al usar el campo óptico de plasmones superficiales para “iluminar” a los cromóforos. La técnica de SPFS puede aplicarse, al igual que la SPR, en modo de barrido y en modo cinético. No es necesario aclarar nada especial sobre el modo de barrido; se registran simultáneamente la reflectividad y la fluorescencia en función del ángulo de incidencia. Con respecto al modo cinético, se realiza de igual modo que en SPR. Se fija el ángulo de incidencia a izquierdas del mínimo de reflectividad, y se registra la intensidad de fluorescencia en función del tiempo. A medida que más analito fluorescente se acerca a la superficie, la intensidad de fluorescencia aumentará. Este aumento será proporcional siempre y cuando el analito que se deposita sobre la superficie no produzca un corrimiento del ángulo de resonancia de los plasmones. En cambio, si los analitos fluorescentes que se acercan a la superficie producen un corrimiento notable del ángulo de resonancia de los plasmones superficiales, la excitación de los cromóforos decaerá a medida que más y más analito se acerque a la superficie. Este efecto hace que el incremento de la intensidad de fluorescencia ya no sea proporcional a la cantidad de analito depositada sobre la superficie, lo cual complica el análisis de los datos cinéticos. Se puede ver de cálculos y se verifica experimentalmente que la no-linealidad se hace importante a partir de desplazamientos del ángulo de resonancia de plasmones mayores a 0,4°, por debajo de ese límite este efecto puede despreciarse [7][8]. En la figura 2.5 se muestran dos mediciones de barrido sucesivas, antes y después de la adsorción de un analito fluorescente sobre un film de Au de 50nm. Las curvas de reflectividad antes y después de la adsorción son idénticas. Sin embargo las curvas de fluorescencia son muy diferentes. Antes de la adsorción se midió solamente un fondo del orden de unas 4000 cps. Después de la adsorción se midió un espectro de fluorescencia correspondiente a la emisión de los fluoróforos que penetraron en el campo de los plasmones superficiales. Puede observarse que, como es lógico, la forma de la curva de emisión de fluorescencia en función de ángulo de incidencia es análoga a la del campo electromagnético de los plasmones. 24 Figura 2.5: mediciones de SPFS antes 0,8 Reflectividad 6 0,4 5,0x10 0,2 y rojo) y después (verde y violeta) de la 0,6 1,0x10 (anaranjado 6 5 Fluorescencia [cps] 1,5x10 adsorción de un analito marcado con Cy5 sobre un film de Au. Las curvas de reflectividad son idénticas antes y después. En cambio la fluorescencia aumenta dramáticamente cuando los analitos fluorescentes se adsorben 0,0 0,0 45 50 55 θ [°] 60 65 en la superficie y son excitados por el campo eléctrico de los plasmones superficiales. Set-up experimental En la figura 2.6 se muestra el set-up experimental utilizado en este trabajo para realizar mediciones mediante SPR y SPFS. Cómo se puede ver el sistema es sencillo. Básicamente es un set-up de SPR [14] modificado con unidades para la detección de fluorescencia. Consiste en un goniómetro θ -2θ (Huber) que puede moverse de a pasos de 0,001°, donde se montan las muestras para variar el ángulo de incidencia del haz láser. Para medir la reflectividad se usa un fotodiodo y un amplificador lock-in, de manera tal que se computa la intensidad solamente en la longitud de onda del láser incidente. Este dispositivo cuenta con dos lásers, lo cual permite trabajar con dos longitudes de onda. Sin embargo para los experimentos realizados en este trabajo sólo se utilizó una: 630nm (HeNe; Uniphase 5mW). Para medir fluorescencia se utilizó un fotomultiplicador (PM1; Hamamatsu) y un contador (HP). Se trabaja con una computadora personal que controla los motores paso a paso de goniómetro, los obturadores y el sistema de protección del fotomultiplicador, y registra la posición del goniómetro y las señales del amplificador y el contador. Cabe aclarar que cuando se trabaja en SPR todo el circuito del fotomultiplicador no se utiliza; ésta parte del set- up se utiliza para trabajar en SPFS. 25 Fotodiodo Lente θ Obturador Láser HeNe Divisor de haz Chopper θ Prisma y celda de flujol Lente Polarizador Goniómetro Láser Nd YAG Espejo Filtro Fotomultiplicador Polarizador Control de obturadores Amplificador de entrada fija (lock-in) Protección de Fotomultiplicador Contador Figura 2.6: Set-up experimental empleado para las mediciones de SPR y SPFS. El formato de las muestras empleadas para los experimentos de este trabajo es el siguiente. Para excitar a los plasmones superficiales se utilizó como acople óptico un prisma de ángulo recto en la configuración de Kretschmann; el material del prisma es un vidrió de alto índice de refracción (Schott, LaSFN9; ε = 3,4039). El film metálico* se evaporó sobre pequeños sustratos de LaSFN9, que se acoplaron al prisma por medio de un aceite de índice de refracción similar.† Sobre el film metálico se posiciona el cuerpo principal de la celda de flujo (figura 2.7b) que está construido con un vidrio de baja fluorescencia (Schott, Herasil). Este se sella contra el metal y contra el plato de fondo (Herasil) a través de O-rings (figura 2.7a). * † En general se utiliza Au por su estabilidad química frente a los solventes comúnmente usados. Este procedimiento se realiza por dos razones: 1- es más fácil evaporar sobre los pequeños vidrios planos que sobre el prisma. 2- la superficie de la cara del prisma se daña con los usos sucesivos. De esta manera, sólo es necesario reemplazar los sustratos que son notablemente más baratos. 26 θ Prisma Líquido acoplante Sustrato de Vidrio Film metálico O-rings Celda de flujo (a) Plato de fondo Entrada Salida (b) Figura 2.7: celda de flujo. 2.4– Microscopía por resonancia de plasmones superficiales (SPM) Para entender el funcionamiento de esta técnica considérese una muestra compuesta por un film metálico sobre el cual se han preparado escalones de una capa dieléctrica de distintos espesores. Supóngase que un haz de luz p-polarizada se expande y se hace incidir sobre esta muestra de modo que ilumine las diferentes zonas simultáneamente. En ese caso las distintas áreas con diferentes espesores tienen diferentes reflectividades y si se detecta el haz reflejado con una cámara, se obtendrá una imagen con contrastes correspondientes a los diferentes espesores [14][15][16]. En la figura 2.8 se ilustra el principio de funcionamiento de SPM. Se exponen cuatro curvas de reflectividad para 4 espesores de una capa de sílice sobre un film de Au y se muestra cómo se generan los contrastes para dos ángulos de incidencia [17]. 27 1 2 3 4 a 0,9 Reflectividad 1 2 3 4 b Figura 2.8: principio de funcionamiento de la microscopia por resonancia de plasmones. Para 1 0,6 un dado ángulo de incidencia, los distintos 2 espesores producirán una reflectividad diferente 3 0,3 produciendo un contraste [17]. 4 0 24 26 28 30 θ [°] También en SPM puede trabajarse en modo de barrido y en modo cinético. Para extraer información cuantitativa de las imágenes obtenidas se necesita trabajar con una cámara CCD que capture las imágenes en forma digital, para poder posteriormente analizar los contrastes con un software adecuado. De este análisis se pueden reconstruir las curvas de reflectividad en función del ángulo de incidencia y las curvas de reflectividad en función del tiempo para distintos puntos del sustrato. Esto significa que puede trabajarse con arreglos multi-spot, lo cual constituye la principal ventaja de la SPM. De esta manera pueden preparase un número de spots sobre un mismo sustrato con diferentes arquitecturas superficiales, exponerlos a la misma solución y monitorear la evolución de los procesos con la garantía de que las condiciones experimentales son idénticas en todos los puntos (concentración, temperatura, etc.)*. En resumen, en una medición de SPM se obtiene información equivalente a varias mediciones de SPR. La mayor desventaja de esta técnica es que la preparación de las muestras y el alineamiento del equipo son notablemente más complicados que en las técnicas anteriores. A diferencia de otras microscopías en las cuales la resolución está limitada por la longitud de onda, la SPM puede alcanzar resoluciones en espesor que van desde algunos ángstroms hasta cientos de nanómetros. La resolución lateral, es decir el tamaño de las mínimas estructuras visualizables, está determinada por la longitud de decaimiento de los plasmones superficiales, la cual depende de la parte imaginaria de la constante dieléctrica del metal utilizado. A mayor ε”, es decir mayores pérdidas, la longitud de decaimiento es menor y consecuentemente la resolución lateral es mayor. Por este motivo se prefiere usar Au para SPM, además de que el Au es químicamente más estable que cualquier otro metal. * Asumiendo que se expande el haz homogéneamente sobre toda el área de interés. 28 2.5– Microscopía de Fluorescencia por resonancia de plasmones superficiales (SPFM) Análogamente, si se trabaja con material fluorescente, pueden capturarse imágenes de la fluorescencia emitida. Un análisis de esas imágenes permite obtener las curvas fluorescencia emitida por distintos puntos del sustrato. La microscopía de fluorescencia por resonancia de plasmones tiene las mismas ventajas y desventajas que la SPM, y las mismas ventajas y limitaciones que la SPFS. Set-up experimental En la figura 2.9 se muestra el set-up experimental utilizado para SPM y SPFS. Presenta unas pocas modificaciones con respecto a un set-up de SPR o SPFS: - Se expande el haz incidente a través de un filtro espacial (objetivo + pinhole) - Mediante una lente convergente se obtiene un haz paralelo. - En lugar de un fotodiodo (en el caso de SPR) o un fotomultiplicador (en el caso de SPFS) se utiliza una cámara CCD con su objetivo, la cual produce una imagen que se visualiza en un monitor. Se utiliza una computadora personal para controlar y registrar la posición del goniómetro y para capturar las imágenes. Posteriormente se pueden analizar las imágenes adquiridas y cuantificar los contrastes en diferentes zonas de modo de obtener las curvas de reflectividad individuales. Cámara CCD Lente Objetivo Monitor PC Prisma Láser Polarizadores Lente θ Film metálico Recubrimiento Objetivo Filtro espacial Filtro Cámara CCD Figura 2.9: set-up experimental empleado para mediciones de SPM y SPFM 29 CAPÍTULO 3: HIBRIDIZACIÓN DE ADN 3.1 – Introducción Para comprender la posterior discusión acerca de los esquemas de detección de reacciones de hibridización, se necesita conocer las principales propiedades físicas y químicas de las moléculas de ADN. Con ese sentido, se tratan en el presente capítulo las características elementales de la estructura y la conformación del ADN, como así también las propiedades fundamentales que derivan de ellas. 3.2 – Ácido Desoxiribonucleico (ADN) El ácido desoxiribonucleico, ADN, es una biomolécula de importancia trascendental para las células vivas. Su función consiste en almacenar la información genética y transmitirla de generación en generación. Esta información se manifiesta cuando, en las condiciones adecuadas, es transcripta al ácido ribonucleico, ARN, para que éste último se encargue de transformarla en una secuencia de aminoácidos. Entonces, el ADN contiene en su secuencia toda la información necesaria para la síntesis de las proteínas necesarias para los seres vivientes. El ADN es un biopolímero compuesto por una secuencia de nucleótidos [19][20]. Estos monómeros están compuestos por tres partes (figura 3.1): - una base nitrogenada - un grupo trifosfato - un azúcar En el caso del ADN, el azúcar es la desoxiribosa y se encuentra en forma de anillo furanósido. La desoxiribosa está unida a una base nitrogenada a través de una unión βglicosídica en el Carbono 1’ y tiene un grupo trifosfato unido en el Carbonos 5’. Las bases pueden ser una purina: Adenina (A) o Guanina (G), o una pirimidina: Timina (T) o Citosina (C). Para dar la cadena de ADN, los nucleótidos se unen a través de una unión fosfodiéster, liberando un anión difosfato y un protón. Esta unión se forma a través de la reacción de un grupo trifosfato de un nucleótido (ubicado en el Carbono 5’ de la desoxiribosa) con el oxhidrilo de otro (ubicado en el C 3’). Estas uniones forman el esqueleto de las cadenas de ADN constituido por el azúcar y el fosfato. Dicha cadena no es simétrica y pueden entonces distinguirse los extremos, uno se denomina 3’ y el otro 5’. Así, un nuevo nucleótido siempre se adiciona en el extremo 3’ (figura 3.2). 30 Guanina Citosina Adenina Timina Figura 3.1: los cuatro nucleótidos que componen el ADN. Un nucleótido está compuesto por un grupo trifosfato (encerrado en rosa), un azúcar (ribosa en el caso de ADN; azul) y una base nitrogenada. En el ADN se encuentran presentes cuatro nucleótidos diferentes sólo distinguibles por sus bases: Guanina, Adenina, Citosina, Timina. Dos cadenas de ADN pueden unirse para formar una doble cadena (llamadas también dúplex). Esto se produce a través de uniones puente de Hidrógeno entre las bases. Los pares unidos no son cualesquiera sino que son Adenosina (A)-Timina (T) y Citosina (C)-Guanina (G) (Figura 3.3)[21]. Y esto da origen a la regla de Chargaff: en una doble cadena de ADN, la cantidad de Purinas (A y G) es igual a la cantidad de Pirimidinas (T y G)*. Para que una doble cadena se forme, es necesario que las secuencias de ambas cadenas sean lo suficientemente complementarias; esto quiere decir que las uniones puente de H formadas sean suficientes para estabilizar la nueva estructura. Por supuesto el dúplex más estable se produce cuando ambas cadenas son perfectamente complementarias. Sin embargo, dentro de ciertos límites, pueden formarse también dobles cadenas que no son perfectamente complementarias, y naturalmente estas últimas serán menos estables que las primeras. * Y a una regla nemotécnica para recordar los pares formado: Aníbal Troilo (AT) y Carlos Gardel (CG). 31 5´ 3´ Figura 3.2: estructura de la cadena de ADN. Obsérvese como se forman las uniones fosfo-diéster entre los nucleótidos que dan origen a la cadena de ADN. La conformación de las dobles cadenas fue dilucidada por Watson y Crick en 1953 [21] y tiene la forma de una doble hélice (figura 3.3). Esto se debe, además de a las uniones puente de H entre bases, a que los pares de bases son planos y tienden a apilarse unos sobre otros, tomando una conformación similar a la de una escalera caracol con los pares de bases en el lugar de los escalones. Se conocen diferentes formas de hélices de ADN, pero bajo condiciones fisiológicas la forma más común es la forma B. Esta forma es una hélice derecha de 2 nm de diámetro que completa un giro cada 10 pares de bases en una longitud de 3,4 nm (la distancia entre bases es de 0,34 nm; figura 3.3). 32 Esqueleto de azúcar Y fosfato Timina Adenina Citosina Guanina Uniones puente de H Figura 3.3: dúplex de ADN. A la izquierda se muestra la estructura de doble hélice que adopta el dúplex. A la derecha, un detalle de las uniones puente de H entre las bases complementarias (AT y CG). 3.3 – Hibridización y desnaturalización La reacción mediante la cual dos cadenas de ADN se unen para dar una doble cadena se denomina reacción de hibridización. La reacción inversa, es decir la separación de una doble cadena en dos cadenas individuales, se llama desnaturalización. En general, estas dos reacciones constituyen un equilibrio dinámico entre los estados de cadenas individuales en forma de ovillos estadísticos y las cadenas dobles en forma de hélice. La estabilidad de las dobles cadenas depende de varios factores, uno de ellos es la temperatura. Al proceso de desnaturalización por aumento de la temperatura se lo denomina melting*. Un parámetro que permite cuantificar la estabilidad de las cadenas dobles es la temperatura de desnaturalización (Tm, melting temperature), que es la temperatura a la cual el 50% de las cadenas dobles se separan. El proceso de melting o desnaturalización por temperatura de ADN puede monitorearse por espectroscopía UV mediante la absorción a 260nm. Las bases * La traducción de melting al castellano es fusión. En inglés utilizan este término debido a las similitudes de este proceso de denaturalización con el cambio de fase de sólido a líquido. Ambos procesos acontecen a una temperatura dada si la muestra es pura. Si la muestra es impura (en el caso de ADN, la muestra es impura cuando contiene más de una secuencia o cadenas de diferente longitud) el proceso sucede dentro de un rango de temperaturas. 33 del ADN absorben a esa longitud de onda pero al formar la doble cadena, por efectos del apilamiento, esta absorción se ve disminuida. Midiendo la absorción a 260nm en función de la temperatura se obtiene la curva de melting, a partir de la cual puede obtenerse la temperatura de melting. A una temperatura dada, la estabilidad de la doble cadena de ADN depende de: • Contenido de C+G: los pares de bases CG contienen tres uniones puente de H, mientras que las AT sólo tienen dos. Entonces a mayor contenido CG, más estable es el dúplex y mayor la Tm. • Longitud de la cadena: a mayor longitud de cadena, mayor es la Tm. Además la pendiente de la curva de melting es mayor, debido a una cooperación mejorada por el apilamiento. • Fuerza iónica: cuando la fuerza iónica del solvente es alta, se evita la repulsión entre los grupos fosfatos cargados negativamente. Esto estabiliza la doble cadena, subiendo la Tm. • pH: Las cadenas de ADN son polielectrolitos, con grupos básicos (las bases) y grupos ácidos (los fosfatos). La uniones puente de H se establecen entre las bases y, lógicamente, son estables dentro de ciertos límites de pH. • Complementariedad: la presencia de no-complementariedades (mismatches) desestabiliza la doble cadena, no sólo por la ausencia de uniones de H, sino también porque el apilamiento se ve distorsionado. El efecto desestabilizante disminuye a medida que aumenta la longitud de cadena. El último punto es muy importante porque permite, mediante la optimización de las otras condiciones, la detección de mutaciones simples o deleciones entre dos cadenas. Lo antes mencionado es la base de los métodos de detección que se explicarán en capítulos posteriores. Hairpin-loops Si la secuencia es la adecuada, una cadena simple de ADN puede formar un lazo (loop) a través de uniones puente de hidrógeno entre bases complementarias dentro de la misma secuencia. Para que el anillo o loop sea estable debe tener al menos cuatro bases. Entonces, siempre que se tenga una cadena simple de ADN que tenga dos fragmentos de su secuencia auto-complementarios, separados por al menos cuatro bases, puede cerrarse sobre sí misma para formar un hairpin-loop. 34 3.4 – Detección y secuenciado de ADN En los métodos de secuenciado convencionales, se trata a las muestras de ADN con agentes que producen una mezcla de fragmentos de cadena de diferentes longitudes y marcados radioactivamente. Los fragmentos son separados por electroforesis en gel y finalmente, del análisis de las bandas obtenidas en el gel puede deducirse la secuencia [22][23]. Los métodos actuales de este tipo pueden secuenciar cadenas de hasta 1000 pares de bases (pb, pares de bases) en algunas horas, lo cual es todavía lento para los requerimientos actuales. Además, estas técnicas son caras (varios dólares por pb) y requieren la utilización de materiales radioactivos y tóxicos. Por estas razones, en los últimos años, una variedad de métodos alternativos han sido (y siguen siendo) desarrollados. Como se dijo anteriormente, la mayoría de los esfuerzos se dirigen hoy en día hacia el desarrollo de esquemas de detección de ADN en superficies, porque esto permite la posterior fabricación de sensores y chips multispot para la detección automática. La mayoría de estos métodos consiste en la detección de las reacciones de hibridización entre un oligonucleótido inmovilizado en una superficie (catcher) y una cadena de ADN en solución (target). Como se ha explicado en la sección anterior, la estabilidad y consecuentemente la constante de afinidad de las reacciones de hibridización dependerá de la complementariedad de las cadenas. El objetivo de estos métodos es distinguir entre secuencias de oligonucleótidos perfectamente complementarias, y secuencias con un mismatch (MM1). Una vez desarrollados estos métodos, diseñando adecuadamente los catchers, pueden utilizarse para secuenciar cadenas completas de ADN mediante el método de secuenciado por hibridización (SBH) [24][25]. Además, en muchos casos (usualmente en aplicaciones farmacéuticas y biomédicas) no es necesario secuenciar una cadena completa de ADN sino que interesa detectar una mutación en un gen determinado. Entonces se pueden preparar sensores con la secuencia del gen defectuoso o examinar la existencia de diferentes mutaciones simples, y así obtener el resultado deseado rápidamente. Actualmente, una variedad de técnicas pueden ser utilizadas para la detección de reacciones de hibridización en superficies. Entre estas técnicas pueden destacarse la espectroscopía por resonancia de plasmones [29]-[37], espectroscopía por ondas evanescentes en fibras ópticas [38][37], microbalanza de cuarzo [27][28]. Otras técnicas involucran la utilización de muestras marcadas; entre ellas espectroscopía de fluorescencia por fibras ópticas [41], electroquímica luminiscente [40] y espectroscopía de fluorescencia por resonancia de plasmones [39]. La decisión se inclinará por un métodos u otro contrastando la alta sensibilidad que brindan las muestras fluorescentes con las ventajas de trabajar directamente con muestras no marcadas. 35 De estas técnicas, en este trabajo se emplearon la espectroscopía por resonancia de plasmones (SPR) y la espectroscopía de fluorescencia por resonancia de plasmones superficiales (SPFS). 36 CAPÍTULO 4: DETECCIÓN Y ESTUDIO DE REACCIONES SUPERFICIALES DE HIBRIDIZACIÓN 4.1 – Introducción Para detectar reacciones de hibridización sobre superficies y estudiar su cinética utilizando las técnicas de SPR y SPFS, se hacen necesarios dos elementos: una superficie sensora y un modelo cinético. En este capítulo se presentan las superficies sensoras y el modelo cinético empleados en los experimentos realizados en este trabajo. Es importante notar que utilizando a modo de ejemplo las arquitecturas de estas superficies sensoras, se explican todos los conceptos necesarios de tener en cuenta para el diseño de nuevas superficies sensoras. 4.2 – Superficies sensoras Las superficies sensoras deben tener las características apropiadas para que la detección sea específica y efectiva. Dichas características se consiguen a través de diferentes arquitecturas superficiales. En este caso, se denominan arquitecturas superficiales a las estructuras supramoleculares que se construyen en las superficies sensoras para inmovilizar a los oligonucleótidos que actuarán como catchers para la detección de una secuencia de ADN. Dichas estructuras supramoleculares deben adecuarse a las necesidades de las técnicas de detección. En el caso particular de las técnicas basadas en la resonancia de plasmones, hay dos variables de importancia vital para una óptima sensibilidad en la detección; estas son la densidad superficial de catchers y la distancia con respecto a la superficie a la que se ubican los mismos. Para ilustrar esto, a continuación se enseñan las dos arquitecturas superficiales que fueron empleadas para los experimentos que se exponen en el capítulo siguiente; una para la detección mediante espectroscopía por resonancia de plasmones superficiales (SPR) y otra para la detección mediante espectroscopía de fluorescencia por resonancia de plasmones superficiales (SPFS). 4.2.1 Film metálico Para empezar, toda técnica basada en la resonancia de plasmones superficiales necesita de la presencia de un film metálico, preferentemente de Au o Ag. La elección de estos metales se debe a varios factores. Primero, la Plata y el Oro tienen propiedades ópticas adecuadas. Esto quiere decir que, para un espesor razonable, la curva de reflectividad vs. ángulo de incidencia tiene las características apropiadas; o sea que el mínimo de SPR es suficientemente agudo y se 37 encuentra a un ángulo de incidencia que puede ser cómodamente detectado. El espesor óptimo es de alrededor de 50nm, tanto para al Au como para la Ag. En la figura 4.1 se Reflectividad muestran curvas de reflectividad teóricas para distintos espesores de Au (ε= -12,3 + i 1,29). 1,0 1,0 0,8 0,8 Film de Au (ε= -12,3 + i 1,29) 50nm 60nm 70nm 80nm 90nm 100nm 150nm 0,6 0,6 Film de Au (ε= -12,3 + i 1,29) 0nm 10nm 20nm 30nm 40nm 50nm 0,4 0,2 0,4 0,2 0,0 0,0 30 40 50 60 70 80 θ [°] 30 40 50 60 70 80 θ [°] Figura 4.1: reflectividad en función del ángulo de incidencia para un sistema compuesto por un prisma (ε =3,4039), un film de Au (ε = -12,3 + i 1,29) de diferentes espesores y agua (ε = 1,778). Las curvas de reflectividad Au y Ag se han comparado en capítulos anteriores. Se ha visto que la curva correspondiente a la Ag presenta un mínimo más agudo, lo cual es, en principio, favorable para mediciones cinéticas o microscópicas porque para un mismo corrimiento del mínimo, el cambio en la reflectividad es mayor. También se destacó la gran amplificación del campo superficial que se obtiene con films de Ag. Sin embargo, el uso de Au brinda mayor resolución lateral para la microscopía, ya que presenta una longitud de decaimiento menor (εAu>εAg). Además, con films de Au se obtiene una mayor sensibilidad; es decir, el corrimiento de θsp producido por una misma capa dieléctrica adsorbida, es mayor si se usa un film de Au. Por ejemplo, si se adsorbe una capa dieléctrica (ε= 2,25) de 5nm sobre un film de Au de 50nm, el mínimo de resonancia de plasmones se corre 1°; si se pretende obtener el mismo corrimiento usando un film de Ag (también de 50nm), la capa debe tener en cambio un espesor de 7nm. Otra característica importante es que ambos metales reaccionan fácilmente con los grupos tiol para dar uniones estables, razón por la cual son sustratos muy adecuados para la preparación de las monocapas auto-ensambladas necesarias para la preparación de las 38 superficies sensoras. Las monocapas auto-ensambladas (SAM*) son arreglos moleculares que se producen espontáneamente cuando se sumerge un sustrato en una solución de un surfactante activo [47]. En comparación con las películas de Langmuir-Blodgett las SAM son más estables y fáciles de preparar [49]. Las SAM más conocidas y estudiadas son las formadas por alcano-tioles sobre Au, ya que los planos (111) del Au y los grupos tiol (S-H) tienen una gran afinidad. Cuando se pone en contacto una superficie de Au con una solución de algún alcano-tiol, éstos se adsorben rápidamente y reaccionan a través de los átomos de S tratando de ocupar todos los sitios disponibles en la superficie. Esto deja a las cadenas hidrocarbonadas apuntando hacia la solución, las cuales, atraídas por fuerzas de Van der Waals, se acomodarán de forma compacta para formar la monocapa. Usando tioles con diferentes grupos funcionales en el extremo opuesto, pueden funcionalizarse superficies con distintas características; es más, las características de la superficie pueden cambiarse después de formada la SAM, mediante una reacción química posterior. Por último, el Au es mucho más estable frente a los solventes y soluciones utilizados más frecuentemente. Este factor es muchas veces el más importante al momento de decidir qué metal utilizar. Si se necesitan las características de la Ag pero con la estabilidad del Au, es posible utilizar un film mixto; por ejemplo de 40nm de Au y 5nm de Ag. En este trabajo, los films se prepararon por evaporación térmica en vacío (5.10-6 mbar) de Au o Ag (Balzers, 99,99%), a una velocidad aproximada de 0,1 nm/s, en una evaporadora Balzers BAE250 o Edwards FL400. Los films se evaporaron sobre sustratos de vidrio LaSFN9 previamente limpiados en ultrasonido en sucesivas etapas con detergente diluido (Hellmanex 2%), agua y etanol (puro). 4.2.2 Arquitecturas superficiales para SPR Para la detección de reacciones de hibridización mediante SPR, es conveniente que las reacciones ocurran cerca de la superficie metálica, ya que el campo óptico evanescente de los plasmones superficiales tiene mayor intensidad en esta zona y en consecuencia la sensibilidad es mayor. Por este motivo, se inmovilizan los oligonucleótidos catcher directamente sobre el film de Au mediante un proceso de auto-ensamblado. Para controlar la densidad superficial de catchers, se auto-ensambla una monocapa mixta, formada por los oligonucleótidos tiolados y otro tiol más pequeño que actúa como espaciador (figura 4.2). El tiol espaciador debe tener en el otro extremo un grupo funcional que brinde la menor adsorción no específica de ADN posible. En este trabajo se utilizó 1-mercapto-6-hexanol (MCH) como espaciador, es decir un tiolalcohol de 6 carbonos. Se eligió un tiol con un oxhidrilo terminal porque se conoce que la adsorción de ADN es despreciable. * Siglas de los términos en inglés: Self Assembled Monolayers 39 Los oligonucleótidos catcher empleados tienen un grupo tiol adosado a su extremo 5’, a continuación tienen una serie de bases que actúan como espaciador, y finalmente la secuencia específica. La densidad óptima de catchers queda determinada por un compromiso entre dos factores: 1) A mayor densidad de catchers, mayor es el cambio en la densidad óptica al producirse la hibridización. 2) A mayor densidad de catchers, la hibridización se ve dificultada por efectos estéricos; es decir, a las cadenas target les es más difícil encontrar una posición adecuada para acoplarse con el catcher. Vidrio Au Espaciador Catcher Target Figura 4.2: arquitectura superficial utilizada en las superficies sensoras para la detección de reacciones de hibridización mediante SPR. En los experimentos realizados en este trabajo, la monocapa se obtuvo poniendo en contacto la superficie metálica con una solución mixta compuesta por el catcher y el espaciador*. Diferentes relaciones entre catcher y espaciador dan como resultado distintas densidades superficiales de catcher. Vale aclarar que la relación entre los tioles en solución no se traslada directamente a la superficie, sino que la proporción de catchers en la superficie es notablemente menor. Esto se debe a que en la mayoría de los casos la velocidad de reacción del espaciador es mucho mayor que la del oligonucleótido. La relación óptima para la detección de oligonucleótidos de 30pb (15 de espaciador y 15 de secuencia específica) fue determinada en 90% catcher, 10% MCH [35]. * Otros autores realizan las monocapas autoensambladas (self assembled monolayers) en etapas. Esto es, primero se realiza una monocapa del espaciador, y luego se pone en contacto a la superficie con la solución del catcher para incluir los oligonucleótidos por susutición de moléculas de espaciador. La densidad de catcher en ese caso se controla variando los tiempos de exposición de la última etapa. 40 4.2.3– Arquitecturas superficiales para SPFS Para la detección mediante SPFS, el valor óptimo de la densidad superficial de catchers está determinado por el compromiso explicado en la sección anterior (vale el mismo razonamiento hecho para el caso de SPR). De todos modos, la densidad de catchers no es la variable crítica ya que la SPFS tiene una gran sensibilidad, sino que la variable más importante de optimizar es, en este caso, la distancia a la cual los cromóforos se ubican de la superficie metálica. Como se explicó en el capítulo 2, la distancia óptima es del orden de un radio de Förster, es decir unos 8 nm para la mayoría de los cromóforos moleculares dipolares. (1) (2) Vidrio Au Biotina Streptavidina Catcher Target con cromóforo Figura 4.3: arquitectura superficial empleada en las superficies sensoras para la detección de reacciones de hibridización mediante SPFS. Por lo tanto, en este caso no conviene usar catchers auto-ensamblados porque los cromóforos quedan muy cerca de la superficie. Lo más favorable es construir una estructura molecular que ubique a los catchers más lejos de la superficie metálica, a una distancia mayor que un radio de Förster. Un tipo de arquitectura superficial que cumple con estos requisitos se muestra en la figura 4.3 y fue la empleada en los mediciones realizadas en este trabajo. 41 Primero se expuso el film metálico a una solución compuesta por un tiol biotinizado (1) y un tiol más corto (2)* para obtener una monocapa auto-ensamblada mixta que (nuevamente el tiol corto actúa como espaciador). La relación entre ambos está optimizada para que las biotinas terminales conformen una matriz adecuada para la subsiguiente formación de una monocapa de streptavidina †. Esta monocapa expone a la solución otros sitios de interacción específicos para biotina, los cuales son ocupados por los oligonucleótidos biotinizados que actúan como catchers. La relación óptima de tioles fue determinada en un 10% de tioles biotinizados y 90% de tioles con OH terminales [7][45][46]. Con esta arquitectura, los cromóforos quedan a una distancia de separación de la superficie metálica de aproximadamente 15 nm‡. 4.3 – Modelo cinético Por último en este capítulo de trata el modelo cinético utilizado para el análisis de las reacciones de hibridización. Este es importante debido a que a partir de experimentos cinéticos pueden obtenerse las constantes cinéticas y, a parir de ellas, la constante de afinidad que permite diferenciar entre secuencias perfectamente complementarias y secuencias con diferencias (mismatches). El modelo cinético de Langmuir [47][48] fue creado para la adsorción sobre superficies de las moléculas de un gas y asume: 1) la adsorción sólo procede hasta la formación de una monocapa 2) la superficie está siempre en contacto con una presión constante de gas 3) todos los sitios de posible adsorción son equivalentes y la superficie es uniforme 4) la adsorción de una molécula es independiente de la ocupación de los sitios vecinos Se puede ver que, bajo ciertas condiciones, las suposiciones 1 a 4 tienen sus análogas para el caso de reacciones de hibridización en superficies. La condición 1 tiene su análoga en el hecho de que sólo pueden formarse cadenas dobles de ADN, lo que quiere decir que sólo una molécula de target puede ligarse a un catcher. La condición 2 es equivalente a requerir concentración constante de target sobre la superficie, lo cual es válido para concentraciones los suficientemente altas (mayores a 10-7 M) como para que los procesos de transporte sean * Ambos compuestos fueron sintetizados especialmente para este fin por Boeringer Manheim GmbH. La streptavidina es una proteína tetramérica (60000 g/mol aprox.) que fue aislada de la bacteria Streptamyces avidinii y es conocida por su capacidad de unir específicamente hasta 4 moléculas de d-biotina (vitamina H) con una extraordinariamente alta afinidad y con una constante de disociación excepcionalmente baja (koff = 10-15 M-1) [42][43]. Tiene una forma aproximadamente tetragonal; sus dimensiones pueden determinarse por dispersión de RX y son 4,2nm x 4,2nm x 5,6nm [44]. † ‡ El valor de 15nm fue estimado para un catcher con 15 bases de espaciador y 15 bases de secuencia de detección. El espesor de la monocapa de tioles es aprox. 1,6nm; el de la monocapa de streptavidina es de 4nm; y la longitud del catcher es aprox. 10nm. 42 despreciables. La condición 3 es imposible de cumplir estrictamente, pero sí se verifica estadísticamente. Por último, si la fuerza iónica de la solución no es muy baja* y la densidad de catchers no es muy alta, puede asumirse que se cumple la condición 4. Entonces se pueden escribir las ecuaciones del modelo de Langmuir adaptadas para las reacciones de hibridización en superficies: Hibridización (adsorción) Desnaturalización (desorción) dφ = k on ⋅ C ⋅ (1 − φ ) dt (1.a) dφ = k off ⋅ φ dt (1.b) Donde ϕ es la fracción de catchers hibridizados, C es la concentración del target en solución, kon y koff son las constantes cinéticas de hibridización y desnaturalización respectivamente. La velocidad global de la reacción es entonces: dφ = k on ⋅ C ⋅ (1 − φ) − k off ⋅ φ dt (2) Esta ecuación diferencial puede resolverse sin dificultad. Con condición inicial nula, la solución es: φ (t ) = [ k on ⋅ C −(k ⋅C + koff )⋅(t −t0 ) ⋅ 1 − e on k on ⋅ C + k off ] (3) En algunos casos se necesita modelar la cinética de un proceso que comienza con una fracción inicial de catchers hibridizados. Para eso se puede resolver la ecuación (3) con condición inicial ϕ(0)= ϕ0: φ (t ) = k on ⋅ C k on ⋅ C + φ 0 − k on ⋅ C + k off k on ⋅ C + k off −(kon ⋅C + koff )⋅(t −t0 ) ⋅e (4) En la figura 3.5 (a) se muestra una simulación de ϕ(t) para el proceso de adsorción y desorción (C=0), de acuerdo con la ecuación (5). Para encontrar la fracción de catchers hibridizados en el equilibrio (figura 5.3(b)), se toma el límite para tiempos infinitos en la ecuación (4), o se igualan las velocidades de hibridización y desnaturalización (1) y (2), y se obtiene: φ Eq = k on ⋅ C K ⋅C = k on ⋅ C + k off K ⋅C +1 (5) Donde K=kon / koff, es la constante de afinidad o de equilibrio. * Cuanto menor es la fuerza iónica de la solución, las repulsiones entre cadenas de oligonucleótidos se hacen más importantes. Esto se debe a que las cargas negativas de los fosfatos del esqueleto de las cadenas se ven más expuestas. 43 La ecuación (4) es la solución general y puede utilizarse para modelar los procesos de hibridización (adsorción), ya sean con condición inicial nula o no, y con el valor de concentración adecuado pueden también modelarse los procesos de desnaturalización (desorción). 1,0 Simulación Langmuir 4 -1 -1 kon= 10 M s 0,8 koff= 10 M -3 1,0 -1 -6 0,8 C = 10 M 0,6 Simulaciones Langmuir de Equilibrio ϕ ϕ 0,6 0,4 0,4 0,2 0,2 7 K= 10 6 K= 3*10 6 K= 10 0,0 0,0 0 500 1000 1500 2000 0 Tiempo [s] 2x10 -6 4x10 -6 6x10 -6 8x10 -6 1x10 -5 Concentración [M] Figura 4.5: A la izquierda, curvas simuladas con el modelo cinético de Langmuir para una 4 -1 - -3 -1 7 -1 concentración 1µM, constante de asociación kon = 10 M s y constante de disociación koff = 10 M . La parte correspondiente a la desorción se simuló con concentración nula (C=0). 6 6 A la derecha, isotermas de Langmuir simuladas con constantes de afinidad K = 10 , 3.10 y 10 M . 44 CAPÍTULO 5: ESQUEMAS DE DETECCIÓN Y DISCUSIÓN DE RESULTADOS 5.1 – Introducción Dado que el objetivo final de esta línea de investigación es la detección de secuencias de ADN a través del estudio de reacciones de hibridización en superficies sensoras, el primer paso para optimizar las condiciones de detección de cadenas dobles de ADN es la detección y estudio de reacciones de hibridización de cadenas simples de oligonucleótidos. En este capítulo se presentan algunos de los esquemas de detección que se emplearon para el estudio de reacciones superficiales de hibridización. Se describen los experimentos realizados con cada técnica, se discuten los resultados y se proponen experimentos que complementarían el trabajo aquí presentado. En todos los casos, a no ser que se aclare lo contrario, se trabajó con un set-up y una celda de flujo tal como se muestran en el capítulo 2, y los resultados expuestos son el promedio de por lo menos dos mediciones. Los filmes metálicos se evaporaron según se explica en el capítulo 4 y las arquitecturas superficiales fueron producidas in situ dentro de la celda de flujo y monitoreadas por SPR. La temperatura de trabajo fue de 21°C + 2°C. 5.2 – Detección mediante SPR La detección de reacciones de hibridización de oligonucleótidos mediante SPR ha sido estudiada en profundidad previamente [29]-[37]. En este caso se pretendió sin éxito detectar reacciones de hibridización de cadenas largas de ADN (4000 pb aproximadamente) mediante SPR, utilizando arquitecturas superficiales similares a las expuestas en el capítulo 4*. Esta serie de experimentos fue motivada por la necesidad de detectar muestras sin marcar y se pensó que la gran masa de las moléculas de la muestra sería suficiente para producir un cambio perceptible en las condiciones de resonancia de los plasmones cuando se hibridizaran sobre la superficie. Las muestras se obtuvieron por clonación, por lo cual estaban en forma de cadenas dobles. Naturalmente, el dúplex formado por el target y su cadena complementaria (4000 pb) es mucho más estable que el formado localmente entre la cadena target y el catcher (15 pb). Por esta razón, se necesita desnaturalizar las muestras previamente a la inyección en la celda de flujo para la hibridización en la superficie. En estos experimentos se desnaturalizaron las muestras térmicamente pero, por razones de tiempo, no pudo optimizarse el procedimiento ni verificarse que el mismo sea realmente efectivo (es decir que una fracción apreciable de la muestra * Dado el gran tamaño de los targets, se emplearon también menores densidades superficiales de catchers para evitar impedimentos estéricos en las reacciones de hibridización. 45 llegan a la celda de flujo en forma de cadenas simples). El último punto puede ser la causa principal del fracaso de los experimentos. Otra posible manera de sobrepasar este obstáculo es mediante el uso de catchers de PNA (Peptide Nucleic Acid). El PNA es un análogo sintético del ADN que tiene la particularidad de que puede formar un dúplex con ADN en condiciones de baja fuerza iónica. Esta característica permite diseñar experimentos en los cuales se desnaturaliza la muestra en condiciones de muy baja fuerza iónica, en donde el dúplex ADN-ADN es inestable, y luego se inyecta en la celda de flujo para exponer las cadenas simples de ADN a la superficie con catchers de PNA, para formar el dúplex ADN-PNA, que sí es estable en esas condiciones. Una vez más, por razones de falta de tiempo, estos experimentos no pudieron realizarse. 5.3 – Detección mediante SPFS La detección y estudio de reacciones de hibridización de oligonucleótidos, utilizando targets marcados ha sido desarrollada anteriormente [7][39] y se han realizado numerosos experimentos de detección y estudio de reacciones de hibridización [50]. Sin embargo más investigación es necesaria en esta dirección para optimizar la detección de ADN. Por otro lado, en este trabajo se desarrolló un novedoso esquema de detección que emplea catchers marcados. Este sistema aprovecha los cambios conformacionales que sufren las cadenas de ADN de los catchers al hibridizar. Con este método se pueden detectar muestras sin marcar con una sensibilidad notablemente mayor que la obtenible con SPR. A continuación se explican los dos esquemas de detección, se exponen resultados típicos de ambos y se comparan para resaltar las ventajas y limitaciones de cada uno. 5.3.1 – Target marcado Este es el esquema tradicional de SPFS. Se utiliza un film de Au de 47nm, evaporado sobre unos sustrato de vidrio LaSFN9, sobre el cual se prepara una nanoestructura como la que se expone en la sección 4.2.3. Las monocapas de tioles y de Streptavidina y los catchers se ensamblaron in situ dentro de la celda de flujo y su crecimiento fue monitoreado mediante mediciones cinéticas de SPR. Los resultados de nuestras mediciones se muestran en la figura 5.1. Todas las soluciones fueron preparadas en buffer PBS (10mM buffer de fosfato, 2,7mM KCl, 150 mM NaCl, pH=7,4). Los tioles fueron ensamblados a partir de una solución 500µM con una relación biotinizado:espaciador de 1:9, la Streptavidina se unió a la superficie funcionalizada a partir de una solución 0,5µM y los oligonucleótidos catcher a partir de una solución 5µM. 46 Después de la formación de cada monocapa se realizó una medición de barrido de SPR (figura 5.2), lo cual permite posteriormente, mediante el ajuste teórico de las curvas, obtener los valores de espesor efectivo. SA 0,42 3 Reflectividad 2 0,38 0,36 Tioles 1 0,34 Catchers 0,32 Espesor óptico efectivo (ε = 2,25) [nm] Figura 5.1: mediciones cinéticas de SPR 0,40 para el monitoreo de la formación de las nanoestructuras 20 30 40 50 60 70 la detección de los eventos de hibridización mediante SPFS. Se muestra el aumento en la reflectividad que produjo cada capa y el espesor óptico efectivo, asumiendo dieléctrica ε = 2,25. 0 10 para para todas las capas una constante 0,30 0 empleadas 80 90 Tiempo [min] 0,08 0,8 Reflectividad Reflectividad 0,07 0,6 0,4 0,06 0,05 0,2 0,04 0,0 45 50 55 60 65 56,0 θ [°] 56,5 57,0 57,5 58,0 58,5 θ [°] Figura 5.2: mediciones de barrido de SPR para cada etapa de la formación de la superficie sensora empleada en SPFS. Las curvas corresponden a: film de Au (anaranjado), tioles biotinizados y espaciador (violeta), streptavidina (rojo) y oligonucleótidos catcher (verde). A la derecha se detalla la zona de los mínimos y se puede observar el corrimiento sucesivo del mismo después de la formación de cada capa. 47 Cabe recordar que los valores de espesor se calculan asumiendo una constante dieléctrica. En nuestro caso el valor es ε=2,25, ya que este es el valor de constante dieléctrica aproximado de la mayoría de las monocapas formadas por moléculas orgánicas. Además, los espesores calculados no son los verdaderos sino que son espesores efectivos, debido a que mediante SPR sólo puede detectarse una densidad óptica que incluye, además del índice de refracción, a la densidad superficial. Esto significa que si el recubrimiento superficial no es completo, el espesor calculado será menor. Una vez preparada la superficie sensora, se inyecta en la celda de flujo la solución de oligonucleótidos target, y se registra la hibridización a través de una medición cinética de SPFS. Ajustando la curva obtenida con el modelo de Langmuir se obtienen las constantes cinéticas y de equilibrio. En general pueden realizarse dos experimentos distintos: cinéticos o de equilibrio. El primero consiste simplemente en inyectar la solución de targets de concentración conocida, esperar al equilibrio y finalmente bombear buffer a través de la celda de flujo (rinsing*), registrando todo el proceso mediante una medición cinética de SPFS. De esta manera se obtienen dos curvas, una a continuación de la otra, de las cuales pueden obtenerse los valores de kon y koff a través del modelo de Langmuir. Finalmente, a partir de las constantes cinéticas puede calcularse la constante de afinidad. Se han realizado previamente experimentos con esta metodología para targets de 15 pb [7]. Los materiales utilizados se muestran en el cuadro 5.1 y los resultados en la figura 5.3. Cómo puede verse, los comportamientos de las cadenas perfectamente complementarias (MM0), las cadenas con un mismatch (MM1) y con dos (MM2), son notablemente diferentes y pueden distinguirse fácilmente por simple observación y a través de las constantes de afinidad (K= kon/koff). Catcher Bio-5´ TTT TTT TTT TTT TTT TGT ACA TCA CAA CTA 3´ Target MM 0 Target MM 1 Target MM 2 3´ ACA TGT AGT GTT GAT 5´-Cy5 3´ ACA TGC AGT GTT GAT 5´-Cy5 3´ ACA TGC ACT GTT GAT 5´-Cy5 Cuadro 5.1: materiales utilizados en los experimentos cuyos resultados se exponen en la figura 5.3. Los mismatches están destacados en color en las secuencias de los targets. El catcher y los targets están modificados en sus extremos 5’ con una molécula de Biotina y una molécula del fluoróforo Cy5, respectivamente. * El término castellano de rinsing sería para este caso enjuagar. En este texto se utilizará el termino inglés siempre con el significado explicado arriba. 48 Figura 5.3: mediciones de 1,2x10 -5 koff= 2*10 s 1,0x10 K= 2,2*10 M 8,0x10 koff= 4,6*10 s 5 7 K= 1,8*10 M MM 0 MM 1 MM 2 Simulación Langmuir 5 4,0x10 5 2,0x10 MM2. -1 Las curvas experimentales -1 fueron MM2: 2 -1 -1 kon= 3,5*10 M s -4 koff= 5,2*10 s 5 K= 6,7*10 M 2000 4000 ajustadas con el modelo de Langmuir. -1 Las constantes cinéticas y -1 de afinidad obtenidas en 0,0 0 la 15 pb con MM0, MM1 y -4 6,0x10 estudiar hibridización en sistemas de -1 MM1: 3 -1 -1 kon= 8,1*10 M s 5 para cinética de reacciones de -1 9 6 Fluorescencia [cps] SPFS Constantes cinéticas MM0: 4 -1 -1 kon= 4,2*10 M s 6 6000 cada caso se exponen en la Tiempo [s] tabla de la derecha.[7] La otra metodología experimental consiste en realizar inyecciones sucesivas de soluciones de target de concentración cada vez mayor, esperando en cada caso al equilibrio. De esta manera se obtienen valores de equilibrio para cada concentración que pueden ajustarse con el modelo de Langmuir para obtener la constante de afinidad K. Este método es mucho más laborioso pero los valores de K obtenidos son más confiables ya que se obtienen en todo un rango de concentraciones. Se han realizado experimentos con este método con los materiales expuestos en el cuadro 5.1 [7]. En la figura 5.4 se muestra el resultado de una medición de equilibrio para el target de MM1; puede verse como el valor de K obtenido concuerda con el valor obtenido de la medición cinética. 1,5*106 6 1,2*10 1µM 8,0*10 Fluorescencia [cps] Fluorescencia [cps] 0,25µM 5 0,1µM 4,0*10 5 0,01µM 0,0 1,0*106 MM1 K=1,6*10-7 M-1 5 5,0*10 0,0 0 100 200 Tiempo [min] 300 0,0 0,2 0,4 0,6 0,8 1,0 Concentración [µM] Figura 5.4: a la izquierda, medición de SPFS para obtener los valores de fluorescencia de equilibrio para distintas concentraciones de target. A la derecha la isoterma de Langmuir obtenida; en la figura se muestra el valor de la constante de afinidad empleado para el ajuste de los puntos experimentales. 49 Cómo se explicó en el capítulo anterior, para que la fluorescencia sea proporcional a la cantidad de targets hibridizados, es necesario que la masa de los targets, al acercarse a la superficie, no modifique de manera importante las condiciones de excitación de plasmones superficiales. En estos experimentos este requerimiento se satisface, gracias a la baja densidad superficial de catchers empleada; esto puede verse en la figura 5.5, donde se muestran las curvas de reflectividad, prácticamente idénticas, antes y después de la hibridización de los targets. 0,05 Reflectividad Reflectividad 0,8 0,6 0,4 0,04 0,03 0,2 0,02 0,0 45 50 55 60 65 θ [°] 56,8 57,0 57,2 57,4 57,6 57,8 58,0 θ [°] Figura 5.5: barridos de SPR antes (verde) y después (rojo) de la hibridización. El corrimiento del mínimo es despreciable, lo que habilita a que se considere una relación lineal entre la señal de fluorescencia y el número de targets hibridizados. Una manera más productiva de realizar estos experimentos consiste en combinar las mediciones cinéticas con las de equilibrio; es decir, medir cuidadosamente las cinéticas de hibridización para cada concentración, para luego ajustarlas con el modelo de Langmuir y obtener los valores de kon y koff *. Así, con un solo experimento se puede obtener un valor de la constante de afinidad K a partir de las constantes cinéticas y otro a partir de los valores de equilibrio. Naturalmente, si ambos valores coinciden, el experimento es auto-consistente y el nivel de confianza de las mediciones es mayor. * Esto quiere decir que deben registrarse en su totalidad con una densidad de puntos aceptables. En la figura 5.4, se puede ver que la medición para 0,01µM no es completa sino que comenzó cuando el proceso de hibridización ya había se estaba desarrollando. Cuando se realizó ese experimento, el interés no era registrar la cinética sino encontrar el valor de euilibrio. 50 Catcher Bio-5´ TTT TTT TTT TTT TTT TGT ATC TCA GTT CTA 3´ Target MM 1 5´ACA TAG AGT AAA GAT 3´- Cy5 Cuadro 5.2: materiales utilizados en los experimentos cuyos resultados se exponen en la figura 5.6. El mismatch está destacado en color en la secuencia del target. El catcher y el target están modificados en su extremo 5’, con una molécula de biotina y del fluoróforo Cy5, respectivamente. Constantes cinéticas C = 0,05 µM 4 -1 -1 kon = 1*10 M s -4 -1 koff = 2*10 s 6 2,0x10 1µM 0,5µM Fluorescencia [cps] 6 1,6x10 C = 0,1 µM 3 -1 -1 kon = 9,4*10 M s -4 -1 koff = 1,8*10 s 0,25 µM 0,1 µM Rinsing 6 1,2x10 C = 0,25 µM 4 -1 -1 kon = 1*10 M s -1 koff = 2*10-4 s 5 8,0x10 C = 0,5µM 4 -1 -1 kon = 1*10 M s -4 -1 koff = 2*10 s 0,05 µM 5 4,0x10 C = 1µM 4 -1 -1 kon = 1*10 M s -4 -1 koff = 2*10 s 0,0 0 6000 12000 18000 24000 30000 36000 42000 Rinsing 3 -1 -1 kon = 9,4*10 M s -4 -1 koff = 1,8*10 s Fluorescencia [cps] Tiempo [s] 1,8x10 6 1,5x10 6 1,2x10 6 9,0x10 5 6,0x10 5 3,0x10 5 7 K= 5,1*10 M -1 0,0 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 Concentración [µM] Figura 5.6: medición de SPFS combinada. Se monitorea la cinética de hibridización hasta el equilibrio para diferentes concentraciones de target. Del ajuste cinético pueden obtenerse las constantes cinéticas y de los valores de equilibrio la constante de afinidad. Esto permite medir la constante de afinidad por dos métodos en un mismo experimento; los valores obtenidos se muestran junto a los gráficos. La curva de 0,05µM no puede ajustarse con el modelo de Langmuir debido a procesos de transporte que toman importancia a tan bajas concentraciones. 51 La figura 5.6 muestra una de nuestras medicines realizada para un sistema con 1 mismatch (MM1); los materales empleados se muestran en el cuadro 5.2. En el gráfico superior se muestra la medición cinética para varias concentraciones y las simulaciones según el modelo de Langmuir. Se puede ver que todas las etapas, a excepción de la correspondiente a 0,05µM, se ajustan aceptablemente con prácticamente los mismos valores de kon y koff . La curva experimental para 0,05µM no puede ajustarse con el modelo de Langmuir y las mismas constantes cinéticas; la hibridización sucede más lentamente que lo predicho por el modelo. Esto puede deberse a procesos de transporte que se hacen importantes que a tan bajas concentraciones. 5.3.2 – Catcher marcado Otro esquema de detección se basa en la dependencia con la distancia de la emisión fluorescente y utiliza un catcher modificado con un fluoróforo en su extremo libre [17]. En la figura 5.7 se muestran la arquitecturas superficiales utilizadas en estos casos. Au Au Vidrio Vidrio Figura 5.7: dos arquitecturas superficiales con catcher marcado empleadas para la detección de reacciones de hibridización mediante SPFS. Al producirse la hibridización, el fluoróforo se aleja de la superficie, ubicándose a una distancia mayor a un radio de Förster y la emisión de fluorescencia aumenta. A la izquierda se muestra la superficie sensora con un catcher sin hairpin-loop; y a la derecha con hairpin-loop. Se comprobó que la presencia del hairpin-loop favorece la diferenciación entre sistemas con diferente número de mismatches. Como se explicó en el capítulo 4, para obtener una emisión de fluorescencia óptima, los fluoróforos deben ubicarse a una distancia mayor que un radio de Förster. Una manera de comprobar esto experimentalmente es preparar una nanoestructura como la de la figura 5.7 y ponerla en contacto con soluciones de diferente fuerza iónica en condiciones de excitación de los fluoróforos. 52 Para el caso de catcher sin hairpin-loop, cuanto mayor es la fuerza iónica, mayor es el apantallamiento de las cargas negativas de los fosfatos del esqueleto de los catchers, y en consecuencia la molécula se puede retorcer para dar una conformación estadística. Contrariamente, si la fuerza iónica es menor, las cargas negativas quedan más expuestas, la repulsión entre los grupos fosfato es mayor y las cadenas son más rígidas. Esto hace que a mayores fuerzas iónicas los fluoróforos queden en promedio más cerca de la superficie y la emisión de fluorescencia sea menor. En la figura 5.8 se muestran resultados de mediciones barrido de SPFS para un catcher con la secuencia mostrada en el cuadro 5.2 (pero modificado con Cy5 en su extremo 3’), que muestran este efecto. Si se usa un catcher con hairpin-loop el efecto observado es el mismo pero en este caso se debe también a que las uniones puente de hidrógeno son inestables en condiciones de baja fuerza iónica y el loop se abre. Los resultados obtenidos para mediciones de SPFS son similares a los mostrados en la figura 5.8; por supuesto los valores exactos dependen del hairpin-loop formado. Hairpin-free Catcher 6 Fluorescence [cps] 2,0x10 0,005 M NaCl 0,025 M NaCl 0,05 M NaCl 0,1 M NaCl 0,25 M NaCl 0,5 M NaCl 1 M NaCl 6 1,5x10 6 1,0x10 Figura 5.8: mediciones de SPFS para fluorescente un catcher inmovilizado en contacto con soluciones de diferentes fuerza iónica. A menor fuerza iónica, el 5 5,0x10 fluoróforo se ubica más lejos de la superficie y la 0,0 emisión es mayor. 45 50 55 60 65 θ [°] Análogamente, una cadena simple es una estructura mucho más flexible que una doble hélice; entonces, a medida que los eventos de hibridización se producen, la fluorescencia aumenta de manera proporcional, debido a la mayor cantidad de fluoróforos ubicados a una distancia mayor que un radio de Förster. Este método es el más novedoso y tal vez más interesante porque aprovecha los efectos conformocionales del ADN para detectar los eventos de hibridización de muestras sin marcar. 53 Una aspecto de importancia en este caso es la foto-degradación (photo-bleaching) de los fluoróforos que produce una disminución de la señal de fluorescencia. En los experimentos realizados, se utilizó un obturador automático para bloquear el haz incidente en forma periódica y así disminuir el foto-bleaching. Además se disminuyó la intensidad del láser. Las dos operaciones están sujetas a una situación de equilibrio: el uso del obturador está limitado por la insuficiencia de datos y la intensidad del láser por la disminución de la relación señal/ruido. No obstante, si se aplican adecuadamente, ambas medidas son efectivas y como puede verse en la figura 5.9, se puede obtener una señal estable de fluorescencia por tiempos aceptables. En los experimentos de target fluorescente, el foto-degradación de los fluoróforos no es importante debido a que los targets con fluoróforos degradados pueden ser remplazados por otros desde la solución. En cambio, en este caso, los fluoróforos están inmovilizados y no hay Fluorescencia [cps] posibilidad de sustitución [17]. 3,0x10 6 2,5x10 6 Figura 5.9: emisión de fluorescencia de un catcher fluorescente inmovilizado. Si se 2,0x10 constantemente el foto- bleaching es importante para tiempo Sin obturador Con obturador 6 ilumina cortos. En cambio, si se utiliza un obturador, la señal de fluorescencia se mantiene 1,5x10 estable para tiempos razonables. [17] 6 10 20 30 40 Tiempo [min] En la figura 5.10 se muestran los resultados de nuestras mediciones cinéticas realizadas en sistemas con MM0 y con MM1, empleando catchers marcados. En el cuadro 5.2 se muestra la secuencia del catcher utilizado; este catcher no tiene la posibilidad de formar hairpin-loop (por esa razón las tablas adjuntadas a los gráficos se.titulan hairpin-free). Una vez más, los puntos son las mediciones experimentales y las líneas llenas son simulaciones según el modelo de Langmuir. Los sistemas con MM0 y MM1 pueden distinguirse a simple vista y a través de las constantes cinéticas y de afinidad, sin embargo la diferencia no es tan grande como en el caso de target fluorescente. Una manera de mejorar la sensibilidad de este método consiste en utilizar una catcher con de secuencia tal que se forme un hairpin-loop cuando este se encuentra desnaturalizado. De esta manera, más cromóforos estarán cerca de la superficie antes de la hibridización, con lo cual la capacidad de detección del método mejora. 54 6 2,4x10 MM1 Catcher marcado Hairpin-free 15-mer 6 Fluorescencia [cps] 2,2x10 Hibridización: 4 -1 -1 kon= 1,2*10 M s 6 2,0x10 -4 -1 koff= 1,0*10 s 8 6 -1 K= 1,2*10 M C= 1 µM 1,8x10 6 1,6x10 Rinsing: 4 -1 -1 kon= 1,2*10 M s 6 1,4x10 -4 -1 koff= 1,0*10 s 8 6 1,2x10 0 2000 4000 6000 8000 10000 -1 K= 1,2*10 M C= 7*10-3 µM Tiempo [s] 6 Fluorescencia [cps] 1,8x10 MM0 Catcher marcado Hairpin-free 15-mer 6 1,6x10 Hibridización: 4 -1 -1 kon= 7,5*10 M s 6 -4 1,4x10 -1 koff= 1,8*10 s 8 -1 K= 4,2*10 M C= 1E-6 M 6 1,2x10 Rinsing: 4 -1 -1 kon= 7,5*10 M s 6 1,0x10 -4 -1 koff= 1,7*10 s 8 5 8,0x10 0 2000 4000 6000 8000 -1 K= 4,4*10 M C= 3E-9 M Tiempo [s] Figura 5.10: mediciones cinéticas de SPFS con catcher marcado sin hairpin-loop para sistemas con MM0 y MM1. Los datos experimentales se ajustaron satisfactoriamente con el modelo de Langmuir. Las constantes cinéticas y de afinidad se exhiben en las tablas adjuntadas a los gráficos. También se realizaron experimentos con un catcher fluorescente cuya secuencia permite la formación de un hairpin-loop de 4 pb. Los materiales empleados se muestran en la cuadro 5.3 y las bases que forman el lazo se destacan en color. Catcher Bio-5´ TTT TTT TTT TTT TTT TGT ACA TCA CAA CTA 3´-Cy5 Target MM0 Target MM1 3´ ACA TGT AGT GTT GAT 5´ 3´ ACA TGC AGT GTT GAT 5´ Cuadro 5.3: materiales empleados para el estudio de reacciones de hibridización con catcher fluorescente con un hairpin-loop de 4 pb (las bases que forman el hairpin-loop están destacadas en color anaranjado). 55 En la figura 5.11 se muestran los resultados obtenidos en nuestras mediciones con los materiales del cuadro 5.3. En este caso la diferencia en la cinética y las constantes de afinidad entre los dúplex con MM0 y MM1 es mucho más notable. Si bien la sensibilidad sigue siendo menor que la obtenida para el caso de targets marcados, la mejora introducida por el hairpinloop del catcher es importante. Por razones de tiempo, no pudieron hacerse más experimentos en esta dirección pero sería importante realizarlos ya que esta técnica permite trabajar con muestras sin marcar, lo cual es una ventaja de gran importancia. Es importante resaltar para el diseño de futuros experimentos que aunque en este caso el hairpin-loop se formó con bases de la secuencia específica a detectar, esto no es necesario. La secuencia del espaciador puede diseñarse de modo tal de formar un hairpin-loop con las bases de la secuencia a detectar. Incluso pueden formarse hairpin-loops mas efectivos: puede optimizarse la cantidad de pb, y la posición para ubicar al cromóforo más cerca de la superficie. 5 Fluorescencia [cps] 1,1x10 MM1 Catcher marcado 4pb-hairpin 15-mer Hibridización: 3 kon= 9,3*10 5 1,0x10 koff= 2,0*10 -4 7 K= 4,6*10 4 9,0x10 Rinsing: 3 kon= 9,3*10 koff= 2,0*10 4 8,0x10 -4 7 K= 4,6*10 0 2000 4000 6000 Tiempo [s] Fluorescencia [cps] MM0 Catcher marcado 4pb-hairpin 15-mer 5 1,2x10 Hibridización: 4 -1 -1 kon= 8,4*10 M s koff= 1,5*10 -4 8 K= 5,6*10 M 5 1,0x10 Rinsing: 4 -1 -1 kon= 8,4*10 M s -4 koff= 1,4*10 s 8 K= 6,0*10 M 4 8,0x10 0 2000 4000 -1 -1 6000 Tiempo [s] Figura 5.11: mediciones cinéticas de SPFS con catcher fluorescente para sistemas con MM0 y MM1. En este caso el catcher puede formar un hairpin-loop de 4 pb. Los datos experimentales se ajustaron satisfactoriamente con el modelo de Langmuir. Las constantes cinéticas y de afinidad se exhiben en las tablas adjuntadas a los gráficos. 56 CAPÍTULO 6: RESUMEN Y CONCLUSIONES En este capítulo se resumen los conceptos más importantes de este trabajo. En primer lugar se estudiaron las técnicas basadas en la resonancia de plasmones superficiales. Se explicaron las características de las mismas con fundamentos teóricos y se analizaron ventajas y limitaciones de cada una. Como se expuso en las secciones de teoría, los plasmones superficiales son modos electromagnéticos que se propagan en interfases. Esto hace que todas las técnicas basadas en la resonancia de plasmones superficiales tengan la particularidad de ser específicas para interfases. Su campo de acción es de unos 200nm desde la interfase. La espectroscopía por resonancia de plasmones (SPR) ya se ha establecido como herramienta de caracterización de películas delgadas y estudio de procesos de adsorción sobre superficies. Tiene la gran ventaja de no requerir muestras fluorescentes ya que la señal es producida por la sola presencia de los analitos en las cercanías de la superficie y una notable sensibilidad: el mínimo espesor detectable está entre 0,1 y 0,2nm. Esta técnica tiene dos limitaciones importantes: 1- No pueden obtenerse espesor e índice de refracción de los analitos en forma independiente. Sólo se detecta un espesor óptico. 2- Baja sensibilidad cuando se quiere caracterizar película de baja densidad lateral o la adsorción de analitos de bajo peso molecular. La espectroscopía de fluorescencia por resonancia de plasmones (SPFS) es una técnica diferente. Consiste en excitar fluoróforos en las cercanías de una interfase con el campo electromagnético superficial de los plasmones. Con esta técnica pueden estudiarse capas superficiales muy diluidas lateralmente o la adsorción de analitos de peso molecular muy bajo (en este caso la masa no juega ningún papel). Debido a mecanismos de disipación de la fluorescencia, sólo pueden detectarse fluoróforos que se encuentren a más de un radio de Förster de la superficie; para los fluoróforos dipolares más usados esto significa unos 8nm. Finalmente, las microscopias por plasmones superficiales. Tanto la SPR como la SPFS pueden aplicarse en modo microscópico. Esto requiere un set-up más complejo y una preparación de las muestras mucho más laboriosa. Sin embargo estas técnicas tienen la gran ventaja poder trabajar con arreglos multi-spot, lo cual permite obtener una gran cantidad de información con un solo experimento bajo condiciones experimentales homogéneas. En segundo lugar se aplicaron algunas de estas técnicas a la detección de reacciones superficiales de hibridización. Cada técnica requiere de una superficie sensora que se adapte a sus características. Estas superficies sensoras se preparan mediante la construcción de nano-estructuras que permitan inmovilizar un oligonucleótido para que actúe como catcher. 57 Se realizaron experimentos con SPR sin obtener resultados satisfactorios. Sin embargo, se diseñaron experimentos que podrían conducir a buenos resultados. También se utilizó la técnica de SPFS en dos esquemas de detección: el tradicional de target fluorescente y un novedoso esquema de detección que emplea catchers marcados. Este último fue desarrollado parcialmente en este trabajo y aprovecha los efectos conformacionales del ADN y los mecanismos de disipación de los fluoróforos excitados para detectar los eventos de hibridización. En esta dirección se propusieron experimentos que permitirían optimizar esta nueva metodología. 58 APÉNDICE I: FUNDAMENTOS TEÓRICOS. I.1 – Introducción Gran parte de este trabajo se basa en la utilización de técnicas que involucran la excitación plasmones superficiales, y la interacción del campo eléctrico evanescente asociado, con películas delgadas dieléctricas. Por esta razón se necesita conocer la teoría de estos modos electromagnéticos para comprender la posterior discusión. En este capítulo se dan los fundamentos teóricos de la teoría del electromagnetismo que son necesarios para comprender el comportamiento y los modos de excitación de los plasmones superficiales. I.2 – Teoría electromagnética La descripción fundamental del electromagnetismo está representada por los vectores campo eléctrico E y campo magnético H Para describir el efecto de los campos electromagnéticos en la materia es necesario introducir un segundo conjunto de vectores: la densidad de corriente j, el desplazamiento eléctrico D y la inducción magnética B. Las derivadas espaciales y temporales de estos vectores están relacionadas por las ecuaciones de Maxwell, las cuales son válidas en todo punto para el cual las propiedades físicas de su entorno son continuas. Ecuaciones de Maxwell: ∇ ⋅ D = 4π ρ (1) ∇⋅B = 0 (2) ∇×E + ∇×H − 1 ∂B =0 c ∂t 1 ∂D 4 π = j c ∂t c (3) (4) En este caso se han escrito las ecuaciones de Maxwell en el sistema de unidades Gaussiano (CGS). La constante c relaciona las unidades eléctricas con las unidades magnéticas y es la velocidad de la luz en el vacío; ρ es la densidad volumétrica de carga. 59 Para determinar en forma única los vectores de campo bajo condiciones dadas de carga y corrientes eléctricas, las ecuaciones de Maxwell deben complementarse con ecuaciones que describan el comportamiento de las sustancias en presencia de los campos electromagnéticos. Éstas ecuaciones son las llamadas ecuaciones constitutivas o ecuaciones materiales. En general estas ecuaciones son complicadas pero si los cuerpos se encuentran en reposo (o se mueven lentamente) y si los materiales son isótropos, las ecuaciones materiales o constitutivas toman la siguiente forma: Ecuaciones Materiales o Constitutivas: j = σ ⋅E (5) D = ε ⋅E (6) B = µ ⋅H (7) Donde σ es la conductividad eléctrica, ε la constante dieléctrica y µ la permeabilidad magnética. Las ecuaciones de Maxwell relacionan los vectores de campo por medio de un sistema de ecuaciones diferenciales. Operando matemáticamente se pueden conseguir ecuaciones diferenciales que satisfacen los vectores eléctrico y magnético por separado. Para aquella parte del espacio que no contiene cargas ni corrientes y constituye un medio homogéneo; es decir ρ=0, j=0, ε y µ independientes de la posición. Sustituyendo la ecuación material (7) en la ecuación de Maxwell (3) y calculando el rotor en ambos miembros se obtiene: µ ∂H ∇ × (∇ × E ) + ∇ × =0 c ∂t (8) Reemplazando la ecuación material (6) en la ecuación de Maxwell (4) y derivando con respecto al tiempo: 2 ∂H ε ∂ E ε !! ∇× = E = 2 c ∂t c ∂t (9) Sustituyendo la ecuación (9) en la (8) se obtiene: ∇ × (∇ × E ) + εµ !! E=0 c2 (10) Ahora, haciendo uso de la identidad ∇ × (∇ × v ) = ∇∇ ⋅ v − ∇ 2 v y teniendo en cuenta que, dado que no hay cargas, ∇ ⋅ E = 0 , se obtiene de la ecuación (10) una típica ecuación de onda. Y de forma similar se obtiene la propia para el campo magnético H: 60 ∇ 2E − εµ !! E=0 c2 (11.a) ∇2H − εµ !! H=0 c2 (11.b) Estas ecuaciones sugieren la existencia de ondas electromagnéticas con una velocidad de propagación dada por: v= c εµ (12) Cabe aclarar que este concepto de velocidad de una onda electromagnética sólo tiene significado preciso cuando se trata de ondas relativamente simples, como por ejemplo ondas planas. Se puede ver claramente que (12) no representa la velocidad de propagación de cualquier solución de (11) si se tiene en cuenta que las ondas estacionarias son también solución de estas ecuaciones. Para las sustancias más comúnmente utilizadas, la constante dieléctrica es mayor que la unidad y la permeabilidad magnética es prácticamente igual a la unidad. Entonces, de acuerdo con (12), la velocidad v es casi siempre menor que la velocidad de la luz en el vacío c. I.3 – Condiciones de contorno Las ecuaciones de Maxwell fueron planteadas para regiones del espacio en las cuales las propiedades del medio (caracterizadas por ε y µ) son continuas. Sin embargo, muchas veces es necesario tratar con situaciones físicas en las cuales las propiedades del medio cambian abruptamente a través de una o más superficies. Es de esperar que también los vectores E, H, D y B cambien abruptamente a través de dichas superficies, mientras que ρ y j den lugar a las correspondientes cantidades superficiales. A continuación se derivan relaciones que describen la transición a través de una interfase. Para empezar es conveniente pensar a dicha superficie de discontinuidad, no como una superficie sino como una capa delgada dentro de la cual los valores de ε y µ varían continuamente desde los valores ε1, µ1 a un lado de la capa, hasta los valores ε2, µ2 del otro lado. Dentro de esta capa considérese un cilindro pequeño cuyo eje principal es normal a la interfase y cuyas bases tienen área δA; tal cual se muestra en la figura I.1. 61 n2 ε2 ; µ2 δA Figura I.1: interfase considerada como volumen de transición para δh las propiedades ópticas. ε1 ; µ1 n1 El vector de inducción magnética B y sus derivadas pueden entonces asumirse continuos a través de la capa de transición. En este caso podemos aplicar el teorema de Gauss a la integral de la divergencia de B en el volumen del cilindro: ∫ divB dV = ∫ B ⋅ n dS = 0 (13) La segunda integral se realiza sobre la superficie del cilindro, y n es la normal saliente. Debido a que se considera que las áreas son pequeñas puede suponerse que B es constante. Entonces, la integral de superficie (13) puede reemplazarse por: B1 ⋅ n1 δ A + B 2 ⋅ n 2 δ A + contibución de las paredes = 0 (14) En el límite para el espesor δh tendiendo a cero, la contribución de las paredes es despreciable, y en consecuencia: n ⋅ (B 2 − B1 ) = 0 (15)* La ecuación (15) impone la primer condición de borde: la componente normal de la inducción magnética es continua a través de una superficie de discontinuidad. El desplazamiento eléctrico se trata de manera similar pero se tiene que considerar un término adicional si hay cargas presentes. ∫ divD dV = ∫ D ⋅ n dS = 4 π ∫ ρ dV (16) Al tomar el límite para el espesor de la capa C tendiendo a cero, debemos pasar de la densidad volumétrica de carga ρ a la densidad superficial de carga ρ* definida por: lim ∫ ρ dV = ∫ ρ* dA (17) n ⋅ (D 2 − D1 ) = 4 πρ* (18) δh→0 Entonces: * Para escribir (14) se tuvo en cuenta que n1=-n2 62 La ecuación (18) impone una segunda condición de borde: en presencia de una superficie cargada con densidad superficial de carga ρ*, la componente normal del desplazamiento eléctrico cambia abruptamente a través de la superficie en un valor igual a 4πρ*. A continuación se examina el comportamiento de las componentes tangenciales. Considérese ahora un área rectangular perpendicular a la capa C como se muestra en la figura I.2. Sea b el vector unitario perpendicular al rectángulo. Entonces, aplicando el teorema de Stokes a la ecuación de Maxwell (3): 1 ∫ ∇ × E ⋅ b dS = ∫ E ⋅ dr = − c ∫ B! ⋅ b dS P2 ε2 ; µ2 ε1 ; µ1 P1 t2 n Q2 t t1 Q1 (19) Figura I.2: corte transversal de la interfase consierada como un b espacio de transición para las propiedades ópticas. La primera y tercera integral se realizan sobre el área del rectángulo y la segunda a lo largo del borde del rectángulo. Si la longitud P1Q1 o P2Q2 (δs) es suficientemente pequeña, puede aceptarse que el campo eléctrico toma valores constantes E1 y E2 a lo largo de los ! también se respectivos lados del rectángulo. De modo similar puede considerarse que B mantiene constante en dichos segmentos. Bajo estas condiciones, (19) puede escribirse como: 1 E1 ⋅ t1 δ s + E 2 ⋅ t 2 δ s + contribución de los extremos = − B! ⋅ b δs δh c (20) Tomando el límite para δh tendiendo a cero, asumiendo que E no tiene ninguna ! es finito, las contribuciones de los extremos P1P2 y Q1Q2 singularidad aguda y que B desaparecen: t ⋅ (E 2 − E1 ) = b ⋅ [n × (E 2 − E1 )] = 0 (21) La orientación del rectángulo es totalmente arbitraria, como así también la del vector unitario b. En consecuencia: n × (E 2 − E1 ) = 0 (22) 63 La ecuación (22) impone una tercera condición de contorno: la componente tangencial del vector eléctrico es continua a través de la interfase. Se puede hacer un análisis similar para el campo magnético. La única diferencia es que aparece un término adicional cuando existen corrientes eléctricas. En lugar de (20) se obtiene: 1! 4π H1 ⋅ t1 δ s + H 2 ⋅ t 2 δ s + contribución de los extremos = D ⋅ b δsδh + j * ⋅b δ s c c (23) El vector j* representa una densidad superficial de corriente definida de manera análoga a la densidad superficial de carga (17). Tomando límite cuando δh tiende a cero: n × (H 2 − H1 ) = 4π j* c (24) Finalmente la ecuación (24) impone una cuarta condición de borde: en presencia de una densidad superficial de corriente j*, el vector campo magnético sufre un cambio abrupto al atravesar una interfase; el valor de dicha discontinuidad es de 4π j * ×n . c I.4 – Ondas electromagnéticas En un medio homogéneo, en regiones libres de cargas y corrientes, los vectores eléctrico y magnético deben cumplir con las ecuaciones de onda (11). La solución más simple es la de un campo electromagnético correspondiente a una onda plana. A continuación se estudiará dicho caso. Sea r(x; y; z) el vector posición de un punto P en el espacio y s(sX; sy; sz) un vector unitario en la dirección de propagación de la onda. Cualquier solución de las ecuaciones de onda del tipo: E = E (r⋅s−vt ) (25.a) H = H (r⋅s−vt ) (25.b) se dice que representa una onda plana porque para cada instante t, E o H son constantes en el plano determinado por r ⋅ s = constante . Denotando con un punto la derivación con respecto al tiempo t, y con una prima la derivación con respecto a la variable u = r ⋅ s − vt , se puede escribir: ! = −vE′ E (∇ × E)x = ∂Ez ∂Ey − = E ′z s y − E ′y s z = (s × E′)x ∂y ∂z (26) (27) 64 Por supuesto pueden obtenerse ecuaciones análogas para el vector campo magnético H, y para las componentes y y z de los rotores correspondientes. Remplazando estas ecuaciones en las ecuaciones de Maxwell (3) y (4): s × E′ + µv H′ = 0 c (28.a) s × H′ + εv E′ = 0 c (28.b) Integrando las ecuaciones (28) con constantes de integración nulas (despreciando cualquier campo constante en el espacio), y considerando como antes v 1 se obtiene: = c εµ E=− µ s×H ε (29.a) H=− ε s×E µ (29.b) Si se realiza el producto escalar por s en las ecuaciones (29) da como resultado: E⋅s = H ⋅s = 0 (30) La relación (30) expresa la transversalidad de los vectores eléctrico y magnético; es decir que los vectores de campo yacen en planos perpendiculares a la dirección de propagación. Es más, de las ecuaciones (29) y (30) puede deducirse que E, H y s forman una terna derecha de vectores ortogonales, y que al mismo tiempo los módulos de los vectores de campo cumplen con la relación: µH= εE (31) Un caso particular de mucho interés es el de las ondas planas harmónicas en el tiempo; es decir cuando cada componente cartesiana de E y H tiene la forma: { a cos(τ + δ ) = Re ae −i (τ +δ ) } r ⋅s τ = ω t − = ωt − k ⋅ r v (32) (33) 65 I.5 – Polarización En las secciones anteriores se mostró cómo la teoría electromagnética de Maxwell predice la existencia de las ondas electromagnéticas, y pudo observarse que en dichas ondas los vectores eléctrico, magnético y la dirección de propagación constituyen una terna derecha. Esto quiere decir que si tomamos al eje Z paralelo a la dirección de propagación s, sólo las componentes X e Y de los vectores E y H serán no nulas. También es de interés conocer la curva descripta por la punta del vector E, a lo largo del tiempo en un punto dado del espacio. Esta curva es lo que se llama estado de polarización. No se desarrollarán las ecuaciones aquí porque lo más importante en este caso es el concepto geométrico*. En general, el vector E describirá una elipse en el plano XY y se dice que la luz está polarizada elípticamente. Lógicamente que esta elipse puede degenerarse en círculo o en una línea recta, en estos casos se dice que la polarización es circular o lineal respectivamente. Considérese una onda plana que incide sobre una superficie. El plano de incidencia es aquel definido por la dirección de propagación de la onda y la normal a la superficie. Si la onda está linealmente polarizada, existen dos casos extremos que son interesantes de destacar. a) El vector E es perpendicular al plano de incidencia, en cuyo caso la onda se denomina Transverse Electric (TE) b) El vector H es perpendicular al plano de incidencia, en cuyo caso la onda se denomina Transverse Magnetic (TM) Es importante notar que una onda polarizada en forma arbitraria puede descomponerse en dos ondas, una onda TE y una TM. Las ondas TE con también llamadas S-polarizadas; mientras que las TM también son denominadas como P-polarizadas. * Para el caso de una onda plana, puede deducirse el estado de polarización planteando las componente x e y de la onda según las ecuaciones (32) y (33) con amplitudes independientes para cada componente. Utilizando la identidad cos(τ+δ) = cosτ cosδ- sinτ sinδ, puede uno deshacerse de la parte variable que contiene τ, y obtener la curva así definida. En general, esa curva será una elipse rotada pero y como casos particulares pueden obtenerse tanto un círculo como un segmento de recta. 66 I.6 – Reflexión y refracción Cuando una onda electromagnética plana incide sobre la interfase de dos medios homogéneos de diferentes propiedades ópticas, ésta se separa en dos: una onda transmitida que penetra en el segundo medio, y otra onda que se refleja propagándose de nuevo en el primer medio. La existencia de las ondas reflejada y transmitida puede probarse mediante las condiciones de contorno impuestas por la interfase, ya que puede verse fácilmente que dichas condiciones no pueden satisfacerse sino se postula la existencia de ambas ondas. Una onda plana que se propaga en la dirección especificada por el vector unitario si *queda completamente definida cuando se conoce el comportamiento de un punto particular en el espacio. Por ejemplo si F(t) representa el comportamiento temporal de uno de los campos en un punto dado, el comportamiento temporal de otro punto cuya posición relativa al primer punto es r, está dada por F(t - r.s/v). En la interfase entre dos medios, la variación temporal de los campos secundarios debe ser la misma que aquella del campo primario. Entonces, si los vectores unitarios que denotan las direcciones de propagación de las ondas reflejada y transmitida son sr y st, al igualar los argumentos de las ondas en un punto r de la interfase: t− r ⋅ si r ⋅ sr r ⋅ st =t− =t− v1 v1 v2 (34) donde v1 y v2 son las velocidades de propagación en los medios. Para ser más explícitos, consideremos a partir de ahora una onda plana que se propaga en el plano xz, con la interfase en el plano z=0, entonces r = (x;y;0 ) y las igualdades (34) quedan: x s ix + y s iy v1 = x s rx + y s ry v1 = x s tx + y s ty v2 (35) Y como las igualdades (35) deben cumplirse para cualquier punto de la interfase, es decir cualquier valor de x e y: s ix s rx s tx = = v1 v1 v 2 s iy v1 = s ry v1 = s ty v2 (36.a) (36.b) El plano definido por si y la normal a la interfase se llama plano de incidencia; en nuestro caso el plano xz. Las relaciones (36) muestran que las tres ondas, la incidente, la reflejada y la * A partir de ahora se utilizaran los superíndices i, r y t para denotar las magnitudes correspondientes a las ondas incidente, reflejada y transmitida respectivamente. 67 transmitida yacen en el plano de incidencia. Denominando θi, θr y θt, a los ángulos que forman los vectores si, sr y st con el semieje z+ se pueden escribir las siguientes relaciones: s ix = sinθ i s iy = 0 s iz = cosθ i s rx = sinθ r s ry = 0 s rz = cosθ r s tx = sinθ t s ty = 0 s tz = cosθ t (37) Si se sustituye el conjunto de igualdades para las componentes x de (37) en (36): sin θ i sinθ r sinθ t = = v1 v1 v2 (38) Entonces, sin θ i = sin θ r , y debido a que la onda reflejada se propaga en el mismo semiplano que la onda incidente, cosθ i = cosθ r ; lo cual quiere decir que: θ r = 2π − θ i = − θ i (39) Esta ecuación junto con la afirmación de que la onda reflejada yace en el plano de incidencia constituye la Ley de Reflexión. También de las relaciones (38) puede verse que: sinθ i v1 = sinθ t v 2 (40) Recordando la ecuación (12) y definiendo al índice de refracción de un medio n como al cociente entre la velocidad de propagación en vacío y la velocidad de propagación en dicho medio: nk = ε o µo vk = c ε k µk sinθ i n1 ε 2µ2 = = = n12 ε 1 µ1 sinθ t n 2 (41) (42) La relación (42) junto con la afirmación de que la onda transmitida yace en el plano de incidencia constituye la Ley de Refracción. Se llama índice de refracción relativo al cociente entre los índices de refracción de ambos medios, n12 = n1 / n2 .En la figura 3 se muestran las direcciones de las ondas incidentes, reflejada y transmitida (o refractada). 68 Z Er// Ei⊥ Er⊥ Ei// θi θr Figura I.3: direcciones y sentidos de las ondas y campos eléctricos 1 (n1) incidente, reflejado y transmitido en X una interfase sobre el plano XY. θt 2 (n2>n1) Et⊥ Et// I.7 – Formulación de Fresnel En la sección anterior se presentaron las leyes de reflexión y refracción. Las mencionadas leyes indican las direcciones de las ondas electromagnéticas reflejadas y transmitidas, en función de la dirección de la onda incidente y de las propiedades ópticas de los medios involucrados. Sin embargo, hasta ahora no se ha tratado el tema de las amplitudes (y por ende de las intensidades) de los campos reflejados y transmitidos o refractados. Los cálculos de Fresnel que se muestran a continuación permiten calcular dichas amplitudes. Una vez más se asumirá que los dos medios son homogéneos e isótropos, y además que ambos tienen conductividad nula y consecuentemente son perfectamente transparentes (ε=ε´; ε´´=0)*. Entonces, su permeabilidad magnética será para los fines prácticos igual a la unidad (µ1= µ2= 1). Sea Ei la amplitud del campo eléctrico incidente. Ei es en un número complejo con su fase igual a la parte constante del argumento de la función de onda δ (ver ecuación (32)); la parte variable es: r ⋅ si τ i = ω t − v1 = ω t − x sin θ i + z cos θ i v1 (43) Descompondremos los vectores en dos componentes; una paralela al plano de incidencia, denotada con el subíndice // y otra perpendicular, denotada con el subíndice ⊥. En la figura 1 * La constante dieléctrica es en general un número complejo ε= ε´+ iε´´. La parte imaginaria ε´´ es la parte relacionada con las pérdidas por absorción. Cuando un material es perfectamente transparente, es decir no hay absorción de luz, ε´´=0. Estos cálculos de Fresnel se realizarán para materiales transparentes para facilitar la comprensión. De todos modos, más adelante se tratará el problema de la excitación de plasmones superficiales, para eso es necesaria la presencia de un film metálico, que por supuesto no es transparente. En ese caso se verá claramente el rol fundamental de la parte imaginaria de la constante dieléctrica. 69 pueden verse los sentidos positivos para dichas componentes. Las componentes cartesianas del campo eléctrico incidente son entonces: E ix = − E i // cosθ i e −i τi (44.a) E iy = E i ⊥ e −i τi (44.b) E iz = E i // sinθ i e −i τi (44.c) Las componentes del campo magnético pueden calcularse fácilmente mediante la ecuación (41) con µ =1: H = ε s×E H ix = − E i ⊥ cosθ i ε 1 e −i τi H iy = − E i // ε 1 e −i τi H iz = E i ⊥ sinθ i ε 1 e −i τi (45) (46.a) (46.b) (46.c) Teniendo en cuenta las leyes de la reflexión y de la refracción deducidas en la sección anterior, siguiendo un procedimiento análogo al recién presentado, pueden plantearse las componentes de los campos eléctricos y magnéticos reflejados y transmitidos. Las condiciones de contorno demandan la continuidad de las componentes tangenciales de los campos: E ix + E rx = E tx E iy + E ry = E ty (47.a) H ix + H rx = H tx H iy + H ry = H ty (47.b) Las condiciones (15) y (18) para las componentes normales de B y D se satisfacen automáticamente. Sustituyendo (47) en las componentes de los campos incidente, reflejado y refractado, y teniendo en cuenta que cos θ r = − cos θ i se obtienen las cuatro siguientes relaciones: 70 cos θ i (E i // − E r // ) = cos θ t E t // (48.a) E i⊥ + E r ⊥ = E t ⊥ (48.b) ε 1 cosθ i (E i ⊥ − E r ⊥ ) = ε 2 cosθ t E t ⊥ (48.c) ε 1 (E i // + E r // ) = ε 2 E t // (48.d) Se puede notar que el conjunto de ecuaciones (48) está compuesto por dos grupos de dos ecuaciones cada uno. Un grupo sólo contiene las componentes paralelas al plano de incidencia, mientras que el otro grupo contiene sólo las componentes perpendiculares al plano de incidencia. Entonces, estas dos clases de ondas son independientes. Haciendo uso de la relación n = ε (recordar que estamos considerando µ=0), se puede resolver el sistema (48) para las componentes reflejada y transmitida n términos de la onda incidente: E t // = 2n1 cosθ i E i // n2 cosθ i + n1 cosθ t (49.a) Et⊥ = 2n1 cosθ i E i⊥ n1 cosθ i + n2 cosθ t (49.b) E r // = n2 cosθ i − n1 cosθ t E i // n2 cosθ i + n1 cosθ t (49.c) E r⊥ = n1 cosθ i − n 2 cosθ t E i⊥ n1 cosθ i + n2 cosθ t (49.d) Las ecuaciones (49) son las llamadas fórmulas de Fresnel. Con ellas se pueden calcular luego la reflectividad y la transmitividad. Por supuesto que estos cálculos sencillos presentados aquí pueden extenderse a sistemas multicapas, e incluso sistemas que incluyan filmes de materiales conductores (es decir, no perfectamente transparentes; ε=ε´+iε´´) I.8 – Reflexión Interna Total Hasta aquí se ha excluido el caso para el cual la ley de refracción da como resultado un valor imaginario para el ángulo de refracción θ t. Esto sucede cuando la luz se propaga desde un medio ópticamente denso hacia otro menos denso; es decir: 71 n12 = ε 2µ2 n2 = <1 ε 1 µ1 n1 y su ángulo de incidencia es mayor que el ángulo crítico θc dado por: sin θ c = n12 . Cuando θi = θc, sinθt = 1, entonces θt = 90° y la luz reflejada emerge en una dirección tangente a la interfase. Si θi supera a θc, toda la luz incidente se refleja dentro del primer medio y se dice que se produce una reflexión interna total. Teniendo en cuenta que θt es un número complejo (sinθt >1) se puede escribir: sin θ t = sin θ i n12 cosθ t = ± i sin 2 θ i n12 2 (50.a) −1 (50.b) Reemplazando estas relaciones en las fórmulas de Fresnel se puede ver que para cada componente la intensidad de la luz totalmente reflejada es igual a la intensidad de la luz incidente: E r // = E i // E r ⊥ = E i⊥ (51) Sin embargo, el campo electromagnético en el segundo medio no desaparece, lo único que sucede es que no hay un flujo neto de energía a través de la interfase. Recordemos la parte variable del factor de fase escrito esta vez para la onda transmitida o refractada (ecuación (43) escrita para la onda transmitida): r ⋅ st τ t = ω t − v2 = ω t − x sinθ t + z cosθ t v2 (52) Reemplazando las ecuaciones (51) en el factor de fase, la ecuación de onda resulta: e −i τt = x sinθi −i t − nv2 e ω z sin 2θi " −1 n2 e v2 (53) La ecuación (53) muestra un aspecto muy importante del fenómeno de reflexión interna total, esto es que existe un campo electromagnético sobre el plano de incidencia que va más allá de la interfase. Dicho campo decae exponencialmente en amplitud a medida que penetra en el segundo medio*†. La longitud para la cual la amplitud decrece en 1/e es: * Obviamente solo el signo negativo delante de la raíz cuadrada se corresponde con la situación física. El signo positivo indicaría que la amplitud de la onda crecería infinitamente en forma exponencial a medida que penetra en el segundo medio. † La interacción de este campo electromagnético evanescente con el medio da origen a un número de técnicas de estudio conocidas como Attenuated Total Internal Reflection (ATR)[10] 72 v 2 sin 2 θ i l= − 1 ω n12 2 − 1 2 λ 2 sin 2 θ i = − 1 2 π n12 2 − 1 2 (54) En la figura 4 se muestra la reflectividad calculada, como así también la intensidad del campo evanescente en la interfase, en función del ángulo de incidencia. Para z=0, las ondas incidente y reflejada están totalmente en fase, lo cual da como resultado una interferencia constructiva y produce una amplificación del campo óptico en la interfase en un factor de 4 aproximadamente. 6 1,0 5 4 3 2 ES / Ein 2 0,6 0,4 2 0,2 1 0 Reflectividad 0,8 θ H2O 0,0 45 θc 50 55 60 θ [°] Figura 1.4: curvas calculadas de reflectividad e intensidad normalizada de campo eléctrico para reflexión interna total de un haz p-polarizado de λ =630nm, en un prisma de ε = 3.4 en contacto con H2O (ε = 1,778). 73 APÉNDICE II: MOVIMIENTO DE LOS ELECTRONES EN UN METAL SEGÚN LA TEORÍA DE DRUDE II.1 – Introducción El descubrimiento del electrón por J.J. Thomson en 1897 produjo un impacto inmediato en las teorías de la estructura de la materia y sugirió un mecanismo obvio para la conductividad de los metales. Tres años después del descubrimiento de Thomson, Drude construyó su teoría de la conducción eléctrica y térmica aplicando la exitosa teoría cinética de los gases a los metales, considerándolos como un gas de electrones. La teoría de Drude [51] supone a los electrones inmersos en un potencial uniforme positivo impuesto por los iones inmóviles en la red cristalina. Se considera que sólo durante las colisiones (con los iones o, en mucho menor medida, con otro electrón) actúan fuerzas sobre los electrones y la duración de las colisiones es despreciable. II.2 – Ecuación de movimiento de los electrones Se trata a continuación el movimiento de los electrones debido a una fuerza (eléctrica o magnética) uniforme dentro del marco del modelo de Drude. Un electrón tomado al azar en el instante t, sufrirá una colisión en el instante t+dt con una probabilidad dt/τ, (τ es el tiempo de relajación) y, contrariamente, pasará un tiempo dt sin sufrir ninguna colisión con probabilidad 1-dt/τ. Si no experimenta ninguna colisión evolucionará bajo la acción de la fuerza uniforme que actúa sobre él (debida al campo eléctrico y/o magnético espacialmente uniforme) y adquirirá una cantidad de movimiento extra f(t)dt + O(dt)2. Sea p(t) la cantidad de movimiento por electrón en el instante t, la contribución a la cantidad de movimiento por electrón de todos los electrones que no colisionan entre t y t+dt es el producto entre la fracción (1-dt/τ) y la cantidad e movimiento promedio [p(t) + f(t)dt + O(dt)2] de dichos electrones. Entonces, si se desprecia la contribución a p(t+dt) de los electrones que sí sufren una colisión entre t y t+dt, se obtiene: ( dt p (t + dt ) = 1 − p (t ) + f (t ) dt + O ( dt ) 2 τ ) dt p (t + dt ) = p (t ) − p (t ) + f (t ) dt + O ( dt ) 2 τ (1a) (1b) La corrección de la ecuación 1 debida a los electrones que sufren una colisión es de segundo orden en dt. Para ver esto nótese primero que esos electrones constituyen una fracción dt/τ 74 del total. Además, como la velocidad (y la cantidad de movimiento) toma una dirección aleatoria después de cada colisión, cada uno de estos electrones contribuirá al promedio de la cantidad de movimiento p(t+dt) sólo lo que haya adquirido a través de la acción de la fuerza f desde la última colisión. Esa cantidad de movimiento debe adquirirla en un tiempo no mayor a dt, y es entonces del orden de f(t)dt. Así, la corrección es del orden de (dt/τ)f(t)dt y no afecta a los términos lineales en dt. Entonces, se puede escribir: dt p (t + dt ) − p (t ) = − p (t ) + f (t ) dt + O ( dt ) 2 τ (2) Donde la contribución de todos los electrones ha sido tenida en cuenta. Dividiendo por dt y tomando el límite cuando dt tiende a cero, se obtiene: dp (t ) dt =− p (t ) τ + f (t ) (3) Esta es la ecuación de movimiento de los electrones impulsados por una fuerza uniforme según el modelo de Drude. Lo que esta ecuación establece es que el hecho de que los electrones colisionen con los iones introduce un término de amortiguamiento en la ecuación de movimiento. 75 AGRADECIMIENTOS Quiero dedicar este espacio para agradecer a la gente que me ayudó a concretar este trabajo de seminario. En primer lugar quiero agradecer al Prof. Dr. Wolfgang Knoll por haberme dado brindado el apoyo académico y económico (gracias a la beca de la Max Plank Gesselschaft que me otorgó) que hicieron posible este trabajo. Y lo más importante, gracias por haberme hecho sentir tan cómodo a gusto trabajando bajo su dirección durante m estadía. Al Dr. Thomas Neumann por haber dedicado tanto tiempo a enseñarme y a divertirme. Joder! A Ana Peré Vignau por todo. A mi familia. A Danfeng Yao por su apoyo para llevar a cabo los experimentos. A la Dr. Lisa “Albareda” Henke por su gran ayuda dentro y fuera de instituto. A la Dra. Ana María Llois por su guía y su supervisión y sobre todo por su apoyo incondicional, que fueron fundamentales para la concreción de este trabajo. A Andreas Scheller por su paciencia con los problemas que nos trae el bueno de Bill. A Gleb Yakubov por las divertidas y valiosas conversaciones. Ya te voy a mandar el mate! A todos los Knollies A mis compañeros del IT. Al personal del MPIP y del IT. 76 REFERENCIAS [1] Raether, H.. Surface Plasmon on Smooth and Rough Surfaces and on Gratings. Springer, Berlin (1988). [2] Agranovich, V. M. Surface Polaritons. North Holland, Amsterdam (1982) [3] Yeh, P. Optical Waves in Layered Media. John Wiley & Sons, New York (1988) [4] Otto, A.. Excitation of nonradiative surface plasmon waves in silver by the method of frustrated total reflection. Zritschrift für Physik 216, 398-410 (1968) [5] Kretschmann, E. Die Bestimmung optischer Konstanten von Metallen durch Anregung von Oberflächenplasmaschwingungen. Zeitschrift für Physik 241, 313-324 (1971) [6] Karthe, W. & Müller, R. Integrierte Optik. Akademische Verlagsgesellschaft Geest und Portig, Leipzig (1991) [7] Liebermann, T. Oberflächenplasmonen-Fluoreszenzspektroskopie zur Detektion molekularer Erkennungsreaktionen. Dissertation, University Mainz, Germany (1998) [8] Liebermann, T. & Knoll, W. Surface-plasmon field-enhanced fluorescence spectroscopy. Colloids and Surfaces a-Physicochemical and Engineering Aspects 171, 115-130 (2000) [9] Knoll, W. Interfaces and thin films as seen by bound electromagnetic waves. Annual Review of Physical Chemistry 49, 569-638 (1998) [10] Axelrod, D., Burghardt, T. P. & Thompson, N. L. Biophys. Bioeng. 13, 247-268 (1984) [11] Förster, T. Intermolecular energy migration and fluorescence. Ann. Phys 2, 55-75 (1948) [12] Pockrand, I., Brilliante, a. & Mobius, d. Chem. Phys. Lett. 69, 499 (1980) [13] Eagen, C. F., Weber, W. H., McCarthy, S. L. & Terhune, R. W. Time-dependent decay of surface plasmon coupled molecular fluorescence. Chemical Physical Letters 75, 274-277 (1980) [14] Hickel, W., Kamp, D. & Knoll, W. Nature 339, 186 (1989) [15] Rothenhäusler, B. & Knoll, W. Surface-plasmon microscopy. Nature 332, 615-617 (1988) [16] Rothenhäusler, B. & Knoll, W. Opt. Soc. Am. B 5, 1401 (1988) [17] Neumann, T. Strategies for detecting DNA hybridizaction using surface plasmon fluorescence spectroscopy. Dissertation, University Mainz, Germany (2001) [18] Cooper, D. N. & Schmidtke, J. Diagnosis of human genetic diseases using recombinant DNA. Human Genetic 92, 211-236 (1993) [19] Adams, R. L. P., Knowler, J. T. & Leader, D. The Biochemistry of Nucleic Acids (Chapman & Hall, London, 1992) [20] Saenger, W. Principles of Nucleic Acid Streucture (ed. Cantor, C.) (Springer, New York, 1983) 77 [21] Watson, J. D. & Crick, F. H. C. A structure for deoxyribose nucleic acid. Nature 171, 737-738 (1953) [22] Sanger, F., Nicklen, S. & Coulson, A. R. Proc. Natl. Acd. Sci. U.S.A 74, 5463-5467 (1977) [23] Maxam, A. & Gilbert, W. Proc. Natl. Acd. Sci. U.S.A 74, 560-564 (1977) [24] Bains, S. & Smith, C. G. A novel method for nucleic acid sequence determination. J. Theor. Biol 135, 303-307 (1988) [25] Drmanac, R. & et.al. DNA sequence determination by hybridization: a strategy for efficient large scale sequencing. Science 260, 1649-1652 (1994) [26] Ebersole, R. C., Miller, J. A., Moran, J. R. & WArd, M. D. J. Am. Chem. Soc. 112, 3239 (1990) [27] Okahata, Y. et al. Anal. Chem. 70, 1288-1296 (1998) [28] Nilsson, P., Persson, B., Uhlen, M. & Nygren, P. A. Real-time monitoring of DNA manipulations using biosensor technology. Analytical Biochemistry 224, 400-8 (1995) [29] Gotoh, M., Hasegawa, Y., Shinohara, Y., Shimizu, M. & Tosu, M. A new approach to determine the effect of mismatches on kinetic parameters in DNA hybridization using an optical biosensor. DNA Research 2, 285-93 (1995) [30] Herne, T. M. & Tarlov, M. J. Characterization of DNA probes immobilized on gold surfaces. Journal of the American Chemical Society 119, 8916-8920 (1997) [31] Knoll, W. et al. Streptavidin arrays as supramolecular architectures in surface- plasmon optical sensor formats. Colloids and Surfaces a-Physicochemical and Engineering Aspects 161, 115-137 (2000) [32] Piscevic, D. et al. Appl. Surf. Sci 90, 425-436 (1995) [33] Kai, E. et al. Detection of PCR Products in Solution Using Surface Plasmon Resonance. Anal. Chem. 71, 796-800 (1999) [34] Nilsson, P., Persson, B., Larsson, A., Uhlen, M. & Nygen, P. Detection of Mutations in PCR Products from Clinical Samples by Surface Plasmon Resonance. Journal of Molecular Recognition 10, 10-17 (1997) [35] Zizlsperger, M. Dissertation, University of Mainz, Germany (1998) [36] Bianchi, N. et al. Biosensor technology and surface plasmon resonance for real-time detection of HIV-1 genomic sequences amplified by polymerase chain reaction. Clin. Diag. Virol. 8, 199208 (1997) [37] Bier, F. & Scheller, F. W. Biosens. Bioelectron. 11, 669-675 (1996) [38] Graham, C. R., Leslie, D. & Squirell, D. Biosens. Bioelectron. 7, 487-493 (1996) 78 [39] Liebermann, T., Knoll, W., Sluka, P. & Herrmann, R. Complement hybridization from solution to surface-attached probe-oligonucleotides observed by surface-plasmon-fieldenhanced fluorescence spectroscopy. Colloids and Surfaces a-Physicochemical and Engineering Aspects 169, 337-350 (2000) [40] Mikkelsen, S. R. Electroanalysis 8, 15-17 (1996) [41] Pinno, P. A. E., Krull, U. J., Hudson, R. H. E., Damha, M. & Cohen, H. Anal. chem. 67, 26352643 (1995) [42] Weber, P. C., Ohlendorf, D. H., Wendoloski, J. J. & Salemme, F. R. Structural origin of High Affinity Biotin Binding to Streptavidin. Science 243, 85-88 (1989) [43] Chilkoti, A. & Stayton, P. S. Molecular-origons of the slow Streptavidin-Biorin Dissocaition Kinetics. J. Am. Chem. Soc. 117, 10622-10628 (1995) [44] Ebersole, R. C., Miller, J. A., Moran, J. R. & Ward, M. d. Spontaneously formed functionally active svidin monolayers on metal surfaces: A strategy for immobilising biological reagents and design of piezoelectric biosensors. J. Am. Chem. Soc. 112, 3239 (1990) [45] Spinke, J. Dissertation, University Mainz, Germany (1992) [46] Piscevic, D. Dissertation University Mainz, Germany (1995) [47] Ulman, A. An Introduction to Ultrathin Organic Films (Academic Press, London, 1991) [48] Atkins, P. W. Physical Chemistry. Oxford University Press (1978) [49] Bain, C. D. & Witesides, G. M. Modelling organic surfaces with self assembled monolayers. Adv. Mater. 4, 110 (1989) [50] Kambhampati, D. Dissertation. University of Mainz, Germany (2001) [51] Ashcroft N. W., Mermin N. D. Solid state physics. 79