Download Generación de imágenes digitales

Document related concepts
no text concepts found
Transcript
Análisis de
imágenes
digitales
FUNDAMENTOS DE LA IMAGEN DIGITAL
Generación de imágenes digitales
FUENTES DE ENERGÍA
•
Básicamente existen dos fuentes de energía para la generación de imágenes:
electromagnética y acústica.
103
10-2
10-5
10-6
10-8
10-10
10-12
Ondas de radio
Microondas
Infrarrojo
Luz visible
Ultravioleta
Rayos-X
Rayos-γ
Infrasonido
0
101
Sonido
102
103
Ultrasonido
104
105
106
Hipersonido
107
2
λ (m)
108
109
1010
Hz
FUENTES DE ENERGÍA
Tipo de energía: ondas de radio y microondas
Ondas del mismo cuerpo celeste llegan a todos los radio
telescopios y se combinan para formar una sola imagen
Técnica: interferometría
Aplicación: estudio de cuerpos celestes
Detector: radio telescopio (VLA, very large array)
Arreglo interferométrico
La inteferometría aumenta
la resolución mediante el
proceso de síntesis de
apertura
Galaxia elíptica M87
3
FUENTES DE ENERGÍA
PET
Tipo de energía: rayos-X, rayos-γ
Técnica: tomografía computada (CT),
tomografía por emisión de positrones
(PET)
Aplicación: estudio anatómico y fisiológico
del cuerpo humano
Detector: intensificador, centellador
Sistema PET-CT
4
CT
Combinación
FUENTES DE ENERGÍA
Técnica pulso-eco
transductor
Tipo de energía: acústica (ultrasonido)
Técnica: pulso-eco
Aplicación: imágenes anatómicas, detección
de fallas en materiales, sonar marino
eco
Detector: transductor piezoeléctrico
pulso
Obstetricia
5
Ecocardiograma
ADQUISICIÓN DE IMÁGENES
λ (m)
103
10-2
10-5
10-6
10-8
10-10
10-12
Ondas de radio
Microondas
Infrarrojo
Luz visible
Ultravioleta
Rayos-X
Rayos-γ
Energía
Dispositivo físico sensible
Señal eléctrica proporcional
a la energía recibida
Digitalizador
Señal digitalizada o
discretizada
6
ADQUISICIÓN DE IMÁGENES
•
Adquisición mediante un sensor CCD
(dispositivo de carga acoplada).
•
Es un chip que contiene un arreglo de células
fotovoltaicas que convierten la luz recibida en
corriente eléctrica.
•
El número de electrones generados es
proporcional a la cantidad de luz recibida.
•
Un sensor CCD con una matriz de 2048×1536
se dice que tiene 3.1 megapíxeles (3,145,728).
7
Filtro RGB
Lente
Píxel
Sensor CCD
ADQUISICIÓN DE IMÁGENES
•
La digitalización o conversión analógica-digital (A/D) consiste en muestrear de
forma periódica la amplitud de una señal, redondear sus valores a un conjunto
de niveles preestablecidos de amplitud y registrarlos como números binarios
en memoria.
•
Tres procesos básicos:
Voltaje
Muestreador
La señal analógica entra
al convertidor A/D
Cuantificador
Codificador
Primer
valor
Último
valor
Intervalo
La señal analógica es
muestreada a
intervalos regulares
La señal muestreada es
convertida a números
binarios
8
La señal binarizada es
almacenada
DEFINICIÓN DE IMAGEN DIGITAL
•
Una imagen adquirida es digitalizada tanto espacialmente como en amplitud (brillo).
•
Por tanto, una imagen digital es una función 2D de intensidad f(x,y), donde x e y son
coordenadas espaciales y el valor de f en un punto (x,y) es proporcional al brillo de
la imagen en ese punto:
⎡ f (0, 0)
f (0, 2)
⎢
f (1, 0)
f (1,1)
f (x,y) = ⎢⎢
"
"
⎢
⎢⎣ f (N − 1, 0) f (N − 1,1)
•
•
⎤
⎥
!
f (1,M − 1) ⎥
⎥
#
"
⎥
! f (N − 1,M − 1) ⎥⎦
!
f (0,M − 1)
0
50
100
Cada elemento de la imagen se denomina
píxel (picture element).
La imágen digital tiene un tamaño definido
con M×N píxeles y posee G niveles de
intensidad con valores en potencias
enteras de 2.
9
150
200
255
M −1
0
50
100
150
200
255
N −1
Píxel
DEFINICIÓN DE IMAGEN DIGITAL
1.Componentes de iluminación i(x,y): cantidad
de luz incidente procedente de la fuente sobre
la escena.
9,000 cd/ft2
i(x,y)
La
naturaleza básica de f(x,y) puede estar
caracterizada por:
2.Componentes de reflectancia r(x,y): cantidad
de luz reflejada por las características de los
objetos.
f (x,y) = i(x,y) ⋅ r(x,y)
donde: 0 < i(x,y) < ∞ y 0 < r(x,y) < 1
1,000 cd/ft2
0.01 cd/ft2
r(x,y)
•
Terciopelo
0.01
Metal pulido
0.65
0.90
10
Nieve
DEFINICIÓN DE IMAGEN DIGITAL
•
Al valor de una imagen monocromática f en las coordenadas (x,y) se le
denomina nivel de intensidad o nivel de gris:
Gmin ≤ f (x,y) ≤ Gmax
donde el intervalo [Gmin, Gmax] es el rango dinámico de niveles de intensidad.
•
En la práctica, la escala de grises se encuentra en el intervalo [0, Gmax], donde
“0” es el negro y “Gmax” es el blanco.
•
Todos los valores entre el negro y el blanco son los tonos de gris.
Gmin
Gmax
11
DEFINICIÓN DE IMAGEN DIGITAL
•
Entonces, una imagen digital en escala de grises es una matriz M×N donde a
cada punto (x,y) le corresponde un valor entre [0, G]:
50
51
52
53
54
55
280
0
0
7
47
115
145
281
0
0
5
43
114
145
282
0
0
3
38
112
145
283
0
0
2
36
110
147
284
0
0
2
34
107
149
285
0
0
2
32
103
150
12
DEFINICIÓN DE IMAGEN DIGITAL
• La
resolución de una imagen, grado de detalle discernible, depende
del muestreo (tamaño de la imagen) y la cuantificación (número de
niveles de intensidad).
• Cuanto
más se incrementa la resolución más se aproxima la imagen
digital a la escena original. En consecuencia, el espacio de
almacenamiento y el tiempo procesamiento serán mayores.
• Determinar
si una imagen es “de buena calidad” depende de la
aplicación que se le quiera dar.
13
DEFINICIÓN DE IMAGEN DIGITAL
•
Resolución espacial en imágenes de 8 bits (G=256).
16×16
64×64
256×256
1024×1024
14
DEFINICIÓN DE IMAGEN DIGITAL
•
Niveles de intensidad en imágenes de 1024×1024 píxeles.
2 niveles
8 niveles
64 niveles
256 niveles
15
FUNDAMENTOS DEL COLOR
•
En 1666 Isaac Newton descubrió que al pasar un haz de rayos solares a través
de un prisma, el haz emergente consiste de un espectro continuo de colores
que van desde el rojo hasta el violeta.
Luz visible
Infrarrojo
Ultravioleta
700 nm
400 nm
Longitud de onda
•
Características de una fuente cromática de luz: radiancia (cantidad total de
energía - W), luminancia (cantidad de energía que un observador percibe - lm)
y brillo (descriptor subjetivo relacionado con la intensidad).
16
FUNDAMENTOS DEL COLOR
Energía
La distribución que muestra la relación entre
energía y longitud de onda (o frecuencia) es el
espectro de energía:
ED
EW
A
1. Longitud de onda dominante, ED, representa
el color de la luz (matiz).
2. Brillo, área A, es la intensidad de la luz
(luminancia).
3. Pureza, diferencia ED−EW, indica el grado de
traslape con otras frecuencias (saturación).
Rojo
Violeta
Frecuencia
Matiz: rojo
Saturación
•
Frecuencia
dominante
Luminancia
17
FUNDAMENTOS DEL COLOR
•
Longitudes de onda de los colores en el espectro visible
Color
Longitud de
onda (nm)
Frecuencia
(THz)
Rojo
625740
480405
Naranja
590625
510480
Amarillo
565590
530510
Verde
500565
600530
Cian
485500
620600
Azul
440485
680620
Violeta
380440
790680
18
FUNDAMENTOS DEL COLOR
•
Anatomía del ojo humano.
Cristalino
Esclerótica
Células de Coroides
pigmento
Neuronas
bipolares
Cavidad posterior
(humor vítreo)
Gánglios
neuronales
Fóvea
Conjuntiva
Córnea
Arteria y vena de
la retina
Iris
Cono
Bastón
Fibras del
nervio
óptico
Luz
Epitelio
corneal
Nervio óptico
Disco óptico
(punto ciego)
Retina
Pupila
Cavidad anterior
Canal de Schlemm
Cuerpo ciliar
Ligamento suspensório
Nervio óptico
• Conos: Sensibles al color (detalles)
≈ 4.5 millones. Existen conos sensibles
al rojo (L), verde (M) y azul (S).
Coroides
• Bastones: Sensibles a la iluminación
(visión general) ≈ 90 millones.
Esclerótica
Músculo recto inferior
19
FUNDAMENTOS DEL COLOR
•
¿Cuántos colores puede distinguir el ojo humano?
Referencia
Cita textual
Resultado
estandarizado
Calkins, David J. Mapping color perception to a
physiological substrate. The Visual Neurosciences
Volumes 1 and 2. The MIT Press, 1993.
"The tremendous variability in the spectral composition of light
reflected from surfaces lends itself to eliciting a daunting gamut
of more than 100,000 discriminable colors, and the variation in
the names we assign these colors is limited only by scope of
human experience."
100 mil
Wyszecki, Gunter. Color. Chicago: World Book
Inc, 2006: 824.
"Experts estimate that we can distinguish perhaps as many as 10
million colors."
10 millones
Kleiner, Kurt. What we gave up for colour vision.
New Scientist, January 24, 2004: 12.
"Humans, other apes, and Old World monkeys have trichromatic
vision, with eyes containing three colour receptors, sensitive to
blue, green, and yellow-red. They allow us and our Old World
relatives to distinguish around 2.3 million colours."
2.3 millones
Myers, David G. Psychology. Michigan: Worth
Publishers, 1995: 165.
"Our difference threshold for colors is so low that we can
discriminate some 7 million different color variations (Geldard,
1972)."
7 millones
Color. Wikipedia. 2006.
"It has been estimated that humans can distinguish roughly 10
million different colors, although the identification of a specific
color is highly subjective, since even the two eyes of a single
individual perceive colors slightly different."
10 millones
20
MODELOS DE COLOR
•
Un color es la variedad de espectros que dan lugar a la misma excitación en
conos del ojo humano.
•
Un modelo de color es un modelo matemático abstracto que describe los
colores por medio de tuplas de números, típicamente tres o cuatro valores,
denominados componentes de color.
•
En un espacio de color la diferencia perceptiva entre colores está directamente
relacionada con las distancias entre colores representados por puntos en el
espacio de color.
•
Un color primario no se puede obtener mediante la mezcla de ningún otro
color, un color secundario se obtiene al combinar dos colores primarios, y un
color terciario surge al mezclar un primario con un secundario.
21
MODELOS DE COLOR
•
Importancia de los modelos de color: captura, almacenamiento, procesamiento, transmisión y
generación del color.
•
La elección del modelo de color depende de la aplicación:
RGB: es el que más se ajusta al modo de captura y generación en imágenes digitales.
CMYK: se relaciona con la generación de color en impresoras.
YIQ,YCbCr: separa la luminancia (brillo) de los canales de crominancia.
XYZ, HSI: están relacionados con la sensación humana del color.
•
Una imagen a color está conformada por la concatenación de canales cromáticos.
B(x,y)
G(x,y)
R(x,y)
.62
.59
.54
.78
.80
.61
.60
.63
.82
.83
.65
.63
.67
.82
.84
.71
.83
.85
.76
.83
.85
.63
.65
.50
.65
.65
.57
.65
.63
.60
.75
.75
.63
.74
.76
.68
.74
.76
.63
.61
.44
.41
.33
.57
.43
.42
.43
.61
.64
.45
.44
.48
.62
.65
.45
.43
.51
.61
.66
.39
.45
.55
.61
.66
.56
.59
.75
.62
.67
.76
.64
.74
.76
Canales cromáticos
B
Imagen a color
G
R
.61
.63
22
MODELO RGB
•
El modelo Red Green Blue (RGB) se basa en la estructura del ojo humano, donde todos los
colores se ven como combinaciones variables de los tres colores primários rojo, verde y azul.
•
La CIE (Comisión Internacional de Iluminación) determinó que la longitud de onda (λ) de los
colores primarios son: Rojo = 700 nm, Verde = 546.1 nm y Azul = 435.8 nm.
•
Es un modelo aditivo, ya que la mezcla de colores produce el color blanco.
B
Azul (0,0,1)
Mezcla de colores aditivos
Cian
Magenta
Blanco
Escala
de grises
Negro
(0,1,0)
Verde
G
(1,0,0)
R
Rojo
Amarillo
Cubo de valores RGB
23
MODELO RGB
RGB
R
G
B
24
MODELO CMYK
•
CMYK (Cyan, Magenta, Yellow, blacK): modelo de colores sustractivo (mezcla
colores para generar el negro) que se utiliza en impresión.
Mezcla de colores sustractivos
A
Amarillo
(0,0,1)
Rojo
Verde
Negro
(0,1,0)
M
Magenta
(1,0,0)
C
Cyan
Azul
Cubo de valores CMY
Conversión de RGB a CMY
⎡ C ⎤ ⎡ 1 ⎤ ⎡ R ⎤
⎥
⎥−⎢
⎢
⎥=⎢
1
M
G
⎥
⎥ ⎢
⎢
⎥ ⎢
⎢⎣ Y ⎥⎦ ⎢⎣ 1 ⎥⎦ ⎢⎣ B ⎥⎦
K = min(C,M,Y )
25
Conversión de CMY a CMYK
C′ =C − K
M′ = M −K
Y ′ =Y − K
MODELO CMYK
•
El rango de colores que pueden generarse en RGB es mayor que en CMYK.
RGB
CMYK
Como se ve en el monitor
R: 193, G: 223, B: 157
Como se imprime
C: 21%, M: 12%, Y:46%, K: 0%
26
MODELO YCBCR
Modelo YCbCr
Cr
•
Sistema de color muy utilizado en video
digital, donde la luminancia se representa
por una única componente (Y), y la
información de color se almacena en dos
componentes cromáticas, Cb (azul
−referencia) y Cr (rojo−referencia):
•
Conversión de RGB a YCbCr:
Y
⎡ Y ⎤ ⎡ 0.299 0.587 0.114 ⎤ ⎡ R ′ ⎤
⎥
⎢
⎥=⎢
⎥⎢
Cb
−0.169
−0.331
0.500
G
′
⎥
⎢
⎥ ⎢
⎥⎢
⎢⎣ Cr ⎥⎦ ⎢⎣ 0.500 −0.418 −0.082 ⎥⎦ ⎢⎣ B ′ ⎥⎦
con:
Cb
G
B
R
, G′ = , B′ =
k
k
k
k = R +G + B
R′ =
27
Plano CbCr constrante en Y=0.5
MODELO YCBCR
YCbCr
Y
Cb
Cr
28
MODELO HSI
•
Los humanos describimos los colores en función del matiz (en
relación a un color puro), saturación (grado de dilución del color
hacia el blanco) e intensidad o brillo.
•
HSI (Hue, Saturation, Intensity): modelo de color ampliamente
utilizado en programas de tratamiento de imágenes (como
Photoshop), ya que proporciona al usuario una forma natural e
intuitiva de manipular los colores.
•
Conversión de RGB a HSI:
⎧
H =⎨ θ
⎪⎩ 2π − θ
•
si B ≤ G
si B>G
⎧
⎫
1 ⎡
⎤
(R
−
G)
+
(R
−
B)
⎪
⎪
2 ⎣
⎦
donde θ = cos−1 ⎨
12⎬
2
⎪ ⎡(R − G) + (R − B)(G − B)⎤ ⎪
⎦ ⎭
⎩⎣
3
[min(R,G,B)]
S = 1−
(R + G + B)
1
I = (R + G + B)
3
29
Modelo HSI
Conversión de HSI a RGB:
B = I(1 − S)
⎡
S cosH ⎤
R = I ⎢1 +
⎥
π
−
H
)
cos(
⎣
⎦
3
G = 3I − (R + B)
H =H
Sector
RG
H =H −
2π
3
Sector
BG
Sector
BR
H =H −
4π
3
MODELO HSI
HSI
H
S
I
30
MODELO XYZ
• La
sensación de color puede
describirse a partir de los tres colores
(longitudes de onda) que estimulan a
los conos tipo S (bajos), M (medios) y L
(altos).
• Las
cantidades de rojo, verde y azul
necesarias para formar un color se
denominan valores triestímulo.
M
• El
modelo triestímulo, es el más
próximo a la percepción humana del
color, consta de un espacio 3D donde
cada dimensión corresponde al nivel de
excitación.
31
L
S
Modelo
triestímulo
MODELO XYZ
• Conversión
de RGB a XYZ:
⎡ X ⎤ ⎡ 0.412453 0.357580 0.180423 ⎤ ⎡ R ⎤
⎥
⎥⎢
⎢
⎥=⎢
⎢ Y ⎥ ⎢ 0.212671 0.715160 0.072169 ⎥ ⎢ G ⎥
⎢⎣ Z ⎥⎦ ⎢⎣ 0.019334 0.119193 0.950227 ⎥⎦ ⎢⎣ B ⎥⎦
• Conversión
de XYZ a RGB:
⎡ R ⎤ ⎡ 3.240479 −1.537150 −0.498535 ⎤ ⎡ X ⎤
⎢
⎥=⎢
⎥
⎥⎢
Y
−0.969256
1.875992
0.041556
G
⎢
⎥ ⎢
⎥
⎥⎢
⎢⎣ B ⎥⎦ ⎢⎣ 0.055648 −0.204043 1.057311 ⎥⎦ ⎢⎣ Z ⎥⎦
32
MODELO XYZ
XYZ
X
Y
Z
33
CONVERSIÓN DE RGB A GRIS
• Una
imagen en escala de grises es el paso inicial en muchos
algoritmos de análisis de imágenes:
• Aunque
posee menos información que una imagen a color, se
mantiene la mayoría de las características importantes en la imagen
como bordes, regiones de interés, formas, texturas, etc.
• La
conversión de RGB a escala de grises se realiza mediante la
siguiente transformación:
I(x,y) = α R(x,y) + β G(x,y) + γ B(x,y)
34
CONVERSIÓN DE RGB A GRIS
• Los
coeficientes (α,β,γ) están configurados de acuerdo a la respuesta del
ojo humano a los colores rojo, verde y azul.
valores estan estandarizados de acuerdo al NTSC como: α = 0.2989,
β = 0.5870 y γ = 0.1140.
• Los
35