Download hyperthreading technology in the netburst microarchitecture

Document related concepts
no text concepts found
Transcript
HYPERTHREADING TECHNOLOGY
IN THE NETBURST
MICROARCHITECTURE
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
ÍNDICE
1. Introducción
2. Descripción de necesidades para la implementación de la
tecnología:
2.1- Cómo trabaja la tecnología
2.2- Estructuras adicionales
2.3- Área de dado
3. Cambios fundamentales
4. Elección de la política de ‘intercambio’ o ‘compartición’.
4.2.1- Recursos ‘Particionados’, ‘Repartidos’
(Partitioned resources)
4.2.2- ‘Reparto’ umbral (threshold sharing)
4.2.3- ‘Reparto’ completo (full sharing)
5. Mejoras en el rendimiento. Ejemplos.
[Lo que se muestra es referente a la primera familia de procesadores Xeon y Pentium 4]
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
1
Introducción a la tecnología del
hyperthreading
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Introducción a la arquitectura
Concepto de Tecnología de
Hyperthreading:
Multithreading simultáneos en la
arquitectura de Intel
Procesador
Procesador
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Procesador
Introducción a la arquitectura
¿Qué ventajas tiene el Hyperthreading?
Utilizando más eficientemente los recursos de
procesadores ya existentes, la tecnología de
Hyperthreading mejora el rendimiento con un
bajo coste e incrementando el tamaño del chip
en menos de un 5%
Nueva dirección en el
desarrollo de la
microarquitectura
Importantes cambios
en cuanto a la relación
coste-beneficios
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
2
Descripción de necesidades
para la implementación de la tecnología:
2.1- Cómo trabaja la tecnología
2.2- Estructuras adicionales
2.3- Área de dado
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Descripción de necesidades para la implementación de la tecnología. Cómo trabaja
Cómo trabaja la tecnología
El diseño del procesador se centra en 4
objetivos:
1. Aumento de la frecuencia de reloj
2. Paralelismo a nivel de instrucción
3. Jerarquía (niveles) de Cache
4. Paralelismo a nivel de ‘hilo’ (thread)
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Descripción de necesidades para la implementación de la tecnología. Cómo trabaja
1.Aumento de la frecuencia de reloj
PIPELINE
t
Aumento
t
SUPERPIPELINE
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Descripción de necesidades para la implementación de la tecnología. Cómo trabaja
2. Paralelismo a nivel de instrucción
EXE
Ejecución
E
de
r
o
n
Fu
era
U.E Multi-Paralela
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
de
n
ord
e
n
Descripción de necesidades para la implementación de la tecnología. Cómo trabaja
3. Niveles de Cache
Procesador
Cache
nivel1
Cache
nivel2
Cache
nivel3
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Fin:
Minimizar
los ciclos
de espera
de datos
Cache
nivel4
Descripción de necesidades para la implementación de la tecnología. Cómo trabaja
4. Paralelismo a nivel de hilo
- Chip multiprocessing (CMP)
- Time-slice multithreading.
A
A
B
B
C
C
…
D
…
D
t
Q
- Switch-on-event
- Simultaneus multithreading
A
A
B
B
C
… t
D
t
Q
Switch
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
C
D
…
t
Descripción de necesidades para la implementación de la tecnología. Estructuras adicionales
Estructuras adicionales
SW o Arquitectura
Architectural
state
SO y Programas Lanzamiento
Instrucciones
Execution
resources
Ejecución
μ-Arquitectura
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Execution
resources
Descripción de necesidades para la implementación de la tecnología. Área de dado
Área de dado
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
3
Cambios fundamentales
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Cambios fundamentales
Teconología Hyperthreadinsg frente a diseño singlethreaded fuera de orden
1º-
3º-
Necesitaban
nuevos
algoritmos para que ambos
procesadores
lógicos
pudieran compartir la lógica
y revisar otros para que
establezcan la prioridad de
las μ-operaciones para cada
procesador lógico.
Derivado
del
2º,
tenemos un
amplísimo
espacio de
verificación.
2ºGran
aumento
de
la
compleji
dad.
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
4
Elección de la política de
‘intercambio’ o ‘compartición’
- Recursos ‘Particionados’, ‘Repartidos’
(Partitioned resources)
- ‘Reparto’ umbral (threshold sharing)
- ‘Reparto’ completo (full sharing)
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Elección de la política de ‘intercambio’ o ‘compartición’.
DEFINICIONES
- Particiones. Los mismos recursos a cada uno de
ellos.(Partition)
- Umbral. Recursos flexibles hasta una cota
máxima. (Threshold)
- Completamente compartido. Recursos flexibles
sin cota máxima de uso. (full sharing)
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Elección de la política de ‘intercambio’ o ‘compartición’.
1. Particiones
Completamente
Compartida
1
1 0 1 0
Ciclo 0
2
1
2
2
2 1 0
2 1 0
1 2 1 0
2 2 1 0
3 2 1 0
0
1
1 0
2 1 0
3
1 0
1 0
2 1 0
4
3
1 0
1 2 1 0
3 2 1 0
2
1
3 2 1 0
3
2 1 0
1
Ciclo 0
1
2 1 0
1 0
Particiones
10 1 0
0
1 0
3
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
BLOQUEADA!
Ciclo 4
2
3 4 1 0
No bloqueada,
puede seguir
su curso
normal
Ciclo 4
Elección de la política de ‘intercambio’ o ‘compartición’. Threshold
Una ‘instantánea’ durante un proceso de intercambio de carga
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Elección de la política de ‘intercambio’ o ‘compartición’. Full Shared
Programas de prueba sobre full shared, normalizados a ‘parciones’
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Elección de la política de ‘intercambio’ o ‘compartición’.
Una ejecución del pipeline de la μ-Arquitectura Netburst
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
5
Mejoras
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Mejoras en el rendimiento. Ejemplo.
¿Por qué Hyperthreading mejora el rendimiento total?
1ª- Acelera las
aplicaciones que ya
‘poseían’ multithreading.
2ª- Acelera el ‘trabajo’
de las ‘multiaplicaciones’ que viene
dadas por multi-tareas
Ejemplo
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez
Ejemplo
Biliografía
http://computer.org/publications/dlib
http://www.intel.com/support/sp/processors/pentium4/sb/CS-007991.htm
http://www.dacya.ucm.es/hidalgo/docencia.htm
Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez