Download hyperthreading technology in the netburst microarchitecture
Document related concepts
no text concepts found
Transcript
HYPERTHREADING TECHNOLOGY IN THE NETBURST MICROARCHITECTURE Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez ÍNDICE 1. Introducción 2. Descripción de necesidades para la implementación de la tecnología: 2.1- Cómo trabaja la tecnología 2.2- Estructuras adicionales 2.3- Área de dado 3. Cambios fundamentales 4. Elección de la política de ‘intercambio’ o ‘compartición’. 4.2.1- Recursos ‘Particionados’, ‘Repartidos’ (Partitioned resources) 4.2.2- ‘Reparto’ umbral (threshold sharing) 4.2.3- ‘Reparto’ completo (full sharing) 5. Mejoras en el rendimiento. Ejemplos. [Lo que se muestra es referente a la primera familia de procesadores Xeon y Pentium 4] Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez 1 Introducción a la tecnología del hyperthreading Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Introducción a la arquitectura Concepto de Tecnología de Hyperthreading: Multithreading simultáneos en la arquitectura de Intel Procesador Procesador Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Procesador Introducción a la arquitectura ¿Qué ventajas tiene el Hyperthreading? Utilizando más eficientemente los recursos de procesadores ya existentes, la tecnología de Hyperthreading mejora el rendimiento con un bajo coste e incrementando el tamaño del chip en menos de un 5% Nueva dirección en el desarrollo de la microarquitectura Importantes cambios en cuanto a la relación coste-beneficios Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez 2 Descripción de necesidades para la implementación de la tecnología: 2.1- Cómo trabaja la tecnología 2.2- Estructuras adicionales 2.3- Área de dado Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Descripción de necesidades para la implementación de la tecnología. Cómo trabaja Cómo trabaja la tecnología El diseño del procesador se centra en 4 objetivos: 1. Aumento de la frecuencia de reloj 2. Paralelismo a nivel de instrucción 3. Jerarquía (niveles) de Cache 4. Paralelismo a nivel de ‘hilo’ (thread) Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Descripción de necesidades para la implementación de la tecnología. Cómo trabaja 1.Aumento de la frecuencia de reloj PIPELINE t Aumento t SUPERPIPELINE Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Descripción de necesidades para la implementación de la tecnología. Cómo trabaja 2. Paralelismo a nivel de instrucción EXE Ejecución E de r o n Fu era U.E Multi-Paralela Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez de n ord e n Descripción de necesidades para la implementación de la tecnología. Cómo trabaja 3. Niveles de Cache Procesador Cache nivel1 Cache nivel2 Cache nivel3 Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Fin: Minimizar los ciclos de espera de datos Cache nivel4 Descripción de necesidades para la implementación de la tecnología. Cómo trabaja 4. Paralelismo a nivel de hilo - Chip multiprocessing (CMP) - Time-slice multithreading. A A B B C C … D … D t Q - Switch-on-event - Simultaneus multithreading A A B B C … t D t Q Switch Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez C D … t Descripción de necesidades para la implementación de la tecnología. Estructuras adicionales Estructuras adicionales SW o Arquitectura Architectural state SO y Programas Lanzamiento Instrucciones Execution resources Ejecución μ-Arquitectura Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Execution resources Descripción de necesidades para la implementación de la tecnología. Área de dado Área de dado Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez 3 Cambios fundamentales Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Cambios fundamentales Teconología Hyperthreadinsg frente a diseño singlethreaded fuera de orden 1º- 3º- Necesitaban nuevos algoritmos para que ambos procesadores lógicos pudieran compartir la lógica y revisar otros para que establezcan la prioridad de las μ-operaciones para cada procesador lógico. Derivado del 2º, tenemos un amplísimo espacio de verificación. 2ºGran aumento de la compleji dad. Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez 4 Elección de la política de ‘intercambio’ o ‘compartición’ - Recursos ‘Particionados’, ‘Repartidos’ (Partitioned resources) - ‘Reparto’ umbral (threshold sharing) - ‘Reparto’ completo (full sharing) Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Elección de la política de ‘intercambio’ o ‘compartición’. DEFINICIONES - Particiones. Los mismos recursos a cada uno de ellos.(Partition) - Umbral. Recursos flexibles hasta una cota máxima. (Threshold) - Completamente compartido. Recursos flexibles sin cota máxima de uso. (full sharing) Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Elección de la política de ‘intercambio’ o ‘compartición’. 1. Particiones Completamente Compartida 1 1 0 1 0 Ciclo 0 2 1 2 2 2 1 0 2 1 0 1 2 1 0 2 2 1 0 3 2 1 0 0 1 1 0 2 1 0 3 1 0 1 0 2 1 0 4 3 1 0 1 2 1 0 3 2 1 0 2 1 3 2 1 0 3 2 1 0 1 Ciclo 0 1 2 1 0 1 0 Particiones 10 1 0 0 1 0 3 Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez BLOQUEADA! Ciclo 4 2 3 4 1 0 No bloqueada, puede seguir su curso normal Ciclo 4 Elección de la política de ‘intercambio’ o ‘compartición’. Threshold Una ‘instantánea’ durante un proceso de intercambio de carga Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Elección de la política de ‘intercambio’ o ‘compartición’. Full Shared Programas de prueba sobre full shared, normalizados a ‘parciones’ Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Elección de la política de ‘intercambio’ o ‘compartición’. Una ejecución del pipeline de la μ-Arquitectura Netburst Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez 5 Mejoras Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Mejoras en el rendimiento. Ejemplo. ¿Por qué Hyperthreading mejora el rendimiento total? 1ª- Acelera las aplicaciones que ya ‘poseían’ multithreading. 2ª- Acelera el ‘trabajo’ de las ‘multiaplicaciones’ que viene dadas por multi-tareas Ejemplo Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez Ejemplo Biliografía http://computer.org/publications/dlib http://www.intel.com/support/sp/processors/pentium4/sb/CS-007991.htm http://www.dacya.ucm.es/hidalgo/docencia.htm Arquitectura de computadores. 2006-2007. Leyre Aldama Pérez