Download Familia de procesadores Intel x86

Document related concepts
no text concepts found
Transcript
Intel 8086 y 8088
Familia de procesadores
Intel x86
• 8086: 1978, 29K transistores
• 8 Registros de 16 bits
• Bus de datos de 16 bits
• Bus de dirección de 20 bits
• Multiplexado con bus de datos
Mario Medina C.
[email protected]
• Aprox. 2.5 MIPS
• 8088: CPU de IBM-PC
• Bus de datos de 8 bits Clock de 4.77 MHz
(IBM-PC)
• Fabricantes: Intel y AMD
Intel 80286
• 80286: 1982, 134K transistores
• Clock de 6 a 12.5 MHz
• Procesador del IBM PC-AT
• Bus de direcciones de 24 bits
• Direcciona 16 MiB
• Tiene modos real y protegido
• Mejoras en microarquitectura lo hacían 2
veces más rápido que 8086 de misma
velocidad
Intel 80386
• 80386: 1985, 275K transistores
•
•
•
•
•
•
• Clonado por Cyrix, AMD y otros
Intel i486
• i486: 1989, 1.2M transistores
•
•
•
•
•
i486
Integra FPU 387 al chip
Instrucciones atómicas fetch-and-add
Agrega cache L1 interna D+I de 8 KiB
i486SX: 486 sin unidad de punto flotante
Desempeño es 50% mejor que i386 de la
misma velocidad
• Pipeline de 5 etapas
© 2014 Mario Medina C.
Arquitectura de 32 bits
Registros extendidos de 32 bits
Modos real, protegido y virtual
16 y 20 MHz
386SLC es 386SX con cache interna de 8 KiB
Intel niega la licencia del 80386 a AMD
Intel Pentium
• Pentium: 1993, 3.1 M transistores
•
•
•
•
•
Microarquitectura P5
60 y 66 MHz
Bus de datos de 64 bits
Desempeño es el doble que i486
Procesador superescalar
• Ejecuta 2 ops. aritméticas por ciclo
• Cache interna de datos 8 KiB e instr. 8 KiB
• Predicción de saltos
1
Intel Pentium MMX
• Pentium MMX: 1997, 4.5 M transistores
• Instrucciones MMX
• Vectores enteros de 64 bits
• datos de 1, 2 o 4 bytes
• 8 registros de punto flotante
• 64 bits cada uno
• Cache interna de 32 KiB
Intel Pentium Pro
• Pentium Pro: 1995, 5.5 M transistores
• Microarquitectura P6
• Bus de direcciones de 36 bits
• Direcciona 64 GiB
•
•
•
•
Clock de 150 y 166 MHz
Instr. move condicional
Superescalar de 3 vías
Memoria cache L2 de 256 KiB a 1 MiB
• Conectada via backside bus
• Opera en paralelo a RAM
Intel Pentium II
• Pentium II: 1997, 7M transistores
• Memoria cache L2 de 256 ó 512 KiB
conectada via backside bus
• Versión Xeon tiene caches 512 KiB a 2 MiB
•
•
•
•
Front-side bus de 100 MHz
Agrega instrucciones MMX a Pentium Pro
Cache L1 de 32 KiB
Clock de 266 MHz
Intel Pentium 4
• Pentium 4: 2001, 42 M transistores
•
•
•
•
•
Microarquitectura NetBurst, 1.5 GHz
Tecnología HyperThreading (3.4 GHz)
Agrega instr. vectoriales de 8 bytes (SSE2)
Luego agrega nuevas instrucciones x86-64
Limitado por alta disipación a altas velocidades
• 180 nm a 65 nm
• Clock hasta 3.8 GHz
© 2014 Mario Medina C.
Intel Pentium III
• Pentium III: 1999, 8.2 M transistores
• Instr. vectoriales de 128 bits (SSE)
• Agrega registros dedicados de 128 bits
• Aceleran cálculos de punto flotante
• Versión Coppermine agrega cache L2 de
256KB en el chip
• 28 M transistores
• Versión Tualatin aumenta cache L2 a 512 KiB
Intel Pentium M
• Pentium M 775: 2003, 140M transistores
• Pentium III muy modificado
• Basado en microarquitectura P6
• Bus del Pentium 4, SSE2, MMX
• No hyperthreading, no SSE3
• Optimizado para bajo consumo
• Desempeño Pentium M 1.6 GHz ~ P4 2.4 GHz
• Cache L1 Datos 32 KiB + Instr. 32 KiB
• Cache interna L2 de hasta 2 MiB
2
Intel Pentium EE
• Pentium Extreme Edition (2005), 164M
transistores
•
•
•
•
•
Pentium 4 dual-core
Microarquitectura NetBurst
MMX, SSE, SSE2, SSE3
Hyperthreading
Arquitectura Intel de 64 bits
Intel Core
• Intel Core: 2006, 150M transistores
•
•
•
•
•
•
Intel Core 2
• Intel Core 2: 2006, 291M transistores
•
•
•
•
•
•
Microarquitectura Core de 64 bits
Solo, Duo o Quad Core
Tecnología de 65nm y 45nm
Cache L2 compartida de 4MB ó 6 MB
Instrucciones SSE3 y SSSE3
Modo SpeedStep (Reloj variable)
Intel Atom
• Intel Atom: 2008, 47M transistores
• Microarquitectura Atom de 64 bits
• Muy popular en netbooks
•
•
•
•
•
•
Intel i7 (Nehalem)
• Intel i7: 2008, 770M transistores
• Microarquitectura Nehalem de 64 bits
• Buses Quick Path Interconnect (QPI)
• Elimina Front-Side Bus
•
•
•
•
•
•
Cache L2 de 4 a 12 MiB
Hyperthreading
Dynamic overclocking (Turbo Boost)
Dual-core, Quad-core ó Six-core
MMX, SSE, SSE2, SSE3, SSSE3
3 canales de memoria DDR3
© 2014 Mario Medina C.
Microarquitectura Core derivada del P6
1 ó 2 Cores de 32 bits en el chip
Cache L1 de 64 KiB
Cache L2 compartida de 2 MiB
No Hyperthreading
Instrucciones SSSE3
Optimizada para bajo consumo de potencia
2 pipelines de 16 etapas
Hyperthreading
MMX, SSE, SSE2, SSE3, SSSE3
Cache L1 Datos 24 KiB + Instr. 32 KiB
Cache L2 de 512 KiB
Intel i7 (Sandy Bridge)
• Intel i7: 2008, 995M transistores
•
•
•
•
•
•
•
•
Microarquitectura Sandy Bridge de 64 bits
Tecnología de 32 nm
Quad-core
Cache L1 de 32 + 32 KiB por core
Cache L2 de 256 KiB por core
Cache L3 compartida de 4 a 8 MiB
Procesador gráfico incorporado en el chip
Advanced Vector Extensions (AVX)
3
Intel Xeon E5 (Sandy Bridge)
• Intel Xeon E5: 2012, 2260M transistores
•
•
•
•
•
•
•
•
Microarquitectura Sandy Bridge-E de 64 bits
Fecha de aparición: marzo 2012
Tecnología de 32 nm
De 2 a 8 cores
Cache L2 por core de 256 KiB
Cache L3 compartida de 2 a 20 MiB
Advanced Vector Extensions (AVX)
Línea Xeon dirigida a servidores y
estaciones de trabajo
Intel I7 (Haswell)
•
•
•
•
•
•
•
•
•
•
•
• 57 instrucciones MMX
• Puede operar sobre 2 enteros de 32 bits, 4
enteros de 16 bits ó 8 enteros de 8 bits
• Diseñado para operaciones gráficas
• Realiza la misma instrucción sobre los datos
• Aparecen con el Pentium MMX
• Usa registros de punto flotante FP de la CPU
• AMD introduce instrucciones 3DNOW! que
usan datos como punto flotante
Registro FP de 64 bits
Entero de 32 bits
Entero 16 bits
Entero 16 bits
Entero 16 bits
Entero 16 bits
8 bits
8 bits
8 bits
8 bits
© 2014 Mario Medina C.
8 bits
SIMD
• SIMD (Single Instruction, Multiple Data)
aplica la misma instrucción en paralelo a
varios datos
• Puede ser interpretado como
8 bits
4 Cores
6 Unidades GPU
Microarquitectura Ivy Bridge
Sobre 1400M transistores
Velocidad: 3.5/3.9 GHz
Cache L1: 64 KB/core
Cache L2: 256 KB/core
Cache L3: 8 MB
Consumo: 77W
Tamaño: 133 mm2
Precio inferior a US$300
• MMX opera sobre datos de 64 bits
Instrucciones MMX de Intel
8 bits
•
•
•
•
•
•
•
•
•
•
•
Instrucciones SIMD de Intel
4/6/8 Cores
Intel HD 4600
Microarquitectura Haswell
Sobre 1400M transistores
Velocidad: 3.6/4.0 GHz
Cache L1: 64 KB/core
Cache L2: 256 KB/core
Cache L3: 8 MB
Consumo: 84W
Tamaño: 177 mm2
Precio: US$300
Entero de 32 bits
Intel i7 (Ivy Bridge)
8 bits
• También llamadas instrucciones vectoriales
cortas
• Beneficia aplicaciones que realizan las
mismas operaciones sobre muchos
datos en forma regular
4
Instrucciones SIMD
• Requiere múltiples unidades funcionales
• Requiere acceso paralelo a datos
Instrucciones SIMD de Intel
• SSE (Streaming SIMD Extensions)
• Agrega a la CPU 8 registros especiales XMM0
a XMM7 de 128 bits
• Instrucciones operan sobre éstos como 4
números de punto flotante de precisión simple
• 70 instrucciones
• Aparece con el Pentium III
• No incluye operaciones sobre enteros
• AMD agrega 8 registros XMM más
• XMM8 a XMM15
Instrucciones SIMD de Intel
Instrucciones SSE de Intel
• SSE2 amplía instrucciones SSE
• Nuevas instrucciones operan sobre registros
XMM de 128 bits
• Aparecen con el Pentium IV
• Operaciones sobre datos como 2 double, 2
enteros de 64 bits, 4 enteros de 32 bits, 4
float, 8 enteros de 16 bits ó 16 enteros de
8 bits
• Puede ser interpretado como
• 13 nuevas instrucciones que pueden operar
horizontalmente, entre los datos que
comparten un mismo registro XMM
• Aparecen en Pentium 4 (Prescott)
• SSSE3 (Supplemental Streaming SIMD
Extensions v.3)
• Aparecen con la microarquitectura Core
• 16 nuevas instrucciones
© 2014 Mario Medina C.
double de 64 bits
double de 64 bits
SSE2
entero de 64 bits
entero de 64 bits
SSE2
entero 32 bits
entero 32 bits
entero 32 bits
entero 32 bits
SSE2
float 32 bits
float 32 bits
float 32 bits
float 32 bits
SSE
16 bits 16 bits 16 bits 16 bits 16 bits 16 bits 16 bits 16 bits
Instrucciones SIMD de Intel
• SSE3 (Streaming SIMD Extension v.3)
SSE
Registro XMM de 128 bits
• SSE2 (Streaming SIMD Extensions v.2)
SSE2
Instrucciones SIMD de Intel
• SSE4 (Supplemental Streaming SIMD
Extensions v.4)
• 54 instrucciones nuevas
• Aparece en microarquitectura Core (Penryn)
• AVX (Advanced Vector Extension)
•
•
•
•
Aparece en microarquitectura Sandy Bridge
Extiende registros a 256 bits (YMM)
Incluye nuevos formatos de instrucción
Requiere soporte a nivel del S. O.
• Windows 7, 8, Linux 2.6.30
5