Download procesadores multi-núcleo

Document related concepts
no text concepts found
Transcript
www.monografias.com
Procesadores multi-núcleo
Edgar Miraya Anamaría ([email protected])
1.
2.
3.
4.
5.
6.
7.
8.
Introducción
Panorama Actual
Descripción inicial
Antecedentes de los procesadores multinúcleo
Ejemplos de procesadores multinúcleo
Futuro de los procesadores multinúcleo
Conclusiones
Glosario
1. Introducción
La presente monografía trata el tema de los procesadores multinúcleo, dando un panorama de
porque se decidió fabricarlos, sus antecedentes, como trabajan. Además se muestra algunos
procesadores multi-núcleos actuales, de Intel, de AMD. Se ha puesto énfasis en el procesador
Cell, por su potencial y su capacidad.
Este trabajo pretende dar una vista amplia de los procesadores multinúcleo. Para mayores
detalles se puede consultar la bibliografía.
2. Panorama Actual
La fuerte competencia en el mundo de los procesadores, especialmente entre Intel y AMD, ha
producido que la tecnología actual de fabricación de procesadores esta llegando a sus límites.
Cada vez la miniaturización de los componentes del procesador es más difícil (el límite de
construcción del silicio ronda los 15-20nm, donde el silicio empieza a ceder por falta de
consistencia, ya se ha llegado a los 65nm), el problema de la generación de calor a aumentado,
produciendo que sea más difícil aumentar la frecuencia principal del procesador. Todos estos
problemas dificultan el aumento de rendimiento de los procesadores.
Los procesadores actuales no sobrepasan los 3.8 GHz (obtenido por el Pentium 4 Prescott),
necesitan grandes disipadores y ventiladores porque generan mucho calor. No se podía continuar
fabricando procesadores de la misma manera, se estaba llegando a un “estancamiento”; era
necesario tomar otro camino, utilizar otra variable que hiciera que el rendimiento del procesador
aumentará. Entonces, basándose en el procesamiento en paralelo, se empezaron a construir los
procesadores multi-núcleo.
3. Descripción inicial
Los procesadores multi-núcleo son un procesador que contiene dentro de su empaque a varios
núcleos o “cerebros”. La mayoría de los procesadores son mono-núcleo, o sea tienen un solo
cerebro. Mientras un procesador mono-núcleo tiene un solo cerebro para ejecutar procesos, un
procesador multi-núcleo puede repartir los procesos entre sus varios cerebros para su posterior
ejecución.
Es como cuando a una persona le dan muchos trabajos por hacer, si otro lo ayuda entre los dos
pueden dividirse el trabajo y terminar más rápido. Si los dos les toca hacer un solo trabajo, si este
es divisible, entonces los dos lo también lo harán mas rápido. Pero si el trabajo no es divisible,
entonces en ese caso uno solo lo haría.
Por eso las aplicaciones que sacan más provecho de estos procesadores multinúcleo son
aquellas que pueden generar muchos hilos de ejecución (thread) como las aplicaciones de
audio/video, cálculo científico, juegos, tratamiento de gráficos en 3D, etc.
Pero de todas maneras siempre hay aplicaciones que no se dividen en hilos de ejecución, que no
aprovechan por completo estos procesadores. Pero estos procesadores pueden ejecutar varias
de estas aplicaciones al mismo tiempo.
Solo cuando uno ejecute una sola aplicación que no sea paralelizable (no se pueda descomponer
en hilos) es cuando no se aprovecha el potencial de procesamiento que tienen estos
procesadores.
Actualmente muchos programas son poco paralelizables (excepto en los sectores donde se usan
supercomputadoras, sistemas distribuidos y paralelos, etc.), pero se pueden ejecutar muchos de
ellos a la vez. Con el auge de estos procesadores, saldrán aplicaciones más paralelizables.
Como historia se puede decir que el primer procesador multinúcleo en el mercado fue el IBM
Power 4 en el año 2000. Una alternativa a los procesadores multinúcleo son los sistemas
multiprocesadores, que consisten en una placa madre que podía soportar desde 2 a más
procesadores. El rendimiento es bastante bueno, pero también es bastante caro.
4. Antecedentes de los procesadores multinúcleo
Los procesadores multinúcleo se basaron en los sistemas distribuidos, la computación paralela, y
las tecnologías como el Hyperthreading; que mostraban como dividir el trabajo entre varias
unidades de ejecución.
Procesamiento en Paralelo
El procesamiento en paralelo es la división de una aplicación en varias partes para que sean
ejecutadas a la vez por diferentes unidades de ejecución.
El procesamiento en paralelo se utiliza en Computación Paralela y la Computación Distribuida.
HyperThreading
Esta tecnología fue creada por Intel, para los procesadores Pentium 4 más avanzados. El
Hyperthreading hace que el procesador funcione como si fuera dos procesadores. Esto fue hecho
para que tenga la posibilidad de trabajar de forma multihilo (multithread) real, es decir pueda
ejecutar muchos hilos simultáneamente.
Un procesador con la tecnología Hyperthreading tiene un 5% más de transistores que el mismo
procesador sin esa tecnología.
Los dos procesadores lógicos, que posee el procesador hyperthreading, tienen su propio estado
de la arquitectura: registros de control, registros de datos, registros de depuración, etc. y el APIC
(controlador avanzado de interrupción programable). Los dos procesadores lógicos comparten la
memoria caché, la interfaz del bus del sistema, etc.
5. Ejemplos de procesadores multinúcleo
Se verá un resumen de los principales procesadores multinúcleo de la actualidad. Se comienza
por Intel, mostrando los procesadores multinúcleo que ha sacado al mercado, luego viene AMD, y
por último se muestra al nuevo procesador Cell, que próximamente va a salir en la PlayStation 3.
Procesadores Multinúcleo de Intel
Actualmente Intel esta fabricando procesadores de doble núcleo. Comenzó fabricando los
Pentium D en el 2005, luego en el 2006 lanzó los Core Duo y el Core 2 Duo.
Pentium D
Los Pentium D están conformados por dos procesadores Pentium 4 Prescott sin Hyperthreading.
Luego Intel sacó el Pentium Extreme Edition (No confundir con el Pentium 4 Extreme Edition) que
era un procesador que tenía los procesadores P4 Prescott, con la tecnología Hyperthreading, lo
que hacia que el software viera cuatro procesadores.
Las características de los Pentium D son:
- Proceso de fabricación de 90nm
- Tienen la tecnología EM64T, que permite trabajar con 64 bits de forma nativa
- Utilizan núcleos SmithField (basados en los Prescott), cada uno de ellos tiene una
memoria caché L2 de 1MB
- Van desde 2.80GHz, del modelo menos potente, hasta 3.20GHz para el modelo más
potente.
El procesador que contiene dos núcleos Prescott se llama Smithfield. Los nuevos procesadores
de doble núcleo Pentium D se llaman Presler, están construidos con tecnología de fabricación de
65nm y van desde 2.8 hasta 3.73Ghz. Tienen una caché L2 por cada núcleo de 2MB (4MB en
total).
Core Duo
Los procesadores Core Duo es una versión para los portátiles, implementa 2MB de caché de
memoria compartida para ambos núcleos. Están hechos con la tecnología de 65nm. Su velocidad
va desde 1.20 hasta 2.33Ghz. El FSB (bus del sistema) va desde 533Mhz del modelo menos
potente hasta 667Mhz para los demás. El gasto de energía va desde 9.0w hasta 31w. Por los
datos se ve que tienen una gran relación rendimiento/energía.
Core 2 Duo
Esta nueva familia de procesadores de Intel esta basado en la microarquitectura Core, que
reemplaza a la antigua microarquitectura Netburst que fue aplicada en los demás procesadores y
que ya estaba llegando a sus límites.
La arquitectura Core proviene de la arquitectura que produjo al Pentium M (utilizado por los Intel
Centrino), que destaca por el gran rendimiento que obtiene de la poca energía que gasta. El
Pentium M además proviene del Pentium III, y este del Pentium Pro (Los Pentium 4 son una rama
genealógica aparte).
Las subfamilias del Core 2 Duo son:
Merom, para portátiles.
Conroe, para equipos de sobremesa.
WoodCrest, para servidores.
Los Core 2 Duo, recién han salido en julio del 2006. Además de la versión normal, hay una
versión extrema. No se tienen todos los datos disponibles, pero ya se han probado algunos de
ellos.
Los Core 2 Duo que han sido probados, por la mayoría de testeadores, son el Core 2 Extreme
X6800, el Core 2 Duo E6700 y el E6600. En las pruebas estos procesadores demuestran tener
más rendimiento que el más poderoso procesador del AMD, el AMD FX-62. Los mas fuertes
(X6800 y E6700) vencen en casi todo al FX-62, en algunas pruebas por un margen considerable
y el tercero (E6600) esta muy cerca.
Procesadores Multinúcleo de AMD
Antes de sacar sus procesadores multinúcleo al mercado, AMD ya había conseguido un gran
éxito con su procesador Athlon 64, que incorporaba la capacidad de direccional 64 bits de
memoria, la tecnología HyperTransport que era un nuevo bus bastante rápido que eliminaba
cuellos de botella anteriores, y otras tecnologías; este procesador fue tomado como base para la
construcción de su procesador de doble núcleo Athlon 64 X2, que salió al mercado a partir del
2005.
Para Servidores, AMD sacó el procesador Opteron X2, que se basaba también en el Opteron de
un solo núcleo, el hermano mayor de los Athlon 64.
Para Portátiles AMD ha sacado el Turion X2, que lleva el poder de los procesadores de doble
núcleo al campo de los móviles.
AMD fue el primero en sacar la tecnología de 64 bits, y también fue la primera en sacar los
procesadores de doble núcleo para servidores, portátiles y computadoras de escritorio. Han
tenido un gran éxito, pero con la aparición de los Core 2 Duo de Intel, basados en su exitoso
Pentium M Centrino, la iniciativa vuelve a las manos de Intel en todos los frentes. Hay que
esperar a que AMD saque sus nuevos procesadores K8L, de 4 núcleos y con tecnologías
mejoradas, como el HyperTransport 3 y una caché L3.
Procesador CELL
El procesador Cell, es un procesador multi-núcleo diseñado por las empresas IBM, Sony y
Toshiba desde el marzo del 2001. Este procesador va a ser usado inicialmente por la PlayStation
3, pero se tiene previsto usarlo también en los productos electrónicos que fabrican estas
empresas, que van desde televisores de alta definición hasta ordenadores.
Los componentes del procesador son:
 1 Power Processor Element (PPE).
 8 Synergistic Processor Elements (SPEs).
 Bus de Interconexión de los Elementos (EIB).
 Controlador de Acceso Directo a Memoria (DMAC).
 2 Controladores de Memoria Rambus XDR.

Una interfaz Rambus FlexIO (Input / Output).
El PPE es el núcleo principal, este se encarga de coordinar el trabajo de todos los demás núcleos
(SPEs), mediante la tecnología SMT (Simoultaneous Multi-Threading). El PPC toma el control del
sistema operativo y deja a los SPEs el trabajo de los demás procesos.
EL PPE esta basado en la arquitectura PowerPC de 64 bits, tiene 32 KB de caché L1 y 512 KB
de caché L2, tiene también tecnología de doble hilo y puede ejecutar dos instrucciones por hilo.
Este procesador esta hecho como los RISC clásicos, o sea no es como los PowerPC
tradicionales, por eso no tiene implementado la predicción de saltos, y la ejecución de
instrucciones es en orden; lo que ahorra una cantidad considerable de transistores, pasando todo
ese trabajo al compilador.
Los SPE son los procesadores auxiliares, son unidades de cálculo vectorial. Pueden ejecutar
hasta dos instrucciones por ciclo. Cada SPE tiene 128 registros de 128 bits cada uno, 4 unidades
de coma flotante, 4 unidades aritméticas enteras y una memoria local de 256 KB (esta memoria
es SRAM como las memorias caché, pero no es una de ellas). Al no utilizar memoria caché, se
simplifica el diseño del SPE. Los SPEs tienen memoria local para tomar los datos que requieren
más rápidamente.
El bus de interconexión de elementos, EIB, esta compuesto por 4 canales de datos de 128 bits,
permite la comunicación entre todos los elementos del procesador, permite también cargar y
mover 16GB de datos por segundo hacia y fuera del Cell respectivamente. Para mantener lleno
este ancho de banda, el procesador Cell utiliza en sus controladores de I/O y la memoria las
tecnologías diseñadas por la empresa Rambus (conocida por haber fabricado las veloces
memorias RAM para Pentium 4, las RIMM, que no tuvieron aceptación en el mercado). La
memoria XDR de Rambus es bastante rápida, llegando a velocidades 12 veces superiores a las
memorias convencionales de 533Mhz actuales.
La velocidad a la que llega es de 4.8Ghz. La tecnología FlexIO, también de Rambus, es una
interface de entrada y salida bastante rápida. Esta constituido por 12 conexiones punto a punto
unidireccionales de 1byte, 7 de estas conexiones son de salida y 5 son de entrada. El FlexIO
puede tener una velocidad desde 400Mhz hasta 8GHz.
El chip Cell ha ahorrado muchos transistores al no implementar caché para los SPEs, ejecución
fuera de orden, predicción de saltos, etc., dejando todo ese trabajo al compilador; con el fin de
poner mas procesadores (SPEs) lo que aumenta el poder de procesamiento, y además para que
el chip sea más sencillo y gaste menos energía. Este chip es un monstruo con sus 234 millones
de transistores, la mayoría dedicados al poder de procesamiento por lo anteriormente expuesto, y
como utiliza muchos “cerebros”, la generación de calor se disemina por todo el procesador.
Otras características de este procesador son:
 Fabricación en 90nm (nanómetros).
 Frecuencia de trabajo desde 3.2 GHz.
 1,3 Voltios.
 Operación a 85ºC con un disipador.
 El prototipo tiene 221mm 2.
 Utiliza la tecnología SOI (Silicio sobre aislante)
Otras características que tiene el Cell es que es escalable, fue diseñado para poder trabajar con
otros Cell. Un PPC de un Cell tiene el potencial de comunicarse con un PPC o un SPE de otro
Cell que se encuentre en la misma placa madre, en la misma red o en cualquier parte del mundo
si ambos estos conectados a Internet.
Otros Procesadores
Otros procesadores multinúcleo importantes que han salido son:
- el PowerPC G5 para las Apple.
- El UltraSparc T1 Niagara, poderoso procesador para servidores, que genera un gran
ahorro de energía por su relación rendimiento/energía. Su fabricante Sun Microsystems
antes también ha sacado buenos procesadores multinúcleo para sus servidores.
6. Futuro de los procesadores multinúcleo
 Actualmente Intel y AMD están ofreciendo sus procesadores de doble núcleo. En los
siguiente años saldrán sus procesadores de 4 núcleos, 8, etc. Intel prevé llegar a construir un
procesador de 32 núcleos para el 2010.
 El procesador Cell ha comenzado a ser construido con la tecnología de fabricación de 65nm.
 IBM esta desarrollando el procesador Kilocore, un procesador que tiene un núcleo principal
PowerPC que maneja a 1024 núcleos auxiliares pequeños de 8 bits.
 En cuanto a tecnologías, IBM ha fabricado, en experimentos, chips con la tecnología SiGe
(tecnología que añade al silicio, mediante procesos nanotecnológicos, capas de germanio,
para mejorar sus propiedades electrónicas) que pueden alcanzar 500GHz con el cero
absoluto, previendo que pueden llegar a 350 Ghz a temperatura ambiente. Esta tecnología no
es tan costosa, pudiéndose implementar en las fabricas de chips a muy bajo precio. Esto
puede ser el comienzo de una nueva generación de procesadores ultrarápidos, comparados
con los actuales.
7. Conclusiones
- Los procesadores AMD e Intel multinúcleo seguirán mejorando, pues llevan compatibilidad
con las instrucciones x86. Las empresas de desarrollo de software se verán obligadas, por
motivos competitivos, a desarrollar software que aproveche el procesamiento paralelo que
tienen estos procesadores. Estos les generará gastos de desarrollo mayores de los
normales.
- En cambio el procesador Cell tiene más problemas, porque no es compatible con el software
existente. Es difícil que las empresas de software hagan programas para el Cell, por el
enorme costo de desarrollo que implica. Pero fue una buena idea ponerlo en la consola
PlayStation 3, porque ello generará una enorme cantidad de programadores, provenientes
de las industrias de juegos, que quieran aprovechar todo el potencial que tiene.
- El rendimiento de los procesadores ha tomado nuevo aliento, después de dejar de avanzar
en MHz. Con esta tecnología se puede seguir mejorando el rendimiento durante un buen
tiempo.
- Dentro de poco, las personas normales tendremos el poder de cómputo que tenían los
supercomputadores hace algunos años. (Se dice que 4 procesadores Cell tienen el poder
equivalente a la supercomputadora más poderosa de EEUU de hace solo 10 años).
8. Glosario
Procesador CELL
http://www.idg.es/pcworld/conocimiento/pdfs/PCWORLD_NT219.pdf
http://www.faq-mac.com/mt/archives/011150.php
http://www.faq-mac.com/mt/archives/011228.php
http://barrapunto.com/journal.pl?op=display&uid=19560&id=15379
http://www.blachford.info/computer/Cell/Cell1_v2.html
http://www.pcwla.com/pcwla2.nsf/articulos/0AB6B09F7369E0A500257060004D9E08
http://www.help400.es/asp/scripts/nwart.asp?Num=159&Pag=24&Tip=M
http://www.computeridea.net/Actualidad/An%C3%A1lisis/Inform%C3%A1tica_personal/Hardware/
20050413015/1
http://sanatox.f2o.org/?cat=9
http://www.rambus.com
Procesadores y Tecnología INTEL
http://www.intel.com
http://www.intel.com/support/sp/processors/pentium4/pentium4_ht.htm
http://www.active-hardware.com/spanish/reviews/processor/3Ghz.htm
http://www.canal-ar.com.ar/Noticias/NoticiaMuestra.asp?Id=3396
http://www.fayerwayer.com/archivo/2006/07/que_tal_es_el_intel_core_duo_2.php
http://es.wikipedia.org/wiki/Intel_Pentium_M
Procesadores AMD
http://www.amd.com/
es.wikipedia.org/wiki/AMD64
http://www.meristation.com/v3/des_noticia.php?pic=HRD&id=cw4471c55c7e8db
Información General
http://www.atc.uniovi.es/inf_med_oviedo/3iccrp/Transparencias/1-Hardware%20del%20PC.pdf
http://www.lcc.uma.es/~pedre/Trabajos_MP/29_Nuevos_Microprocesadores.pdf
http://www.fdi.ucm.es/profesor/sdelpino/ETC/historia.pdf
http://www.jeuazarru.com/docs/procesadores_dual_core.pdf
http://arstechnica.com/news.ars/post/20060407-6556.html
http://www.macuarium.com/foro/lofiversion/index.php/t108847-0.html
http://cum.unex.es/Profes/profes/jlguisado/materiales_ec_teoria/Trabajos%20monograficos%2020
05-2006/Paralelismo%20a%20nivel%20de%20thread%20-%20grupo%202.ppt
http://www.arcos.inf.uc3m.es/~jdaniel/seminarios/ssooa06/tendencias-proc.ppt
Edgar Miraya Anamaría
[email protected]
Estudiante de la Facultad de Ingeniería de Sistemas e Informática de la Universidad Nacional
Mayor de San Marcos. Lima, Perú.
Trabajo para el curso de Arquitectura de Computadoras.
Intel Core i7: Descripción y características del nuevo procesador de Intel.
Con el nombre en clave de Nehalem conocido hasta ahora desde hace varios años que se
lleva desarrollando, por fin llega al mercado rebautizado con el nombre comercial Intel
Core i7 en sus versiones de dos, cuatro y ocho núcleos.
Construído a 45 nm., es el primer procesador del Intel en conseguir poner cuatro y ocho
procesadores integrados de forma nativa compartiendo una misma memoria caché y
procesador de instrucciones. Asímismo vuelve la tecnología hyperthreading ya utlizada en
el Pentium 4, por lo el sistema operativo nos reportaría 16 procesadores si tuvierámos
instalado el Intel Core i7 Octo. Además el controlador de memoria va integrado dentro del
propio procesador con la nueva tecnología QuickPath, algo a lo que AMD ya nos tiene
acostumbrados desde hace bastante tiempo con su tecnología HyperTransport.
Tenemos cambio de socket y de chipsets, es decir, este procesador no será compatible con
ninguna de las placas madres desarrolladas para Intel Core 2 y procesadores anteriores.
Intel Core i7 necesita placas madre nuevas y chipsets nuevo. El zócalo para el procesador
ha crecido considerablemente de tamaño pasando a ser LGA1366 en comparación con el
anterior LGA775.
El Nombre “Intel Core i7″
Aunque Intel aún no se han pronunciado acerca de la procedencia del nombre “i7″, se ha
especulado mucho sobre este nombre en la web. No coincido con ninguna de estas
especulaciones, por lo que publico aquí la mía. La letra “i” vendría de Intel, y el número
haría referencia a la generación del procesador según la siguiente tabla.
Generación 1: Abarcaría todos los procesadores de Intel hasta el 80188.
Generación 2: El procesador Intel 286 y todas sus variantes.
Generación 3: El procesador Intel 386 y todas sus variantes.
Generación 4: El procesador Intel 486 y todas su variantes.
Generación 5: El procesador Intel Pentium y todas sus variantes.
Generación 6: El procesador Intel Core, Intel Core 2 y todas sus variantes.
Generación 7: El procesador Intel Core i7. Múltiples Núcleos con HyperThreading (HT)
Multi-Threading (SMT).
Una de las principales características de este procesador es el integrar múltiples núcleos de
forma nativa (single die). Es decir, núcleos que comparten la memoria caché y el juego de
instrucciones. Disponible en versiones de dos, cuatro y ocho núcleos a velocidades que
van inicialmente desde los 2.66 Ghz. hasta por encima de los 4 Ghz.
Con Hyperthreading Multi-Threading, tecnología ya utilizada con Pentium 4, cada
procesador será capaz de ejecutar dos instrucciones por cada ciclo de reloj, por lo que en
un sistema que tenga instalado el Intel Core i7 Octo, el sistema operativo le reportará que
tiene instalado 16 núcleos.
El viejo HyperThreading (HT), cambia de nombre con Intel Core i7, para llamarse
Simultaneous Multi-Threading (SMT) contará con 2 vías (2-way) que permitirá
administrar hasta 16 hilos (threads) de ejecución en un procesador de ocho cores, que es lo
que permite Intel Core i7 o en su defecto 8 hilos de ejecución en un procesador Quad core.
Resulta algo contradictorio pues los procesadores multi-núcleos deberían suplir lo que se
intentaba hacer con el HyperThreading en procesadores de un solo núcloe de la compañía
años atrás, pero la idea de tener mas hilos de ejecución es algo que para futuros sistemas
de computo seduce bastante y si se pueden entre comillas tener mas hilos, habrá que ver
como los sistemas y aplicaciones aprovechan estos canales adicionales para optimizar la
performance, pues es sabido que cuando Intel incorporo el HT en sus P4, no todas las
aplicaciones hacían uso o sabían aprovecharlo, pues todo o casi todo se programaba para
un solo hilo de ejecución. Actualmente la tendencia es aprovechar los procesadores dual o
quad core para optimizar el rendimiento, veremos si este remozado HT logra hacer
diferencia.
Memoria Caché Compartida de Alto-Nivel.
Mejoras en la memoria caché con una nueva arqitectura de tres niveles: la caché L1 con
32 Kb. de caché para intrucciones y otros 32 Kb para caché de datos; nueva caché L2 por
núcleo de latencia muy baja con 256 Kb por núcleo para datos e instrucciones; y una
nueva caché L3 compartida por todos los núcleos y con diferentes configuraciones en Mb.
según el tipo de procesador, 8 Mb en el caso de un Core i7 Quad con cuatro núcelos,
aunque con el tiempo se irá ampliando esta memoria caché compartida.
Intel tendrá en sus procesadores lo que ha denominado Multi-level shared cache, esto
quiere decir que seguramente tanto la memoria cache de nivel 2 (L2) como la memoria
Cache de nivel 3 (L3) serán memorias compartidas por cada uno de los núcleos del
procesador, esto trae la ventaja de que se simplifica el diseño de la arquitectura interna del
procesador, pero hay que ser cuidadosos en la forma en al que cada uno de los cores
intenta acceder a la memoria para que no se produzcan conflictos en los accesos, quizás
con un switch interno que administre las peticiones. Esto por que siempre será mas optimo
que cada core tenga su propio cache y que acceda a el exclusivamente a que tener un solo
Gran cache en que dos, cuatro o mas núcleos intenten acceder a el provocando, colas o
latencias demasiado altas en los accesos, lo que provoca un contrasentido en la razón de
ser del la memoria Cache de un procesador, la cual es ahorrarse tiempos al tener un cache
externo o tratar de acceder a la memoria principal en tareas críticas.
Intel QuickPath
El procesador Intel Core i7 lleva integrado el controlador de memoria dentro del propio
procesador. La tecnología Intel QuickPath Interconnect, es una tecnología de
interconexión con el procesador punto a punto desarrollada por Intel en competencia con
la tecnología HyperTransport de AMD.
Esta tecnología incluye un controlador de memoria dentro del propio procesador.
Reemplaza al Front Side Bus (FSB) de los procesador Xeon e Itanium.
El rendimiento de esta tecnología está reportado para ser de 4,8 a 6,4 Gigatransferencias
por segundo (GT/s) por dirección, y un enlace puede ser 5, 10 o 20 bits de largo en cada
dirección. Además el ancho de banda provisto por un enlace largo completo asciende de
12,0 a 16,0 GB/s por dirección, o de 24,0 a 32,0 GB/s por enlace.
Admite hasta tres canales de memoria DDR3 a 1600 Mhz.
Integrated Graphics Processor
Tambien incluirá un procesador gráfico integrado dentro del propio procesador también
en respuesta al anuncio de AMD con su tecnología Fusion que consiste en integrar un
procesador gráfico dentro del propio procesador.
En el caso de Intel Core i7, habrá versiones distintas de este procesador, unas sin este
controlador y otras con este procesador integrado.
Aunque no veremos procesadores Intel Conre i7 hasta el año 2.009, la idea es la de incluir
una GPU, procesador gráfico discreto integrado, para modelos concretos, como por
ejemplo portátiles y dispositivos ultra-móviles (UMPC) ya que se consegurían consumos
de energía muy bajos por lo que se aumentaría considerablemente la duración de las
baterías en sistemas móviles como los portátiles.
Nuevo Conjunto de Instrucciones SSE 4.2
Streaming SIMD Extensions (SSE) es un conjunto de instrucciones SIMD (Single
Instruction, Multiple Data - Única Instrucción, Múltiples Datos) añadidas en el año 1.999
al procesador Pentium III, como extension a la arquitectura x86 como respuesta a la
tecnología 3DNow! que AMD tenía implementada años atrás.
La versión 4.2 de las extensiones de vector de Intel SSE trae de regreso al futuro el x86
ISA atrás con la adición de nuevas instrucciones de manipulación de cadenas. Digo
“Regreso al futuro” porque el soporte a nivel de cadena de procesamiento ISA es una
característica de las arquitecturas CISC que se considera obsoleta actualmente en los años
post-RISC. Pero la cadena de instrucciones del nuevo SSE 4,2 están destinadas a acelerar
el procesamiento de XML, lo que las convierte en perfectas para la Web y aplicaciones
futuras basadas en XML.
SSE 4.2 también incluye una instrucción CRC que acelera el almacenamiento y las
aplicaciones de red, así como una instrucción POPCNT útil para una variedad de tareas de
patrón especificado. Además, para ofrecer mejopr soporte a las aplicaciones multi-hilo,
Intel ha reducido la latencia de los hilos de las primitivas de sincronización.
En el frente de virtualización, acelera las transiciones y tiene algunas mejoras sustanciales,
que no voy a detallar aquí, en su sistema de memoria virtual que reduce en gran medida el
número de esas transiciones requeridas por el Hypervisor.
Otras Características
Cuatro unidades de dispatch en vez de tres, lo que se traduce en un 33% más de mejora de
proceso de datos por parte del procesador. El Intel Core i7 podrá ejecutar cuatro
microinstrucciones a la vez en lugar de las tres de Intel Core 2, consiguiendo un aumento
considerable en velocidad.
Además este procesador llevará un segundo buffer de 512-entradas TLB (Translation
Look-aside Buffer). Este circuito es una tabla utilizada para convertir las direcciones
físicas y virtuales por el circuito de memoria virtual. Añadiendo esta segunda tabla se
mejora considerablemente el rendimiento del procesador.
Un nuevo segundo buffer de predicción de bifurcaciones o BTB (Branch Target Buffer) y
aumentando el tamaño del primer y este segundo nuevo buffer permitirá carga más
instrucciones y predecir con más exactitud cual es la siguiente instrucción a procesador
mejorando
aún
más
el
rendimiento
del
procesador.
Disponibilidad y Modelos.
Incialmente en octubre de 2.008 veremos los primeros modelos con socket LGA1366,
cuatro núcleos y 8 Mb. de memoria caché, serán los Intel Core i7 Quad a velocidades de
2,66 Ghz, 2,93 Ghz y en su version Extreme Editon a 3,2 Ghz con versiones de doble y
triple canal de memoria DDR3 a 800, 1066, 1333 y 1600 MHz con buses de memoria de
1x 4.8 GT/s QuickPath, 1x 6.4 GT/s QuickPath y 2x QuickPath. El consumo de este
procesador estará en 130 W y socket LGA1366.