Download AMD ATHLON

Document related concepts
no text concepts found
Transcript
Universidad de Alcala
Curso de Arquitectura
Avanzadas 2001/02
Prof. José Antonio De Frutos
AMD ATHLON
Y
PENTIUM 4
Antonio Bruno
Maurizio Alosi
Indice
AMD ATHLON
AMD Athlon ......................................................................... pag.2
Athlon : Introducción ............................................................ pag.3
Athlon : Características ......................................................... pag.4
- Core del Procesador .............................................. pag.4
- Características Avanzadas .................................... pag.5
- La caché del Primer Nivel – L1 ............................ pag.6
- La caché del Segunda Nivel – L2 ......................... pag.6
- FPU – Floating Point Unit
(Unidad de coma flotante) .................................... pag.7
- Introducción SIMD ............................................... pag.8
- BUS ...................................................................... pag.8
- AMD 750 – Irongate ........................................... pag.11
Benchmarks ......................................................................... pag.13
Overclocking ....................................................................... pag.15
Conclusión ........................................................................... pag.16
PENTIUM 4
Arquitectura totalmente nueva ............................................ pag.17
Hyper Pipelined Tecnology ................................................. pag.18
- Bus de Sistema de 400 Mhz ................................ pag.18
- Rapid Execution Engine ...................................... pag.18
- Caché otras características .................................. pag.19
- Operación matemáticas : FPU y SSE2 ................ pag.19
Cómo es el Pentium 4 físicamente ...................................... pag.20
El chipset .... y la memoria .................................................. pag.22
Rendimiento (1) ................................................................... pag.23
Rendimiento (2) :SSE2 y optimización ............................... pag.25
Algunos precios orientativos ............................................... pag.27
Conclusión ¿ versión 1.0 ? .................................................. pag.28
1
AMD Athlon
Desde que en 1998 AMD anunció el futuro lanzamiento del K7, al que después AMD ha
bautizado como Athlon,
Mientras que Intel solo se ha preocupado de ir agotando la arquitectura x86 del Pentium
Pro añadiendo pequeños parches y subiendo la velocidad de los procesadores y buses, AMD
ha optado por el desarrollo de un procesador de séptima generación capaz de llenar el
hueco que Intel ha dejado entre sus procesadores de sexta generación y los futuros
procesadores con una nueva arquitectura EPIC sobre la que correrán sus procesadores de
64bits, Merced.
Prueba de esto es el adelanto del lanzamiento del procesador Pentium III 600, es bastante
extraño que Intel haya subido el voltaje del core del procesador del PIII 600 a 2.05
Voltios frente a los 2 Voltios del PIII a 450-550 Mhz. Después de múltiples retrasos el
Merced sigue siendo una incógnita del que se conoce poco o nada. La arquitectura x86 en
0.25 micras cada vez lo tiene más complicado para subir de velocidad y la tecnología en 0.18
micras (Coppermine) se retrasa...
Pero mientras tanto el K7 de AMD está aquí. El K7 es un procesador que es capaz de darle
a Intel donde más le duele, rendimiento superior a igual velocidad de reloj, rendimiento
superior al Pentium III incluso en el que hasta hoy era el reino de Intel las operaciones en
coma flotante.
Eso hará que AMD pueda adoptar una estrategia de mercado igual a la que Intel ha usado
con AMD durante mucho tiempo simplemente con subir un escalón en la frecuencia en el
procesador seguirá teniendo el procesador con mas rendimiento del mercado
2
Athlon : Introducción
Externamente el Athlon es muy parecido al Pentium III, con la diferencia del logo de la
marca. Viene en un cartucho similar al de los antiguos Pentium II y Pentium III.
No es compatible con los Slots 1 y 2 de Intel ya que dispone de un diseño propio
denominado Slot A que eléctricamente es distinto al diseño de Intel. Esta similitud
permitirá a los fabricantes utilizar los mismos sistemas de refrigeración de los Pentium II
de Intel.
Slot 1 :
Slot A :
La novedad de este procesador es que AMD no ha tratado de seguir los dictados
tecnológicos de Intel como hasta ahora y eso le ha hecho innovar y sacar al mercado un
producto que yo personalmente creo que es bastante interesante.
3
Athlon : Características
- Múltiples decodificadores paralelos de instrucciones x86
- 128KB de Caché L1 (64KB para instrucciones y 64KB para datos)
- 3 pipelines para enteros independientes
- 3 pipelines para cálculos de direcciones independientes
- 3 Unidades de coma flotante superescalar, con pipelines independientes que ejecutan
instrucciones de coma flotante x87, MMX y 3Dnow!.
- Bus del sistema de 200Mhz basado en el protocolo EV6 de Digital
- Enhanced 3DNow! que aporta 24 instrucciones SIMD nuevas a las ya existentes que dan
soporte a funciones matemáticas de enteros, streaming graphics, y funcionalidades DSP.
Estas nuevas funcionalidades del 3DNow! aumentan el rendimiento por ejemplo de la
decodificación de MP3s y funciones de modem.
Core del Procesador:
Todas las CPUs modernas x86 toman operaciones complejas CISC y las decodifican a
instrucciones RISC mas compactas y que son decodificadas mas eficientemente. El Athlon
llega a decodificar hasta 3 instrucciones x86 por ciclo de reloj.
4
Comparemos los decodificadores del Athlon con las del P6. El Intel Pentium III tiene tres
unidades de decodificación paralela que se conocen como compleja, simple y simple. Intel
tiene estrictas reglas para el uso de estos decodificadores. Esto significa que idealmente 3
instrucciones pueden ser decodificadas al mismo tiempo, si y solo si una de ellas es
compleja y las otras dos son simples. Intel define una instrucción como compleja que puede
ser representada por no mas de 4 microOPs y simple aquella que puede ser traducida por 1
microOP. El Athlon puede decodificar 3 instrucciones al mismo tiempo, pero dispone de
decodificadores completos lo que significa que virtualmente puede decodificar cualquier
combinación de instrucciones en cualquiera de sus decodificadores sin ningún tipo de
restricciones como en la arquitectura P6 de Intel.
Otra ventaja del Athlon sobre el core del P6 de Intel es la precisión del árbol de
predicción de salto cuya tabla se compone de 2048 entradas que almacena la operaciones
más usadas por el procesador e intenta predecir cual será la próxima instrucción a ejecutar
en el pipeline. Esta tabla es 4 veces más larga que la usada en el P6 pero su ventaja no
estriba solo aquí sino que la penalización en caso de error es menor que en caso del P6. Esto
es debido a que el Pipeline del Athlon es más corto(10 etapas en enteros y 15 en los Pipeline
de coma flotante contra los 15 estados en enteros y aproximadamente 30 en los Pipelines
del core del P6).
Características Avanzadas:
En las aplicaciones 3D, uno de los handicaps es que cada cambio de escenario necesita se
escriba a la memoria de video de la tarjeta gráfica. Esto causa que la escritura de bytes
simples interrumpan los procesos de triangulación y así reducir el rendimiento del sistema.
Una salida a este dilema es combinar las escrituras simples en un buffer de escritura
combinada y entonces transferir los datos utilizando el ancho de banda completo del bus
AGP o PCI. Así, el número de ciclos de penalización(causados por la escritura de un byte
5
solamente) pueden ser reducidos significativamente, incrementando el rendimiento medio
en aplicaciones 3D en un 80 por ciento. Pero para conseguir esto es necesario añadir los
llamados registros MTRR (Memory Type Range Registers) o buffer de escritura
combinadas (Write Combine). El P6 de Intel tiene no menos de 8 de estos MTRRs, el Athlon
tiene 4 buffers WC de 64bits cuya novedad reside en que son capaces de ejecutar
escrituras fuera de orden en tanto en orden ascendente como descendente.
Físicamente el Athlon posee 22 Millones de transistores en 184 mm2 usando una tecnología
de 0.25 micras. En cuanto al voltaje del core del procesador es de 1.6 voltios que es
inferior al de los procesadores Pentium III (2.0v).
La Cache de Primer Nivel - L1 :
El Athlon dispone de 4 veces más cache de primer nivel que el Pentium III y cuadruplica la
caché de datos y la caché de instrucciones, es decir dispone de 128KB de cache L1 lo que le
permite dar unos resultados excelentes en aplicaciones ofimáticas tipo Word, Excel, .....
que precisamente son aplicaciones que se benefician del uso de este tipo de memoria.
La Cache de Segundo Nivel - L2 :
Aunque los inicialmente los procesadores Athlon vendrán con una caché L2 de 512KB, como
el Pentium III, corriendo a la mitad de la velocidad del reloj del procesador.
El Athlon fue diseñado con una cache de segundo nivel muy flexible. Puede ir desde los 0.5
hasta los 8MB y su velocidad puede ir en un ratio de 1/3, 1/2, 1/1.5 a 1/1 en relación a la
velocidad de la cache L2/velocidad de reloj del procesador. Esto abre un amplio abanico de
posibilidades al Athlon desde versiones de bajo costo, con caches L2 lentas y escasa
(512Ks) hasta estaciones de trabajo y servidores con hasta 8MB de cache L2 corriendo a la
velocidad del reloj del procesador. El hecho de que no esté integrada en el core del
procesador hace que el Athlon tenga un formato en cartucho, Slot A.
La cache L2 del Athlon puede operar a una frecuencia programada que le permite la
compatibilidad con una amplia variedad con memorias SRAMs, incluidas DDR.
Aunque los inicialmente los procesadores Athlon vendrán con una caché L2 de 512KB
corriendo a la mitad de la velocidad del reloj del procesador puede llegar a direccionar
hasta 8MB. Con esta ventaja AMD posiciona el procesador en el segmento más alto de la
pirámide, los servidores. Para ello AMD ha registrado varios nombres "Athlon Select",
"Athlon Professional", y "Athlon Ultra".
6
:
FPU - Floating Point Unit (Unidad de coma flotante)
El Pentium III tiene dos unidades de coma flotante una de la cuales esta dotada de pipeline
y la otra parcialmente dotada de pipeline. El Athlon dispone de 3 unidades de coma flotante
con pipeline independientes lo que permite que puedan ser alimentadas al mismo tiempo ya
7
que cada una de ellas tiene su propio puerto. El Pentium III tiene también 3 unidades de
ejecución de coma flotante pero desafortunadamente todas ellas están bajo solo un puerto.
Lo que hace que solo pueda ejecutar una sola instrucción de 80 bits extendida por ciclo de
reloj cuando el Athlon puede ejecutar 2.
Una ventaja de esto lo notarán aquello que se dediquen al diseño sintético por ejemplo 3D
Studio Max en los que el tiempo de render bajará radicalmente.
Al fin un procesador que es capaz de destronar al hasta hoy indiscutible rey en esta
faceta.
Instrucciones SIMD :
El Athlon dispone de 45 instrucciones 3Dnow! Que son 24 instrucciones más que sus
antecesores. El Intel Pentium III dispone de 71 instrucciones SSE. Las 24 nuevas
instrucciones del Athlon se distribuyen de la siguiente manera:



12 instrucciones para aumentar las capacidades multimedia en cálculos matemáticos
en enteros (reconocimiento de voz y procesamiento de video)
7 instrucciones para acelerar el movimiento acelerado de datos en sistemas
gráficos para aumentar la calidad de estos(texture compression / Páginas Web 3D,
etc.)
5 instrucciones DSP para aplicaciones avanzadas de comunicaciones (soft ADSL,
soft modem, MP3 y Dolby Digital Surround sound)
BUS :
8
La mayor diferencia entre el Athlon y el Pentium III son sus respectivas arquitecturas de
buses. La arquitectura que Intel está usando en sus diseños actuales (PIII y PIII Xeon) es
la basada en el bus GTL+ (Gunning Transceiver Logic) que corre a una velocidad de 100Mhz
pero que subirá a 133Mhz con la entrada en escena del nuevo chipset i820(Camino).
AMD utiliza una arquitectura de bus EV6 de Digital que esta empleara en sus Alpha y que
teóricamente puede subir hasta los 400Mhz. Técnicamente el bus EV6 aporta una serie de
ventajas respecto al GTL+ de Intel, entre ellas podemos destacar una topología punto-apunto(cada procesador es un sistema multiproceso dispone de su propio bus a 200Mhz, en
el GTL+ los procesadores comparte este bus a 100Mhz por lo que cuantos más
procesadores menos ancho de banda), una interface de memoria asíncrona(la velocidad de
la memoria es independiente a la velocidad del bus y es determinada solamente por el
chipset). Como curiosidad podemos citar que el bus EV6 soporta sistemas
multiprocesadores de hasta 14 procesadores. El espacio de direcciones del EV6 es también
mayor que el del bus P6, es de 43 bits de profundidad contra los 36-bits del bus P6.
Además el EV6 permite transferencias de 64bytes en ráfagas en vez de los 32 soportados
por el GTL+ por lo que el EV6 es capaz de mandar más datos a la vez a través del bus que el
GTL+. El bus EV6 también añade seguridad ya que añade un byte de ECC (Error Checking
Correction) en todas las transferencias, una característica implementada en el bus GTL+ de
Intel pero que esta ausente en todas las plataformas Super7.
Aunque el bus del Athlon corre a 100Mhz el bus EV6 toma los flancos de subida y bajada de
los ciclos de reloj por lo que técnicamente la velocidad es de 200Mhz por lo que el sistema
de memoria de los primeros Athlon correrá sobre RAM PC100 a 100Mhz pero el bus EV6
permite cambiar fácilmente el tipo y la configuración de la memoria disponible para esta
plataforma.
De este modo el bus del Athlon es el sistema con el bus de sistema más rápido sobre
sistemas x86 con una tasa de transferencia de hasta 1.6 GB/s más de los 1.06 GB/s que el
9
Pentium III alcanzará una vez de que chipset 'Camino' o 'i820' cuando sea lanzado y es
exactamente el doble del ancho de banda de los sistemas actuales sobre chipsets BX ya
que GTL+ opera a 100MHz y da un ancho de banda de 800MB/s (64-bits x 100MHz = 6400
Mb/s / 8 = 800MB/s).
Si AMD escalara el bus EV6 hasta los 400Mhz se alcanzaría una velocidad de transferencia
de hasta 3.2 GB/s de ancho de banda máximo que seguiría siendo superior a los 2.1 GB/s en
los buses a 133Mhz aprovenchando los dos flancos del ciclo de reloj.
En la siguiente tabla podemos ver un sumario de las arquitecturas de los procesadores :
10
AMD 750 - Irongate :
El chipset AMD-750™ consiste de dos dispositivos físicos: el AMD-751™ system controller
(North bridge) y el AMD-756™ peripheral bus controller (South bridge).
11
El AMD-751™ es compatible con PCI 2.2 y soporte de hasta 6 PCI masters, soporte de
hasta 768MB de memoria DIMM de SDRAM PC-100, soporte AGP 2.0 y modos AGP 1x y 2x.
El AMD-756 da soporte IDE Ultra DMA-33/66, soporte Plug-n-Play, ACPI 1.0 y gestión de
potencia APM 1.2, soporte USB de hasta 4 puertos.
Este es el primer chipset de AMD para Athlon. Lo primero que llama la atención de este es
la similitud frente al conocido chipset BX de Intel. soporta SDRAM de PC100, AGP, slots
ISA y PCI. Para el futuro AMD planea añadir soporte para memorias PC133, RDRAM, AGP
4x y ATA-66.... Desafortunadamente no tiene soporte multiprocesador, pero si se espera
que los futuros chipset tengan soporte para multiproceso.
12
Benchmarks :
Los resultados hablan por si mismos, Athlon es capaz de batir al Pentium III en casi todos
los benchmarks realizados. Tanto en uso ofimático, juegos, estaciones de trabajo, CAD y
Render 3D y además con el soporte para multiproceso y cache L2 ampliables lo hace ideal
para Servidores también. Todo esto lo hace ahora mismo uno de los sistemas mas
recomendables y todoterreno del momento.
3D Studio
Intel
FutureMark
Max Frames
Multimedia MultimediaMark
Renderizados
Bench
99
por Hora
Quake 3
1.08 -Q3
demo1 640x480x16
Windows
98
SysMark
98
Windows NT SP5 - SysMark 98
AMD
Athlon 650
Mhz
88.7
1113.6
1792
114.3
284
308
AMD
Athlon 650
Mhz
81.8
1050.23
1650
109.7
265
292
Intel
Pentium
III 600
Mhz
56.3
859.19
1856
94.7
238
264
Intel
Pentium
III
550Mhz
51.4
776.16
1721
87.4
222
247
13
IntelPentium III 600 AMDAthlon 600
Ziff-Davis Winbench99 Ver1.1
CPU Mark99
44.1
56.3
FPU WinMark
3040
3230
Business Disk WinMark
2740
2860
High-End Disk WinMark
10100
10300
Disk CPU Utilization[%]
3.40
3.65
Business Graphic WinMark
226
264
High-End Graphic WinMark
643
780
968
998
3DMarks
5580
6024
CPU 3DMarks
9011
10503
2D
5.42
6.75
3D
4.52
4.62
Bus
9.01
10.10
Ziff-Davis 3D Winbench99 Ver1.2
3D WinMark
Futuremark 3DMark 99 Max Pro
Final Reality 1.01
Esto es solo una muestra de la cantidad de benchmark realizados y cuyos resultados en la
mayoría de los casos coincide con estos datos. El Athlon barre al Pentium III en casi todos
los casos. Solo en aquellos casos en los que el programa de medida está optimizado para las
extensiones multimedia de Intel es favorable al Pentium III y no en todos los casos.
14
Overclocking :
Una cosa que llama la atención es que las placas de sistemas Athlon carecen de jumpers lo
que a primera vista podría hacer dudar la posibilidad de que se pueda aumentar de vueltas
los Athlon pero no, los sistemas Athlon necesitarán una "MHz card" para modificar el
multiplicador, frecuencia de bus.......
15
Conclusión:
La verdad es difícil comentar algo al margen de lo que ya se ha dicho, el AMD Athlon por
primera vez supera al Intel Pentium III en casi todos los aspectos, tanto en rendimiento
como en su diseño el K7 es el procesador x86 más rápido hoy por hoy. Solo debemos
esperar que AMD sea capaz de responder a la expectación que ha levantado en los foros de
Hardware con su Athlon, si es capaz de producir procesadores en cantidad suficiente para
satisfacer la demanda serán los propios usuarios los que auparán a este procesador al lugar
que merece.
Esperemos de todos modos como reacciona Intel y como lo trata el mercado esta avalancha
que se le viene encima. De entrada a procedido a bajar los precios de sus procesadores
veremos que medidas toma a parte de esta.
16
PENTIUM 4
Una arquitectura totalmente nueva
Para toda empresa, el márketing es una cuestión muy importante, hasta el punto de
condicionar la propia creación de un producto... y por supuesto su nombre. Debido al enorme
éxito que tuvo el Pentium original (después de bajarle el voltaje y corregir aquél improbable
fallo matemático que... en fin, es historia), Intel decidió llamar así a sus siguientes
procesadores, aunque en ocasiones no fuera del todo lógico.
De esa forma, si el Pentium MMX era una pequeña variante del núcleo del Pentium, el
Pentium II no se le parecía apenas (era bastante más avanzado y descendía directamente
del Pentium Pro, el primero en usar la llamada arquitectura P6). Y en cambio, el Pentium III
(normal y Coppermine), básicamente es un Pentium II con algunas mejoras (tal vez útiles,
pero no revolucionarias).
Sin embargo, el Pentium 4 se ha diseñado partiendo casi de cero. En concreto, se basa
en la nueva arquitectura NetBurst© (microarquitectura, siendo puristas), que según Intel
se basa en los siguientes pilares:





Hyper Pipelined Technology;
Bus de Sistema de 400 MHz;
Execution Trace Cache;
Rapid Execution Engine;
Advanced Transfer Cache;



Advanced Dynamic Execution;
Unidad Multimedia y de Coma Flotante
Mejorada;
Streaming SIMD Extensions 2 (SSE2).
¿Terrible, verdad? Bien, no todo lo anterior es igualmente importante, como veremos a
continuación. Vamos a separar las partes que creemos más importantes y a explicarlas de la
manera más sencilla posible.
17
Hyper Pipelined Technology
Éste es uno de los principales
cambios internos del Pentium 4.
Veamos cómo lo explicamos:
dentro del microprocesador, los
datos pasan por "pipelines"
(canales de datos), de un número
determinado de etapas.
En un Pentium con arquitectura P6
(Pentium Pro, Pentium II,
Pentium III y Celeron), el pipeline
tiene 10 etapas; en el Pentium 4,
hay 20 etapas. Cuantas más
etapas, más se tarda en
"liberar" los datos, por lo que
cuando Intel dice que esto
aumenta el rendimiento... en fin, suponemos que habla el departamento de márketing. Por
supuesto, otras divisiones de Intel son más serias y reconocen abiertamente que el
rendimiento DEBE BAJAR por este motivo.
Sin embargo, esto tiene una ventaja: permite alcanzar mayores velocidades de reloj
(más MHz). Lo que busca Intel es perder parte del rendimiento para poder recuperarlo a
fuerza de MHz (GHz, más bien). Es un compromiso, y probablemente lógico.
Bus de Sistema de 400 MHz
Nada de lo que quejarnos, es una de sus mejores características. Ojo porque, en realidad,
no son 400 MHz "físicos", reales, sino 100 MHz cuádruplemente aprovechados con una
especie de "doble DDR", o como hace el AGP 4X; por ello, el multiplicador a seleccionar en
la placa para el modelo de 1,4 GHz (1400 MHz) es 14x, no 3,5x.
Estos 400 MHz "equivalentes" (que lo son, la idea funciona), mejorarán el rendimiento de
aplicaciones "profesionales" y multimedia (como renderizado y edición de vídeo), y el de
muchos juegos 3D.
La cifra mágica de trasferencia que se alcanza son 3,2 GB/s, mientras que los nuevos AMD
Athlon con bus de 266 MHz (realmente "133x2") se quedan en 2,1 GB/s (eso sí, muy bien
aprovechados), el Pentium III con bus de 133 MHz en sólo 1 GB/s... y el pobre Celeron, con
sus 66 MHz, en unos míseros 0,5 GB/s.
Rapid Execution Engine
Otra novedad absoluta de esta nueva arquitectura: algunas partes del Pentium 4
funcionan al doble de la velocidad de reloj; es decir, ¡a 3 GHz en el modelo de 1,5 GHz!!
En concreto, estas partes son dos unidades aritmético-lógicas de enteros (ALUs). Bien, el
caso es que esto suena maravilloso, y debería hacer volar al micro en aplicaciones "no
matemáticas" (como las de oficina o muchas acciones del propio sistema operativo)... pero
18
como veremos más tarde, parece que no lo consigue, debido muy probablemente al exceso
de etapas del pipeline.
Caché y otras características
La caché L2, integrada en el micro y
de 256 bits, es una mejora de la
tecnología "Advanced Transfer
Cache" estrenada con el Pentium III;
puede alcanzar 48 GB/s en el modelo
de 1,5 GHz. Esto representa el doble
de lo que puede hacer un Pentium III
de la misma velocidad, y es mucho más
de lo que puede alcanzar un AMD
Athlon, sobre todo porque en éste la
caché L2 tiene un bus de sólo 64 bits.
En cuanto a Execution Trace Cache y
Advanced Dynamic Execution, son
aburridamente técnicas: mejoran la
ejecución especulativa y la predicción de ramificaciones (branch prediction), de tal forma
que... en fin, digamos que intentan mejorar el rendimiento, o más bien paliar la pérdida del
mismo a la que obliga el nuevo pipeline.
Operaciones matemáticas: FPU y SSE2
Llegamos al apartado más polémico de este micro: su tratamiento del apartado matemático,
entendiendo por esto los renderizados, los juegos 3D, la compresión y descompresión de
audio y vídeo, los cálculos matemáticos con funciones complejas...
Para enfrentarse a ello, el Pentium 4 tiene CUATRO posibilidades: utilizar la unidad de
coma flotante "de toda la vida" (la "FPU"), utilizar las ya clásicas (y casi anticuadas)
instrucciones MMX, utilizar las SSE (Streaming SIMD Extensions, introducidas con el
Pentium III), o la gran novedad: las instrucciones SSE2 (Streaming SIMD Extensions 2,
claro).
Éstas son no da menos que 144 nuevas instrucciones, algunas capaces de manejar cálculos
de doble precisión de 128 bits en coma flotante (lo cual es algo excelente, confíe en
nuestra palabra). La idea es reducir el número de operaciones necesarias para realizar las
tareas.
...Pero todo este esquema tiene un gran problema: la unidad FPU del Pentium 4 parece ser
muy lenta, incluso peor que la del Pentium III. Esto podría no ser muy grave, ya que las
SSE2 hacen el mismo trabajo en mucho menos tiempo... pero las SSE2 sólo pueden ser
utilizadas por software específicamente preparado para ello, software optimizado.
Y claro, el 99,99% del software actual no está optimizado. Por esto, si se compra un
Pentium 4 para trabajar con su actual 3D Studio Max o Photoshop, encontrará que un
Pentium III o un Athlon son de un 10% a un 100% más rápidos. Volveremos más tarde sobre
esto...
19
Cómo es el Pentium 4 físicamente
Bueno, disculpas por el "rollo" técnico; vamos ahora a la parte física, que es bastante más
gratificante. Ante todo, el Pentium 4 necesita placas
base diseñadas específicamente para él.
Esto es lógico, ya que su diseño es muy distinto al del
Pentium III, interna y externamente. El chip en sí viene en
formato zócalo y tiene 423 pines; por tanto, su zócalo se
llama "Socket 423". Pero aquí viene la sorpresa: según
todos los informes disponibles, este formato será
sustituido por otro con más pines (¿478?) EN MENOS
DE UN AÑO.
Sí, ha leído bien: si se compra hoy un Pentium 4 y la
correspondiente placa base, dentro de un año se
encontrará con un equipo incompatible con los siguientes
Pentium 4. Uno se pregunta si se trata de una broma macabra cuando Intel dice que ésa es
"la estrategia más segura contra la obsolescencia"... o será de nuevo el departamento de
márketing.
Otras características importantes hacen relación al núcleo del chip:
20
Pentium III 1 GHz
Pentium 4 1,5 GHz
Athlon 1,1 GHz
105 mm2
217 mm2
120 mm2
Millones de
transistores
28,1
55
37
Calor a disipar
33 W
54,7 W
55 W
Tamaño núcleo
Como vemos en la tabla comparativa, el calor generado ha subido mucho, situándose a la
altura del "caliente" Athlon. Esto no es una limitación insalvable (al menos no lo ha sido para
el Athlon), pero obliga a dejarse de soluciones baratas e instalar un ventilador de calidad...
...Y en el caso del Pentium 4, mucho más: se necesita una carcasa, una fuente de
alimentación (ambas ATX 2.03) y un ventilador + disipador específicos; aparte de por
consideraciones de consumo y estabilidad, porque el sistema de fijación del sistema de
refrigeración es bastante complicado y va anclado con tornillos a la carcasa.
En cierto modo es comprensible, Intel ha trabajado pensando en el futuro y en la calidad
(regatear en "detalles" nunca es bueno), pero es una lástima que no haya dado opción a
personas que deseen utilizar sus actuales cajas (o racks) para servidor, muchas
perfectamente capaces de lidiar con este chip.
Finalmente, un detalle positivo: el núcleo del micro está mejor protegido que antes, gracias
a un disipador de calor integrado sobre el mismo (por eso tiene ese aspecto metálico).
21
El chipset... ¡y la memoria!
Entramos en uno de los temas más polémicos respecto al nuevo micro de Intel: durante
muchos meses, sólo estará disponible para memoria RDRAM (Rambus). O, más
correctamente: durante muchos meses sólo habrá disponibles placas base con el chipset
Intel 850, que sólo soporta memoria RDRAM.
¿Y qué tiene de malo esta memoria? Bien, tiene dos problemas: que no es un estándar libre
(hay que pagar royalties a su inventora, Rambus Inc.) y su elevado precio (por lo
comentado antes y porque es difícil de fabricar).
Sería mucho más deseable utilizar memoria DDR-SDRAM, pero Intel está atada de manos
por un contrato con Rambus que se lo impide; ya ha declarado que se arrepiente, que
fabricará chipsets para DDR en cuanto expire dicho contrato y que dará licencias a otros
fabricantes para diseñar los chipsets adecuados... pero eso llevará mucho tiempo,
probablemente todo un año.
En honor a la verdad, la Rambus ha empezado a brillar con este chip, aunque gracias a un
pequeño truco: Intel ha utilizado DOS canales de memoria RDRAM, alcanzando
3,2 GB/s de transferencia máxima teórica (1,6 GB/s por canal).
Esto es bastante más que los 2,1 GB/s de la DDR, o el mísero 1 GB/s de la PC133; además,
Intel "regala" dos módulos de 64 MB de memoria RDRAM con cada conjunto de placa y
micro... Pero no hay nada gratis en la vida, y menos en el mundo del hardware: al ser dos
canales, ¡¡deben ocuparse las ranuras de dos en dos con módulos idénticos!!.
Esto complica seriamente las posibilidades de expansión y hace casi inútil la oferta de
Intel, pues si este micro es útil en algún ambiente es en el profesional, donde se suelen
utilizar 512 MB o más. Como las placas base sólo tienen 4 ranuras RIMM, la única solución
sería recurrir a los módulos de RDRAM de 256 MB, cuyo precio es TOTALMENTE
PROHIBITIVO.
Y para colmo, no toda la RDRAM es igual, ni mucho menos. La única que realmente
merece la pena es la RDRAM PC800; pero bastante gente está vendiendo equipos con
memoria RDRAM PC600, cuyo rendimiento es un 50% menor (incluso con dos canales,
apenas alcanza los 2,1 GB/s de la muchísimo más económica DDR con un canal).
22
Rendimiento (1)
Arquitectura, diseño... donde estén unos buenos gráficos de rendimiento, que se quite todo
lo demás. Pues en este caso, hay algún gráfico... pero ciertamente extraño.
El primero es cortesía de Intel; para ser exactos, hemos juntado los datos de dos páginas
que Intel se ha encargado de mantener bien separadas, porque no dejan en buen lugar al
nuevo microprocesador.
Estamos hablando del rendimiento en Word, Excel, PowerPoint, CorelDraw, Netscape
Communicator, Photoshop...? Parece claro que la nueva arquitectura del Pentium 4 tiene
algún problema, muy probablemente por el larguísimo pipeline de 20 etapas.
23
Pero bueno, la cosa puede mejorar un poco si nos pasamos al sistema operativo profesional
(y más caro) de Microsoft, el Windows 2000:
(Ah, para los suspicaces: la configuración de los ordenadores es IDÉNTICA hasta donde
puede serlo (una suerte, la verdad). Sólo se diferencian en el micro, la placa base y la
memoria... ¡y los Pentium III ni siquiera utilizan memoria DDR, sólo PC133!!)
Podríamos deducir que el Pentium 4 no está pensado para mejorar el rendimiento en esta
clase de tareas "sencillas" (?); ¿y en multimedia? Bien, veamos qué tal se le da el MPEG2
(el formato de compresión de vídeo de los DVD):
Bueno, muchísimo mejor, empezamos a notar la fuerza de los GHz, el bus de 400 MHz y la
memoria RDRAM.
Pero aparte de observar que es en las aplicaciones multimedia de audio y vídeo,
renderizados y juegos 3D, donde puede merecer la pena el Pentium 4, una simple
división nos indica que el diseño es mucho menos potente que el del Pentium III en relación
a los MHz (o GHz):
Es decir, que un futuro Pentium III de 1,2 GHz sería más rápido que el Pentium 4 de
1,5 GHz en esta misma tarea.
...Y un Athlon de 1,2 GHz con memoria DDR-SDRAM estaría MUY por delante de ambos, y
en este caso no hablamos de un micro futuro, sino de una realidad que está en el mercado.
24
Rendimiento (2): SSE2 y optimizaciones
Desgraciadamente, Intel apenas nos proporciona más datos de utilidad, sólo una larga serie
de tests sin utilidad práctica o sobre el rendimiento en Internet (como si eso tuviera
mucho que ver con el microprocesador...). Bueno, al menos nos da unas pruebas de
Quake3... pero poco significativas:
La cuestión "extraña" es que se ha utilizado una resolución de ¡640x480 puntos con 256
colores!! Veamos: ¿quién en su sano juicio utiliza una GeForce2 GTS con esa configuración?
Y el dato del Athlon, sacado de la página de AMD, también está a esa resolución y con una
GeForce2 GTS...
Es fácil de explicar: en ambos casos se ha hecho únicamente para destacar la diferencia
entre los micros, ya que a 1024x768 ó 1280x1024 la diferencia de rendimiento sería
casi indistinguible, incluso con esa excelente tarjeta gráfica (como demuestran en
AnandTech, estaría entorno al 1% o menos).
En todo caso, este dato es relativamente positivo para el Pentium 4, aunque el Athlon se
mantiene cerca gracias a la DDR y su nuevo bus a 266 MHz (porque si el Pentium 4 se pone
por delante es únicamente por los dos canales de RDRAM y el bus a 400 MHz, no
precisamente por su diseño interno).
Y de esta prueba vamos al asunto más polémico sobre el rendimiento de el Pentium 4: las
aplicaciones fuertemente matemáticas. Como dijimos en el apartado correspondiente de la
arquitectura, con el método clásico de manejar estas operaciones (la unidad FPU), el
rendimiento del Pentium 4 es HORROROSO.
Por ejemplo, Tom's Hardware (que está inmerso en esta polémica hasta el cuello) destaca
que el mismo renderizado en 3D Studio Max 2 puede tardar EL DOBLE en un
Pentium 4 a 1,4 GHz que en un Athlon de 1,2 GHz con DDR (y también más que en un
Pentium III); y algo parecido ocurre en aplicaciones multimedia como compresión de vídeo a
MPEG4...
...HASTA QUE SE OPTIMIZA LA APLICACIÓN PARA SSE2. La cuestión es que los
ingenieros de Intel han apostado TODO al rendimiento con aplicaciones SSE2, descuidando
25
la unidad FPU. Esto hace que en aplicaciones optimizadas (prácticamente ninguna de uso
frecuente... por ahora) el rendimiento suba muchísimo, a la vez que en muchas de las no
optimizadas es casi ridículo.
Una apuesta muy fuerte, diría yo; porque puede que dentro de un año existan muchas
aplicaciones optimizadas (que habrá que comprar, claro), pero mientras se tendrá un
micro muy lento. Y con un año de edad un micro es viejo, sea el que sea...
26
Algunos precios orientativos
Dejando aparte el rendimiento, la compra o no de cualquier ordenador es una cuestión de si
resulta económicamente rentable. Vamos a exponer algunos datos, y usted mismo decidirá
si el Pentium 4 merece la pena a este respecto...



Microprocesador + ventilador (+ regalo de 2 módulos RDRAM de 64 MB):
o 1,4 GHz: 925 $
o 1,5 GHz: 1.130 $
Placa base:
o Intel D850GB Garibaldi: 225 $
o ASUS P4T i850: 325 $
Memoria RDRAM: tipo PC800, marca Samsung:
o 1 módulo de 128 MB: 250 $
o 1 módulo de 256 MB: 560 $
Se trata de datos medios obtenidos en PriceWatch. Como dato comparativo para la
cuestión de la memoria, Crucial vende módulos de DDR-SDRAM de 128 MB por 129 $...
aunque por otro lado los módulos de DDR-SDRAM de 256 MB no son fáciles de encontrar
todavía.
En cuanto a PCs completos, Dell, IBM, HP y Gateway tienen modelos desde 1.999 $, pero
ojo: normalmente a 1,4 GHz, sólo con 128 MB y sin monitor.
27
Conclusión: ¿versión 1.0?
No vamos a andarnos por las ramas, nuestra conclusión es clara: hoy por hoy, NO LO
COMPRE. NO.
¿Motivos? Primero, que quede claro que NO SOMOS ANTI-INTEL (aunque muchos no lo
crean, escribo esto desde un PC equipado con un Pentium III, y muy a gusto).
Sencillamente:
1.
2.
3.
4.
5.
6.
el rendimiento en muchas aplicaciones "normales" es muy bajo, y seguirá siéndolo
hasta que no se alcancen los 1,8 GHz, aproximadamente;
durante unos meses apenas habrá aplicaciones optimizadas para las SSE2 (y
deberán comprarse cuando salgan);
para juegos es más eficaz (y barato) comprarse una tarjeta gráfica potente;
la memoria RDRAM (Rambus) es demasiado cara, con los módulos de 256 MB a un
coste totalmente ridículo;
actualmente, los precios de lanzamiento son exageradamente altos;
pero, sobre todo, SERÁ SUSTITUIDO EN MENOS DE UN AÑO (¿9 meses?)
POR OTRO MODELO, con 478 pines en lugar de 423. Éste casi parece el
Pentium 4 versión 1.0...
Puede que tenga sus ventajas (de acuerdo, las tiene); incluso puede que, si tiene suerte y no
le importa el coste, su aplicación favorita sea optimizada con éxito para las SSE2; pero,
sinceramente, ¿quiere quedarse con una carísima placa base INCOMPATIBLE en cuestión
de meses?
Y un micro incompatible con las nuevas placas, y una memoria que podría ser sustituida (o
no, ya veremos) por la DDR-SDRAM... Demasiado riesgo para mi gusto, prefiero un Athlon
con DDR o incluso un fiable Pentium III.
Eso sí, el Pentium 4 parece tener mucho futuro. Las SSE2 funcionan y sin duda se
implantarán, el nuevo diseño permitirá aumentar los GHz a gran velocidad (están previstos
2 GHz a finales de 2001), en su momento aparecerá en versión dual, y todavía se puede
reducir su consumo y aumentar su vida útil con un paso a 0,13 micras. Brillante futuro... el
de la versión 2.0.
28