Durante la entrada anterior os estuve comentando acerca de la memoria, tanto la RAM como la memoria de almacenamiento masivo. En esta entrada me voy a centrar principalmente tanto en la CPU como en la GPU empezando por la primera que es con lo que haré un análisis de las especificaciones de esta durante esta entrada.

Mark Cerny al hablar del uso de núcleos Zen2 no comento en ningún momento que fuesen a medida, no nos debe sorprender desde el momento en que con el AMD Jaguar no hicieron tampoco ningún cambio respecto a lo que les ofrecio AMD en su día pero en todo caso hemos de tener en cuenta que uno de lo elementos más importantes dentro de un SoC es el espacio y dudo mucho que el espacio ocupado por la CPU en PS5 sea mayor que el de la CPU en el chip del modelo original de PS4.

PS4 utilizaba dos modulos Jaguar con 4 núcleos y la cache L2 de estos, el tamaño total de cada uno era de 26mm^2, por lo que ambos de un total de 348mm^2 ocupaban un 15% solamente de todo el chip. En el caso del AMD Zen en su primera generación cada modulo media unos 44mm^2 incluyendo la cache L3, la variante utilizada en el Raven Ridge tiene la mitad de cache L3 y ocupa unos 36mm^2 y podríamoss deducir que escalando del nodo anterior de «14nm» al de «7nm» el area disminuye a los 22mm^2 y a los 18mm^2 respectivamente por cada uno de los dos módulos aunque la pregunta clave es… ¿Cual va a utilizar Sony?.

Existe una tercera configuracion que hemos visto no en «14nm» sino en 7nm con el AMD Rome, la cual consiste en 16MB de cache L3, de haber existido este modelo a «14nm» cada CCX hubiese ocupado 52mm^2 en total y la reducción a «7nm» daría 26mm^2 exactos pero hemos de tener en cuenta el tema del enorme uncore en el SoC que he comentado en la entrada anterior y que los núcleos Zen2 tienen unas pequeñas mejoras sobre el Zen que no podemos cuantificar aún en cuanto a espacio pero no creo que aumenten en más de 1 o 2mm^2 por núcleo.

En todo caso dado que el espacio en un SoC es limitado no me extrañaria que el Zen2 de Ariel tuviese meno memoria cache L3 que sus equivalente en PC.

Por otro lado, un elemento que hemos de tener en cuenta es el tema de la velocidad de reloj de la CPU, porque aquí hay un elemento del que muchos no quieren hablar y es que si la GPU alcanza los 1.8 Ghz es muy posible que la CPU no pueda alcanzar su velocidad máxima de 3.2 Ghz por motivos de longevidad del hardware y estabilidad de este, es decir, que una vez pasada la etapa de los tests de calidad con el actual modelo de Ariel que tanto Sony como AMD decidan que la velocidad máxima sea un poco más baja aunque no creo que toquen la velocidad base de 1.6 Ghz que se ha revelado.

Comparativamente con Jaguar, en la potencia en enteros tiene una capacidad de 10.6 MIPS en el benchmark Dhrystone en comparación de los 3,1 MIPS de cada núcleos Jaguar y esto es por ciclo de reloj y por núcleo. Esto significa que Zen tiene tiene una capacidad como minimo 3 veces superior en monohilo y esto es importante por lo que comente de la Ley de Amdahl dado que todo programa sea del tipo que sea tiene una parte secuencial y otra paralelizable. En cuanto a coma flotante, la primera generación del Zen tiene el doble de ALUs para ello y alcanza el doble de rendimiento y con Zen2 con el apoyo de una unidad SIMD el doble de ancha (256 bits) soporta instrucciones SIMD con el doble de operandos pero en el caso de las clásicas instrucciones de 128 bits no va a aumentar el rendimiento por lo que en FLOPS en cuanto a ciclos de reloj es un 2X, en todo caso con el uso de los Compute Shaders para físicas, detección de colisiones y tareas de este tipo estamos hablando de una parte en desuso en general en cuanto al desarrollo de juegos.

El hecho de ir aumentando los núcleos y/o los hilos de ejecución esta muy bien pero nos encontraremos con que lo que ocurrirá es que a medida que aumentemos la cantidad de núcleos para la parte paralelizable esta se resolverá cada vez en menos tiempo pero la parte secuencial se mantendrá por lo que llegará un punto en que añadir más núcleos/hilos no aumenta el rendimiento sino que disminuirá el rendimiento aportado por núcleo.

Es por ello que el salto de rendimiento necesitaba núcleos que en monohilo funcionarán mucho mejor que los actuales AMD Jaguar para esas partes secuenciales en los juegos. Es más, el aprovechamiento de los hilos adicionales ha de ser explicito, por eso cuando PS5 este ejecutando juegos en modo PS4 y PS4 Pro no van a utilizar el modo multihilo y se van a quedar con los 8 núcleos sin el multihilo activado, obviamente en modo PS5 estará activado así como la velocidad de reloj máxima.

En las patentes sobre la retrocompatibilidad se dice que Sony va a buscar una forma para que los juegos se ejecuten tal cual capando al procesador, simple y llanamente y esto no me digáis como lo se pero pienso que eso es una tontería que se le ha pasado a Sony por la cabeza a la hora de escribir las patentes o más bien sus abogados. Pienso que PS5 en modo PS4 y PS4 Pro funcionarán en modo 1.6 Ghz y ya se que en la Pro la CPU va a 2.1 Ghz pero el Zen a 1.6 Ghz es muy superior, aparte de que en dicho modo el multihilo va a estar desconectado como he comentado antes, la GPU por otro lado ira a 1Ghz porque realmente no le hará falta utilizar más potencia para ejecutar los juegos de PS4 y PS4 Pro y aún así los juegos rendirán mejor que en PS4 y PS4 Pro.

En modo PS5 la pregunta es si la CPU va a funcionar con los 3.2 Ghz de velocidad de reloj marcados en los prototipos de Ariel/Gonzalo de lo que se tiene constancia. En todo caso hay que tener en cuenta que los núcleos Zen tienen un rendimiento x2 respecto a Jaguar por núcleo y ciclo de reloj. Por lo que si mantienen la velocidad de reloj en el kit final en lo 3.2 Ghz en modo PS5 entonces estaríamos hablando de un salto x4 en cuanto a la CPU de PS4. Paradojicamente el salto en cuanto a CPU es mucho más alto que el salto que vimos de PS3 a PS4 y no podemos olvidar que en cierta manera se perdió en cuanto a CPU al perderse la enorme capacidad de cálculo de los SPE para ciertas tareas, las cuales tuvieron que ser trasladas a los Compute Shaders de la GPU, pero no os equivoquéis que no se van a mover de ahí.

Jaguar es el mayor cuello de botella de la familia PS4, en el sentido de que con una CPU mucho más potente la GPU podría haber rendido mucho más, sobretodo si tenemos en cuenta que el primer elemento en operar a la hora de generar cada fotograma en el juego es siempre la CPU. Es decir incluso en modo de velocidad reducida la nueva CPU puede dar unos cuantos milisegundos adicionales que permitan aumentar la tasa de fotogramas en punto conflictivos donde Jaguar era una limitación y/o la resolución a la hora de jugar a juegos de PS4 y PS4 Pro. En el caso de PS5 nos va a permitir escenas con una mayor cantidad de elemento en pantalla o una mayor interactividad entre los diferentes elementos de la misma.

La baja velocidad de reloj base (1.6 Ghz) en comparación a los núcleos Ryzen que hay en el mercado y los que saldrán bajo Zen 2 (Ryzen 3000) me dan a pensar de que por temas de consumo el SoC funciona a un voltaje menor de lo que funcionaría un SoC en PC, al menos en el dominio correspondiente a la CPU… ¿A que me refiero con dominio? Bueno, una de las particularidades del nuevo uncore de AMD es que sus componentes pueden funcionar en regiones energéticas completamente distintas. en el Raven Ridge que es el uncore base tenemos dos regiones distintas.

El uncore del Raven Ridge es importante porque el de Ariel va a derivar de este y podemos ver como existen dos regiones energéticas distintas:

  • La Region A es la interfaz entre la CPU, GPU y el I/O Hub en el caso de Raven Ridge.
  • La Region B es el controlador de memoria, el multimedia engine y las interfaces de pantalla.

Pero la configución de las regiones no tiene porque ser así ni ser 2, es por ello que lo mejor es ir a datos más técnicos y tirar de la patente del actual uncore de AMD.

En este podemos ver varias regiones marcadas como 202…

Moviendonos a la FIG.2 se muestra un diagrama en bloques de una representación de un tejido/estructura (fabric). En una encarnación dicho tejido/estructura 200 puede ser implementada como el
tejido/estructura 115 del sistema de computación de la (FIG.1). En una representación, el tejido/estructura 200 puede ser particionada en una pluralidad de regiones 202A-C. las cuales son representativas de cualquier tipo de región, con cualquier número de componentes por región . Como se muestran en la FIG.2 hay tres regiones separadas 202A-C repartidas por la topología del tejido/estructura 200.

En una encarnación cada región 202-AC del tejido/estructura 200 es asociado con un power-gating domain distinto.

Por lo que de la patente deducimos:

  • Estamos hablando de la organización del uncore de un SoC.
  • El uncore se divide en un número de regiones con que pueden ser las que se quiera.
  • Cada región puede tener la cantidad de elementos que se quiera.
  • Cada región tiene su perfil energético.

Mi teoría es que CPU y GPU van a tener regiones energéticas distintas en el SoC Ariel de PS5:

  • Region A: CPU.
  • Region B: GPU.
  • Region C: Southbridge+HBCC+Controlador de Memoria.
  • Region D: Aceleradores e Interfaz de Pantalla.

El motivo de ello es que pienso que mientras la CPU va a ejecutarse a velocidades inferiores que sus equivalentes en PC, la GPU lo que hará es funcionar bajo la mayor velocidad posible por el hecho que es la parte que más les interesa que funcione a máximo rendimiento en el nuevo sistema y porque además tenemos que tener en cuenta los problemas con el ahogamiento térmico entre los diferentes elementos, especialmente entre la CPU y la GPU que se pueden dar por la alta velocidad de reloj de la GPU.

El hecho de aumentar la capacidad de procesamiento de la CPU respecto a PS4 y PS4 Pro va a significar además el hecho de que la sección del sistema que se ejecuta de manera paralela al juego se va a ejecutar a mucha mayor velocidad rápido y si le sumamos la nueva tecnología de almacenamiento los saltos desde el juego al sistema y viceversa se van a realizar a mucha mayor velocidad que ahora y de manera completamente instantánea. En realidad como comente en la entrada de ayer no pienso que dicha sección consuma más de 4GB de memoria y que su funcionalidad vaya más allá que la que tiene PS4 en el momento de salida de la consola, es más, creo que los prototipos actuales se ejecutan con el mismo SO que se ejecuta en las PS4 y las PS4 Pro actuales sin cambios de ningún tipo en lo que a la funcionalidad se refiere.

Simplemente el cambio más significativo será la velocidad de acceso de las transiciones entre el juego y el sistema e incluso es posible que veamos un «True Instant Gaming» en el sentido de tener el mapa de la RAM almacenado en la memoria NVM y que se recupere en poco más de un segundo ya desde que encendemos la consola y/o la re-activamos desde el modo Stand-By o simplemente desde la consola apagada sin tener que esperar que inicie todo el sistema con toda la parafernalia de menús que habría por el medio.

Y ya que he sacado el tema del uncore, hemos de tener en cuenta que los SoC de AMD basados en núcleos Zen tienen la particularidad de funcionar bajo el mismo tipo de uncore y dejad que os suelte una pequeña teoría que tengo o suposición, viendo la similitud en la lista de dispositivos entre Ariel y Fireflight(Fenghuang) y que ambos son SoCs para gaming diría que uno deriva del otro.

Recordad que Fireflight (Fenghuang) es el SoC a medida para la consola-PC chino Subor Z+ de la que he hablado varias veces. Pues bien, pienso que Ariel es un salto incremental del SoC de dicho sistema:

¿Los motivos?

  • Ambos derivan del Raven Ridge, aunque Ariel estará fabricado a 7nm por TSMC y FF a 14nm por Global Foundries.
  • Su uncore es prácticamente idéntico, como curiosidad el uncore de FF y el de Raven Ridge soporta hasta 8 núcleos Zen cuando solo tienen 4 (1 CCX). Ariel en cambio soporta los 8 núcleos (2 CCX). Es decir, el doble que Fireflight.
  • Si mis suposiciones y mis cálculos son ciertos entonces el ancho de banda de la RAM con Ariel sería de 512GB/s, el doble que los 256GB/s de FF. Obviamente para este nuevo ancho de banda hacen falta memoria GDDR6.
  • FF tiene dos interfaces HDMI desde su Display Engine, Sony habría cambiado una de ellas por un USB-C con Display Port integrado.

Dicho de otra manera estaríamos hablando sin contar el aumento en lo ciclos de reloj de que es Ariel vendría a ser Fireflight x2 pero para completar el puzzle nos faltaría la GPU, aunque esto lo comentare en la entrada siguiente.

Esto es todo, como siempre tenéis el Discord y los comentarios de la misma entrada para comentar el contenido de la misma.