He estado ordenando los nombres en clave y los rumores acerca de lo que planea AMD en los próximos meses tomando como referencia las filtraciones de Komachi, Apisak y demás «leakers». He de agradecer a los que habéis hecho los comentarios en la entrada «Rumores 27-12-2019» por lo que esto en el fondo no deja de ser un segundo Feedback pero no ire referenciando comentarios de manera ordenada como siempre.

Dicho esto vamos a lo importante:

en los drivers de amd existen ciertas curiosidades con navi 10 y navi 12 parece que se identifican igual.

inicalmente aprecia asi…

En los drivers de amd existen ciertas curiosidades con navi 10 y navi 12 parece que se identifican igual.

inicalmente aprecia asi…

fdef CONFIG_DRM_AMD_DC_DCN2_0
DML_PROJECT_NAVI10 0x33
DML_PROJECT_NAVI10v2 0x33
DML_PROJECT_NAVI14 0x34

en los ultimos de diciembre que he mirado aparece esto.

SMU11_DRIVER_IF_VERSION_VG20 0x13
SMU11_DRIVER_IF_VERSION_ARCT 0x0F
SMU11_DRIVER_IF_VERSION_ARCT 0x10
SMU11_DRIVER_IF_VERSION_NV10 0x33
SMU11_DRIVER_IF_VERSION_NV12 0x33
SMU11_DRIVER_IF_VERSION_NV14 0x34
SMU11_DRIVER_IF_VERSION_RNA0 0x91

Se ha de tener en cuenta que las GPUs de la misma familia pueden tener cambios menores como el hecho de que ciertas unidades de aceleración como pueden ser los controladores de pantalla o incluso la SMU sean distintas. La SMU es el System Management Unit que controla la temperatura y el funcionamiento estable del procesador para que no se sobrecaliente, lo que marca la lista es que la SMU de Navi 10 y Navi 12 son la misma, pero solo es una unidad autónoma dentro de la GPU. El hecho de que en Navi 10 y Navi 12 sean la misma significa que su SMU o al menos la configuración de la misma se mueven por los mismos parametros de consumo energético y temperatura generada.

RNA0 parece que es Renoir si nos atenemos a esto

….
if defined(CONFIG_DRM_AMD_DC_DCN2_1)
define RENOIR_A0 0x91
define DEVICE_ID_RENOIR_1636 0x1636
….

o aqui


/* Navi10 */
{0x1002, 0x731B, PCI_ANY_ID, PCI_ANY_ID, 0, 0, CHIP_NAVI10}
{0x1002, 0x731F, PCI_ANY_ID, PCI_ANY_ID, 0, 0, CHIP_NAVI10}
/* Navi14 */
{0x1002, 0x7340, PCI_ANY_ID, PCI_ANY_ID, 0, 0, CHIP_NAVI14}
{0x1002, 0x7341, PCI_ANY_ID, PCI_ANY_ID, 0, 0, CHIP_NAVI14}
{0x1002, 0x7347, PCI_ANY_ID, PCI_ANY_ID, 0, 0, CHIP_NAVI14}
{0x1002, 0x734F, PCI_ANY_ID, PCI_ANY_ID, 0, 0, CHIP_NAVI14}
/* Renoir */
{0x1002, 0x1636, PCI_ANY_ID, PCI_ANY_ID, 0, 0,CHIP_RENOIR}

….

Fijaos en un detalle en concreto, los codigos 0x73… hacen referencia a que la GPU es de la arquitectura RDNA/Navi mientras que los códigos 0x16 hacen referencia a que la GPU es de la familia GCN/Vega que es el caso de la GPU que lleva el SoC/APU Renoir para PC.

tambien tenemos:
….
if defined(CONFIG_DRM_AMD_DC_DCN1_0)
case CHIP_VEGA10:
case CHIP_VEGA12:
case CHIP_VEGA20:
case CHIP_RAVEN:
if defined(CONFIG_DRM_AMD_DC_DCN1_1)
case CHIP_ARCTURUS:
if defined(CONFIG_DRM_AMD_DC_DCN2_0)
case CHIP_NAVI10:
case CHIP_NAVI12:
case CHIP_NAVI14:
if defined(CONFIG_DRM_AMD_DC_DCN2_1)
case CHIP_RENOIR:
case CHIP_ARCTURUS:

DCN es el controlador de pantalla, uno de los múltiples aceleradores. Lo que marca la lista son las diferentes versiones que tiene cada GPU y cada SoC de AMD y como se puede ver va en orden ascendente de versión con cada nueva generación de chips ya que el controlador de pantalla va mejorando.

En ROCm les tienen puesto diferente identificador…

….
const HsaDeviceId HSA_VEGA10_HBCC_ID = 10;
const HsaDeviceId HSA_RAVEN_ID = 11;
const HsaDeviceId HSA_VEGA12_ID = 12;
const HsaDeviceId HSA_VEGA20_ID = 13;
const HsaDeviceId HSA_GFX1010_ID = 15;
const HsaDeviceId HSA_GFX908_ID = 16;
const HsaDeviceId HSA_ARIEL_ID = 14;
const HsaDeviceId HSA_NAVI10_ID = 15;
const HsaDeviceId HSA_MI100_ID = 16;
const HsaDeviceId HSA_NAVI12_ID = 17;
const HsaDeviceId HSA_NAVI14_ID = 18;

Aquí a cosa se va concretando, algunos de los chips están repetidos y se puede ver por la ID que tienen al final. Pero el que llama la atención en todo esto es Ariel… Cuya referencia la tuvimos por primera vez a principios de 2019. Pero especialmente sabemos de su existencia por el repositorio de dispositivos PCI donde aparece listado como un SoC/APU más.

Lo importante aqui es la identificación 13e9 que corresponde a la GPU… ¿Pero que significa 13e9? Según los rumores de hace un año hace referencia a una gama llamada «Navi 10 Lite».

A la que le corresponde la clave GFX100x mientras que Navi 10 estándar tiene la clave GFX101x en todas sus versiones. ¿Que diferencias hay entre las unidades Lite y las no-Lite? Que las primeras parecen formar parte de un APU/SoC mientras que las segundas van a GPUs dedicadas.

Por otro lado, otro leaker llamado APISAK llamaba «Gonzalo» a «Ariel» pero resultan el mismo chip.

¡Pero unos meses más tarde hay un cambio en la GPU de Ariel! Deja de llevar una GPU con la clave 13e9 para llevar una con la clave 13f8 por lo que esto indica un cambio de GPU.

No sabíamos a que correspondía Ariel/Gonzalo en ningún momnto por aquel entonces, todo el mundo apuntaba a que era el SoC de PlayStation 5 pero no lo sabíamos por aquel entonces, era un chip extraño que no aparecía en los mapas de ruta de AMD para PC.

El chip sigue evolucionando en sus etapas finales del desarrollo, el siguiente paso es pasar de llamarse Ariel a «Flute» con un pequeño cambio en la ID de la GPU que pasa a ser 13f9 en vez de 13f9.

Komachi nos aclaro en su día que las GPUs del SoC Ariel se mueven entre (13e0 y 13ff) para el identificador, en realidad lo que esta diciendo es que pueden haber un total de 32 configuraciones distintas y que cada configuración tiene su Sub-ID.

Pero la filtración de Flute nos permite saber cosas como que utiliza un bus de 256 bits GDDR6 con una configuración x8 que le permite colocar dos chips de memoria por canal y llegar a los 16GB con chips de 1GB.

Y que la cantidad de cache L3 de la CPU es mucho más baja que la de los Zen 2 de PC, quedandose en solo 4MB por CCX en vez de los 16MB. Algo que tiene sentido si tenemos en cuenta el espacio limitado del SoC para colocar todos los componentes.

Si realmente Ariel/Gonzalo son una serie de SoC con «Navi 10 Lite» entonces tiene sentido que hagamos un repaso a las referencias a «Navi Lite» dentro de los drivers de AMD.

  • NV_NAVI10_LITE_P_A0 0x80
  • NV_NAVI10_LITE_P_B0 0x81
  • NV_NAVI12_LITE_P_A0 0x82
  • NV_NAVI21_LITE_P_A0 0x90

Veamos, los dos primeros sonla misma GPU pero una es una variación más avanzada de la otra. En cuanto a Navi 12 Lite es algo extraño y parece un experimento, las diferencias entre Navi 12 y Navi 10 es que pese a tener la misma configuración en WGP/CUs de Navi 10 tiene algunos pequeños cambios como ahora:

  • Uso de memoria HBM2 en vez de GDDR6.
  • Soporte para las instrucciones en 4 y 8 bits de enteros para el Deep Learning.

Esto último no lo tiene Navi 10 (RX 5700 y posiblemente RX 5600) pero si Navi 14 (RX 5500).

Lo que llama poderosamente la atencion es la Navi21_lite con el identificador 0x9x en vez de 0x8x que nos marca que es de una generación por encima de las Navi Lite de la familia GFX100x… No en vano lo tenemos como un identificador distinto al de GFX100x por lo que la GPU no correspondería en ningún momento a la gama Ariel/Gonzalo.

ASIC ID : GFX10 = NAVILITE.
: GFX1000 = NAVI10LITE.
: GFX1001 = NAVI10LITE.
: GFX100X = NAVI12LITE.

ASIC ID : GFX10_2

: : GFX1020 = NAVI21LITE.

Fijaos que tenemos un solo representante de la familia Navi 20 Lite… Al cual le pertoca el código GFX1020… No forma parte de los GFX100x ni de los GFX101x que son las tarjetas gráficas. ¿Puede que sea una tarjeta gráfica para PC? No, porque estas tienen el código GFX103x y fijaos como hay varios códigos que corresponderían a una familia de tarjetas gráficas.

ASIC ID : GFX10_3
: GFX1030 = NAVI21.
: GFX1031 = NAVI22.
: GFX1032 = VAN GOGH.
: GFX103X = NAVI23.

Por lo que aparte de Ariel que se basaría en «Navi 10 Lite» tenemos otro SoC basado en «Navi 21 Lite».

Por lo que en estos momentos estamos bastante…

Hace unas semanas comente un rumor que apareció, no suelo comentarlos pero me pareció interesante hacerlo porque daba una «información» distinta, basicamente venía de un foro asiático.

IPC再高也不能讓我準時下班 目前天宮本家的產品都挺安靜的 首先Renoir應該趕不上今年上 應該說所有要靠輪班星7nm量產的計畫都被往後延最少三個月 然後天宮就發了mail來 天宮:好無聊阿~ 教徒:是…? 天宮:你跟我一起回鍋來當打工仔吧! 教徒:….!? 現在就一堆詭異代號的東西在線上跑 例如: Arden OBR/Oberon Sparkman 第一個應該就Xbox 第二個滿有機會是PS5 第三個很有趣,最近才開始評估的case layout很像Renoir,但是稍微胖一點 而且不是筆電專用的FPx腳位 而是半定制SoC常見的BLx …話說遊戲機廠商是不是少了哪家來著? 這個還不確定歐 聽聽就好

Retired Engineer desde su cuenta de Twitter nos hizo el favor de traducirlo.

La suposición es que Arden es el SoC de Xbox y Oberon el de PS5 mientras que Sparkman parece ser una especie de Renoir pero más gordo, el problema con esta afirmación la veremos luego cuando volvamos a citar a Komachi. Es más, parece ser que Sparkman es otro producto custom… De Oberon solo sabemos que podría tener relación con Flute/Gonzalo/Ariel… Pues bien hace unas horas se filtra lo siguiente:

Es decir, que Oberon y Arden son realmente el mismo chip. Sabíamos de la existencia de Arden como un chip aparte de Ariel ya en el repositorio pero con las especificaciones incompletas.

Por lo que Oberon no es Ariel pese a que tengan nombrés relacionados, sinceramente…

De todo esto ha salido que la GPU de PS5 no va a tener trazado de rayos acelerado por «hardware» en el sentido de que no tendrá unidades de intersección. En realidad Sony nunca ha afirmado que Ariel sea el SoC de PS5 sino que ha sido la rumorología la que ha creado dicha narrativa de la que los fanboys de cierta marca se han ido beneficiando.

Por otro lado no sabíamos si Arden tenía una GPU dedicada o era algo como Matisse (Ryzen 3000) pero Komachi nos confirmo que tiene una Navi Lite al confirmar que tiene GPU dedicada.

El código esta fuera del rango 13e0 a 13ff como es obvió, pero la sorpresa viene cuando se confirma que Arden soporta trazado de rayos.

Si atamos cabos esta claro que Navi 21 Lite tendría todos los números de que fuese la GPU dentro de «Arden» y que Ariel haya caido por completo el olvido debido a que la primera generación de Navi/RDNA no tiene soporte para Ray Tracing. Pero lo sorprendente es que por otro lado tenemos un segundo chip llamado Sparkman, el cual parece tener un layout parecido al de Renoir… Pues bien, creo que los rumores del foro asiático han confundido las cosas ya mi también por lo que os pido disculpas.

Si Sparkman es una versión más gorda de Renoir como lo fue Fireflight de Raven Ridge entonces esto que filtro Komachi no tiene sentido desde el momento en que la GPU de Renoir al ser una GFX9 haría que la versión engordada de la misma también lo fuese, por lo que Sparkman no es un derivado de Renoir.

Sparkman al igual que Arden también tiene modo de retocompatibilidad, pero el Gen0 con 4RB+ nos marcan que podría tener relación con Xbox. Así pues tenemos un SoC/APU muy parecido a Arden/Oberon que podría bien ser el mismo o ser otro completamente distinto o una variación del mismo. El problema de todo esto es que como GPU RDNA de segunda generación tenemos solo una que es la llamada «Navi 21 Lite» que coincide con una configuración en concreto.

Los Astroturfers/Viral Marketers haciendo de la suyas.

En el sitio de propaganda de Microsoft llamado Thurrot.com… Brad Sams comento en un video de que Arden es el nombre en clave del SoC de la siguiente Xbox, lo que ahora conocemos como Xbox Series X.

Si juntamos y ordenamos toda la información da la sensación de que existe un solo SoC general para la next gen ya que entonces llegamos a la conclusión de que Arden, Oberon y Sparkman son realmente el mismo SoC y por tanto el mismo chip. Lo fácil sería pensar que Ariel va a PS5, pero eso supone afirmar que PS5 no tiene soporte para la aceleración del trazado de rayos por hardware y Sony ha sido muy clara acerca de que si que lo tiene.

Es más, la propia Sony volvio a dar una entrevista a Wired en el pasado Septiembre que convierte a las habladurías de los Astroturfers de Microsoft en eso, en habladurías malintencionadas.

Antes de que lo hagan, Cerny quiere aclarar algo. Cuando hablamos por última vez de la próxima consola, habló sobre su capacidad para admitir el trazado de rayos, una técnica que puede permitir la iluminación y los efectos de sonido complejos en entornos 3D. Dadas las muchas preguntas que ha recibido desde entonces, teme haber sido ambiguo sobre cómo la PS5 lograría esto, y confirma que no es una solución a nivel de software, lo que algunos temían. «Hay una aceleración del trazado de rayos en el hardware de la GPU», dice, «lo cual creo que es la declaración que la gente estaba buscando». una técnica de representación gráfica parece ser lo único que a Internet le importó).

Es decir, nos encontramos que PS5 vendría a tener trazado de rayos por hardware… ¿En que se traduce esto? Pues se traduce en que Ariel no es el SoC/APU de PS5 ya que este se basa en Navi 10 Lite y por tanto la familia Arden/Oberon/Sparkman podría hacer referencia sin problemas a las consolas de siguiente generación y aquí entramos a una cosa que ha pasado en las últimas horas que ha sido un disparo en el pie por parte de Digital Foundry y de los gordos además.

Digital Foundry esta confundiendo en su artículo lo que es Gonzalo/Ariel con el SoC de PS5… Esto es porque se ha ido creando dicha narrativa que entra en conflicto con lo que afirmo Cerny para Wired. Simplemente si la GPU en el SoC de PS5 soporta aceleración de trazado de rayos por hardware no puede ser Ariel que lleva Navi 10 Lite que como su nombre indica hace referencia a una Navi/RDNA sin soporte para Ray tracing.

Pero Leadbetter se nos agarra al clavo ardiendo…

La filtración de Gonzalo en abril sugirió que PlayStation 5 presentaría un clúster de CPU basado en Zen 2 que se ejecuta a 3.2GHz emparejado con un núcleo de gráficos Navi que se ejecuta a 1.8GHz. Evidencia un poco menos concreta vinculada a los identificadores PCI Express sugirió que AMD se refería a la GPU como ‘Navi 10 Lite’, lo que infiere en gran medida que la GPU tendría las mismas 40 unidades de cómputo que la parte Navi 10 basada en PC que se encuentra en el RX 5700 y RX 5700 XT (con cuatro CU probablemente deshabilitadas para obtener mejores rendimientos de la línea de producción). Las filtraciones de prueba que surgieron en los últimos días no nos dicen nada sobre el componente de la CPU, pero confirman 36 unidades de cómputo disponibles que se ejecutan a 2.0 GHz, lo que, aunque no está confirmado, nos daría una GPU de 9.2 teraflop para PlayStation 5.

A lo que Leadbetter hace referencia es a Gonzalo/Ariel/Flute… Pero al contrario de lo que yo he ido afirmando y la narrativa también no tiene porque tener relación con el SoC de PS5 y viendo como han aparecido rumores de que este no soporta Ray tracing por hardware (Ariel, no PS5) podemos decir que cualquier afirmación en ese sentido es cuanto menos digna de ser considerada…

Leadbetter se cura en salud con lo siguiente:

En reacción al leak, ha habido un argumento que sugiere que las especificaciones de PS5 no son válidas porque no se menciona el trazado de rayos acelerado por hardware, mientras que Arden lo ha confirmado (junto con VRS – sombreado de velocidad variable).

Pero lo risible viene ahora, no en vano nos intentan hacer creer que es posible crear un SoC/APU con 56 CUs/28 WGP sin problema alguno en cuanto al espacio disponible… ¿El motivo? Ah, no tienen ninguna referencia para ello pero han ido repitiendo ello continuamente y ahí tenemos a Leadbetter «confirmando» lo de los 56 CUs/28 WGP en el SoC de Xbox Series X.

¿Cual es el problema? Por ejemplo una GPU basada en RDNA1 con 48 CUs/24 WGP ocuparía casi unos 300mm^2 de un espacio que supuestamente estaría sobre los 360mm^2 y siendo generosos 380mm^2 faltando CPU y Uncore (para comunicarlo todo).

Y estas CUs carece de la unidad de cálculo de la intersección de rayos. En Nvidia su equivalente mide unos 0.7mm^2 en total por TCP y al igual que la solución de AMD esta conectada a la cache de datos/texturas, pero AMD habría colocado las dos piezas de manera conjunta.

Suponiendo que la solución vendría a ser similar, vamos a decir que el entramado del trazado de rayos suma una media de 1mm^2 por WGP… ¿Vais viendo como aumenta? Es que la configuración de 56 CUs es imposible por el tamaño.

Pe… pero Urian… 7nm+… 7nm+

Veamos la información de los 7nm+ o 7nm EUV por parte de TSMC… La fuente es Wikichip.

El nodo N7 + es la primera tecnología de proceso de TSMC en adoptar la litografía EUV. No está relacionado con N7 ni N7P y tampoco es compatible con IP, lo que requiere una nueva implementación (nuevo diseño físico y validación). N7 + entró en producción en masa en el segundo trimestre de 2019 y usa EUV para cuatro capas críticas. En comparación con el proceso TSMC N7, se dice que N7 + ofrece una mejora de densidad de aproximadamente 1.2x. También se dice que N7 + ofrece un 10% más de rendimiento en iso-power o, como alternativa, hasta un 15% menos de potencia en iso-performance. En el papel, N7 + parece ser marginalmente mejor que N7P, aunque eso tiene el costo de volver a implementar el diseño.

¿Que problema tiene esto? AMD no tiene porque re-diseñar el núcleo Zen2 para 7nm EUV para las consolas. Por otro lado al ser un proceso más nuevo sus obleas van a ser mucha más caras. Por otro lado si AMD ha diseñado ya la GPU para las consolas de siguiente generación en el nodo de 7nm no tiene mucho sentido hacer un cambio de última hora de este calibre. Lo siente pero lo de los 7nm+ no se sostiene.

El hecho de que AMD hable de Navi 21 Lite en los drivers con un código distinto me hace pensar que es un diseño «distinto» y posiblemente pensado para casar con Zen 2. Puede que me equivoque al 100% con ello pero creo que lo de los 56 CUs es producto del fanboys de Microsoft más que nada y no tiene nada en cuenta.

Urian, no nos has aclarado nada.

He aclarado más de lo que os pensáis.

Esto es todo, como siempre tenéis el Discord y los comentarios de la misma entrada para comentar el contenido de la misma.