Voy a dar una pincelada rápida de esto en respuesta a un mensaje en twitter.

RDNA2 es RDNA con mejoras por lo que tenemos que partir de RDNA para hacernos una idea, no creo que la implementación de AMD de las unidades para el Raytracing como he dicho varias veces no difiera mucho de lo visto en las Turing de Nvidia… ¿Y donde conectan las Turing de Nvidia las unidades Traversal Unit que forman el RT Core?

Tienen acceso a la Cache de datos L1 (texturas) que en RDNA es la Cache L0 y las tenemos en la cache L2, en el caso de RDNA2 y mirando las diapositivas… Esto…

… entonces en RDNA evolucionaría en esto:

No he puesto el diagrama completo pero se entiende… ¿Como es que pienso así? Hay algo raro en el caso de la cache L0 del RDNA que me hace sospechar que falta una pieza.

Las unidades de texturas suelen organizarse de 4 en 4 porque se trabajan con fragmentos de 2×2 que es lo que se necesita para hacer el filtro bilineal, para el bilineal la unidadd de texturas necesita 4 muestras por pixel y de ahí que en GCN hayan 16 unidades L/S entre las unidades de texturas y la cache L1.

El Workgroup del RDNA (Compuesto cada uno por dos CUs) tiene en cada una de las CUs la organización para el filtrado de texturas y el acceso a dichas unidades como en GCN con una cache L0 privada de cada CU.

Pero AMD en otra diapositiva nos dice que el número de accesos por cache L0 es el doble por lo que aparte de la unidad de texturas tiene que haber otro cliente por cojones.

Es decir, tenemos 32 unidades L/S realmente pero AMD no habla de ellas en ningún momento en las diapositivas pero se intuyen lo que me hace pensar dada la organización que es para conectar las unidades para el Raytracing. Aparte que el desequilibrio de lectura/escritura de la cache L0 a la Cache L1 hace pensar que ahí puede haber espacio para algo.

Y si, puede que me equivoque pero no creo que RDNA2 difiera mucho de RDNA1, excepto en este detalle y la evolución completa a ser un Tile Renderer como os he ido comentando en las últimas entradas y que se intuye de la organización general del chip.

Esto es todo, como siempre tenéis el Discord y los comentarios de la misma entrada para comentar el contenido de la misma.