Comentario Original:

¿Cuáles son las probabilidades de un Tegra con tecnología RTX con GPC de Turing o Ampere usando RTcores?

Teniendo en cuenta el tiempo para una actualización del Switch llegar (2 años) veremos un Switch con tecnología superior en 2022?

En el caso de continuar con Nvidia, dudo mucho que veamos algo basado en Turing sino más bien basado en Ampere. Pero dado que por el momento Orin sigue siendo un apunte en el mapa de ruta pues…

Ya lo he comentado muchas veces, pero Orin ha de tener la potencia de medio Drive Pegasus en total, por el momento Drive Pegasus es uno de los casos de vaporware más grandes que existen.

El rendimiento lo miden por DL-TOPS Deep Learning Tera Operations per Second donde un DL-TOP no es ni siquiera una operación en FP16 sino en Int8 y se a de tener en cuenta que lo Tensor Cores del Tegra Xavier son más parecidos a los de Turing por el hecho de soportar Int8 al contrario de Volta pero no soportan Int4. Esto utilizando la técnica SWAR (SIMD Withing a Register) que permite ir desdoblando ALUs y registros de manera sucesiva.

El motivo por el cual el Drive Pegasus es vaporware, es porque para soportar Int8 en los Tensor Cores han de revisar Volta y a estas alturas existiendo Turing no lo van a hacer. Por otro lado, sería fácil evolucionar por completo el Volta de Xavier en Turing/Ampere de Orin. ¿El motivo? Turing es una extensión de Volta y Ampere es Volta a 7nm.

¿El motivo por el cual creo que vamos a ver un SoC a 7nm en el caso de existir? Pues porque en el nodo 12FF/16FF nos encontramos con que Xavier es un chip enorme.

No en vano, mide unos 350mm^2 en total, lo mismo que el SoC de Xbox One X… Y no solo eso sino que esta rodeado por 8 chips de memoria LPDDR4X, una cantidad ingente para un sistema portátil.

El primer cambio a realizar sería sustituir la LPDDR4X por LPDDR5, es un cambio similar al de la GDDR5 a la GDDR6 y el objetivo es reducir el número de chips así como el perimetral del chip asignado a la interfaz con la memoria externa. La LPDDR5 ya es un estandar de la JEDEC y nos permite con un bus de 128 bits llegar a los 102.4 GB/s, no incluyo un bus de 512 bits por parecerme el salto en 2X demasiado pobre.

El segundo cambio es la la eliminación de los aceleradores que tienen que ver con el Deep Learning aparte de los Tensor Cores dejando solo los Tensor Cores dentro de la GPU para dichas tareas, también eliminariamos la interfaz PCI Express para los Drive PX ya que nos sería completamente inutil en este chip.

El tercer cambio obviamente sería la GPU, pero siendo un Inmediate Renderer y su dependencia del ancho de banda para el rendimiento hemos de tener en cuenta que unos 102.4 GB/s no es un salto en el ancho de banda muy impresionante. Y antes que me digáis que apple con el A12 y el A12X no tiene problemas, antes de que me nombréis los Snapdragons… Tened en cuenta que la configuración de dichas GPUs es que son un Tile Renderer puro y esto les hace menos dependientes del ancho de banda de la memoria externa. La gente debería entender que Switch fueron la necesidad de Nintendo de tener una consola nueva combinado con la ansias de Nvidia de limpiar stock de los X1, y no creo que ambas se esperasen el enorme éxito que ha tenido la Nintendo Switch.

El cambio más posible por parte de Nvidia es que hagan como ha hecho AMD en RDNA y estén creando un tile Renderer, aunque en el primer RDNA solo vemos al feto gestandose, su organización da pistas para un Tile Renderer.

Lo que ha hecho AMD es añadir una cache adicional, global, a nivel de Shader Engine, esto es ideal para el Tile Rendering desde que los RB están conectados a este, esto permite escribir el Color Buffer y el Backbuffer en la L1 y recuperarlo desde esta sin tocar la memoria principal. Fuera de pequeños cambios las GPUs de Nvidia y AMD son muy parececidas entre si. Turing en estos momentos tiene una serie de caches privadas a nivel de SM/CU y una cache global para los GPC que es la L2, sería tan sencillo que hacer como AMD y sacar una cache a nivel de GPC con tal de reducir enormemente el impacto sobre la memoria externa. Personalmente no me extrañaría que Nvidia en Ampere «Copiase» eso ya que es una forma de quitar estrés sobre el controlador de memoria y las empresas se suelen copiar entre si estas cosas de manera continuada.

En todo caso, si tuviese que poner una fecha para una eventual Switch 2… 2022.

Esto es todo, como siempre tenéis el Discord y los comentarios de la misma entrada para comentar el contenido de la misma.