About Taringa!

Popular channels

Xbox One podria destrozar a la Ps4 en rendimiento




Xbox One podria destrozar a la Ps4 en rendimiento

muchos tadingas se preguntaran como es posible?


Una de los temas más controvertidos con la nueva consola de Microsoft es el tema del ancho de banda, el motivo es sencillo, PlayStation 4 tiene un ancho de banda de 176 GB/seg gracias al uso de memoria GDDR5, mientras que XBO tiene un ancho de banda de 68 GB/seg por el uso de memoria DDR3, las cosas se agravan si tenemos en cuenta que usan la misma CPU y la cantidad de memoria principal que queda libre para la GPU.




176-26=150, 68-26=42, en otras palabras, Xbox ONE tiene un ancho de banda de 42 GB/seg para la GPU con la memoria principal, una cifra realmente ridícula si tenemos en cuenta que la GPU del sistema es comparable con la HD 7770 en cuanto a potencia, cuyo ancho es justo el doble.

aca entra en juego la SRAM
que le daría una potencia nunca vista a la siguiente consola de Microsoft.
pero hay algo que no encuadraba absolutamente para nada, el tamaño de la ESRAM, unos 32MB me parecen insuficientes tanto para tareas de post-procesado como para el atlas de texturas. Por lo que la única manera de poder solventar este problema es a través de una descompresión/compresión de texturas al vuelo.




el búfer de imagen queda almacenado en formato PTC. y es enviado y descomprimido al vuelo sobre la memoria principal y de ahí leído por el controlador de video para codificar la señal de video.


El búfer frontal de imagen, el que se envia a la señal de video, no tiene canal alpha. Esto significa que el contenido de la ESRAM esta en formato PTC. y es descomprimido/comprimido por los Shaders al vuelo.


Una unidad de proceso, método y medio para la descompresión o la generación de textura dentro de una unidad de procesamiento gráfico (GPU). Las texturas están comprimidas con un esquema de ratio variable como el JPEG. Las texturas comprimidas son sacadas de la memoria del sistema y transferidas a la memoria cache local de la GPU sin ser inicialmente descomprimidas. Una tabla es utilizada por la cache para localizar los bloques individuales de la textura comprimida. Un procesador shader de descompresión recibe los bloques comprimidos y entonces realiza la descompresión al vuelo de los bloques. Los bloques descomprimidos entonces son procesados de forma habitual por un procesador shader de la GPU que vaya a consumir la textura.





En varias encarnaciones, la memoria de texturas 220 es utilizada para almacenar los datos de textura. En dicha encarnación, la memoria de texturas 220 provee un acceso rápido a ciertos datos de texturas, como una textura que es usada frecuentemente, de lo que sería posible si los datos de texturas fueran almacenados solamente en la memoria 226 o la memoria local 230.






La cadena de Shaders 320 puede incluir un shader que consume la textura 321 y un shader que lo descomprime 322, los cuales son representativos de cualquier número de procesadores shader los cuales pueden ser incluidos en el grupo de shaders 320. En varias encarnaciones la cadena de shaders 320 puede incluir un procesador shader adicional que puede ser configurado para generar datos de textura de forma procedural.



En una de la siguientes operaciones, el shader que utiliza la textura 321 puede ser utilizado para realizar la descompresión, y el shader que descomprime 322 puede ser configurado para realizas las funciones del shader consumidor de texturas. Cada procesador del grupo de shaders 320 se puede ser configuar para realizar una variedad de funciones dependiendo de los requerimientos de la operación actual.


Esto significa que parte de la potencia de los shaders es utilizada para la descompresión, pero no se ha de olvidar que estamos en una era donde las GPU soportan varios contextos al mismo tiempo y aprovechan los tiempos muertos y la enorme latencia con la memoria principal para realizar ciertas operaciones.

En varias encarnaciones, se puede asignar las tareas de descompresión a los shaders sin utilizar. También, se puede reservar un número de unidades de computación (shaders) para permitir que los shaders de descompresión sean lanzados en un número (concreto) de unidades de computación.


Mirando ahora la FIG. 4A, el diagrama de bloques de una encarnación de la cache de datos es mostrada. La Cache 410 puede contener porciones de las texturas 420 y 430, las cuales son representativos de cualquier número de porciones de texturas las cuales están almacenadas en la cache 410. Las texturas 420 y 430 pueden ser texturas comprimidas.




La idea de las texturas parcialmente residentes se puede aplicar también a PlayStation 4 y en PC, dada que la arquitectura de la GPU es la misma y la idea no es otra que la de poder cargar trozos concretos que se van a utilizar en ese momento, la diferencia es el hecho de que Xbox One esta mejor optimizada para ello gracias a la ESRAM, al ser una memoria mucho más pequeña el tiempo de búsqueda es menor y su menor latencia también acelera el proceso. La contrapartida no es otra que los datos de textura tienen que ser llevados desde la DDR3 a la ESRAM, para ello se usan los Move Engines, los cuales tienen una velocidad de transferencia de 25.6 GB/seg, algunos pensaréis que esto es peor que usar la DDR3 por el ancho de banda, pero pensad en la DDR3 como la M30 o las Rondas de Barcelona donde pueden haber atascos y los Move Engines como la carretera secundaria que es más lenta pero en ciertas circunstancias nos hace llegar antes. Tampoco se ha de olvidar que los Move Engines tienen mecanismos de empaquetado y desempaquetado de datos que son ideales para este caso.

El shader que va a usar la textura lo que hace es mirar si tiene el trozo de textura o bloque que esta buscando dentro de su memoria local/cache L1, si lo tiene entonces realiza el trabajo, se ha de tener en cuenta que el shader que hace uso de la textura ya la tiene descomprimida en su memoria local/cache L1 con una tabla que dice la localización exacta de la textura en memoria, entonces el sistema de memoria lo busca en la RAM y carga las texturas no comprimidas en una segunda unidad para que esta las descomprima para la primera unidad, la patente en ningún momento habla de ningún mecanismo automático de descompresión de datos sino que todo es realizado por los shaders de la GPU, restando potencia de los mismos. Pero en Xbox ONE tenemos la ESRAM por lo que la petición de memoria en este caso se hace sobre la RAM (DDR3) pero para trasladar los datos a la ESRAM desde donde son leídos por las unidades directamente y descomprimidos sobre el Shader que los va a utilizar con una diferencia en este caso y es el hecho de que dará la dirección de memoria de la ESRAM en la que se encuentran los datos para un uso posterior. La ESRAM es crucial en esto por la latencia, el motivo por el cual se han acabado implementando multiples contexto es por el hecho de que la latencia de la memoria es tan alta que los tiempos de espera se suelen aprovechar mandando a la GPU a hacer tareas de computación, las cuales a diferencia del procesamiento gráfico en general si que están centradas en la latencia al realizarse sobre las mismas caches, la descompresión JPEG en este caso es una tarea de computación.






Haciendo referencia ahora a la FIG. 5, se muestra un diagrama de bloques de un espacio virtual para un bloque de 8×8 texeles. Cada texel puede ser mapeado a una única dirección dentro del espacio de dirección virtual 570. El texel 1 puede estar mapeado en la dirección 501, texel 2 puede ser mapeado en la dirección 502, así para todos los 64 texels del bloque 8×8 500. El bloque 500 puede ser un bloque dentro de una textura comprimida, y el espacio de direccionamiento 570 puede ser localizao para el bloque 500 de la textura comprimida. La textura puede incluir una pluralidad de bloques además del bloque 500. El direccionamiento virtual 570 puede también incluir una unida dirección para dada texel de la pluralidad de bloques en la textura.

En algunas encarnaciones, la textura puede ser organizada de acuerdo a superbloques, Un superbloque puede ser una colección de 16 bloques de 8×8, lo cual es un tile de 32×32 pixeles, para un total de 1024 pixeles.

En una encarnación, una unidad de extracción puede tener un tamaño de 2 Kb (256 bytes). En otras encarnaciones, la unidad de extracción puede ser cualquiera de varios tamaños. Se pueden empaquetar varios bloques comprimidos en una, el máximo número de bloques que pueden ser empaquetados en una unidad de extracción son 16. En otras encarnaciones, se puede empaquetar diferente número de bloques en la unidad de extracción.
Además, múltiples peticiones de descompresión pueden ser empaquetadas dentro de una instrucción vector SIMD. Los vectores SIMD pueden facilitar la descompresión de múltiples bloques en un solo vector. En una encarnación, 16 bloques pueden ser descomprimidos en un solo vector, con un bloque por cada cuatro nodos.


el procesador gráfico siempre accede al atlas para procesar, en el caso de XBOX One la DDR3 sería donde se encuentra la información y el Atlas es la ESRAM.



Xbox one desmiente el rumor sobre underclock

http://attackofthefanboy.com/news/xbox-underclocking-rumors-false-microsoft/

tiemblan los fan boys de ps4







La nueva bestia de las consolas






Si te sirvió la info como no vas a dejar puntos?
0No comments yet