El post que buscas se encuentra eliminado, pero este también te puede interesar

Guia sobre la gpu. Todo lo que querias saber

GUIA SOBRE LAS CARACTERISTICAS DE LAS GPU ACTUALES Y NO TAN ACTUALES

Espero os guste y os ayude a entender más, la informática.

Guia sobre la gpu. Todo lo que querias saberMac nvidia

Aqui os pongo toda la información acerca de las caracteristicas tecnicas de las GPU´s actuales. De esta forma, los no entendidos en tarjetas graficas, sabran en que fijarse a la hora de comprar y para aquellos que tengan la curiosidad de saber que es una determinada parte de la GPU o VPU.


VPU : Video Processor Unit o en castellano Unidad de procesamiento de video.

GPU : Graphics Processor Unit o en un perfecto castellano, Unidad de procesamiento de gráficos.


VERTEX SHADER :

en terminos de programacion es una función que recibe como parámetro un vértice. Sólo trabaja con un vértice a la vez, y no puede eliminarlo, sólo transformarlo. Para ello, modifica propiedades del mismo para que repercutan en la geometría del objeto al que pertenece. Con ésto se puede lograr ciertos efectos específicos, como los que tienen que ver con la deformación en tiempo real de un elemento; por ejemplo, el movimiento de una ola. Donde toma una gran importancia es en el tratamiento de las superficies curvas, y su avance se vio reflejado en los videojuegos más avanzados de la actualidad. Particularmente, en el diseño de los personajes y sus expresiones corporales.



PIXEL SHADER :

Este no interviene en el proceso de la modelacion del “esqueleto” de la escena, sino que forma parte de la segunda etapa: la rasterización. Allí es donde se aplican las texturas y se tratan los pixeles que forman parte de ella. Básicamente, un píxel shader especifica el color de un píxel. Este tratamiento individual de los pixeles, permite que se realicen cálculos principalmente relacionados con la iluminación del elemento del cual forman parte de la escena, y en tiempo real. Teniendo la posibilidad de iluminar cada píxel por separado. De esta forma es como se lograron crear los fabulosos efectos que se pueden apreciar en Doom 3, Far Cry y Half Life 2, por mencionar sólo los más conocidos. La particularidad de los píxel shaders es que, a diferencia de los vertex shaders, requieren de un soporte de hardware compatible. En otras palabras, un juego programado para hacer uso de píxel shaders requiere si o si de una tarjeta de video con capacidad para manipularlos.

Para poder programar usando comandos de las funciones Pixel Shader y Vertex Shader, se usa el lenguaje HLSL (High Level Shader Languages).

Versiones de PS y VS de las diferentes familias de GPU´s del mercado

DirectX 8.0 (Pixel Shader 1.1 – Vertex Shader 1.1):
Familia GeForce 3, de NVIDIA.

DirectX 8.1 (Pixel Shader 1.3 y 1.4 – Vertex Shader 1.1):
Familia GeForce 4 TI, de NVIDIA (hasta Pixel Shader 1.3).
Radeon 8500, 9000, 9100, 9200 y 9250, de ATI (hasta Pixel Shader 1.4).

DirectX 9.0 (Pixel Shader 2.0 – Vertex Shader 2.0):
Familia GeForce FX, de NVIDIA.
Radeon 9500, 9700, 9800 y Familia Xx00, de ATI. Familia 900 y 950, de Intel.
Familia Volari, de XGI. Deltachrome y Gammachrome, de S3.

DirectX 9.0c (Pixel Shader 3.0 – Vertex Shader 3.0):
Familia GeForce 6 y GeForce 7, de NVIDIA.
Familia X1000, de ATI.

DirectX 10 (Pixel Shader 4.0 - Vertex Shader 4.0):
Familia GeForce 8, GeForce 9 y 200GTX de NVIDIA.
Familia HD2000 de ATI.

DirectX 10.1 (Pixel Shader 4.1 - Vertex Shader 4.1):
Familia HD3000 y HD4000 de ATI.
Familia 400 de S3



UNIDAD ROP (Raster Operator Unit)

Cuando los pixel procesados se almacenan en la memoria de video de la tarjeta, listos para ser resueltos en pixeles presentados en pantalla, esta tarea es manejada por una unidad de la GPU llamada ROP.
Un GPU moderna pone un número de ROPs en ejecución, basados en cómo el GPU debe optimizar la salida del pixel sin cuellos de botella, para realizar las tareas finales de la representación. Así como simplemente resuelve y dibuja los pixeles en pantalla, el hardware del ROP también realiza un número de optimizaciones para ahorrar el ancho de banda de la memoria al leer y escribir los pixeles en un framebuffer, tal como compresión del color (incluso ahorrar 1 byte de datos del color por pixel es un ahorro enorme en términos de ancho de banda).
Las unidades ROP también se ocupa de la compresión Z y compara, (para ver cuál pixel está encima del otro) siendo lo que mas facilita para calculos de multisample antialiasing. El Multisample antialiasing utiliza la información de la profundidad Z para alterar el color de los pixeles, de modo que sea la geometría rasterisada anterior en el proceso de la representación alisada (antialiased) para que se vea la imagen mas suave.

Y para que todos memoricemos facilmente lo que son las unidades ROPS:
-El ROP es el que da a la GPU la capacidad de escribir los pixeles, manejar cualquier antialiasing así como la compresión Z y la compresion de color.




Pipeline TMU (Texture Mapping Unit)

-Es el motor encargado de procesar las texturas por cada pixel pepeline. Tambien conocidas como Graphical Pipeline, es una pequeña etapa de la GPU que realiza las tareas menos pesadas. En concreto esta unidad rota y vuelbe a clasificar un bitmap según su tamaño para aplicarlo sobre un plano arbitrario de un objeto 3D dado.



FillRate (Tasa de relleno)

La tasa de relleno (FillRate) es el número de texel (Pixel + textura asociada) que es capaz de generar el motor gráfico en un segundo. Se puede sacar con la formula : Mhz del nucleo por el numero de Pixel Pepelines. ( FR = Vn * Px ). Por ejemplo si una 6600GT tiene 8 pixel pepelines y 500Mhz de velocidad del nucleo, entonces tendria un FillRate teorico de : 500*8= 4000Mtexels/s.



Pixel Pipelines

Es donde ocurren las etapas requeridas en transformar una imagen tridimensional hacia una pantalla de dos dimensiones. Las etapas son responsables de procesar la información, al principio proporciona propiedades en los puntos de finales (vértices) o controlar los puntos primitivos geométrico usados para describir que debe ser renderizado. Los tipos primitivos típicos en 3D son líneas y triángulos. El tipo de propiedades proporcionadas por vértice incluye coordenadas de x-y-z, valores RGB , la translucidez, la textura, reflexión y otras características.


Estos son varias etapas que un Pixel Pipeline de una gráfica moderna procesa en la GPU. (Cortesía de NVIDIA Corp.) :

ati



Shaders Unificados

Hasta ahora tanto pixels como vertex shaders son unidades de proceso separadas (procesadores dedicados). Los pixels shaders se encargaban del aspecto y color de la textura, mientras que los vertex se encargaban de la alteración de estas según su posición en el mapa 3D (x,y). El problema con éste sistema es que dependiendo de muchas variables, cambia la carga de pixels o vertex shaders; muchas veces se ocupan mucho más las unidades de pixels y otras veces mucho mas las unidades vertex dejando en “reposo” un buen porcentaje del potencia de cálculo. Con los shaders unificados, cada unidad es capaz de procesar tanto pixel como vertex shaders según sea requerido, de esta manera se podrá maximizar la eficiencia en la utilización de los recursos de una tarjeta, ya que se podrá hacer un balance de carga según lo requiera la aplicación, si se necesita mucha potencia en vertex o en pixels no estarán limitados por las unidades específicas de cada cual, sino que podrán hacer uso de todas las unidades si es necesario.

El uso de Shaders unificados en teoría mejorará bastante el rendimiento final y las posibilidades de programación para juegos, reproducción de video sin tanta penalización, efectos en post producción a tiempo real y un largo etcetera.


TIPOS DE FILTROS GRAFICOS


Anti-Aliasing: Es una técnica por hardware o software que mediante algoritmos matemáticos, se consigue que las imagenes tanto en 2D, como en 3D se vean lo más nitidas posible. En esta técnica se persigue reducir los dientes de sierra de los bordes de los objetos aplicando diversos algoritmos. En las imágenes tridimensionales, se requiere de potencia gráfica pues se aplica en tiempo real a miles de imagenes en pantalla simultaneamente, lo que si pensamos en aplicar AA 8x, estamos hablando de aplicar 8 veces a todas las imagenes simultaneamente en pantalla y tiempo real, los pesados algoritmos de alisamiento de bordes más de 25 veces por segundo.Actualmente existen 2 técnicas al momento de aplicar este filtro, que son el Super Sampling, y el Multi Sampling. También existen varios niveles de Antialiasing, que generalmente son 2x - 4x - 6x y 8xS en las vgas de Nvidia.


Filtro Anisotropico:

- El filtro Anisotropico es un filtro de mayor complejidad. Este surgió como heredero o mejora de los antiguos filtros linear, bilinear y trilinear. Estos filtros son las etapas de filtración de una técnica conocida como mipmapping, cuya función es mejorar la calidad de una representación gráfica 3D, por medio de la yuxtaposición de las texturas que forman un objeto 3D, que han debido ser minimizadas en su tamaño, para mejorar el rendimiento en estas aplicaciones.(No confundir con la compresión de texturas, esto se refiere explícitamente a la calidad de la textura). El nivel de mipmapping es conocido como Level Of Detail o LOD, cuya calidad se mide en factores negativos y positivos. A mayor nivel negativo de LOD, mayor será la calidad y nitidez de la textura y por el contrario, a mayor nivel positivo de LOD, menor será la calidad gráfica de la textura.


Supersampling

-Su funcionamiento requiere, como muchos de ustedes sabrán, de un poder de cálculo considerable. En primer lugar, dibuja la imagen a una resolución mucho más grande a la que saldrá por pantalla, para poder llevar a cabo el tratamiento del color dentro de cada píxel y lograr un valor promedio acuerdo a las circunstancias. En el interior de cada uno, realiza un división del mismo en varios sub-pixeles, y toma muestras (samples) del color de éstos para llegar a dicho promedio. Existen diferentes criterios para completar este proceso, que describiremos a continuación:

* Adaptive supersampling: considerando que la mayoría de los pixeles en pantalla no necesitan tomarse en cuenta para el supersampling, esta modalidad reconoce cuando se da una situación de este estilo y evita valioso tiempo de cálculo. ATI, en su familia X1000, puso en práctica una variante del Adaptive supersampling que afecta las texturas “transparentes” y mejora sustancialmente la calidad de imagen.
* Grid supersampling: el píxel se divide en una grilla de n x n subpixeles y, conforme a esta división, se toman las muestras de cada subpixel. A pesar de ser el más rápido, no resulta tan efectivo en la imagen final.
* Random: como el nombre lo indica, los puntos seleccionados son aleatorios. Esto puede producir resultados desbalanceados, como por ejemplo, zonas del píxel demasiado sampleadas y otras sin ningún tipo de muestra.
* Poisson Disc: al igual que el Random, toma muestras de forma aleatoria, pero chequea de que los puntos escogidos no estén muy cerca entre sí para prevenir el desbalanceo del método anterior.
* Jittered: esta variante combina las primeras dos, ya que divide el píxel en distintas partes, y por cada una de ellas obtiene un punto aleatorio de muestra. Su principal característica es su sencilla implementación.

Terminado el proceso de muestreo, la imagen vuelve a acondicionarse a la resolución de salida esperada, habiendo hecho los cálculos necesarios para la aplicación de los nuevos valores de color en los pixeles intervenidos.

Grid supersampling y Random :

tarjetas

Poisson Disc y Jittered :

Asus

Multisampling

La innovación que aporta el multisampling respecto al supersampling es que solo se calcula un valor de la textura por pixel, en vez de un valor por cada subpixel como en el supersampling. Mientras que en el supersampling se renderiza la imagen al completo a mayor resolución de la original, en el multisampling solo se hace para la geometría, no para las texturas. Esto ahorra tanto tasa de relleno como ancho de banda.
El ahorro es menor en ancho de banda debido a que aunque solo se genera un valor de color por pixel, lo que ahorra tasa de relleno, este valor debe ser almacenado por separado para cada subpixel.



Mip mapping:

El Mip mapping es el encargado de difuminar las texturas para que no pixelen, suavizándola más o menos según el tipo. Aquí tendríamos un polígono sin Mip mapping...
Como pueden ver se ven varios cuadraditos en la textura, en la próxima imagen serán corregidos con dicho efecto:



La calidad de este filtrado también depende de la paleta de color que se use, cuanto mayor sea mejor.

También es la teórica culpable de que a veces las texturas se vean borrosas.

Cuando una textura es pequeña, sin mip mapping será un conjunto de enormes pixeles. Con Mip mapping serían un enorme borrón. En cualquier caso siempre queda mejor, como podemos ver a continuación...





En una palabra: el mip mapping se utiliza para que las textura no pixeles (se vean cuadraditos) y se suavicen.


Filtro bilinear:

El filtro bilineal es unas de las maneras más simples de evitar el efecto de pixelado (grandes cuadros para dibujar el entorno) sin texturas, lo cual puede ser especialmente visible cuando un personaje se mueve cerca de un objeto con textura mapeada.
El filtro bilinear suaviza las texturas coloreando cada texel, con un rango de colores cercano a los 4 texel de alrededor.
La diferencia de calidad es muy grande, en especial en aquellos casos donde el mapeado de texturas ha sido realizado.


Filtro trilinear

En pocas palabras podemos decir que el cometido del Filtro trilinear es lograr texturas más realistas y reduce los parpadeos de la imagen.

Podemos decir que el filtro trilinear es prácticamente lo mismo que el bilinear pero más, es decir, si el bilinear reduce un 20% los cuadraditos de las texturas, el trilinear lo hará un 40% (estos % son orientativos y solo como ejemplo, no tienen nada de real).

Como pueden ver la diferencia de calidad no es asombrosa pero si nos fijamos más detalladamente veremos que la calidad mejora un poco:

gpu

Filtro trilinear y filtro bilinear

TIPOS DE ANTIALIASING by gman

El modo 16xS aplica primero una base de SuperSampling 2x2, con la tecnica de renderizar el frame completo al doble de resolucion tanto horizontalmente como verticalmente. Por ejemplo para un monitor de 1920x1200 serian 3840x2400.

Dado que tiene mas informacion del frame, ahora hay mas puntos de referencia de geometria, color, etc... y puede calcular el frame de salida a 1920x1200 con mucha mas precision.

Al aplicar el MultiSampling 4x sobre este superframe se obtiene mas calidad.

Y lo mejor de todo es que aparte de mejorar la calidad del alisado, tambien nos aumenta la nitidez geometrica y el filtrado de texturas.

Por ejemplo si se usa AA 16xS junto con el AF 16x, el resultado es como estar usando AF 32x gracias a haber calculado el frame a 3840x2400 con AF 16x.

Para aplicar el MultiSampling a todo el frame hay que activar la casilla de Transparent AA y dentro elegir el modo SuperSampling que es el tipo de Transparent AA de mas calidad.

Si no activa el Transparent solo se aplica en los bordes de poligonos, y los sprites y todo tipo de texturas transparentes se ignoran, quedando el frame final descompensado, pues en unas zonas tendriamos AA y en otras no.


OPCIONES DE OPTIMIZACIÓN GRAFICA

Originalmente Escrito por danko9696

Si tenemos un TFT a 60Hz y se tienen 50 FPS, se representa 1 frame cada dos refrescos de pantalla, ya que hay que redondear debido a que mientras se espera para mostrar un frame, la gráfica no hace nada salvo esperar.

Con 50 FPS (por ej), cuando llega el barrido del monitor, el frame no está listo (casi, pero no). Al poco tiempo despues del barrido del monitor, la tarjeta ya ha terminado el frame, pero se tiene que quedar esperando al siguiente barrido, en el cual ya si que mostrará el frame. Por eso se tienen 30fps con 60Hz.

Hay una forma de que no pase eso, de no perder tantos frames al estar por debajo de la tasa de refresco, que es activando el Triple Buffer. Con un buffer adicional, despues de tener listo el frame, la tarjeta no tiene por que estar ociosa, y puede ir preparando el siguiente frame.
-Los inconvenientes: no todos los juegos lo soportan bien, consume mas memoria gráfica y que añade algo de lag (poco pero no insignificante, sobre todo online, cuando buscamos el menor lag posible).
-Las ventajas: que los frames no bajan a la mitad si tenemos menos fps que la frecuencia de refresco.

Y otra cosa, se puede decir que el tearing es molesto (mas para unos que para otros) pero refleja con mas fidelidad lo que ocurre en un momento dado que v-sync o v-sync+triple buffer. Sin vsync en cada momento ves lo que la gráfica está renderizando justo en ese momento, de ahí los cortes de imagén, ya que se deben a que parte de la imagen corresponde a un frame y la otra parte corresponde al siguiente frame.


SCREEN TEARING

-Antes se hablaba de optimizar la salida de FPS de la tarjeta al monitor activando el Triple Buffer. Pero en algunos casos si no se activa el Vsync se ven cortes en la imágen, puesto que estamos viendo la actual imágen y la siguente sin un orden correcto.
Este efecto de cortar la imágen en dos o en las partes que sea, se llama Screen Tering y para hacer que desaparezca no hay más que activar el Vsync y el Triple buffer para no perder FPS.

EJEMPLO:

Windows

Diferentes Buses de conexion GPU/Procesador I/O

Actualmente conviven diversos buses de interconexión entre el procesador grafico y el procesador central de un PC, y son los siguientes:


PCI :

Antes que este bus, estaba el bus ISA el cual tenia un ancho de banda pasante de solo 16bits, lo cual limitaba hasta cierto punto. Como actualizacion, crearon el bus PCI el cual tiene una ranura mas corta que el ISA y de mayor ancho de banda, 32bits. Su velocidad de reloj para comunicarse con el puente sur (southbridge) es de 33Mhz. Aun se sigue utilizando para equipos antiguos que no disponen de ranuras AGP ni PCIe.
Tanto el bus ISA como el PCI, no comunican directamente con el procesador, si no que tienen que pasar antes por el SouthBridge luego por el Nothbridge y ya luego al procesador.
La velocidad te transferencia total del bus PCI es de 133MB/s.


AGP :

Este ya deja de ser un bus de comunicaiones, para pasar a ser un puerto especifico. Se creo para comunicar mas directamente las GPU con el procesador intercomunicandose mediante el NorthBridge que es mas rapido que el puente sur, corriendo este a 66Mhz en su version primitiva (AGP 1x). Tenia caracteristicas que lo ponian en cabeza respecto al bus PCI en cuanto a conexion de tarjetas graficas, como el poder acceder a la memoria del sistema mas directamente y mas canales de direcciones. Pero sigue siendo de 32bits.
Para conseguir quitarse la limitacion del ancho de palabra, lo que hicieron fué aumentar la velocidad de reloj con el que se comunica con el chipset:

AGP 1x 66Mhz, 3.3v con una tasa de 264MB/s
AGP 2x 133Mhz, 3.3v con una tasa de 528MB/s
AGP 4x 266Mhz, 3.3v o 1,5v con una tasa de 1GB/s
AGP 8x 533Mhz, 1,5v o 0,7v con una tasa de 2GB/s


PCI-Express :

Bus PCI-e se creo por Intel Corp. para sustituir principalmente al puerto AGP y al bus PCI con el tiempo, por su mayor ancho de banda. Como ya dije, el puerto AGP es unico para un dispositivo y el bus PCI es para diversos dispositivos conectados a el. El PCI-e se puede conectar a el diversos dispositivos, ya sean tarjetas graficas, t. red, sonido, etc.
Cada PCI-e dispone de un Lane segun su velociadad. El PCI-e 2x dispone de 2 Lane. Cada lane es capaz de transmitir 250Mb/s en cada direccion. Es decir, los Lane disponen de dos direcciones para enviar datos, y si envian por cada direccion a la vez, se duplica la cantidad de datos.

PCI-Express 2.0

Entre las versiones 1.0a, 1.1 (Las usadas ahora mismo) y la 2.0 encontramos principalmente la diferencia del mayor ancho de banda: Las dos versiones primitivas funcionan a 2,5 GHz mientras que la 2.0 a 5 GHz. En el caso de la 2.0 con 16 líneas se consigue un ancho de banda de 16 GB/s.

En cuanto a los demás cambios, tenemos estas nuevas características:

-Control dinámico de la velocidad de conexión, lo que permitirá a los desarrolladores controlar por software la velocidad de la conexión.
-El sistema operativo y los controladores podrán notificar estos cambios.
-También se ha rediseñado el bus para poder proporcionar más corriente a los dispositivos (sobre los 200w).
-Estructura rediseñada para controlar mejor las ranuras, interconexiones y dispositivos.
-Mecanismos de control opcionales para transferencias punto a punto.
-Control de tiempo de espera de las transferencias de datos.
-Un sistema opcional para reiniciar funciones en dispositivos multifunción.

Fuente: Noticias3D

CHIPS GRAFICOS

NVIDIA Linux

NV1 : 1995 primer chip grafico de nvidia experimental. Salio al mercado gracias a Diamond con sus tarjetas Diamond Edge 3D 2xx0 SGS STG2000 y Diamond Edge 3D 3xx0 . Este chip no tenia todas las capacidades Direct3D por lo que sufria problemas en diversos juegos. En contrapartida a su competencia, este chip poseia capacidades para sintetizar General MIDI.

NV2: Segundo chip grafico de nvidia. Este seria la base del Riva128. Sega casi lo intrujo en su Saturn después de machacar a nvidia diciendo que el NV1 no le servia.

NV3: Sacado en 1997 este es el RIVA128 final. Chip de 128bits, 16bits de profundidad de color y 16 bit de buffer Z. Sufria diversos problemas en filtros trilineales y en la generacion de mip-maps. Tenia solo 1 pixel pepeline dispoble y 1 pixel por ciclo de reloj. Era Dx3 y contaba con 3Millones de transistores. Contaba con un canal de 128bit de memoria.

El chip VANTA era una version recortada del RIVA128 con bus de memoria 64bit y clocks recortados.

NV4: Salio en 1998 para sustituir al NV3, con nombre Riva TNT. Tenia 2 pixel pepeline, 32bits de profundidad de color, 24 bit de buffer Z. Era un chip DirectX 5, contaba con 8 millones de transistores. 128 bit de bus de memoria. Tenia entre 8 y 16MB de memoria.

NV5: Salio en 1999 para sustuir al RivaTNT, con nombre Riva TNT2. Era exacto al RivaTNT pero este chip tenia dos canales de 64bit en el bus memoria con un total de 128bit, tenia los clocks aumentados y permitia mas cantidad de memoria, en este caso 32MB. Fue compatible con Directx6. También salio la version recortada de este llamada RivaTNT2 M64.

NV6: Eran los chips TNT y TNT2 recortados en cuanto a buses de memoria, pixel pepelines y clocks. Supongo que el chip NV7,8 y 9 fuese una variante de estos.

NV10: Salio en 1999 y supuso el boom de los GPU, pues es la primera GPU del mundo. (Al menos en ambito domestico). Su nombre fue Geforce256 pues fué el primer chip de 256bits. Tenia 4 pixel pepelines por 2 unidades de texturas cada una y un ROP. Búfer Z/Stencil de 32 bits. Primer procesador con T&L, filtro Bilineal, Trilineal, Anisotropico 2x y Cube Environment Mapping. Tenia un ancho de banda de memoria de 128bit en un canal y montaba tanto memoria SDR como DDR. Fue compatible con DirectX 7. Este chip poseia 23millones de transistores.

NV11: Salio en el año 2000 con nombre Geforce2. La novedad de este chip era su motor T&L de segunda generacion, reproduccion de video de alta definicion por hardware,Sombreado por píxel con NVIDIA Shading Rasterizer,Búfer Z/Stencil de 32 bits. Contaba con 4 pixel pipelines por 2 unidades de textura cada una y un ROP. Y logicamente los clock mas altos por lo que daba tasas mas altas que la Geforce256. Sus variantes fueron: Geforce2 MX, PRO, GTS y Ti. El NV16 fué el Geforce2 Ultra y seguramente el Ti y alguno mas que cité.

NV17: Salio en el año 2002 con el nombre Geforce4 MX y es una variante del chip NV11 (Geforce2), pero con 8 pixel pipelines en lugar de 4. Tenian exactamente las mismas caracteristicas y compatibilidad Dx7.

NV18 : Es el chip NV17 solo que tenia como novedad el AGP a 8x.

NV19: El mismo chip NV18 solo que en version PCI-e con un chip puente.

NV20: Salio en el año 2001 con el nombre Geforce3. Este seria el primer chip programable del mundo para el ambito domestico. Contaba con 4 Pixel Pipelines con 2 TMU por pipe, 4 unidades ROPs, 1 procesador vertex shader (nfiniteFX) y capacidad para procesar 4 texturas por pasada. Tenia 4 canales de memoria de 32bit cada uno, haciendo un total de 128bits usando solo memoria DDR. Pimera tarjeta con HRAA ( Antialiasing a alta resolución y pantalla completa), gracias al sistema patentado Quincunx AA. Tenia 57 millones de transistores y era compatible con DirectX 8. (Pixel Shader 1.1 y Vertex Shader 1.1)
La versión de este chip para x-box era igual, solo que tenia 2 procesadores vertex shader en paralelo en lugar de uno.


NV25: Lanzado al mercado en Abril del año 2002 para sustituir al chip Geforce3 (NV20) con el nombre Geforce4 Titanium (Ti). Como novedad tenia mejorado el controlador de memoria (LMA II), soporte de visualizacion dual, y la misma arquitectura NV20 solo que este chip contaba con 2 procesador vertex shader en lugar de uno, como el chip NV20. También se le fué actualizados el soporte Pixel Shader a la version 1.3 contando con 1 procesador Pixel Shader y 2 vertex shader. El soporte Vertex Shader quedó como estaba. Contaba con hasta 63 millones de transistores y en su version final NV28 contaba con soporte AGP 8x. Todos los chip Geforce4 Ti eran compatibles con DirectX 8.1. (modelos 4200, 4400, 4600 y 4800).


NV30 : Lanzado al mercado en febrero del año 2003 con el nombre Geforce FX 5800. Este chip pretendia revolucionar el mercado 3D, gracias a su nuevo motor grafico CineFX basado en procesadores Pixel Shader y Vertex Shader 2.0 Extendidos, lo que significa que tienen efectos adicionales al resto de chips de la epoca con SM 2.0. Este chip como contrapartida al sus hermanos pequeños (NV25, NV20,etc) tenia 4 canales de memoria de 32bit con un total de 128bits usando chips DDRII para asi (en teoria) suplir el ancho de banda total de solo 128bits. Tene una organizacion de 4 pixel pipelines por 2 TMU por pipe, 4 unidades ROP (la misma que las Geforce4) es capaz de tratar hasta 16 texturas por pixel, tiene 4 procesadores Vertex Shader y 1 procesador Pixel Shader. Se comenta que este chip, fué creado en conjunto con los mejores ingenieros de nvidia y 3dfx despues de haber sido absorvida.
Estos chips contaban con hasta 125 millones de trasistores.

Todas variantes de este chip eran iguales en cuanto a su arquitectura y organizacion, salgo el NV35 que tenia 4 canales de 64bit lo que aumentaba considerablemente el ancho de banda, y ciertos añadidos como añadir 2 pequeños ALU FP (Procesadores Fragmentados ) en cada pipe con nombre de serie FX 5900.


NV40: Lanzado alla en el año 2004, fué el chip que refloto a nvidia despues del chasco con su serie FX. Este chip era una revolucion, respecto a su primo FX pues fué el primero en presentar la tecnologia SM 3.0, que contaba con 6 procesadores vertex shader 3.0 ,16 procesadores pixel shader 3.0 ademas de calcular hasta 16 texturas por pasada, poseia 32 procesadores fragmentados con precision 32 bit,un TMU por pipe y dos unidades ROP. Este chip contaba con hasta 222 Millones de trasistores.

Los siguientes chips NV42(6800), NV43(6600), NV44(6200), NV45(6800) son variaciones de la misma arquitectura, pero con recortes a nivel de hardware o simplemente por reduccion de fabricacion y algunos por cambio de BUS. El NV45 fué el ultimo chip 6800 para PCI-E que se fabricó.


G70: Lanzado en junio del año 2005 para como no, hacer competencia y ser la reina del rendimiento 3D. Como mejoras respecto a su progenitor NV40 hasta 24 pixel pipelines 3.0 , 8 procesadores vertex shader 3.0. , 2 unidades ROP y por cada pixel pipeline llevaba 1 TMU . Su BUS de memoria estaba organizado en cuatro canales de 64bit con un total de 256bits soportanto tipos de memoria como son DDR, GDDR2 y GDDR3. La organizacion del Rasteriser es igual al GPU NV40 con la salvedad de que en el NV40 tenia 32 procesadores FP con precision de 32bit, y el GPU G70, tiene 2 ALU's por Texture Pipeline, cada uno con capacidad de Vec3 + Scalar or Vec2 + Vec2 con precision de 32FP, 24 pipelines, 16 texturas por pasada y 32 buffer- Z.
Además de contar con novedades de diseño y mejoras, contaba con optimizaciones en la tecnologia HDR, filtrados, nuevos modos de FSAA, y algo muy importante era en el menor consumo electrico respecto al NV40 y menor generacion de calor gracias a este aspecto.

Como bien se lleva haciendo las variaciones de nomenglatura en la serie 7 asi como en todas las familias, siempre son pequeñas variaciones de la misma arquitectura, pero con reducciones en cuanto a pixel pipelines, tipo de memoria y velociada de reloj del core. Asi salen diversos chips como el G71, G73, etc.



G80: Lanzado en el año 2007 como evolucion real respecto a sus familiares G70, NV40, etc, bajo el nombre comercial de Geforce 8800. Este chip trae como novedades la unificacion de los procesadores pixel shader y vertex shader en su version 4,0, esto se traduce en 128 procesadores de "proposito general". Y digo esto por que estos 128 procesadores son capaces de realizar cálculos tanto vertex shader como pixel shader, valanceando la carga de estos segun sea requerido, no dejando nunca ninguna unidad vagueando, o esperando instrucciones. Además cuenta con 6 canales de 64bit de memoria usando tipos de memoria tanto GDDR como GDDR4. La configuracion del Rasteriser, cuenta con 32 texturas por pipeline, 24 pixels por pipeline y 32 buffer Z. Es capaz de tratar hasta 128 texturas por pasada con una precisión FP32. Los procesadores fragmentados, o "Fragment Processor" se basan en 128 procesadores del tipo escalar con funciones MADD+MUL. Otra novedad con la que cuenta es una nueva tecnica de compresion de texturas llamada 3Dc+ ademas de contar con las DXTC desde su version 1 a la 5.
Como nota curiosa, en este chip no todas unidades de proceso trabajan a la misma frecuencia como hasta ahora, si no que las unidades de shaders trabajan a una frecuencia distinta de las unidades TMU, ROPs, etc. Es probable que esto ocurra, pues el trabajo mas costoso lo harán las unidades de shaders y para que el resto de unidades TMU, ROP, ALU´s, etc no tengan que estar esperando por los procesadores de shaders a que terminen, probablemente a estas unidades al realizar trabajos menos costosos sus clocks son mucho menores que los clocks de las unidades de shader.
Este chip G80 cuenta con 681 Millones de transistores


G92: Lanzado al mercado a finales del año 2007 como introducción al PCI-e 2.0 (compatible con PCI-e 1.1), mejora del chip G80 en cuanto a cantidad de unidades TMU y reduccion de tamaño pasando de 90nm a 65nm bajo el nombre de Geforce 8800GT/GTS y 8800GS. Lleva 754 millones de transistores.

Internamente este chip posee 128 procesadores de proposito general (stream processors), 64 TMU y 16 ROPs lo cual lo hace un serio adversario frente a las soluciones montadas con el chip G80, posee un bus de memoria de 256bit en cuatro canales de 64bit del tipo GDDR hasta GDDR4. Se mantiene la compatibilidad por hardware en Dx10 asi como en OpenGL.
En el caso de los chips 8800GT y GTS llevan 56 TMU, 16 ROPs, 256bit de ancho de palabra en el bus de memoria y 112 SP en el caso de la GT y 128SP en el caso de la GTS.
En el caso de la versión 8800GS lleva 48 TMU , 12 ROPs, 96 SP, 192-bit de ancho de palabra en el bus de memoria.

G94: Variante del famoso G92, sacado al mercado a principio del 2008, bajo el nombre comercial de 9600GT, es igual a su primo G92 en caracteristicas técnicas con la salvedad de los recortes en SP, TMU, etc. En su interior lleva 64 SP, 32 TMU, 16 ROPs y todo esto conectado a la memoria mediante un bus de 256bit (64-bit x 4 canales).

GT200: Lanzado al mercado a mediados del año 2008 para luchar por el reinado del rendimiento contra ATi y sus HD4800. Actualmente tiene dos variantes denominados Geforce GTX260 y Geforce GTX280.
Este chip posee en su interior 1,4 Millones de transistores fabricado con tecnologia de 65nm. Al igual que sus primos, posee arquitectura con Stream Processors en lo que en esta versión se ve aumentada hasta los 240 unidades. Además posee 32 ROPS, 80 TMU y un BUS de memoria de 512-bit en conjunto de memoria GDDR3.


ATI gigabyte

EGA Wonder y VGA Wonder: Chips lanzados por primera vez por ATi en 1987. No disponogo de datos tecnicos de estos chips.

Mach8: Lanzado en el año 1991. Capaz de procesar gráficos independientemente de la CPU.

Mach32: Lanzado en el año 1992. Integra la controladora y la aceleradora gráfica en un único chip

Mach64: Lanzado en el año 1994. Tenia soporte de hardware para conversión del espacio de color YUV a RGB, y esto sirvió para proveer aceleración MPEG para el PC.

Rage: Lanzado en el año 1996 como primer chip grafico 3D de la compañia. En realidad era una fusion del chip Mach64 con funcionalidades 3D, entre ellas algunas OpenGL.

Rage II: Este fue el primero en soportar Z-Buffer por hardware, compresión de texturas, filtrado bilineal, trilineal y diversos modos de mezcla de texturas bajo Direct3D, y algunas funcionalidades OpenGL.

Nota: No dispongo de datos acerca de las caracteristicas tecnicas de los chip anteriormente mencionados, por lo que hasta que no lo encuentre no podre poner estos datos.

Rage 128: Lanzado en el año 1998. Este nuevo chip contaba con una configuracion de 2 texturas, 2 pixels pipeline ,2 Z-buffer en cada pipeline y contaba ademas con 2 TMU por pipeline ,2 unidades ROP y un canal de memoria de 128bit contanto con el tipo de memoria SDR. Capaz de tratar hasta 2 texturas por pasada con una precion de 32 bit. Fue tambien el primero de su familia en pasarse al puerto AGP. Era compatible por hardware con DirectX5 y compatibilidad total por hardware con OpenGL. Como nota el chip Rage128, en su epoca fué el primero en procesar texturas en 32bit con un rendimiento excelente, pero en modo 16bit el rendimiento caia en picado aunque tenia el mejor rendimiento en reproduccion DVD.

Rage128 PRO: Lanzado en el año 1999. Este nuevo chip era una revision del famoso Rage128 con la misma configuracion de hardware en cuanto a cantidad de pixel pipelines, z-buffer , TMU y ROPs. Como novedad traia soporte por hardware de DirectX 6, nuevos modos de filtros de textura como son el bilinear y trilinear, contaba ademas con el sistema de compresion de textura DXT1, el soporte de AGP4x y lo mas novedoso de la epoca era la compatibildiad de trabajar en paralelo con otra GPU. Este chip contaba ya con 8 Millones de trasistores.


Nota historica anecdotica: Rage Fuey Maxx: Fue la primera placa de video en montar 2 GPU en una sola placa gracias al soporte del Rage128PRO.

R100: Lanzado al mercado en el año 2000 bajo el nombre de Radeon. Este nuevo chip traia multitud de diversas novedades respecto a su antecesor, ademas de una nueva arquitectura lo que le inyectaba mas rendimiento. Su configuracion interna era 2 pixel pipelines, 3 TMU por pipe, 2 buffer-z y hasta 3 texturas por pasada. Tenia un canal de 128bit de memoria contando con los tipos de memoria tanto SDR como DDR. Tenia todos los filtros de la anterior generacion, asi como la capacidad de compresion de textura de la anterior generacion y como novedad añadieron la capacidad de compresion de textura S3TC de S3. Pero estas novedades no eran la verdadera baja de este chip, si no el famoso motor T&L , compatibilidad total con DirectX 7 que le permitian introducirse en el mercado del ocio asi como el profesional, gracias a su rendimiento a la hora del tratamiento de imagenes y video.

RV100: Este chip lanzado al mercado a mitad del año 2000 con el nombre de Radeon 7000, era exacto al R100 con el inconveniente de tener el bus memoria de solo 64bit en un canal con soporte para memoria SDR como DDR. Versiones del Radeon 7000 que salieron al mercado recortaban aun mas al chip dejandole solo 1 pixel pipeline.

R200: Chip lanzado al mercado en el año 2001 como evolucion del R100 con el nombre de Radeon 8500. Este chip traia numerosas novedades muy importates para la epoca como ser el primer chip de Ati en ser programable contando con un procesador Pixel Shader 1.4 y dos procesadores Vertex Shader 1.1 contando con compatibilidad total con DirectX 8.1. La configuracion Rasteriser se formaba por 8 pixel pipelines 4 texturas por pipe y 4 buffer - Z. Era capaz de tratar hasta 6 texturas por pasada, tenia capacidad para tratar filtros bilineal, trilineal y 16:1 Bilinear Anisotropic, asi como capacidad de comprimir texturas usando los metodos DXTC (1-5), S3TC y capacidad de procesamiento con precision FX16. Usaba dos canales de memoria de 64bit cada uno con un total de 128bit usando tipos de memoria DDR.
Algunas variantes de este chip fueron el RV250 (Radeon 9000) y el RV280 (Radeon 9200/9250). Los modelos Mobility Radeon de esta generación seguían el mismo patrón de nombrado.

Este chip dio muy buenos resultados a Ati en cuanto a nombre en el mundo de los video juegos desbancando al poderoso NV20(Geforce3) y al superdotado NV25(Geforce4 Ti) en cuanto a capacidades , y en el mundo profesional en cuanto a su calidad de video.

R300: Lanzado al mercado a mediados del año 2002 con el nombre comercial Radeon 9700, fué el chip grafico mas potente del mercado para uso personal que existia, además de ser de el primero en soportar las versiones de shaders 2.0 del mercado. Para ello cuenta con 8 procesadores Pixel Shader 2.0 , 4 procesadores Vertex Shader 2.0 , 1 TMU por pixel pipeline, 2 ROPs y capaz de procesar hasta 16 texturas por pasada. Cuenta con cuatro canales de memoria de 64bit cada uno, haciendo un total de 256bits logrando anchos de banda muy altos, usando tipos de memoria tanto DDR como DDRII. Dentro de la zona rasteriser, adema nos encontramos con que los procesadores fragmentados son capaces de realizar operaciones del tipo FP24 Vector + Parallel FP24l, Scalar per pipeline with pipelined Texture Address Processor, ademas de poder contar con filtros Bilinear, Trilinear, 16:1 Bi/Trilinear Anisotropic y con compresion de texturas DXTC (1-5), S3TC. Y con todo esto dentro del chip, le hacen falta hasta 107 millones de transistores para albergarlo todo.
Como nota curiosa del chip, este cuenta con soporte de multi-GPU de hasta de 256 chips. Imaginaos el volumen de tal cantidad de chips, y la potencia generada. ¿Alucinante verdad?

Los siguientes chips basados en el R300, son los famosos R350 y R360 los cuales son iguales pero con mejoras en el buffer Z, añadidos nuevas tecnologias 3D y diversas mejoras de rendimiento. El RV350, seria la gama baja de este chip contando con las mismas tecnologias, pero recortado en cuando a que llevaba 4 procesadores pixel shader, 4 procesadores vertex shader y bus de 128bit. Para el resto de configuraciones era igual. El chip RV360, se basaba en las mejoras del R360 pero igualmente recortado que el RV350.


R400: Lanzado al mercado a principios del año 2004, pero realmente fue el chip R420 bajo el nombre X800. Este chip era un chip avanzado basado en la arquitectura del chip R300 pero con mejoras y añadidos. El interior de este chip, estaba configurado por 16 pixel pipelines, 1 TMU por pixel pipeline, 16 procesadores pixel shader 2.0b, 6 procesadores vertex shader 2.0, 2 ROPs y capaz de procesar 16 texturas por pasada. Cuenta con 4 canales de memoria de 64bit cada uno haciendo un total de 256bit, siendo compatible con memorias del tipo DDR, GDDR2 y GDDR3. La configuracion rasteriser de los procesadores fragmentados se basa en 1 Full, 1 Mini ALU por pipe, cada ALU capaz de Vec3 / Scalar Co-issue y la precision de los mismos es de FP24. La capacidad de compresion de texturas usa las tecnologias DXTC (1-5) , S3TC y 3Dc. Para albergar todo esto se necesitan hasta 160 Millones de transistores y al igual que su primo R300 soporta multi-GPU hasta 256 chips. Si existiera esta tarjeta grafica...

R423: Era el mismisimo chip R420 pero para PCI-Exprees. Luego aparecio el chip R430 con las mismas caracteristicas, pero para versiones de gama alta, como el X850 asi como el chip R480.


R500: Realmente era el R520, lanzado al mercado a finales del año 2005 bajo el nombre comercial X1800. Es el primer chip de Ati en contar con tecnologia SM 3.0, y para ello cuenta con una nueva arquitectura pero aun asi, basada en la vieja R400. Este chip alberga en su interior 16 pixel pipelines, 16 procesadores Pixel Shader 3.0, 1 TMU por pipe, 8 procesadores Vertex Shader 3.0, 2 ROPs y procesa hasta 16 texturas por pasada. Cuenta con 8 canales de memoria de 32 bits cada uno, haciendo un total de 256bits. Cuenta con el novedoso filtro anisotrico de hasta 16 muestras, asi como es capaz de comprimir texturas usando las tecnologias DXTC, S3TC 1-5, 3Dc+ y Normal Compression. Cuenta con una precision de proceso FP32. Como el anterior chip R300, cuenta con soporte multi-GPU de hasta 256chips. Y para albergar todo esto, posee hasta 321 Millones de trasnsistores.
La version de este chip con proceso de fabricacion menor y con pequeñas mejoras es el chip R580 con la misma arquitectura. Las versiones recortadas de estos chips son los RV530, RV 535, RV 560 y RV570. Todos con recortes en el bus de memoria, numero de procesadores pixel shader y vertex shader, además de contar con reducciones en el proceso de fabricación.

R580: Presentado al publico a principios del 2006, bajo el nombre comercial de X1900 supuso una revolución en los chips graficos de Ati, pues reestructuraron toda la complejidad del chip eliminando el concepto de "pixel pipeline" y sustituyendolo por "Fragment Pipeline". Lo que viene a decir, es que el lugar de tener varias etapas en un pipeline, vamos a desacerlas y tener unidades de shader dedicadas. En este chip puede tener hasta 48 unidades de shader 3.0, o "Fragment Pipelines", 16 TMU´s, 16 ROP´s, 8 procesadores vertex shader 3.0, puede procesar hasta 16 texturas por padada procesadas con filtros Bilinear, Trilinear, de 2 a 16x Anisotropico y manejar texturas comprimidas con tecnologia DXTC/S3TC 1-5 y 3Dc+ Normal Compression. Sus "Fragment Processor" se componian de : 3x [1 MADD + 1 ADD ALU] por pipe, cada ALU con capacidad de Vec3 / Scalar Co-issue con precision FP32. Cuenta con un bus de memoria de 256bit compuesto de 8 canales de 32bit cada uno, contando con memoria del tipo GDDR1 hasta GDDR4. Como novedad en este chip, es capaz de trabajar con HDR y Anti-Aliasing a la vez, ademas de contar tecnologia AVIVO. Para alvergar todo esta tecnologia el chip necesita nada mas y nada menos que 384 millones de trasnsistores. Y al igual que sus predecesores, soporta tecnologia multi-GPU de hasta 256 chips.


R600: Lanzado al mercado este año 2007, es la joya de la corona de AMD/Ati bajo el nombre comercial Radeon HD 2900. Internamente este chip, tiene poco que ver con sus primos, pero no está muy lejos de la arquitectura del R580. Posee en su interior 320 Shaders Unificados 4.0, pero de la forma que Ati diseña sus chips. Es decir, esos 320 procesadores , trabajan de la misma forma que lo hacen los 48 procesadores de su antecesor el R580, pero además de procesar pixel shaders, valancean el trabajo tanto para procesar pixel shader 4.0 como vertex shader 4.0 novedad introducida en esta nueva generacion de VPU´s. Además cuenta con 16 TMU´s, 16 ROP´s, capaz de procesar hasta 16 texturas por pasada usando los mismos filtros que su antecesor R580. Cuenta con 8 canales de 64bit cada uno, haciendo un total de 512bit de ancho de banda. Soporta por hardware Directx 10, y OpenGL 2.1.
Para que este chip, pueda alvergar toda estas virgerias, necesita nada mas y nada menos que los impresionantes 720 Millones de trasnsistores.

RV670: Lanzado al mercado a finales del año 2007 como revision del chip R600 y mejora respecto a este bajo el nombre de HD 3800 series. Las novedades que incorpora son la actualizacion de la version DX a la 10.1 por hardware. Reduccion considerable de tamaño pasando de 80nm a 55nm reduciendo a su vez el consumo de forma considerada.

RV770:

S3 vpu

Savage3D: Lanzado al mercado en Mayo del 98, fue llamado por diversas webs el como el Voodoo killer por sus impresionantes caracteristicas tecnicas, compuestas por una arquitectura de 128bits de ciclo unico para 2D/3D, posee 1 pixel pipeline, no tenia TMU, buffer-z hasta 24bits, RAMDAC a 250Mhz, bus de memoria de 64bits de un canal usando memoria SDRAM ( 2MB, 4MB y 8MB ) y con compatibilidad todal para DirectX 6.0. En este modelo el chip no tenia soporte para compresion de texturas S3TC, pero si tenia AA y filtro anisotropico. Existio en versiones PCI y AGP.


Savage4: Lanzado al mercado en Otoño del 99, fue una revision dela arquitectura del Savage3D pero con mejoras ya añadidos. 1 pixel pipeline, 2 TMU, 1 unidad ROP,Z-Buffering de 32 bits , RAMDAC a 300Mhz, incorpora ya la tecnologia S3TC y LOD_Biasing , Soporte para render de 32 bits , Multitextura en una pasada, Bump Mapping, Anti aliasing, Filtrado anisotrópico. Era compatible totalmente con DirectX 6.0 y OpenGL, lo que le convertia en un chip ya mas interesante que su anterior version. Como su version Savage3D, contaban con capacidades 3D avanzadas de tratamiento de texturas, que no he puesto, asi como en todos los chips que menciono.


Savage2000: Lanzado al mercado a principios del año 2000, este chip seguia manteniendo la arquitectura del savage 3D, pero aumentando su fuerza bruta con 2 pixel pipelines, 2 unidades TMU, Z-Buffering de 32 bits, RAMDAC de 350Mhz, tecnologia Environment Mapping ,Dot3, asi como S3TC y DXTC, poseia ademas motor de T&L, era compatible con DirectX 6.1 y OpenGL, tenia un bus de memoria de 128bits usando memoria SDRAM con capacidades de hasta 32MB. Con todos estos detalles que lo hacian de un chip realmente imponente, en aquella epoca con la aparicion del NV10, R100, Avenger, etc este chip no triunfo y puso a la compañia en jaque. Segun un articulo de la epoca:

"Después del relativo fracaso de la S3 Savage 2000, S3 se toma un año "sabático" y se reestructura. Por un lado S3 pasa a llamarse SONICblue y la división de gráficos de S3 se concentrará en el desarrollo de chips gráficos integrados en las placas base, especialmente en colaboración con VIA; tal es el caso del futuro chipset con vídeo integrado VIA KM133 para micros AMD.
S3, por tanto, abandona momentáneamente la "arena" de batalla... pero puede que sólo momentáneamente, tal como afirma Paul Ayscough, vicepresidente de márketing de S3 "esperamos regresar en 12 ó 18 meses con algo fresco y sorprendente".
No obstante, S3 (en adelante SONICblue) no lo tendrá fácil para hacerse un hueco en la fabricación de chips gráficos integrados en las placas, después de los recientes anuncios al respecto de NVIDIA y ATI. Lo que está claro es que necesitará el apoyo incondicional de VIA, y por si acaso se diversificará hacia otros productos como reproductores de MP3, PDAs, dispositivos de comunicaciones."


DeltaChrome S4: Lanzado al mercado en julio del 2004. Fué el chip de entrada de S3 al mercado grafico. Este chip poseia 4 pixel pipelines, 1 unidad ROP por pipe, 1 unidad TMU por pipe, 4 procesadores pixel shader 2.0, 2 procesador vertex shader 2.0, procesa hasta 16 texturas por pasada, integra tecnologias de compresion S3TC y DXTC. Tiene un bus de memoria dividido en 2 canales de 64bits usando memoria del tipo DDR. Posee un RAMDAC dual a 400Mhz a 10bit y posibilida de salida TV/HDTV. Los filtros de textura que es capaz de manejar son Bilinear, Trilinear y de 1 a 16x en los filtros anisotropicos. Compatibilidad total con Directx 9.0. Y motor Chromotion-Engine 1.0.

DeltaChrome S8: Lanzado al mercado en invierno del 2003, de cara al mercado de gama alta. Este chip era igual a su compañero de batalla S4 pero con mas fuerza. 8 Pixel pipelines, 8 Procesadores Pixel Shader 2.0, 4 Procesadores Vertex Shader 2.0, 1 unidad TMU por pipeline, 1 unidad ROP por pipe, 16 texturas por pasada, tratamiento de texturas con filtros Bilinear, Trilinear, Anisotropico hasta 16x, compresion de texturas DXTC (1-5) y S3TC, precision de proceso FP16 y FP24 y un RAMDAC dual a 400Mhz a 10bit y posibilidad de salida TV/HDTV. Como bus de memoria posee canal unico de 128 bits usando memoria del tipo DDR. Compatibilidad total con DirectX 9.0 y motor Chromotion-Engine 1.0.

GammaChrome S14:Lanzado al mercado a principios del 2005 al igual que el S18 y S19. Este chip posee el nuevo motor de S3 Chromotion Engine 2.0 lo que le confiere efectos adicionales a los adjuntados por las librerias DirectX 9.0, lo cual serian compatible con DirectX 9.0+. Este procesador posee 4 pixel pipelines, 4 procesadores pixel shader 2.0+, 1 procesador vertex shader 2.0+ y todas las caracteristicas de sus hermanos S18 y S19 salvo que solo puede usar memoria DDR1.

GammaChrome S18: Este chip posee 4 pixel pipelines, 1 unidad ROP por pipe, 4 Procesadores pixel shader 2.0+, 4 procesadores Vertex Shader 2.0+, 16 texturas por pasada, 1 TMU por pipe, 2 canales de 64bit de memoria haciendo un total de 128bits para memoria de tipo DDR. Tratamiento de texturas con filtros, Bilinear, Fast Trilinear, Trilinear, 16X Anisotropic , compresion de textura DXTC (1-5) y S3TC. Precision de procesdado FP24. Chip nativo PCI-Express con Dual RAMDAC a 400Mhz y 10bit. Compatibilidad total con DirectX 9.0+ y motor Chromotion Engine 2.0.

GammaChrome S19: Lanzado al mercado a la vez que su hermana GammaChrome S18 situandose como la mayor de la familia gracias a sus 8 pixel pipelines, 8 Procesadores Pixel Shader 2.0+, 4 procesadores Vertex Shader 2.0+,

DeltaChrome S25: Gemela al chip Chrome S27 pero con menores frecuencias y memoria GDDR2.

DeltaChrome S27: Lanzada al mercado a principios del año 2005, este chip cuenta con 8 pixel pipelines y 4 procesadores vertex SM2.0 junto con un interfaz de memoria de 128-bit GDDR2/GDDR3 a una frecuencia de 700Mhz(1,4Ghz). Cuenta ademas con 4 TMUs y 4 ROPs.

Chrome 430 GT: Lanzado al mercado en el tercer trimestre del año 2008 para introducirse en el mercado de la gama baja empujando fuerte, gracias a su gran rendimiento y altas posibilidades de manejo en los distintos formatos de video, incluido el videoHD y blue-ray.

3dfx Guia sobre la gpu. Todo lo que querias saber

SST1: Lanzado al mercado en el año 1996 bajo el nombre de Voodoo Graphics. Fué la primera aceleradora 3D del mercado para uso domestico . Este chip contaba con 1 pixel pipeline, 1 TMU por pipe, una unidad ROP y era capaz de procesar hasta 1 textura por pasada. Tenia un bus de memoria de 64bits contanto con memoria del tipo EDO. Este chip era compatible por hardware con la version DirectX 3.0 y tenia hasta 1 Millon de transistores.

SST96: Lanzado al mercado en Febrero del año 1998 bajo el nombre de Voodoo2. Este chip era una evolucion del SST1 contando con 1 pixel pipeline, 2 TMU por pipe, una unidad ROP y capaz de procesar hasta 2 texturas por pasada. Tenia un bus de memoria de 192bit contando con memoria del tipo EDO. Era compatible por hardware con la version DirectX 3.0 y tenia hast 1 Millon de transistores. La novedad de este nuevo chip , o conjunto de chips que era en realidad, era la novedosa tecnologia SLI. Esta tecnologia permitia conectar 2 tarjetas voodoo2 en paralelo, inyectando asi el doble de potencia.

Banshee: Lanzado al mercado a mediados del año 98 bajo el nombre de Voodoo Banshee. Este chip era en realidad un SST96 pero con aceleracion 2D y con 1 TMU por pipe en lugar de 2 y un bus de 128bit en lugar de 192 como el voodoo2. Pero el bus de memoria usaba en lugar de memoria EDO, SDR lo que le daba cierta velocidad extra en el acceso de memoria, por lo que entre el chip SST96 y el Banshee en muchos casos apenas habia diferencias, en cambio en otros la diferencia se notaba mucho.

Avenger: Lanzado al mercado en Noviembre del año 98, con nombre comercial Voodoo3. Este nuevo chip de 3dfx, era una mezcla del Banshee y del SST96 con la misma configuracion que este, pero con un canal de memoria de 128bit. Este chip era AGP, pero habia versiones de este para PCI. Ademas contaba con nuevas tecnicas de filtrado como el bilineal tradicional y el nuevo trilinieal, solo que para texturas simples. Era compatible por hardware con la version DirectX 6.0, y como sus hermanos pequeños (SST1, SST96, Banshee) procesaban en color de 16bit. Salvo que este chip, procesaba realmente en color verdadero 32bit, solo que salia por pantalla a 16bit.


VSA-100: Lanzado al mercado a principios del año 2000, con diversos nombres comerciales segun la cantidad de estos chips usados y eran Voodoo4, Voodoo5 y Voodoo6. Este chip tenia diversas novedades respecto al avenger, y era que era capaz de procesar y ofrecer color verdadero 32bit. Tenia una configuracion de 2 Pixel Pipeplines, 2 TMU por pipe, 2 ROPs y procesaba 2 texturas por pasada. Tenia un canal de memoria de 128 bits usando memoria del tipo SDR. Era compatible por hadware con la version DirectX 6.0. Y era el primero en soportar FSSA a pantalla completa. Para albergar tal canitdad de tecnologia necesitaba hasta 14 Millones de transistores.

Chips no comercializados de 3dfx:

Rampage: Este chip nunca salio al mercado, y usaria el nombre de Spectre con diversos modelos 1000, 2000 y 3000. Seria el primer chip 3dfx en usar motor T&L , conllevando esto a tener un procesador pixel shader. Tendria una configuracion de 4 pixel pipelines, 1 TMU por pipe y 4 ROPs. Tendria un canal de 128bits usando memoria del tipo DDR. Ademas de los tipicos sistemas de filtrado bilineal y trilineal, poseeria el filtrado Anisotropico de 16 muestras. (16x) y FSSA a pantalla completa 2x y 4x.
Los modelos 2000 y 3000 tenian avances mas novedosos como tener 1 procesador vertex shader 1.0, y 1 procesador pixel shader 1.0 y la misma configuracion, salvo el modelo 3000 el cual poseia 2 canales de memoria de 128bit y una configuracion 4x2.

Matrox Mac

MGA MGA1064SG: Lanzado al mercado en el año 1996, bajo el nombre de MGA Millenium. Era un acelerador 2D de 64bit y con aceleracion 3D. Tenia un bus de 64bit de un canal, usando memoria del tipo SGRAM. Fué el primer chip en usar RAMDAC en su salida a 220Mhz con una resolucion maxima de 1600x1200. Era compatible con DirectX 5.0.

MGA1164SG: Lanzado en 1997 con el nombre Mystique, el cual fué el unico cambio que recibio este nuevo lanzamiento con respecto al chip anterior, pues eran practicamente iguales.

G100: Lanzado al mercado en ???? con nombre de Productiva.

G200: Lanzado al mercado en ???? bajo el nombre de Mystique G200 o Millennium G200. La diferencia estaba en que la Millenium G200 llevaba un RAMDAC mas rapido y memoria mas rapida, en contrapartida a la Mystique que segua con el RAMDAC mas lento y memoria mas lenta, pero con salida TV. El chip G200 fue el primero en soportar el puerto AGP completo, es decir contaba con la caracteristica DIME (Direct Memory Execute) lo que le permitia almacenar texturas en la memoria local del PC. Este chip era de 128 bit en dos buses internos para agilizar el trabajo. Era capaz de renderizar con una profundidad de color de 32-bit en lugar de los tipicos 16 bits. Tenia capacidad para filtrados trilinear mip-map y anti-aliasing y poseia un pixel pipeline y una unidad TMU.

G400 Toucan: Lanzado al mercado en el año 1999. Con todas las buenas cosas en 2D de sus antecesores y mejoras en cuanto a 3D. Contaba con un bus de memoria de 128bits en un canal usando memoria del tipo SDR o SGRAM. Contaba con 2 pixel pipelines, 2 texturas por pasada y 2 buffer-z. Capaz de utilizar filtro bilinear y con el famoso EMBM (Environment-Mapped Bump Mapping). Era compatible con DirectX 6.0.

Parhelia:

Trident nvidia

XGI ati

El chip puente de NVIDIA

La estrategia de NVIDIA, al menos para sus productos GeForce PCX, se basa en el nuevo chip puente reversible High-Speed Interconnect (HSI). El puente HSI es un interfaz AGP-a-PCI-E totalmente transparente a nivel software. Inicialmente se usará para conectar chips gráficos AGP a puertos PCI Express, pero también se puede emplear para conectar futuros chips PCI Express a interfaces AGP.

Las tarjetas GeForce PCX usan el chip HSI como puente entre el interfaz AGP del GPU y el slot PCI-E X16. Para aprovechar al máximo el ancho de banda disponible, NVIDIA aumentó la velocidad de reloj de la interfaz AGP en sus GPUs NV3x al doble, consiguiendo así un "AGP 16X". El chip HSI habla con el GPU a 4'2GB/seg de ancho de banda total, que puede ser usado para transferir datos en cualquier sentido. Como comentamos, PCI-E X16 puede transferir datos a 4GB/seg en cada sentido, y, por tanto, da 8GB/seg de ancho de banda total. Esto significa que el "AGP 16X" puede cubrir la mitad del ancho de banda del PCI-E X16; pero dado que la mayoría de las conversaciones de tipo gráfico son en un único sentido (del procesador hacia la tarjeta gráfica), esta solución debería funcionar razonablemente bien.

Según NVIDIA, los chips GeForce FX han sido diseñados con velocidades AGP superiores a 8X en mente, y las GPUs de todas las tarjetas GeForce PCX pueden trabajar al menos a "AGP12X". NVIDIA todavía está validando sus GPUs para su linea PCX, pero es muy probable que las tarjetas gráficas de gama alta, como la GeForce PCX 5950 empleen una GPU trabajando a "AGP 16X".

Aún a "AGP 12X", las tarjetas GeForce PCX ofrecerían unos 3'1GB/seg de ancho de banda. Sin embargo, NVIDIA se apresura a indicar que el ancho de banda efectivo de PCI Express es mucho más importante que los máximos de pico teóricos. Ellos ofrecen la siguiente ecuación para describir el ancho de banda efectivo:

ancho efectivo =ancho total * (tamaño /(tamaño + sobrecarga de cabeceras)) * eficiencia.

Los chips gráficos admiten un tamaño de 64 bytes y tienen 20 bytes de sobrecarga por cabeceras, lo que supone 3GB/seg de ancho de banda efectivo, si suponemos una eficiencia del 100%. Según NVIDIA, los chips gráficos de ATI sólo admiten tamaños de 32 bytes, lo que reduce el ancho de banda efectivo a 2'5GB/seg (menos que el AGP 12X. Tech Report preguntó a ATI acerca de dichas transferencias de 32 bytes y la ecuación de ancho de banda efectivo de NVIDIA, pero aún no han respondido).

Fuente: Agilisa.es

El chip puente de ATI

El chip puente de ATI, con nombre Rialto tiene las mismas funciones que el chip HSI, que se basa en convertir las señales PCI-Exprees del chip grafico en señales interpretables por el chip controlador del puerto AGP.




SideBand Addressing: técnica para aumentar el ancho de banda en las transferencias por el bus AGP. A grosso modo, consiste en añadir una ruta alternativa entre el porcesador de la gráfica y la memoria RAM, a parte del bus principal (AGP). Para qué? pues pq mientras envía peticiones y comandos a través del Sideband bus (bus lateral digamos).. Puede seguir reciviedo datos por el AGP.. Si esta opción no estuviese activada, tendría q enviar peticiones y comandos, y recivir datos a través del AGP, pero no peude hacerlo de forma simultanea. Asi q toca parar el flujo de datos q entran para hacer nuevas peticiones. Y se pierde eficiencia.

El SideBand Adressing, se lleva a cabo separando (demultiplexando) el bus de direcciones del bus de datos. Para ello se añaden 8 líneas laterales (sideband lines) extra. Q conforman un interface de 8 bits a través de los cuales la gráfica realiza nuevas peticiones y comandos sin detener el flujo de datos entrante por el bus principal.

Dos consideraciones, esta técnica aumenta el rendimiento del sistema gráfico (o al menos en teoría, debería hacerlo). Pero a su vez el bus lateral es mucho más sensible a aumentos en la velocidad. asiq ¡¡atentos a la estabilidad overclockers!! (si al subir el FSB sin tener bloqueada la frecuencia AGP sufrís inestbilidad quizás os toque desactivar esta opción).

Para activarlo se debe ir a la configuración de BIOS de la placa base (seguramente en el apartado advanced chipset features, ya q afectan al controlador de memoria y al bus AGP q se encuentran en el puente norte).
Otro modo de activarlo es desde la pestaña nVstrap del programa Rivatuner.

Según varios usuarios, esta técnica apenas aporta rendimiento extra real siendo otra tecnologia más en las placas base AGP para mejorar el rendimiento, sin llegar a buen puerto. Similar a la apertura AGP, apenas usada en la realidad.


COMENTA



tarjetas


3 comentarios - Guia sobre la gpu. Todo lo que querias saber

@farruggia
a favoritos cuando este con mas tiempo lo leo jeje
@MariusSinclair
Muy completo post. Necesitaba esta info, pero ¿podrías poner la fuente?