|
La GeForce 3 y el NV20 Desmitificados!!
Viernes, Marzo 02, 2001
La arquitectura de memoria Lightspeed.
La tasa a la cual los pixels pueden ser formados dentro de la GeForce 3 representa un problema real cuando se compara con el ancho de banda de memoria disponible en estos días. De hecho, las tarjetas gráficas de hoy ya sufren notablemente los efectos de los cuellos de botella del ancho de banda de memoria. Entonces, la única opción era usar memoria de mayor velocidad con su costo mayor asociado o hacer un mejor uso de la memoria disponible actualmente. Obviamente, Nvidia se lanzó con una alternativa viable respecto a la situación corriente, creando la arquitectura de memoria Lightspeed.
La LMA (Lightspeed Memory Architecture) es un conjunto de funciones de memoria que incluye el controlador de memoria Crossbar, compresión de archivos 4:1, y Early Z Culling. Estas herramientas se hicieron para permitir que Nvidia optimizara la velocidad con la cual los datos pueden ser transferidos entre la GPU, y el subsistema de memoria de la tarjeta gráfica.
El controlador de memoria Crossbar.
Dentro del reino de las supercomputadoras, esta tecnología ha sido implementada para permitir que los datos sean partidos en trozos más pequeños antes de viajar por el cable. Normalmente, estos datos son enviados en paquetes de 256-bits, aún si la cantidad real de espacio de bus requerido pueda ser considerablemente menor. Esto resulta en una entendible caída en el rendimiento en los casos en que solo 64-bits se necesitan para actualmente transferir los datos en cuestión.
Exactamente esta situación la que el "Memory Crossbar Controller" alivia, dividiendo en paquetes de 64-bits todos los datos transferidos. Como resultado, desde que cada petición de lectura o escritura puede ser manejada independientemente una de otra, una ganancia mayor de rendimiento se puede obtener que cuando se manejan los datos con el ancho de 256-bit.
Si la situación lo demanda, los cuatro canales de 64-bits pueden ser recombinados nuevamente en un paquete de 256-bits. De acuerdo a Nvidia, sin embargo, 64-bits es suficiente en el 75% de los casos.
Compresión 4:1.
Los datos circulando desde o hacia la memoria pueden fácilmente ser comprimidos sin pérdida ni deterioro. Efectivamente, tal compresión - que directamente afecta el Z-buffer - se hace sin pérdidas visibles de datos, siendo transparente para el usuario.
Como todos sabemos, el Z-buffer esta en constante demanda por la memoria del sistema, y por lo tanto, comprimiendo los datos, es posible reducir el tráfico a lo largo del bus.
Early Z Culling.
Típicamente, los objetos destinados a una escena se traen de atrás para adelante. Cuando se ven, sin embargo, los objetos de más atrás muy a menudo son ocultados por los objetos del frente.
Este simple hecho inspiró a Nvidia a desarrollar una pequeña tecnología que llamaron "Early Z Culling", la cual, fundamentalmente, es un algoritmo pensado para detectar con anticipación que objetos serán realmente visibles cuando se dibujen, y cuales estarán ocultos en la pantalla. Haciendo esto, se vuelve posible evitar malgastar tiempo de proceso en éstos últimos.
Este truco permite ahorrar una buena cantidad de tiempo que de otra manera se perdería haciendo llamadas al Z-buffer, a la memoria, y procesando objetos que no se podrán ver.
Siguiente: Antialiasing de alta resolución.
|