Chips de Vídeo 3D

Este artigo visa fornecer uma comparação entre as características principais de diversos chips de vídeo com recursos 3D disponíveis atualmente.

Não incluirei aqui os chips antigos de placas 3D (como o 3dfx Voodoo Graphics, o NVIDIA RIVA 128/128ZX, o Rendition Verité, o Intel i740, entre outros). Começarei com os chips que fizeram sucesso até o começo desse ano, e serão apresentadas características que diferenciam os chips dos concorrentes assim como suas limitações.

 

A Geração Anterior

 

3dfx Voodoo 2: O primeiro chip a oferecer o recurso de dupla texturização em um único ciclo de clock (por meio de dois TMU's - Texture Management Units), o Voodoo 2 reinou por muito tempo sozinho na área 3D. Disponível na forma de placas "add-on" PCI, requisitam uma placa 2D separada para o computador funcionar. O forte desse chip sempre foi a performance, ainda mais com a possibilidade de serem utilizadas duas placas para o processamento 3D (método chamado de SLI - "ScanLine Interleave", onde uma placa processa as linhas pares enquanto a outra trata das ímpares). Por ser da 3dfx, é compatível com a API GLIDE, ainda utilizada em alguns jogos, mas em cada vez menor escala. Não possui, ainda, um driver OpenGL completo, apenas "mini GL's" que contém "subsets" da API OpenGL para conseguir rodar alguns jogos (como Quake 2). Com limitação no tamanho das texturas em 256x256, e suporte apenas a 16 bits de cores, a qualidade da imagem deixa a desejar quando comparada a outros chips. Outra desvantagem é a limitação de memória, que é limitada à memória local (o Voodoo 2 não permite acessar a memória do sistema), e só permite 4 MB de framebuffer (limitando a resolução em 800x600 com uma única placa, 1024x768 com duas), e 4 ou 8 MB para texturas (para placas de 8 e 12 MB de memória, respectivamente).

3DLabs Permedia 2: Conhecida pelos seus poderosos aceleradores gráficos para trabalhos profissionais, o Permedia 2 é um chip da 3DLabs voltado para o mercado mais doméstico. É o único chip aqui apresentado a ter um "geometry engine", poupando a CPU de cálculos de polígonos ao criar uma cena em 3D. No entanto, enquanto o desempenho para aplicações profissionais é excelente (melhor que o de um RIVA TNT), para jogos o chip não atende muito às expectativas, devido à baixa "fill rate".

Matrox MGA-G200: O primeiro chip da Matrox a apresentar características 3D exigidas pelos programas mais modernos, apresenta como ponto alto a ótima qualidade de imagem. Apresenta uma nova tecnologia de acesso à memória da placa, batizada de "Dual-Bus", onde é possível ao mesmo tempo gravar e ler dados da memória, esse processo acelera principalmente jogos baseados no DirectX 5. Apesar de tudo que foi dito, o desempenho 3D da placa ficava bastante aquém do da Voodoo 2, e outro fator que contribuiu para o "fracasso" da placa foi o grande atraso do OpenGL ICD da Matrox (que só saiu há algumas semanas, quase um ano após o lançamento do chip). No entanto, ainda hoje é um dos que apresentam o melhor 2D.

NVIDIA RIVA TNT: Esse chip foi muito esperado devida às declarações da NVIDIA de que seria um "Voodoo killer", fornecendo desempenho muito acima do que era conseguido por outros chips na época. Não foi o que aconteceu, mas certamente o TNT é o melhor e mais flexível chip da segunda geração. Combinando um desempenho semelhante ao da Voodoo 2 com a qualidade de imagem semelhante à do G200, com a melhor implementação da interface AGP e drivers para Direct3D e OpenGL, o chip tem todas as características necessárias para um ótimo acelerador 3D. Foi o primeiro chip a apresentar anisotrophic filtering, mais eficiente do que o método utilizado por outras placas (bilinear e trilinear filtering).

S3 Savage 3D: Depois de muito tempo em cima do trono de melhores chips de vídeo para o mercado doméstico, a S3 parece ter parado com o desenvolvimento. O Savage foi o primeiro de uma nova geração de chips da S3, visando o mais novo mercado de jogos 3D. O desempenho do chip ficava entre o G200 e o TNT, mas seu sucesso foi limitado devido às grandes dificuldades enfrentadas com os drivers desenvolvidos. É o único chip da segunda geração a apresentar a técnica de compressão de texturas S3TC (desenvolvida junto com a Microsoft e presente no DirectX 6), que permite que uma textura possa ocupar até 1/6 do espaço que normalmente ocupa, com nenhuma ou pouca perda de qualidade. Essa característica permite que texturas cada vez maiores e mais detalhadas possam ser transmitidas pela interface AGP, sem saturá-la. Ainda não há suporte muito grande à S3TC, pois isso exige que hajam dois conjuntos de texturas (as comprimidas e a não, para as placas não compatíves com S3TC), o que significa mais trabalho por parte dos artistas que trabalham no desenvolvimento de jogos, e mais espaço ocupado no CD. Os problemas com drivers foram solucionados com o lançamento da placa Beast Supercharged, da Hercules, que inclusive apresentava velocidade maior, mas o chip acabou não emplacando de forma definitiva no mercado.

3dfx Voodoo Banshee: Com o fracasso do chip Voodoo Rush, o Banshee é o primeiro chip da 3dfx a entrar seriamente no mercado de chips 2D e 3D. Chamado de um "Voodoo 2 castrado", o Banshee nada mais é do que um chip Voodoo 2 com uma TMU a menos, e velocidade um pouco maior (100 MHZ, contra 90 MHz do Voodoo 2). Apesar de funcionar também em interface AGP, o chip não possui suporte a texturização via interface AGP, não podendo assim utilizar a memória do sistema para armazenar texturas. Possui as mesmas limitações do Voodoo 2, com exceção da memória. A performance é comparável à do Savage 3D, um pouco inferior a um Voodoo 2. Houveram algumas melhoras na qualidade de imagem também. Só é possível aumentar a resolução (3D) até 1024x768.

ATI Rage 128: Com os chips anteriores da ATI apresentando desempenho fraco em Direct3D e sem OpenGL ICD, a ATI devia aos seus consumidores um chip à altura dos mais atuais. O Rage 128 veio cobrir esse anseio, trazendo performance semelhante ao RIVA TNT. O maior trunfo do Rage 128 é ter uma otimização na utilização da memória, que permite que haja muito pouca perda quando são utilizados 32 bits de cores, comparando com 16 bits. Mas os problemas enfrentados pela ATI no desenvolvimento de drivers atrasaram o lançamento da placa, fazendo com que saísse muito próxima dos lançamentos da terceira geração de chips das outras empresas. Um problema nos drivers OpenGL praticamente inutilizava a interface AGP em jogos, problema resolvido nos drivers mais atuais. As placas mais novas apresentam uma versão mais rápida do Rage 128, mas que ainda não chega ao desempenho dos chips da terceira geração. Tem suporte a até 32 MB de memória local. Junto com o TNT e o Voodoo 2, esses são os únicos chips a suportarem dupla texturização num mesmo ciclo de clock entre chips dessa geração. Ao contrário dos outros chips (exceção dos Voodoos) que suportam texturas de até 2048x2048 pixels, o tamanho máximo aceito pelo Rage 128 é 1024x1024.

Number Nine Ticket-to-Ride IV: Chip que equipa as placas Revolution IV da própria #9, o T2R4 não apresenta um desempenho 3D muito bom: é comparável a um G200. No entanto, possui a melhor qualidade de imagem em 2D, essencial para profissionais que trabalham com resoluções muito altas, além de suporte a até 32 MB de memória local e saída de vídeo digital (para, por exemplo, monitores LCD mais modernos).

 

A Nova Geração

 

3dfx Voodoo 3: Disponível em 3 versões até agora (2000, 3000 e 3500), que são diferenciadas apenas na velocidade, o mais correto seria chamar esse chip de "Banshee 2" ou "SLI on-a-chip". É um chip 2D e 3D que possui as mesmas limitações do Banshee, mas uma performance muito superior devido à maior velocidade de operação, além de uma segunda TMU para acelerar o processo de texturização. Possui boas chances de overclock, principalmente as versões 2000 e 3000. Com a compra da STB, a 3dfx passa a fabricar suas próprias placas agora, assim como já faziam Matrox e ATI, entre outras. Apesar de processar internamente os dados com precisão de 32 bits (aumentando assim um pouco a qualidade da imagem em comparação com as Voodoos anteriores), e utilizar (segundo a 3dfx) algoritmos melhores para a conversão, tendo um resultado final supostamente comparável a "uma imagem de 22 bits", ainda só permite o uso de 16 bits de cores. A 3dfx lançou um OpenGL ICD completo para a linha Voodoo 3, mas que ainda tem performance bastante limitada.

NVIDIA Vanta, RIVA TNT2 e RIVA TNT2 Ultra: Família de chips sucessores do RIVA TNT, são nada mais do que um TNT com velocidade maior, além de algumas otimizações na unidade de texturização e no acesso à memória. Herdam do TNT a ótima qualidade de imagem e a ótima interface AGP. Com velocidades de (núcleo/memória) 100/110 (Vanta), 125/150 (TNT2) e 150/175 (TNT2 Ultra), a performance está entre as melhores entre placas semelhantes. Há grandes possibilidades de overclock; há casos de conseguiram que uma Hercules Dynamite TNT2 rodasse a 190/190, e uma Dynamite TNT2 Ultra chegasse a incríveis 200/250.

S3 Savage 4: Nova geração da série Savage, esse chip, além de maior velocidade em relação ao Savage 3D, apresenta suporte a dupla texturização no mesmo ciclo de clock, e memória local de até 32 MB. Disponível nas versões normal (rodando a 125 MHz) e Pro (143 MHz), apresenta, além da ótima qualidade de imagem e suporte a S3TC, desempenho pouco superior a um RIVA TNT ou Voodoo 2. Uma nova versão do Savage 4 está equipando as novas placas da Diamond, rodando com velocidade de 166 MHz.

Matrox G400: O novo chip da Matrox é o que mais apresenta novidades. Primeiramente, ele marca uma nova estratégia da Matrox, extinguindo a série "Mystique", e diferenciando seus produtos pela velocidade da placa, todas com a grife "Millenium" a partir de agora. Quanto às novas características, além de suporte a 32 MB de memória local e "multi-texturing", temos o Dual-Head, que permite que dois monitores (ou conjunto de monitor e TV, etc) sejam usados com uma única placa, além do Environment Mapped Bump Mapping, característica do DirectX 6 que aumenta muito a qualidade com que texturas são apresentadas, podendo ser aplicada uma nova textura por cima para termos o efeito de "bump" (imperfeições nas texturas, por exemplo a sensação de "relevo" ao olhar uma parede de perto). Essa caracteríctica acompanha de uma perda de performance, mas que não prejudica a jogabilidade nos jogos atuais que a suportam (como o Expendable, que acompanha a placa), e podendo também ser desabilitada se desejado, voltando ao método "emboss" normalmente usado (e que utiliza a CPU do sistema para ser aplicado). A Matrox vem trabalhando fortemente no seu OpenGL ICD, e os resultados são bastante visíveis: com os últimos drivers, uma G400 normal (rodando a 125 MHz) possui performance (tanto em OpenGL como em Direct3D) comparável a uma TNT2 Ultra rodando a 150 MHz. Há relatos de pessoas conseguindo "overclockar" a G400 normal para velocidades próximas da G400 MAX.

3DLabs Permedia 3 Create!: O sucessor do Permedia 2 vem com um rol de novas características, prometendo muito: Dot3 Mapping (método de bump-mapping que utiliza "emboss", mas acelerado por hardware), Environment Mapped Bump Mapping por software, Virtual Textures (método de reorganização de texturas para otimizar o desempenho), suporte a S3TC, entre outros, além, claro, dos requeridos 32 MB de memória local (não suportados apenas pelo Voodoo 3 na geração atual) e multi-texturing. No entanto, apesar de características interessantes, o desempenho que supera em pouco a geração anterior de chips (e portanto bem inferior aos mais atuais) e o alto preço sugerido atualmente tornam a placa uma opção não muito interessante.

PowerVR Neon 250: A nova placa da VideoLogic apresenta uma nova maneira de ver como é feita a renderização: ao invés de processar todo o quadro e depois verificar que partes estão sobrepostas à outras, essa verificação é feita antes, e só o necessário (o que vai efetivamente aparecer na tela) é processado pelo chip, sendo a renderização feita pixel a pixel. O resultado é uma placa que, com um chip rodando a 125 MHz, consegue desempenho bem superior a placas com outros chips rodando na mesma velocidade. Soma-se a isso Dot3 Mapping, além de full-scene anti-aliasing (característica que melhora, em muito, a qualidade da imagem, mas mata o desempenho). No entando, a dificuldade em encontrá-la, o alto preço sugerido e a inexistência de um OpenGL ICD completo (existe apenas um miniGL otimizado para Quake 3) não a tornam uma solução interessante, principalmente levando em conta o atraso com que foi lançada.

 

A novidade: Tranformations & Lighting

 

NVIDIA GeForce 256: A NVIDIA lançou oficialmente seu novo chip na última semana, apesar de nenhuma placa ainda estar sendo vendida com ele. O 256 no nome vem da capacidade do chip em processar quatro pixels simultaneamente, sendo 1 pixel: 32 bits de cores (RGBA), 24 de Z-Buffer e 8 de stencil buffer, somando 64 bits por pixel. Foi adicionado suporte também a S3TC. O chip promete revolucionar os jogos 3D, fazendo todos os cálculos geométricos e de fontes de iluminação (até 8) via hardware, livrando a CPU desse trabalho. O que pode vir disso é performance melhor que qualquer chip gráfico de hoje em processadores mais modestos como Pentium II 300 ou K6-2 300. Aliando isso a 4 unidades de texturização além de outros efeitos (como o "Cube Environment Mapping") e capacidade de processar até 15 milhões de triângulos por segundo, o chip promete. Mas o preço, assim como a performance, também irá aumentar...

S3 Savage 2000 (GX4): Com o novo chip a S3 promete entrar de vez na luta pelo chip mais rápido. Aumentanto a largura de banda para a memória para 128 bits (até o Savage 4 era de apenas 64 bits, uma das causas de o chip não ser tão rápido), além de Transforms & Lighting por hardware (como o GeForce 256), é esperar para ver o que o novo Savage vai trazer. Testes preliminares mostram que apesar de ter uma maior "fill rate", os drivers ainda não estão maduros, o que faz com que ela tenha desempenho bastante mediano, e muitas vezes pior que chips mais antigos como o G400 e o TNT2.

 

O que vem por aí

 

3dfx VSA-100: A 3dfx já anunciou o novo chip que vai equipar sua nova geração de placas, que irá se chamar (pra variar) Voodoo 4 e Voodoo 5. Pra quem esperaca muito, o anúncio inicial soou um pouco decepcionante, já que a "fill rate" anunciada é menos do que chips que atualmente já são vendidos, além da ausência de T&L. A 3dfx trabalhou numa arquitetura bastante escalável, onde diversos chips podem ser postos para trabalhar em paralelo em um processo semelhante ao SLI utilizado pelo Voodoo 2. Dessa maneira, ao utilizar mais de um chip na mesma placa (série Voodoo 5), será possível explorar os recursos do accumulation buffer (ou como a 3dfx chama, "T-Buffer"), como anti-aliasing e motion blur. A impressão que fica é que a 3dfx está lançando esse chip meio atrasada, e que a concorrência na data do lançamento prevista vai ter chips já bem superiores. Mas esperamos ser surpreendidos, e que algo realmento novo e bom saia da 3dfx.

Bitboys Oy Glaze 3D: O Glaze 3D já virou lenda no mundo 3D. Prometido por muito tempo, os Bitboys parecem dar sinais de que finalmente vão produzir o chip. A empresa finlandesa nunca produziu chips, apenas fez projetos (uma de suas criações é o "Environment Mapped Bump Mapping", adotado pela Microsoft no DirectX 6 e usado pela Matrox na sua linha G400). Decidiram que vão fabricar esse chip, e prometem o lançamento para o começo do ano 2000. Características principais são as quatro unidades de texturização (a 125 MHz), com capacidade para SLI, além de um accumularion buffer. É esperar para ver.

 

T&L x Fill Rate

 

O novo chip da NVIDIA, assim como declarações da 3dfx sobre o seu futuro processador gráfico, levantaram uma interessante questão: o que é mais importante, aceleração geométrica ("Transforms & Lighting"), ou fill rate? A discussão é longa, e vários pontos devem ser analisados.

O primeiro ponto é o mais visível: é fácil notar que a imensa maioria dos jogos atualmente são feitos para obterem maiores benefícios de placas que oferecem alta fill rate, já que o consumidor de jogos não dispunha, até agora, de uma solução barata que contivesse T&L via hardware. Da mesma forma, uma grande fill rate pode trazer outros benefícios como "full scene anti-aliasing", como demonstrado pelo T-Buffer da 3dfx. Mas já começam a aparecer jogos (como o Quake 3: Arena) que podem ser bastante beneficiados pela presença de um processador geométrico dedicado. O que nos leva à segunda questão...

Existem diferentes tipos de jogos. E diferentes tipos de jogos têm diferentes características. Enquanto um "First Person Shooter" como Quake 2 ou Quake 3 tende a ter uma grande quantidade de polígonos (cenários complexos, vários personagens na tela, etc), podendo obter vantagens com o T&L (não é o caso do Quake 2, por exemplo, por não ter sido desenvolvido com o objetivo de ter alta taxa de polígonos por motivos citados acima), outros jogos como simuladores de vôo por exemplo vão ser beneficiados muito mais por uma placa com alta fill rate, devido à grande quantidade de texturas utilizadas para desenhar as paisagens. O mesmo raciocínio pode ser aplicado a outros tipos de jogos: simuladores esportivos tendem a ter maior quantidade de polígonos (portanto, podem ser mais beneficiados pelo T&L), enquanto "adventures" e simuladores de corrida tendem a ter muitas texturas em jogo.

Por último devem ser analisadas as maneiras com que as tecnologias estão aplicadas atualmente. Trabalhando com OpenGL não há problema algum: por ser uma API usada por profissionais, há muito tempo ela tem suporte a T&L, portanto se sua placa tem T&L os seus jogos OpenGL automaticamente irão utilizar esses recursos. O resultado pode ser notado em alguns benchmarks do Quake 3 com placas GeForce 256, em que ela se sai bem melhor que placas da geração atual (TNT2, Voodoo 3) - mas não "estupidamente" melhor, já que a GeForce 256 atualmente está rodando com um "modesto" clock de 120 MHz, e anda tendo alguns problemas de aquecimento...

O problema maior nesse sentido é representado pelo Direct3D. A API da Microsoft somente na sua última encarnação (7.0, recém lançada) oferece suporte a T&L via hardware. Por esse motivo, são modestos os ganhos de performance em jogos D3D atualmente usando uma placa com T&L (no caso da GeForce, os ganhos podem ser atribuídos às quatro unidades de texturização, contra duas das placas atuais). Além disso, o modo como T&L está aplicado dentro do D3D não é dos melhores: o jogo tem que ser especificamente escrito para utilizar aceleração de T&L por hardware, ao contrário do OpenGL onde isso é transparente para o programador. Isso pode levar desenvolvedores a evitarem o uso dessa tecnologia no Direct3D, já que são poucos os chips que a suportam (atualmente apenas o GeForce 256, alem do anúncio do Savage 2000 da S3).

Há também alguns jogos que usam seu próprio "engine" para T&L (alguns só transformations), como por exemplo o "Unreal Tournament" que ainda irá ser lançado. Dependendo de como essa implementação for feita, a capacidade de acelerar T&L oferecida pela OpenGL pode ser inutilizada por esses jogos.

Deve-se lembrar que o suporte a AGP 4x (ou, no mínimo, 2x) e memórias locais de alta velocidade são essenciais para que uma placa com T&L possa mostrar todo o seu pontencial, já que o tráfego entre a CPU do sistema e o chip gráfico deve aumentar muito com a presença dos dados para os cálculos geométricos. Um dos problemas das primeiras placas com o GeForce 256 a serem lançadas é exatamente a velocidade das memórias, que acaba limitando o desempenho do chip. A utilização de memórias DDR-RAM (Double Data Rate RAM, memórias que utilizam tanto a borda de subida como a de descida do sinal de clock) poderá melhorar esse quadro - com o respectivo aumento de preços. Essas memórias possibilitarão que todos os 256 bits que podem ser processados simultaneamente pelo GeForce o sejam no mesmo ciclo de clock, já que a interface com a memória do chip continua sendo de 128 bits.

O que se pode notar é que é preciso ainda esperar um pouco para ver se T&L por hardware vai realmente trazer benefícios a curto prazo para os jogos. É uma tendência para o futuro, com certeza, mas comprar agora pensando no futuro é sempre algo muito perigoso no mundo de hardware 3D, que evolui muito rapidamente.

 

Benchmarks!

 

Infelizmente não temos aqui equipamentos para fazer testes, mas abaixo estão alguns links para páginas onde o desempenho das placas e chips acima podem ser verificados e comparados:

Marcelo Vanzin



Hard&Cia - 2001
Dúvidas, sugestões e críticas gerais? Hard&Cia Mail