グラフィックボードの歴史を振り返る 

  1999年〜2004年  1999年後半からGeForceが市場へ出回りtotal約5年でこれだけ進化したことになるんですね〜

  CPUの歴史を振り返るはこちら  マザーボードの歴史を振り返るはこちら  CPU冷却の歴史を振り返るはこちら

 VoodooがでてPCGameもMotoRacer
 が火付け役となりこのGameほしさに
 このVoodooを購入した人も多いことでしょう
 PCGameはここから始まったと言っても過言
 ではありません
 Voodoo2が開発されて、さらにPCGameが
 白熱してきました
 QUAKE2はもっとも有名がGameで特にこの
 ころからGameFPSを重視するように、なって
 きました

 Voodoo2をSLIとして2枚で奇数偶数の走査を
 をうけもちFPSの高速化する画期的な方法で
 QUAKE2のFPSをあげることに成功しました
 3dfx社の全盛時到来でした

 PCGameもunrealやHarfLifeと次々だされてそれを
 如何に駒落ちしないでみれるPC環境は非常に重要でした

解像度 16bit Celeron463A P2 525 P3 600 P3 620 P3 672
640*480 127 FPS  133.5 FPS 150.4 FPS 155.5 FPS 160.5 FPS
800*600 124 FPS 127.2 FPS 132.5 FPS 122.2 FPS 122.2 FPS
1024*768 95 FPS  94.00 FPS 89.60 FPS 89.80 FPS 84.50 FPS 

 しかしQUAKE2のtimedemo1の計測では、Voodoo2のSLIでも800*600解像度
 からのFPSがCPUクロックがUPしても上昇していません
 これが当時の技術の限界でした

 Voodoo3においては3dfx社がここから低迷することになります
 理由はVoodoo2のSLIと比べて大きな変化がなかったことです
 発熱も大きく非常に扱いにくかった事を覚えてます

 画質性能は維持されていたのですが。。。

 P3 600MHZ で UNREALの FPSを測定
 toimedemo 1 demomap demo1.dm2 にて測定
                  

画面解像度       Voodoo3 3000 170MHZ   TNT2 ultra 200MHZ コア160MHZ      
640*480 − 
800*600
1024*768 47.2258 FPS  49.020351 FPS

 Voodoo3に勝った瞬間ですね
 メモリー32M搭載
 ドライバーもGPU温度に対して余裕もあり、(これは非常に重要であった)
 安定度も良く、TNT系はここから急激に伸びることになります

 GeForce2の到来です

 私はここからGeForce系へ移行する事となります
 今まで問題であった1024*768解像度のFPSをあげることは
 至難の業であったのですが、このグラフィックであっという間に
 FPSのUPを実現してしまいました

 Voodoo系はここで影を潜める事になります
 GForce2-proでコアクロックとメモリークロックがUP合戦の
 第1次合戦が始まります

 このころになるとレースゲームでCMRをはじめとして
 レースゲームが大人気の的になります

 GForce2-GTSでコアクロックとメモリークロックがUP合戦の
 第2次合戦が始まります

 次々にレースゲームが出されてどのFPS確保にグラフィックも
 大苦戦を強いられる時期です

解像度 16bit P3 672-1 P3 750-2 P3 846.7-3
640*480 166.7 FPS  185.8 FPS 209.2 FPS
800*600 164.2 FPS 177.5 FPS 191.9 FPS
1024*768 138.2 FPS  133.0 FPS 134.4 FPS

 このグラフィックボードで800*600解像度がCPUクロックに応じて
 UPするようになりました


 GForce2-ultraでコアクロックとメモリークロックがUP合戦の
 第3次合戦が始まります

 次々出されたどのGameもほぼ満足出来る性能を発揮する
 用になりました

 このころから次第にPCGameの人気が低迷しはじめます
 がしかしWindowsXPの影響もあり、さらに大性能の
 グラフィックボードの開発が進められることになります

 このあたりではQUAKE2では測定にならず、
 QUAKE3が基準となりました

解像度 16bit P3 1070mhz P3 1000mhz
640*480 134.5 FPS 
800*600 134.4 FPS 126.3 FPS
1024*768 131.8 FPS 
1280*1024 120.0 FPS
1600*1200  95.0 FPS  94.1 FPS

 1280*1024解像度までほぼ640*480のFPSと同等まで性能を上げてきました

 GForce3でコアクロックとメモリークロックとともに
 FSAAの期待が高まります

 第4次合戦が始まり3DMark2001のベンチ合戦が
 活発になります
 RADION8500の発売で、コスト戦争に入り、ベンチ的にはHigh Polygon Count が
 表示に高い数値で推移して、高スコアをたたき出しました
 一部MBとの互換性もありますが、低コスト高性能という時代に乗り出しました

 2002現在手作りPCの通販でのハイスペックマシンの定番ですね

 AMDとの互換性に多少難があり、私のKT133マシンで使用可でしたがKT266では
 だめでした(いずれもAopen製)
 GForce3-TiでGPUの製造プロセス0.15ミクロンとなり、
 さらに高いコアクロックとメモリークロックFSAAの
 期待はよりいっそう高まります

 第5次合戦が始まり3DMark2001のベンチ合戦が
 活発になります

 GForce4-Ti4600でGPUの2002.06現在で
 最高グラフィック性能となり、高いコアクロックと
 メモリークロックを実現してPCGameの再到来の気が
 少しづづ高まりつつあります
 
 第6次合戦が始まりましたが、3DMark2001のベンチ合戦は
 落ち着いた状態となりました

 このレベルになると1280*1024解像度までのFPSが確保されて
 あれほど重かったGameも軽々動作させる性能になります
 気がつくとこのグラフィックボードでメモリーが
 128Mにもなってました

 当初は8M程度からの競争だったんですがね。。。

 QUAKE3の32bit時で1280*1024まで640*480時のFPSとほぼ同等まで
 性能を上げてきました

解像度 32bit アスロン2100+ 1850mhz
640*480 192.0 FPS 
800*600 191.8 FPS
1024*768 190.2 FPS 
1280*1024 171.1 FPS

GeForce FX 5900ファミリーが、GeForce FX 5800に比べて改良されている点は、大きく以下の4点がある。

(1) メモリバス幅が256bit
(2) UltraShadowの機能が追加
(3) Intellisample HCTの機能が追加
(4) ピクセルシェーダがCineFX 2.0に拡張

http://pc.watch.impress.co.jp/docs/2003/0527/hotrev215.htm

クリエイティブメディア株式会社は、ATI TechnologiesのVPU「RADEON 9800 PRO」を搭載したビデオカード
 「3D Blaster 5 RX9800 Pro AGP 256MB DDRII」を6月上旬より発売する。価格はオープンプライスで、店頭予想価格は66,800円前後の見込み。

 256MBのDDR2メモリを搭載した、DirectX 9対応ハイエンドビデオカード。
 AGP 8Xに対応し、コアクロックは380MHz、メモリクロックは700MHz(DDR)。

 http://pc.watch.impress.co.jp/docs/2003/0530/creat.htm


Radeon9800XTの性能を下記に示す。

Process .15 micron
Engine Clock Speed 412+ Mhz
Rendering Pipelines 8
Full precision PS2.0 FPU’s 8
Peak Pixel Fill Rate 3.3+ Gpixels/sec
Peak Vertex Throughput 412M+ Triangles/sec
Maximum Floating-Point Precision 128-bit
Textures Applied per Pass 16
Geometry Pipelines 4
Memory Clock Speed 364+ Mhz DDR
Peak Memory Bandwidth 23.3+ GB/sec
Bandwidth Compression Ratio 8.8:1
RAMDAC 400Mhz
AA Sampler per Second 19.8+ Gsamples/sec
Maximum Texels Filtered per Pixel 768+ Texels/Pixel
nvidia GeForce6800Ultra

  GeForce6800 GeForce6800 Ultra
Code name nVidia NV40
Production 222 Mill. Tr. in 130nm
Technology class DirectX9
Shader 3.0
Pixel pipelines 12 16
Chip clock 350 MHz 400 MHz
Storing act 400 MHz 550 MHz
Memory binding 256 bits 256 bits
Memory equipment 128 MT GDR 256 MT GDDR3
Chip interface AGPx8 AGPx8
Launch ? 14. April
Starting price 299 $ 499 $
RadeonX800XT

RadeonX800 pro RadeonX800XT RadeonX880XT
Code name ATi R420 ATi R423
Production 180 Mill. Tr. in 130nm 180 Mill. Tr. in 130nm
Technology class DirectX9
Shader 2.0
DirectX9
Shader 2.0
Pixel pipelines 12 16 16
Chip clock 475 MHz 500 MHz 500 MHz
Storing act 475 MHz 500 MHz 500 MHz
Memory binding 256 bits 256 bits 256 bits
Memory equipment 256 MT GDDR3 256 MT GDDR3 256 MT GDDR3
Chip interface AGPx8 AGPx8 PCI express x16
Launch 4. May 31. May 14. June
Starting price 399 $ 499 $
nvidia GeForce7800GTX

製品名 Extreme N7800GTX/2DHTV/256M
グラフィックスチップ NVIDIA GeForce 7800 GTX
ビデオメモリ DDR3 SDRAM 256MB
コアクロック 470MHz*
メモリクロック 1.2GHz
RAMDAC 400MHz
メモリインターフェース 256bit
最大解像度 2,048×1,536ドット
バスインターフェース PCI Express x16
外部インターフェース DVI-I×2、S-VIDEO×1
ASUSTeK独自機能 Splendid、GameFace Messenger、GameLiveShow、GameReplay
付属ソフト Xpand Rally、Joint Operations、Project Snow Blind、Media & Show、Power Director 3、ASUS DVD
付属品 TV入出力ケーブル×1、DVI-I→Dsub 15ピン変換アダプタ、ASUSユーティリティ&ドライバCD-ROM
nvidia GeForce7900GTX

製品名
EN7900GT TOP/2DHT/256M
EN7900GT/2DHT/256M
グラフィックスコア
NVIDIA GeForce 7900 GT
ビデオメモリ
GDDR3 SDRAM 256MB
コアクロック
480MHz
450MHz
メモリクロック
1.4GHz(700MHz DDR)
1.3GHz(650MHz DDR)
メモリインターフェース
256bit
外部インターフェース
DVI-I×2、HDTV対応汎用端子×1
付属ゲーム
Peter Jackson's King Kong
Xpand Rally
Xpand Rally


考察

 VoodooではまだPCIでした、Voodoo2でもPCIでした。
 Voodoo2を2枚使用した画期的技術で走査を交互のGPUが管理することでFPS確保をしてきました。
 しかしこれは2枚の同じボードが必要有ること、2つのPCIスロットが無くなることなど問題がありました。
 Voodoo3でこれをAGPに変更となり結果性能は同じ性能であった為に期待はずれの感がありましたが
 当時の技術では、一枚のグラフィックボードでSLI並にして値段も下げると言うことは大変な技術だったはずです。

 しかしそれもつかのまで、GeForce256という新しいチップがでてきて、時代を変えることになりました。

 GeForce256でレタリング処理速度それによりメモリーの増大、メモリーインターフェース128bit
 等々の技術により、800*600以上での解像度のフレーム数(FPS)の確保の実現を可能にした。

      GeForce 256

 変換、ライティング、セットアップ、およびレンダリングを
1 つの GPU 上で行うことによって、
 1500 万ポリゴン/秒および 4 8000 万ピクセル/秒のパフォーマンスを実現します。
 独自の最新
256 ビットレンダリングエンジンによって、ビジュアルの複雑さが 10 倍増大し、
 将来のグラフィックリアリズムの方向性を決定するというものです。


 グラフィックコア:
 メモリインターフェイス:
 トライアングル/秒:
 ピクセル/秒:
 メモリ:


256 ビット
128 ビット
1500
4 8000
最大 128 MB


    GeForce3 と DirectX8

 GeForce3 がすぐに得になるいくつかの機能を備えているのは、ありがたいことで、他の新しい DirectX8 の仕掛けが、
 それほどすぐに 3D ゲームで使われることはなかった。 
 とは言いながら、ジャイアントシチズンカブトなどは素晴らしいものだったですね。
 GeForce3 が、来たるべき Microsoft の Xbox と非常によく似た機能リストを備えて登場した最初の 3D プラットフォームである事。
 このような機能を今市場に持ち込むことは、Xbox にとっても大変有利になったことでしょう。


 その後各社からそれに対応する新しいグラフィックボードが出てきました。
 メモリー帯域を増やして書留能力を向上させるものでした。

     RADEON 8500

 RADEON 8500には、レンダリング性能を25%向上するというメモリー帯域幅節減技術“HYPER II”、
 ピーク時に毎秒6250万トライアングルの処理能力を持つ“CHARISMA ENGINE”、4つのレンダリングパイプラインで
 毎秒2Gテクセルの処理能力を持つ3Dレンダリングエンジン“PIXEL TAPESTRY”などを搭載している。
 また、よりリアルなテクスチャーやライティング効果を得られるという“SMART SHADER”技術も搭載する。
 SMART SHADERは、Windows XPに搭載されるDirectX 8.1の機能である“Vertex Shader 1.0/1.1”“
 Pixel Shader 1.2/1.2/1.3/1.4”をサポートしている。



  DirectXベースの世界最速GPU“GeForce4 Ti”シリーズ

 スペックもクロックもGeForce3を引き離す

 Graphics Core 256-bit
 Core Clock 300MHz
 Memory Interface 128-bit DDR
 Memory Bandwidth 10.4
 Fill Rate (AA samples/sec.) 4.8 billion
 Triangles/ sec. 136 million
 Effective Memory clock rate 650 MHz
 RAMDAC 350 MHz
 Operations/ sec. 1.23 trillion

   NV25

 GeForce4 Ti4600(と、下位モデルとなるGeForce4 Ti4400)は、米国時間2月5日にGeForce4 MXと同時発表され、
 Nvidiaの最新GPUとなりました。
 コードネーム“NV25”と呼ばれていたGeForce4 Tiでは、GeForce3シリーズで搭載したプログラマブルVertex Shaderと
 Pixel Shader(※1)エンジンの総称“nFinite FXエンジン”を強化した“nFinite FX IIエンジン”を新たに搭載。
 nFinite FX IIでは、Vertex Shaderの数が従来の倍となる2つになり、単純に性能が2倍となっているほか、
 Pixel Shaderも新しい命令が追加され、速度の向上が図られてます。

 ※1 Vertex Shader・Pixel Shader
 ポリゴンの各頂点(vertex)が持っている座標や色、フォグなどの情報情報を演算リアルタイムに演算するエンジンがVertex Shader。
 これにより、人間の細かな表情や肌の伸び縮みなどをリアルに表現できる。一方Pixel Shaderは、色や透明度をはじめとするさまざまな
 テクスチャへの効果を任意に変更するためのエンジンで、陰影を持つリアルなテクスチャを表現するために用いられる。
 これらは“ハードウェアT&L”と呼ばれるポリゴン処理と光源処理のエンジンをDirectX8.xへ対応させるべく拡張したもの。
 この2つのエンジンを持っているかどうかで“DirectX8対応”かどうかが決まると言っても過言ではない。


 結果としてVoodooの時代から大きく変化してきたのは、転送速度ですね。
 多くのパイプラインを持ちDDRとの組み合わせで高速化してます。
 高解像度でのFPSの低下はGeForce前ではどのCPUでもFPSが変化しない部分はここにあったわけです。
 結果メモリー帯域の上昇と、コアクロック メモリークロックをあげることが一番に重要点であったわけです。
 がしかしこれを行うと発熱が増大して一気にエラー続出となります。
 その技術は基盤からGPU内部までにいたるところで消費電力を抑える技術が必要だったと想像します。
 ですから常に発熱への発熱度は低い状態で生産せざる終えない部分だったともいえます。

 今後は顧客重視からもっと安定した製品へと後術進歩していくとおもいますが、高クロック化での発熱対策は
 次第にCPUと同等になっていくと想像します。

 我々評価する立場のサイトにおいても次第に高度になってきてます。
 単純にヒートシンク変更だけでは、騒音・スペース等で問題が大きいですから、
 より良い方法を見つけて行かなければなりません。
 そう言う意味では非常に楽しみな世界でもあります。

 
  世界的に見てGeForce系が日本に大人気を呼び世界的に見るとマトロックス系が今も寝ず良く存在するには意味があります。
 個人的には発熱安定性と、信頼性でしょうね。
 今までこれらのグラフィックの評価をしてきて、発熱の問題は常について回る問題でした・
 しかしG200使用時では発熱による問題の経験がありません。(PCGame向きではありませんでしたが。。。
 恐らくこれからも高クロック 高クロックメモリーDDRと高クロック化避けられては通れない部分ですから
 各社ともに発熱対策技術の技術アップがさらに白熱してくるでしょう。

 又我々自作評価者にとっては、結局その得たマージンを極限まで伸ばすのでしょうね!
 夢があって常に次に出るグラフィクを予想していける最新技術の予想が可能であると信じております。
 
 しかし性能面では明らかに技術的にも高解像度のFPSは上昇していくでしょう
 一番の技術はDDRによるモモリーり転送のスピード技術ではないでしょうか?
 今まではグラフィックボードの性能が追いつかなかったことが多かったわけですが、今年はかなり
 CPUとマザーボード及びメモリーがデーター転送技術を発展させて、さらなる高くロック時での
 データー転送の効率を上昇させてますから、さらに高クロック化に拍車をかけるでしょう。
 しかしそれだけではなく、DX9とドライバーとの関連をもっと重要してくると思われます。 


2004年4月に入りNVIADIAがGeforce6800を投入
・The Pixel Pipe Performance

NV30/35系はカラー+Zの場合は4ピクセル/クロックで、テクスチャ処理は8テクスチャ/クロックの性能だった。 Zまたはステンシルの場合は8ピクセル/クロックだった為、NV30/35系は4x2(4パイプ2テクスチャ)/8x0アーキテクチャと呼ばれていた。NVIDIAはこの点を自ら指摘、NV40を同様の方法で形容するなら「16x1/32x0」アーキテクチャになる。 1テクスチャユニットを備えたPixel Shaderが16基ある事になる。 NV40のPixel Shaderは、かなりユニークだ。最大の特徴は、1つのPixel Shader内で4インストラクション/クロックと非常に高い並列度を実現しており、各Pixel Shader内には2つの演算ユニットが備えられている。 そのため、通常のPixel Shaderと比べると、2倍のオペレーションを1クロックで行なう事がが出来る。 またNV40ではラスタオペレーションを行なうROPサブシステムは、Pixel Shaderから分離されている。 ROPが16ユニットあるため、NV40ではシェーダパフォーマンスだけで無く、ピクセルアウトプットのパフォーマンスも高い。 NVIDIAは、NV35ではシングルテクスチャフィルのピクセル性能は約4(3.99)ピクセル/クロックだった、それがNV40では、12.27ピクセル/クロックと3倍以上に向上した。 そしてNV40ではDDR3メモリをサポート、登場時に1.1Gtps(transfer per second)のメモリ転送レートが実現され、メモリインターフェイスは256bitで、メモリの生帯域は35.2GB/secとなる。 しかし現実PCGameにおいてはFPSの大幅なUPにつながっていない事実がある。 これはFSAAに対しては有利に当然働くメモリー帯域の性能向上効果であるが、通常でのPCGameにおけるFPS確保は、やはりコアクロックとメモリークロックによる事も事実である。 3DMark03ベンチマークでのUPはほぼ理解できたが、現実今のPCGameにおけるFPS確保は問題が残りそうである。 ただしDX9.0対応のHalo, Codecreatures 等では素晴らしいUPとなります。 重要なのはFSAAの×8あたりでもFPS低下が少ないのは画質向上においては画期的です。 2006年後あたりのPCGameにおいては素晴らしい画質を得ることでしょう。


2004年は大きくグラフィックが前進します。 メモリーパイプラインが2倍の16へと。そしてメモリーもDDR3へPixel Shader3.0もDx9.0cから対応してきそうです。
これにより大幅に転送能力が向上してFSAA使用時のFPS確保がgoodになりました。
1280*1024でFSAAを掛江tのPCGameが十分可能になるのはまた1時代更新と言うことになります。
またATIも同様にR420を5月ENDにリリースしてきます。
性能争いの中でどうなるかは微妙です。 がしかし互いに時代の更新になるのは間違いありません。
1600*1200解像度でのPCGameも問題なく出来そうです。
これにより画質はTV映画のような画質でより細かく表現されて怖いくらいの綺麗さの中でPCGameが出来る環境となるでしょう。

2004.04.28

GPUの処理の並列度と効率を上げるアプローチの重要性



2005後半の90nmプロセスになると、さらに飛躍的に搭載トランジスタ数が伸び、ハイエンドGPUは、3億トランジスタを搭載するようになると言われる。NV50やR500世代がこれに当たる。90nm GPUは、アーキテクチャ的にはDirectX 10になると推測される。
GPUもCPUと同様に、その性能は動作周波数×並列度×効率で決まる。そしてCPUと同様に、このうち周波数は引き上げることが徐々に難しくなり、消費電力が向上しているためとチップ自体の複雑度が増しているとPCWatchで報じている。 もともとグラフィックには歴史があり、常にPCGameのFPSがどの解像度でボトルネックになるかを目指してきたように感じる。 当初は800*600だったが、Geforceの出現で1024*768解像度でFPS向上を達成した。 しかしそれと同時にFSAAが進んできており、同時にバスラインへの帯域量がいつしか競争の主眼となった。 現在でもHALO等のPCGameのパフォーマンスが上であるためにグラフィックGPUのクロックは引き上げざるおえない状況である。 しかしNV40は6 Vertex Shader+16 Pixel Shader+16ピクセルエンジン構成によってスレッドの並列性を高め、各Shader内部の並列性や効率を高める事で対応しようとしている事から、恐らくはATIもR420で、間Shader内部の並列性と実行効率の向上を図る事である程度達成すると考える。 PCGameのパフォーマンスを追いかける状態というのは変わっていないが、FPSより画質を求めた競争に変わり、どこまでパフォーマンスを引き出せるかが今後の主眼といえる。

考察1: GeForce6800とRadeonX800のとくにはPCGame-fpsにおいてかなりばらつきがあります。 海外サイトの評価はあくまで参考ですので6800側に有利であったりX800が非常によい値が出たりしてます。 しかしながらこのサイトにおいては基本的にfpsはコアとメモリークロックにあると考えてます。 X800XTでクロック分(コア1.26倍・mem1.5倍)を考慮して最低20%〜50%UPするだろうと考えてます。
従って50fpsが60〜75fpsあたりに今までのPCGameは向上するとクロックから予想します。 パイプラインはあくまでのそのfpsをFSAAをかけたときに低下させないでfps維持をするかですから、 これを考えると同一ドライバーであればはX800XTはRadeon9800XTに比べて性能は確実にアップします。 Radeon9800XTを500/500でほぼ予想UP率になります。 ただ発熱で予想と同じ結果は出ませんでしたが発熱損失が抑えられていれば問題ないでしょう。 NVIDIAにおいてはドライバーが絡んでますので難しいです。 一概には何とも言い難い部分があります。 クロックだけを考えると性能低下の可能性もあります。 (non-FSAA時) TI4600時よりATIに変更しましたので評価できてませんが、ハード的にATIと違いますのでもう少し評価データーが集まればと考えます。 いずれにしても5950等含めてドライバー依存で3DMark03に走った部分は否定できません。 ATIはボードは同じようですから基本設計は同じでパイプラインの違いとGPU変更のみで対応しているようで、基盤も形もRadeon9800XTと同じようです。 いずれにしても今年は NVIDIA VS ATI 画質とともに性能を良い意味で競争してほしいと思います。


考察2:新RADEONがプログラマブルシェーダ3.0仕様への対応を見送ったことにより、プログラマブルシェーダ3.0仕様は当面はNVIDIAのGeForce6800系(GeForce6系)独自の仕様となる。これは立場こそ逆転しているが、かつてATIがRADEON8500登場と同時に打ち出した新仕様「プログラマブルピクセルシェーダ1.4」に、NVIDIAが後発のGeForce4Tiでは対応を見送った状況によく似ている。実質的にGeForce4Tiは「先代GeForce3の高性能版どまり」という位置付けだったわけだが、結果として、GeForce4TiはRADEON8500よりも「製品としては」成功を収めた。 RADEON X800シリーズはXTとPROの両モデルが同時に発表されたものの、リリース時期は若干ズレが設定される。下位モデルのRADEON X800PROは、5月4日以降に随時店頭に並ぶ予定で、上位のRADEON X800XTは5月21日以降となっている。価格は未定としながらも、「先代のRADEON9800XTや同PROの価格から大きく逸脱はしない」としている。PCWatch 上記の考察にも記入しましたが私の個人的見解と言えばプログラマブルシェーダ3.0に対応してくると言うことは今のところ無しと言うのが個人的見解です。 従ってクロック並のSpecUPが無いとユーザーは当然購入してこないであろう。 中身の問題は色んな解説で解ったよう解らない様な感じでもあるのだが、基本的ベースはPCWatch等で報じられているのを参考にすればだいたいは理解できる。 しかし問題はだからこそ現行のPCGameでもパフォーマンスは向上すると確実に思ってしまう部分がある。 あくまで画像処理の部分の大幅な改善である以上は画質の追求にある。 ただATIはこの画質追求に以前からの9800XTの高クロック版なのである。 従って現行Gameでも確実にfpsが上昇するが、NVIDIAもDriverと6800もX800並の画質を整えた為にDriverの改革次第ではかなりの効果も認められる可能性が出てきている。 ハード的に処理しているATIの方法はDriver処理で対応できない部分の対応かそれとも新技術かは知れない?  いずれにしても価格競争と発熱はATIは結果トランジスタを160 Millで抑えており9800XTから交換しても問題とならないだけでなく、520MHZ/1120MHZと言うことでGF6800Uも同じクロックでOC可能?と考えられることから白熱して来るであろう。 実質2004年がグラフィックを決める年になるかも知れない。 私は個人的にはATI有利と見ている。 理由を下記に示す。
1 同クロックではATIが有利。
2 消費電力・発熱ではATIが圧倒的に有利。
3 PS3.0使用は数年先であると個人的に考えている。 等々価格も適当な価格調整をすると考えられる等が理由に掲げられる。


ATIは基本的にはR3xx系の拡張版

PCWatchによると下記のことが説明されている。 NV40はShader 3.0/32bit Pixel Shaderで、6 Vertex Shader、16 Pixel Shader、16 ROP(Rasterizing OPeration)サブシステムを備える。そのため、GPUのトランジスタ数は非常に多い。2億2,200万トランジスタでダイサイズ(半導体本体の面積)は300平方mmクラスだ。その結果、NV40は高消費電力&高発熱で、しかも高コストという問題を抱えてしまった。また、Shader 3.0対応のシェーダプログラムを走らせた場合には、Shaderユニットの実行効率を維持することが難しいという課題もある。

それに対して、ATIはShader 2.0/24bit Pixel Shaderを選択した。そのため、Shaderの回路規模は当然NVIDIAより小さくなるため、問題はずっと軽減される。トランジスタ数は1億6,000万、ダイサイズは200平方mm台と、NV40より一回り以上小さい。消費電力は70W台前半(X800XT)と、これもNV40より低い。 RADEON X800の製造プロセスは、消費電力が比較的低い台湾TSMCの0.13μmのLow-kオプション付きプロセスなので、RADEON X800の発熱量はRADEON 9800XT(TSMC 0.15μm)よりも少ないという。つまり、R420の方がNV40より、実装しやすく熱設計や熱対策も容易で、製造コストも低く量産に向いたGPUというわけだ。 無理をしても巨大GPUを作るNVIDIAと、あくまでも現実的な範囲でGPUを設計するATI。今回は、両社の姿勢の違いが明確になった格好だ。 R420の製品ラインナップは、16パイプの「RADEON X800 XT」と、12パイプの「RADEON X800 PRO」の2製品。RADEON X800 XTは500MHz以上のコアクロックと1Gtps(transfer per second)以上の転送レートのGDDR3メモリ256MB搭載で提供され、価格は米国で499ドル程度。RADEON X800 PROは475MHzのコアクロックと900Mtpsのメモリ256MBで399ドル程度という。

私の考察にもあるが、ATIの考え方は有る意味素直で取り組みやすいと感じる。 クロック性能から予想される性能もはっきりしている。 9800XTからの引き継ぎが明確で発熱・消費電力・PS3.0見通しは個人的にとても共感できる。 499$でX800XTが購入できるとなると6800Ultraに勝充分勝てるとの読みがあるのだろう。 いずれにしても企業である異常はNVIDIAもATIも現行Gameにおいても画質向上に性能もアップしないと顧客重視ではない為、今年は是非白熱した展開を望みたい。


オーバークロックの魅力

 これは常に時代の先端を先取りすることが出来ると言うことです。
 個人的には、次のCPUの安定度まで予測が出来ますから、AMDかInetelかは選択が非常に顧客としては
 興味深くなります。
 自己満足の世界ではありますが、明らかに各企業が出す次期製品の性能を出してしまうわけですから
 その満足度は計り知れない部分があります。
 又その時点でどの製品がどれだけ良いか? 予想が魅力ですね。
 いくら製品の品質管理がUPしても顧客情報という部分では我々の情報から決まったロットの商品を購入する
 となると企業も楽観はしていられないわけです。

 いずれにしても、時代先取りの満足感とやはり人より少しでも早くと言う欲望は技術進歩に大変役立つことでしょう!
 我々はそのために結構な出費を強いられるわけですが。。。 あせあせ  

 それでも人より早く動作させたときの魅力は、何とも言い難い満足度がありますね。
 このサイトではPCGameでのFPSのUPと安定したドライバーの選択にあるわけですが、クロックアップの世界に何故か
 入ってしまう魅力がたまりません。