グラフィックボードとは何かについて解説します。グラボやビデオカードと呼ばれることもあります。主な役割は画像や映像の出力です。実はほとんどのCPUにGPU(グラフィックス機能)が搭載されているので、グラフィックボードがなくてもモニター出力など最低限の機能は果たせます。しかしながら、3Dゲームをプレイしたり画像生成AIに活用したりするのには性能が足りずストレスが溜まることになると思います。最近は画像生成AIが注目され、外付けグラフィックボードの重要度が増しています。
グラフィックボードとは?
画像・映像処理を担当
グラフィックボードは、画像処理及び映像処理を得意とするPCパーツです。身近なところだと3Dゲーム・3D CAD・画像生成AIなどで活躍します。グラフィックボード内部にGPU(Graphics Processing Unite)が搭載されていて3Dグラフィックス処理を行います。GPUはCPUと同様にプロセッサーですが、特性及び役割が異なります。GPUは、搭載しているコア数が多く3Dゲーム出力など並列的な計算処理を高速に行えます。GPGPU(Genereal Purpose Computings on GPU:GPUの汎用計算)も普及して来ていて画像処理演算以外にも利用可能です。具体的には動画のエンコードなどのアプリケーションで活用されます。
GPU(グラフィックボード)とCPUの違い
GPU | CPU | |
---|---|---|
役割 | 画像描写に特化 | システム全体の処理 |
コア数 | 1,000-20,000 | 2-24 |
計算処理 | 並列 | 直列 |
処理速度 | ★★★★★ | ★☆☆☆☆ |
GPUとCPUはどちらもプロセッサーですが役割が異なります。GPUは、画像処理に特化しています。一方で、CPUはシステム全体の処理を担当します。画像処理以外全般と言っても良いでしょう。GPUはコア数が1,000から20,000と多くCPUとは規模が異なります。並列処理が得意で大量のデータを効率的に処理できます。処理速度も圧倒的です。CPUは直線的で複雑な処理が得意です。CPUはコンシューマー向けのハイエンドであるCore Ultra 9 285Kでも24コアです。Ryzen 9000シリーズの最上位モデルであるRyzen 9 9950Xでも16コアです。
グラフィックボードの構成要素
グラフィックボードの構成要素をまとめました。グラフィックボードとGPUは同じものとして扱われることもありますが、厳密に言えば両者は異なるものです。GPUはあくまでもチップそのものを表します。VRAM・インターフェース・ヒートシンク・補助電源・出力端子・BIOSなどを含めてグラフィックボードを構成しています。
- GPU
- VRAM
- インターフェース
- ヒートシンク
- ファン
- 補助電源
- 出力端子
Graphics Processing Uniteの略でグラフィックボードの根幹部分です。無数のトランジスタが搭載されていて画像処理全般を担います。
画像データを一時保存するGPU用のメモリです。システムメモリと分けることで効率的にデータのやり取りが行えます。次の項目「GPUメモリ(VRAM)について深堀り」で詳しく解説しています。
マザーボードと接続するためのインターフェース(PCI-Express)が設けられています。
使用時の熱を放出するためにヒートシンクがあります。
効率的に外に熱を排出するためのファンが搭載されています。エントリークラスのモデルだとファンが搭載されていないファンレスモデルもあります。
電源を供給するための電源コネクタが搭載されています。16-pin、12-pin、8-pin、6-pinなどモデルごとに設定されています。2×8-pinなど2つのコネクタが必要です。
モニター出力用の端子が設けられています。最近はDisplayPortとHDMIが主流です。古い端子だとDVIやVGAがあります。
GPUメモリ(VRAM)について深堀り
GPUメモリとは
GPUメモリとは、グラフィックボードに搭載されているメモリのことです。システムメモリと役割は似ていますが、GPUメモリは映像データなどグラフィックスに特化したメモリと考えるとわかりやすいです。グラフィックボードとストレージの間の橋渡し的な存在です。GPUが必要なデータをGPUメモリから読み込み演算を行います。ストレージからデータを取り出すよりもより速くより効率的に処理ができます。GPUメモリ容量が多いとたくさんのデータを保存できるので効率的だといえます。4K環境など高解像度になるとGPUメモリに掛かる負担も大きくなります。
ゲームのGPUメモリ消費量が増えている
ここ最近はGPUメモリの重要度が増しているように思います。モンハンワイルズなどGPUメモリ消費量の多いタイトルが登場しているからです。設定を上げるとVRAM容量の警告出るゲームもありますね。WQHDや4K環境ならVRAM消費は顕著に上がります。また、レイトレーシングもGPUメモリへの負荷が大きいです。
GPUメモリ周りでいうとキャッシュやメモリ帯域幅が果たす役割も大きいです。キャッシュ容量が多いと高速でのデータ処理が可能となります。メモリ帯域幅が広ければより多くのデータを一度に送ることができて効率的です。最低でも8GB、できれば12GB以上のグラフィックボードを選択したいですね。キャッシュやメモリ帯域幅も満足できる水準になります。
各グラフィックボードのGPUメモリ一覧
型番 | VRAM | 帯域幅 |
---|---|---|
GeForce RTX 5090 | GDDR7 32GB | 1,790 GB/s |
GeForce RTX 4090 | GDDR6X 24GB | 1,008 GB/s |
GeForce RTX 5080 | GDDR7 16GB | 960 GB/s |
GeForce RTX 4080 SUPER | GDDR6X 16GB | 736.3 GB/s |
Radeon RX 7900 XTX | GDDR6 24GB | 960.0 GB/s |
GeForce RTX 5070 Ti | GDDR7 16GB | 896.0 GB/s |
Radeon RX 9070 XT | GDDR6 16GB | 644.6 GB/s |
GeForce RTX 4070 Ti SUPER | GDDR6X 16GB | 716.8 GB/s |
Radeon RX 9070 | GDDR6 16GB | 644.6 GB/s |
GeForce RTX 3070 | GDDR6 8GB | 512.0 GB/s |
GeForce RTX 4060 Ti 16GB | GDDR616GB | 288.0 GB/s |
GeForce RTX 4060 Ti 8GB | GDDR6 8GB | 288.0 GB/s |
GeForce RTX 4060 | GDDR6 8GB | 272.0 GB/s |
GeForce RTX 3060 | GDDR6 12GB | 360.0 GB/s |
GeForce RTX 3050 8GB | GDDR6 8GB | 224.0 GB/s |
GeForce RTX 3050 6GB | GDDR6 6GB | 168.0 GB/s |
主要グラフィックボードのGPUメモリの規格/容量とメモリ帯域幅をまとめました。基本的にはGPUメモリ容量が多いモデルほど高性能になるのでGPUメモリ容量を基準にグラフィックボードを選ぶのは得策とは言えません。ただし、最近はAAAタイトルを始めGPUメモリ消費量が増加傾向にあり、GPUメモリ容量から計算して選ぶのもよいかもしれません。
GeForce RTX 4060 TiではVRAM容量が異なるモデルが販売されています。16GBと8GBです。通常のゲームプレイにおいては同等の性能です。価格の安さからGeForce RTX 4060 Tiの人気が高いですが、将来性を考えると16GBモデルを選ぶのもよいかもしれません。GeForce RTX 3050にもVRAM容量異なる8GB版と6GB版があります。こちらはCUDAコアとクロック周波数の差別化が図られていてGeForce RTX 3050 8GBの方が性能高いです。
グラフィックボードの活躍の場
グラフィックボードが活かせる用途は意外と多いです。パソコンで色々なことに挑戦してみたいと考えている方も導入を考えてみてください。
3Dゲーム
3Dゲームはもっともオーソドックスなグラフィックボードの活用できる用途です。グラフィックボードがないとゲームを起動すること自体できないこともあります。CPU内蔵グラフィックスでは力不足です。最近は美しいグラフィックスをウリにしたタイトルも増えて来ました。新しい技術であるるレイトレーシングによってよりリアルなゲーム描写が実現できます。その代償として負荷が上がるため高性能グラフィックボードが必須です。
動画編集
動画編集作業においてもグラフィックボードが活躍します。基本的にはCPUが処理を行いますが、Premire ProやDaVinci ResolveなどGPGPUを活かせる作業ではより高速での処理が可能となります。グラフィックボードを搭載することでレンダリング・エンコード・プレビューなどの処理が速くなります。お仕事で動画編集を行なっているならグラフィックボード搭載は必須と言えるでしょう。
画像生成AI
2023年以降注目度が増している画像生成AIにおいてもグラフィックボードが有効です。使用ユーザーの多いStable Diffusionでも高性能なグラフィックボードを搭載している方が明らかにパフォーマンスが高くなります。GPUメモリ容量が多いモデルを選ぶ方が良いでしょう。AI生成を目的とするならGeForce RTX 2060 SUPER以上、できればGeForce RTX 3060以上がおすすめです。
3D CAD
3D CAD(Computer Aided Design)は3次元のオブジェクトやモデルを設計するためのソフトウェアです。直訳するとコンピューター支援設計となります。製造業のプロダクト設計や建築業の建築物設計向けです。3Dグラフィックスを取り扱うことになりますので、グラフィックボードの出番です。
機械学習・ディープラーニング
機械学習もグラフィックボードの活躍の場として注目されています。機械学習とはデータを分析する方法の一つです。機械(コンピューター)が自動で学習を行い、大量のデータからルールや法則性を見つけ出しそれらを活用した予測・判断を行うことが可能となります。人間が行うと何十時間・何百時間と掛かる作業でもコンピューターを活用することでより迅速に処理を行えます。ディープラーニングは機械学習の中に含まれていてカテゴリーとしては「教師あり学習」に分類されます。つまり、過去の入力データと出力データ(教師)を学習して、入力データから出力データを推計するものです。
マイニング
一時はマイニングが流行しました。マイニングとは、ビットコインなどの仮想通貨の取引記録をブロッックチェーンに保存する作業を行うことです。取引を成立させることでその報酬として仮想通貨を得ることです。仮想通貨は円やドルなどの法定通貨と異なり特定の組織が管理しているわけではないので、ブロックチェーン上で管理する必要があります。このマイニングにおいてはGPGPUが威力を発揮します。並列処理が高速でCPUと比べても優位性があります。
グラフィックボードの種類
グラフィックボードの種類について、メーカー・用途・デバイスごとに詳しく見ていきましょう。あなたの好みや目的に合わせて選択する必要があります。
二大メーカー+Intel
NVIDIA | AMD | Intel | |
---|---|---|---|
ブランド | GeForce | Radeon | Arc |
世代 | Blackwell | RDNA 4.0 | Battlemage |
構造 | モノシリック | モノシリック | モノシリック |
プロセス | 4nm | 5nm | 5nm |
Steamシェア | 83.07% | 11.49% | 5.21% |
価格帯 | 118,800円~393,800円 | 114,800円~128,800円 | 45,800円~49,980円 |
ラスタライズ性能 | ★★★★★ | ★★★★☆ | ★★★☆☆ |
レイトレーシング性能 | ★★★★★ | ★★★★☆ | ★★★★☆ |
画像生成AI | ★★★★★ | ★★☆☆☆ | ★★☆☆☆ |
省電力性 | ★★★★★ | ★★★★☆ | ★★★★☆ |
コスパ | ★★★★☆ | ★★★★★ | ★★★★☆ |
グラフィックボードのメーカーについて見ていきます。二大メーカーはNVIDIAとAMDです。IntelはCPUメーカーとしては歴史が長いですが、グラフィックボードメーカーとしては後発です。2022年3月にArcブランドを投入しています。まだまだドライバーなどが不安定なときがあるので、基本的にはNVIDIAかAMDのいずれかのモデルから選択すると良いと思います。
NVIDIAのGeForceブランドはモノシリックダイを採用したグラフィックボードです。現行のBlackwell世代の製造プロセスは4nmです。Steamでのシェアが83.7%と高くなっています。迷ったらGeForce製モデルを選択すると良いでしょう。価格帯も幅広く、特にフラグシップモデルのGeForce RTX 5090は圧倒的な性能を有しています。総合性能が高くゲーム以外の用途にも対応しやすいです。省電力性も高く扱いやすいと言えるでしょう。
AMDのRadeonシリーズの現行モデルはRDNA 4.0世代となります。Steamでのシェアは11.49%とNVIDIAに大きく水を開けられています。フラグシップモデルのRadeon RX 9070 XTでもGeForce RTX 5090と比べて大きく劣ります。Radeon RX 9070 XTの価格的な競合はGeForce RTX 5070 Ti/GeForce RTX 5070となります。同価格帯で見れば高いラスタライズ性能を持っていると言えます。ただし、レイトーシングや画像生成AIではワンランク以上落ちます。
Intelはかなり苦戦中です。Arcブランドの2世代目に当たるBattlemageが登場しましたが、ラインナップは少なくシェアも5.21%に留まります。内臓GPUも含まれていると考えるとArcブランドのシェアはもう少し低くなるでしょう。ミドルクラスのモデルしかラインナップがありません。同価格帯では優れたラスタライズ性能・レイトレーシング性能を持っています。画像生成AIは今一つです。省電力性は高いです。
ゲーム向けモデルとプロ向けモデル
GeForceブランド | NVIDIAブランド | |
---|---|---|
メーカー | NVIDIA | NVIDIA |
ターゲット | 一般消費者 (ゲーマーなど) | クリエイター (設計・建築会社など) |
主な用途 | ゲーム | 3D CAD・動画編集 |
API最適化 | DirectX | Open GL |
発色 | RGB各色10bit 10億6433万色 | RGB各色10bit 10億6433万色 |
複数モニター | 最大3画面最大8画面 | 最大8画面 |
価格帯 | 30,000円~393,800円 | 20,000円~1,500,000円 |
目的によって選ぶべきグラフィックボードが変わります。ゲームなど一般消費者向けのモデルはGeForceブランドです。APIはDirectXです。一方で、NVIDIAはクリエイターなどプロフェッショナルをターゲットにしたブランドとなります。数世代前まではQuadroという名称でした。
もしかしたらそちらの方を知っているという方も多いかもしれません。主な用途は3D CADや動画編集などとなります。発色についてはどちらもRGB各色10bit 10億6433万色です。かつてGeForceブランドはRGB各色8bit、1677万色と表現できるカラーが控えめでした。その後2019年以降Pascal世代以降のモデルについては10bitに対応となっています。
デスクとラップトップ
項目/モデル | RTX 5090 | RTX 5080 | RTX 5090 |
---|---|---|---|
プラットフォーム | デスク | デスク | ラップトップ |
GPUアーキテクチャ | Blackwell | Blackwell | Blackwell |
GPUコア | GB202 | GB203 | GB203 |
製造プロセス技術 | 4nm TSMC | 4nm TSMC | 4nm TSMC |
トランジスタ数 | 922億 | 456億 | 456億 |
ダイサイズ | 750m㎡ | 378m㎡ | 378m㎡ |
SM数 | 170 | 84 | 82 |
CUDAコア | 21,760 | 10,752 | 10,496 |
RTコア | 170 | 84 | 82 |
Tensorコア | 680 | 336 | 328 |
ベースクロック | 2017 MHz | 2295 MHz | 990 MHz |
ブーストクロック | 2407 MHz | 2617 MHz | 1515 MHz |
GPUメモリ | GDDR7 32GB | GDDR7 16GB | GDDR7 24GB |
メモリクロック | 28.0 Gbps | 30.0 Gbps | 28.0 Gbps |
メモリインタフェース | 512 bit | 256 bit | 256 bit |
メモリバス帯域幅 | 1,790 GB/s | 960 GB/s | 896.0 GB/s |
消費電力 | 575W | 360W | 95W-150W |
PCIe外部電源 | 1x 16-pin | 1x 16-pin | - |
上記テーブルはデスクトップ向けグラフィックボードとラップトップ向けグラフィックボードのスペックをまとめたものです。ポイントは同じGeForce RTX 5090でもデスクトップ向けモデルとラップトップ向けモデルでスペックが異なるということです。ラップトップ向けのGeForce RTX 5090は、デスクトップ向けモデルであるGeForce RTX 5080と同じGPU GB203を搭載しています。GB202よりも二回り小さいGPUです。
CUDAコア・RTコア・Tensorコアもデスクトップ向けのGeForce RTX 5090と比べると48%程度の規模です。さらに、クロック周波数は控えめです。ラップトップ向けGeForce RTX 5090のベースクロックは990MHzで、ブーストクロックは1515MHzです。デスクトップ向けの2つのモデルと比べると大きく劣ることがわかります。GeForce RTX 5090 LaptopのGPUメモリはGDDR7 24GBとGeForce RTX 5080よりも8GB多いです。GeForce RTX 5090よりも8GB少ないですね。
その他大きく異なるのは消費電力です。GeForce RTX 5090が575W、GeForce RTX 5080が360Wに対して、GeForce RTX 5090 Laptopは95W-150WとGeForce RTX 5080の半分以下です。幅があるのはベンダーによって設定するTDPが変わるためです。ゲーミングノートPCにおいては熱の問題があるため消費電力を抑える必要があります。これぐらいのTDPが限界ということです。
グラフィックボードのスペックを解説
項目/モデル | RTX 5090 | RTX 5080 |
---|---|---|
GPUアーキテクチャ | Blackwell | Blackwell |
GPUコア | GB202 | GB203 |
製造プロセス技術 | 4nm TSMC | 4nm TSMC |
トランジスタ数 | 922億 | 456億 |
ダイサイズ | 750m㎡ | 378m㎡ |
SM数 | 170 | 84 |
CUDAコア | 21,760 | 10,752 |
RTコア | 170 | 84 |
Tensorコア | 680 | 336 |
ベースクロック | 2017 MHz | 2295 MHz |
ブーストクロック | 2407 MHz | 2617 MHz |
GPUメモリ | GDDR7 32GB | GDDR7 16GB |
メモリクロック | 28.0 Gbps | 30.0 Gbps |
メモリインタフェース | 512 bit | 256 bit |
メモリバス帯域幅 | 1,790 GB/s | 960 GB/s |
L2キャッシュ | 96MB | 64MB |
L3キャッシュ | - | - |
消費電力 | 575W | 360W |
PCIe外部電源 | 1x 16-pin | 1x 16-pin |
バスインターフェイス | PCIe 5.0 | PCIe 5.0 |
出力 | 1x HDMI 2.1b 3x DisplayPort 2.1b | 1x HDMI 2.1b 3x DisplayPort 2.1b |
グラフィックボードの特徴を知る上でスペックを理解しておくことは重要です。他のグラフィックボードとの比較すべきポイントも見えてくると思います。NVIDIAのGeForce RTX 5090とGeForce RTX 5080のスペックを見ながら解説していきます。
アーキテクチャ/GPU
アーキテクチャ及びCPUを見れば世代がわかります。NVIDIAの最新アーキテクチャはBlackwellとなります。GPUコアの数値が少ない方が大きく性能が高いです。製造プロセスはパフォーマンスに影響を与える部分です。微細化されるとクロック周波数の引き上げや省電力性の向上などの恩恵が得られます。
CUDAコア/RTコア/Tensorコア
GPUユニットのコア数を表しています。数千個~数万個のコアを持っているのが一般的です。CPUと比べるとコアの数が多くそれがGPUの特徴となっています。同じメーカー・同じ世代であればより多くのシェーダーコアを搭載している方がより高い処理性能を持っていると判断できます。
メーカーや世代が変わると単純に数値で比較することは難しいです。目安として考えるのが良いと思います。RTコアはレイトレーシングを担当して、TensorコアはDLSSを担当するコアです。こちらも数字が多い方がよりパフォーマンスが高いです。CUDAコア以上に世代の影響を受けます。
クロック周波数
定格クロックであるベースクロックとオーバークロック周波数であるブーストクロックも性能を把握するための指標となります。1秒間当たりに処理できる回数を表しています。例えば、2GHz(2000MHz)だと1秒間で20億回処理できるということです。こちらも同じメーカー・世代のグラフィックボード同士の比較でのみ純粋な比較が行えます。ベンダーが販売するモデルの中にはこの規定のブーストクロックを超えたオーバークロックモデル(OC)も存在しています。より高性能なファンが搭載されているなど通常モデルよりもコストが掛けられています。標準モデルよりも少しだけ高い性能が期待できますが、上位モデルに追いつくほどではありません。
GPUメモリ(VRAM)
GPUメモリについては最近重要度が増しているので別項目「GPUメモリ(VRAM)について深堀り」で詳しく解説しています。メモリクロック・メモリバス・メモリバス帯域幅などの数値も重要になります。メモリクロックはGPUメモリ自体のクロック周波数です。数値が高い方がより高速です。メモリバスは一度に送ることができるデータ量を表しています。メモリバス帯域幅は、GPUとメモリ間のデータ転送速度を示しています。メモリ帯域幅が速いほどGPUの演算処理が効率的になります。
L1/L2/L3キャッシュ
キャッシュはGPUとGPUメモリの仲介役です。キャッシュを活用することでより素早く必要なデータを取り出すことができます。数値が少ないキャッシュの方がGPUに近くそして容量は小さくなります。GPUはL1キャッシュ→L2キャッシュ→L3キャッシュ→GPUメモリと順にデータを探します。キャッシュにデータがあれば処理が高速になるということです。
消費電力(TDP/TBP/TGP)
TDP・TBP・TGPはそのグラフィックボードの消費電力を知る上で参考になります。メーカーによってTDPやTBPなど呼び名が異なっています。消費電力に合わせて電源ユニットを選択する必要があります。メーカーによって推奨電源が指定されていることもあります。また、エアフローを考えたPCケースの選択も重要です。例えば、ハイエンドのグラフィックボードを選択するなら本体内部のスペースが大きく、エアフローの確保がしやすいミドルタワーやフルタワーケースが好ましいです。