「GPGPU」の可能性を探る：ゲームだけが用途じゃない！（4/5 ページ）

画像処理専用の演算ユニットとして活用されてきたGPU。これまで、その主たる用途として連想されるのは、コンピュータゲームであった。しかし、「その能力の高さを、ほかの用途にも活用できるのではないか」と考えるのは自然なことだ。この「GPGPU」の具現化 /実用化に向け、ICベンダー、EDAツールベンダーらは、どのような施策を進めているのだろうか。

[EDN] PC用表示関連情報

LINE

Hatena

前のページへ | 次のページへ

シミュレーションの高速化

　米ANSYS社と米Agilent Technologies社のEEsof部門も、GPUのサポートを発表している。両社は、シミュレーションの高速化を実現する目的でGPUを活用している。

■ANSYS社の例

写真1 「Tesla C2050」　ANSYS社は、「『C2050』など、NVIDIA社の『Tesla 20』シリーズの製品により、極めて高速なシミュレーションが行えるようになる」と述べている。

図1 「ANSYS 13.0」による解析の例　GPUをサポートする「ANSYS 13.0」には、新たな電磁界トランジェントソルバーが含まれている。ブロードバンド、レーダーなどのアプリケーションにおいて、時間の経過に伴って現れる電磁解の影響を評価する手段を技術者に提供してくれる。

　ANSYS社は、CUDAに基づくNVIDIA社のGPU「Tesla」をベースとした高性能コンピューティング手法を発表した（写真1）。 ANSYS社によると、「クワッドコアCPUとTeslaを利用した高性能コンピューティングによって、エンジニアリング系のシミュレーションの時間を、最大で、クワッドコアCPUのみの場合の半分に短縮することができる」という。ANSYS社は、機械シミュレーションツール、電気シミュレーションツールの両方でこの機能を披露している。

　ANSYS社は、構造/伝熱解析ツール「ANSYS Mechanical」でGPUによる高速化の効果を得たが、「有限要素解析（例えば、3次元電磁界解析ツールで使われる）など、類似の算術手法を用いるほかのシミュレーションにおける効果も、少なくとも同程度に高いはずだ」との見解も示している（図1）。

　これらの例を見てもわかるように、シミュレーションにおいて、GPUを利用することにより、数値解析の部分の高速化が図れる。ANSYS社の開発者らは、 Intel社のクワッドコア品「Xeon X5560」を搭載するホストマシンと、「Tesla 20」シリーズの「C2050」を使用するGPUカードによって行った評価の結果を論文としてまとめている。それに加えて、ANSYS社は、AMD社のGPUカードを同様の目的に使用した場合についての調査も行っている。

■Agilent社の例

　Agilent社のEEsof部門とNVIDIA社は、互いの技術を密に利用し合う関係にある。

　Agilent社は約3年前に、同社のシミュレーションツールにおけるGPUのサポートに取り組んでいると発表した。そのツールを、NVIDIA社は同社独自のIC設計フローにおいてシグナルインテグリティのシミュレーションに使用している。そして、Agilent社は、CUDAのアーキテクチャ向けに、同社の回路/デバイス/電磁界ツールの各種要素を対象としたGPUベースのアクセラレーション技術を提供している。

　Agilent社は、周波数領域においては、上述した技術を、高周波デジタルシステムにおけるバックプレーン、長い配線、コネクタなどに対するSPICEベースのシミュレーションに適用している。

　その一方で、同社は「時間領域のシミュレーションは、並列コンピューティング手法にさらに適している」との見解も示している。実際、扱う信号の波長よりも大きい物理的空間に対する有限差分解析の処理には、並列コンピューティングが適している。携帯電話端末のアンテナシステムや自動車内の放射電磁界がその例である。

　また、高速デジタル回路のプリント基板からのEMI（電磁干渉）の解析において、同様に良好な結果が得られたという例もある。この例の解析は、小さなセルから成る細かいメッシュモデルを必要とするものであった。GPUを利用することによって、シミュレーション速度が最大1桁向上したという。

　Agilent社のEEsofシグナルインテグリティ製品マネジャを務めるColin Warwick氏は、「SPICEの処理は、本質的に並列処理で扱うことができ、そのままGPUの配列に対応する」と述べている。プログラムの中に並列化が困難な部分と、どうしてもCPUで実行しなければならない部分があることを考慮しても、GPUを利用すれば、全体的な実行時間を1/5に短縮可能だという。アイダイアグラムを作成するために、膨大なビットデータがデジタルチャンネルを通過する様子を SPICEでシミュレーションするような場合には、この時間短縮の効果は非常に大きい。

　ほかの企業と同様に、Agilent社もCUDAアーキテクチャ向けに関連プログラムルーチンを開発している。また、ANSYS社の例と同様に、 Agilent社はクワッドコアのプロセッサと、8Gバイトまたは16Gバイトのメモリーを搭載したベースマシンを利用している。大規模な並列処理を実行する場合、GPUによる効果を維持するための鍵となるのは、十分な量のメモリーを用意することである。Warwick氏は、「初期のGPU製品には、この点において制約があった。しかし、現在のNVIDIA社製のカードは、同社の『Fermi』アーキテクチャを採用することによって、6Gバイトのメモリーを搭載することが可能になった」と述べる。つまり、4スロットのPCIeカードケージを使うことにより、24Gバイトのメモリーの利用が可能になる。しかもホストは、それを標準的なPCIeデバイスであると見なすため、広く利用されている低コストのハードウエアが使用できるという利点もある。

図2 3Dステレオビューワ　ADSの3Dステレオビューワ機能を使うと、伝導構造の各点における電流の方向と大きさを表す矢印と、遠方電磁界の放射パターンを表す半球状の部分が、画面から飛び出しているように見える。ADSは、グラフィックスアクセラレーションとしてNVIDIA社の GPUを利用している。

　Agilent社は、NVIDIA社のGPUを、同社の設計者が当初想定していた用途にも利用している。つまり、3次元を含む、高解像度のグラフィックス表示である。Agilent社のEDAプラットフォーム「ADS（Advanced Design System）」における3次元プレーナ電磁界シミュレータ「Momentum G2 Element」およびFEM（Finite Element Method：有限要素法）電磁界シミュレータは、3Dステレオビューワ機能を備えている（図2）。この3Dステレオビューワは、NVIDIA社のGPU「Quadro」とクワッドバッファステレオ技術である「3-D Vision」を利用して、高解像度の3Dによる電磁界/電流のレンダリングを行う。この機能を利用するには、「Quadro FX」を搭載したホストマシン、3-D Visionの立体メガネ、駆動周波数が120Hzの3-D Vision対応ディスプレイが必要となる。「3次元でシミュレーション結果を表示すると、2次元の画面では見落としがちな、電磁界における詳細部分や構造が明らかになる」とWarwick氏は述べている。

低消費電力化への対応

前のページへ | 次のページへ