数兆パラメータを備えるAIモデルを、既存のGPUベースのシステムよりも高速かつ高効率で実行できるとして、ウエハースケール技術に期待が高まっている。米国カリフォルニア大学リバーサイド校(UCR)のエンジニアチームは、過熱や過度な電力消費なしで大量のデータ移動が可能な、フリスビーサイズの半導体チップを開発した。
ウエハースケール技術が再び注目を集めている。現在、数兆パラメータを備えるAIモデルを、既存のGPUベースのシステムよりも高速かつ高効率で実行可能になるとの期待が高まっている。米国カリフォルニア大学リバーサイド校(UCR)のエンジニアチームは、過熱や過度な電力消費なしで大量のデータ移動が可能な、フリスビーサイズの半導体チップを開発したと発表した。
同チームが「ウエハースケールアクセラレーター」と呼ぶこの大型チップは、Cerebrasがディナープレートサイズのシリコンウエハー上に製造した。このウエハースケールのプロセッサは、非常に高いエネルギー効率ではるかに優れたコンピューティング性能を提供できるという。これはAIモデルが引き続き大型化し、ますます要件が厳しくなっていることから、絶対不可欠な特徴だといえる。
ディナープレートサイズのシリコンウエハーは、切手サイズのGPUとは全く対照的だ。GPUは、画像や言語、データストリームを並列処理するような複数の計算タスクを実行でき、現在のAI設計において不可欠とされている。
しかし、UCRボーンズ・カレッジ・オブ・エンジニアリング(Bourns College of Engineering:BCOE)の電気/コンピュータ工学部の教授で、Device誌に掲載された論文の筆頭著者であるMihri Ozkan氏は「AIモデルの複雑性が増すにつれ、ハイエンドGPUでさえも性能/エネルギーの限界に達しつつある」と述べている。
同氏は「AIコンピューティングはもはや、速度だけの問題ではない。過熱を起こしたり過度に電力を消費したりせずに、大量のデータを移動できるシステムを設計する必要があるのだ。GPUは、交通量の多い高速道路に例えられる。効率的だが、渋滞が発生するとエネルギーを無駄にしてしまう。ウエハースケールのエンジンは、直接的かつ効率的で汚染も少ないことから、むしろモノレールに近いといえる」と付け加えた。
UCRのエンジニアチームが開発したCerebrasの「Wafer-Scale Engine 3(WSE-3)」は、単一ウエハー上に4兆トランジスタを集積し、90万個のAI専用コアを搭載する。さらに、Cerebrasによると、WSE-3システムの推論ワークロードの消費電力量は、同等のGPUベースのクラウドセットアップと比べて6分の1だという。
Teslaのウエハースケールアクセラレーターである「Dojo D1」も、1モジュール当たり1兆2500億トランジスタと約9000個のコアを搭載する。このようなウエハースケールチップは、データが複数の小型チップ間を移動する際に生じる性能ボトルネックを解消するために開発されている。
ただし、UCRのOzkan氏も認めているように、依然として熱の課題が残る。ウエハースケールチップは、熱設計電力が1万ワットに達することから、高度な冷却方式が必要だ。そこでCerebrasは、チップパッケージにグリコールベースのループを構築している。一方でTeslaは、チップ表面全体に均等に冷却液を送り込む冷却システムを採用しているという。
【翻訳:田中留美、編集:EDN Japan】
Copyright © ITmedia, Inc. All Rights Reserved.