韓国DeepXのアクセラレーターチップ「DX-M1」シリーズの多くは、2〜5Wの消費電力範囲で25TOPS(INT8)の性能を発揮する(例外は13TOPSの「DX-M1M-L」)。同社の最も印象的なデモの一つは、推論実行中にチップ上にバターを直接載せ、バターが溶けないほど発熱しないことを実証したものである。
25TOPSの性能は、ドローンやロボット、その他のカメラシステムにおける姿勢推定や顔認識といったビジョンタスクには十分である。開発中の「DX-M2」は、エッジ環境で生成AIワークロードを実行できるようになるという。同社の技術的強みの一つは量子化方式で、FP32という元の精度に匹敵する精度で、INT8量子化ネットワークを実行可能だ。DeepXは自社技術をベースにしたチップ、モジュール/カード、マルチチップ構成のシ小型システムなどを、さまざまなエッジアプリケーション向けに販売している。
Syntiantの低消費電力エッジAIアクセラレーター「NDP250」は、同社のプロセッサと比較して5倍のテンソル処理スループットを実現している。コンピュータビジョン、音声認識、センサーデータ処理向けに設計されていて、マイクロワットという超低消費電力で動作できる。ただし、常時稼働のビジョン処理では、数十ミリワット程度の消費電力となる。
Syntiantの他の製品と同様に、同チップはSyntiantのAIアクセラレーターコア(30 GOPS[INT8])に加え、Arm Cortex-M0 MCUコアとオンチップTensilica HiFi 3 DSPを搭載している。オンチップメモリは最大600万ビットのパラメータを保存可能だ。NDP250のDSPはSyntiant製品では初めて浮動小数点演算をサポートする。同社は自動音声認識とテキスト読み上げモデルの両方を実行できる能力が、特に音声インタフェースに適しているとする。
NVIDIAの「Jetson Orin Nano」シリーズは、あらゆるエッジデバイスにおけるAI処理向けに設計され、特にロボティクス分野をターゲットとしている。「Ampere」世代のGPUモジュールで、LPDDR5メモリを8GBまたは4GB搭載する。8GB版は33TOPS(INT8, Dense)または17TFLOPS(FP16)の演算性能を発揮する。また、3つのパワーモード(消費電力)を備える。7W、15W、そして「Jetson Orin Nano Super」に新たに追加された25Wだ。25WモードではGPU、メモリ、CPUのクロックを向上させることで、メモリ帯域幅を15Wモードの65GB/秒から102GB/秒に拡大する。CPUは、Arm Cortex-A78AE 64ビットコアを6コア搭載。Jetson Orin Nanoは、ビジョントランスフォーマーや各種小型言語モデル(一般的にパラメータ数が70億未満)を含む、エッジ環境におけるマルチモーダルAIや生成AIに適しているとする。
【翻訳、編集:EDN Japan】
ファミコンにも採用された「MOS 6502」、その末路をたどる
万能のタイマーIC「LMC555」がまだ驚かせる、可変抵抗1個で4桁可変
先見の明が支えたMotorola「MC68000」 PowerPCの陰でロングセラーに
EDA大手3社、Intel「18A」向けツールでそろい踏み
そもそもDRAMって何?Copyright © ITmedia, Inc. All Rights Reserved.
記事ランキング