PR

「持続可能なAI」への挑戦:FuriosaAIのRNGD NPUが拓く、省電力・高性能AIの未来

スポンサーリンク
AI・先端技術

「持続可能なAI」への挑戦:FuriosaAIのRNGD NPUが拓く、省電力・高性能AIの未来

近年、AI技術の発展は目覚ましく、私たちの生活やビジネスに不可欠な存在となりつつあります。しかし、その裏側でAIデータセンターが消費する膨大な電力は、環境負荷や運用コストという大きな課題として浮上しています。この問題に真正面から挑むのが、AI半導体技術企業のFuriosaAIです。彼らがNeurIPS 2025で披露したRNGD NPUは、「持続可能なAI」を実現するための画期的なソリューションとして注目を集めています。

NeurIPS 2025で示されたAIの未来と課題

2025年12月2日から7日にかけて米国サンディエゴで開催されたNeurIPS(Neural Information Processing Systems Conference)は、神経ネットワークおよび人工知能分野において世界最大規模かつ最も権威ある学術イベントの一つです。Google Scholarのコンピュータサイエンス/AI分野でNatureやScienceと同等の影響力を持つこの会議では、毎年、AIの未来を形作る画期的な論文が発表されてきました。AlexNet、Word2Vec、そしてTransformerモデルといった基盤技術も、NeurIPSでその産声を上げています。

今年のNeurIPSにおける主要キーワードは、段階的思考を行う推論能力、クラウド接続なしで動作するオンデバイスAI、そしてAI倫理に関わる安全性とアライメントでした。そして、これらの技術進化の影で、特に活発な議論が交わされたのが「持続可能なAI演算」です。AIモデルの構築過程における気候的利益とコストの議論、データセンターの持続可能性向上、炭素排出量削減を目的としたワークロード分散など、AIのあり方そのものを見直す研究が数多く発表されました。結論として、AI構築に必要な電力消費をいかに効率化するかが焦点となり、その中核にAI半導体の効率向上が位置づけられています。

AI半導体の現状と電力消費のジレンマ

FuriosaAIの最高研究責任者(CRO)であるカン・ジフン氏は、NeurIPSの「シルバー・パビリオン」で「シリコンからモデルまでのAI効率最適化(Optimizing AI Efficiency from Silicon to Model)」をテーマにスポットライト発表を行いました。カンCROは、データセンターが処理できるデータ量と電力消費量には強い相関関係があると指摘し、ハイパースケーラーやAIデータセンター運営企業が発電所への投資を検討するほど、電力消費が喫緊の課題であることを強調しました。

「同じ電力消費でより多くの処理を行えるようにすることが業界全体の課題だ」とカンCROは述べ、既存のAI半導体であるGPUとシストリックアレイが抱えるジレンマを解説しました。

GPUの強みと課題

GPUは、複数のメモリ階層構造を持ち、柔軟なデータフローを提供します。グローバルメモリからローカルメモリへの移動など、多様な処理に適している点が強みです。この特性から、AIモデルの学習には有利ですが、推論用途では投入コストに対する効率が相対的に低いという課題があります。データ移動の自由度が高い一方で、追加の実行時間と消費電力が必要となるため、電力効率の観点からは最適とは言えません。

シストリックアレイの強みと課題

一方、Google TPUやAWS Trainiumに代表されるシストリックアレイ方式は、特定用途向けに設計された専用半導体です。データフローが固定されている点が特徴で、個々の演算効率は高いものの、行列積など特定の演算に用途が限定されます。企業の用途に合わせて設計されることが多いため、汎用性には欠け、特定の企業で大規模に採用されるケースが中心となります。

FuriosaAIのRNGD NPU:電力効率と柔軟性を両立する新世代AI半導体

FuriosaAIのRNGDは、テンソル縮約プロセッサ(TCP)を通じて、GPUとシストリックアレイの間に位置するバランスの取れたソリューションを提供します。

SRAMとSystolic Array、TCPのデータ処理フロー

カンCROは、TCPではSRAMが複数のスライスに分割され、それぞれのスライスからデータが抽出される形でルーティングされると説明しました。従来のシストリックアレイが一方向のデータフローを前提とするのに対し、RNGDはデータフローの方向を構成できるのが大きな特徴です。SRAMを複数スライス単位で管理し、データを順次送るだけでなく、2枚から最大8枚まで同時に分配できます。これにより、従来のシストリックアレイが固定サイズの行列しか処理できなかったのに対し、RNGDは任意サイズの行列演算を分割処理することで、ハードウェア資源を最大限活用できます。

さらに、RNGDのデータフローは処理効率の向上だけでなく、ソフトウェア管理の面でも優れています。PyTorchで実行される高水準かつ集約的な演算をアーキテクチャに直接マッピングでき、成果を確認しやすいとのことです。結果としてFuriosaAIは、LLMサービスを含む独自構築のソフトウェアスタックを提供しています。

Furiosa SW Stackのソフトウェアアーキテクチャ

導入後のメリットとスタートアップが学ぶべきこと

RNGD NPUの導入は、AIを扱う多くの企業、特に電力効率とコスト削減に課題を抱えるデータセンター運営企業やスタートアップにとって、大きなメリットをもたらします。

導入のメリット

    • 圧倒的な電力効率によるコスト削減: カンCROは、RNGDが15kWラックを基準に、NVIDIA H100システムより3.5倍多くのトークンを生成できると述べました。これは、同じ電力消費でより多くのAI推論処理が可能になることを意味し、データセンターの運用コストを大幅に削減し、外注費削減にも寄与します。

    • 性能向上と競争力強化: 電力効率の向上は、データセンターの電力密度をさらに引き上げ、より高性能なAI演算を可能にします。これにより、AIサービスの応答速度向上や、より複雑なモデルの効率的な実行が実現し、企業の競争力強化につながります。

    • 柔軟な開発環境: RNGDはクラウド環境での効率的な管理と配備を想定し、Kubernetesをサポートしています。また、低レベルアクセスAPIを提供することで、専門開発者が独自に最適化されたコンパイラやシステムを構築できるため、開発の自由度が高まり、生産性向上に貢献します。

RNGDとGPUのラックレベル性能比較

導入における考慮事項(デメリット・課題)

RNGDは非常に有望な技術ですが、新しい技術の導入には常にいくつかの考慮事項が伴います。

    • 初期導入コスト: 新しいハードウェアへの移行には、当然ながら初期投資が必要となります。長期的な運用コスト削減効果を考慮した上での投資判断が重要です。

    • 技術習熟期間: 既存のGPUベースのシステムからRNGD NPUへの移行には、エンジニアの新しいアーキテクチャやソフトウェアスタックへの習熟期間が必要となる可能性があります。しかし、FuriosaAIが提供する独自のソフトウェアスタックやKubernetesサポートは、このハードルを下げる手助けとなるでしょう。

    • 具体的な導入事例の蓄積: 量産が来年1月から始まるため、大規模な導入成功事例はこれから蓄積されていく段階です。先行導入企業の声やベンチマーク結果を注視することが大切です。

スタートアップがRNGDから学べること

AI分野のスタートアップにとって、FuriosaAIのRNGD NPUの登場は多くの示唆を与えます。

  • 「持続可能なAI」への早期対応: AIの倫理的側面や環境負荷は、今後ますます重要になるテーマです。RNGDのような省電力AI半導体は、このトレンドに早期に対応し、企業イメージ向上や新たなビジネスチャンス創出に繋がります。
  • 既存の課題解決に特化した独自アプローチ: GPUとシストリックアレイの「中間」を狙うというRNGDのアプローチは、既存技術の限界を深く分析し、そこに独自の技術で切り込むことの重要性を示しています。ニッチな課題でも、それを解決する革新的な技術は大きな市場を切り開く可能性を秘めています。
  • ハードウェアとソフトウェアの統合: RNGDは単なる半導体ではなく、その上で動作するソフトウェアスタック全体で効率を最適化しています。ハードウェアとソフトウェアの両面からユーザー体験を設計し、エンドツーエンドのソリューションを提供することの価値を教えてくれます。

まとめ:RNGDが描く「持続可能なAI」の未来

FuriosaAIのRNGD NPUは、AIデータセンターが抱える電力消費という根深い課題に対し、具体的な解決策を提示するものです。来年1月からの本格量産が始まれば、韓国のみならず世界各国のAIデータセンターに導入され、炭素排出削減とAI推論効率の向上の両立に大きく貢献するでしょう。「持続可能なAI演算」というテーマへの関心が高まるほど、RNGDのような高効率AI半導体への注目度も一段と高まると考えられます。

AIの導入を検討している、あるいは既存のAIインフラの課題に直面している企業にとって、RNGDは「もっと効率的に、もっと持続可能に」という願いを叶える強力な選択肢となるはずです。電力コストの削減、処理性能の向上、そして環境への配慮。これら全てを実現することで、あなたのビジネスを次のステージへと押し上げるきっかけとなるでしょう。


プレスリリース配信日: 2025年12月25日

タイトルとURLをコピーしました