NVIDIAが世界最大のAIスーパーコンピュータを支援し、xAIのColossusがAI新時代を加速

NVIDIAが世界最大のAIスーパーコンピュータを支援し、xAIのColossusがAI新時代を加速

最近、NVIDIAはxAIが構築した世界最大のAIスーパーコンピュータ「Colossus」クラスターが正式に稼働を開始したと発表しました。このスーパーコンピュータは、米国テネシー州メンフィスに位置し、10万台のNVIDIA Hopper GPUで構成されています。また、NVIDIA Spectrum-X™イーサネットネットワークプラットフォームによって、かつてない性能を実現しています。Colossusは、xAIのGrok大型言語モデルのトレーニングをサポートし、X Premiumユーザー向けにチャットボット体験を提供しています。

 

世界最大のAIコンピュータ構築への迅速な旅

通常、この規模のスーパーコンピュータシステムの構築には数ヶ月から数年かかることが一般的ですが、xAIとNVIDIAの協力により、Colossusはわずか122日で稼働を開始しました。最初のラックが設置されてからトレーニング開始まで、わずか19日で実現したことも注目に値します。さらにxAIは、Colossusを20万台のGPUに拡張し、かつてないAI計算システムを作り上げる計画を進めています。

 

卓越した性能を支えるNVIDIA Spectrum-Xの秘密

Colossusの圧倒的な性能の実現には、NVIDIA Spectrum-Xイーサネットネットワークプラットフォームが重要な役割を果たしています。このプラットフォームは標準イーサネットに基づき、多テナントの大規模AIファクトリーに優れたパフォーマンスを提供します。ネットワークのすべてのレイヤーで、Colossusはネットワーク混雑によるアプリケーションの遅延やデータパケットの損失をゼロに保ち、Spectrum-Xの混雑制御技術によって95%のデータスループットを達成しています。

通常のイーサネットでは、多くの流量衝突が発生し、スループットは60%程度にとどまりますが、Spectrum-Xプラットフォームの優れた制御技術がその限界を超え、Grokモデルのトレーニングにおける効率を飛躍的に向上させています。

 

Colossus:AIの限界を超えるトレーニングシステム

この強力なAIトレーニングシステムについて、NVIDIAのネットワーキング部門上級副社長であるギラッド・シャイナー氏は、「AIはミッションクリティカルな存在になりつつあり、性能、安全性、スケーラビリティ、コスト効率の向上が求められています」と述べました。NVIDIA Spectrum-Xプラットフォームはイノベーターのために設計されており、xAIチームにAIワークロードの処理と分析を迅速に行う力を与え、AIソリューションの開発、展開、そして市場投入までの時間を短縮しています。

Xプラットフォームでイーロン・マスク氏も「Colossusは世界最強のトレーニングシステムです」と称賛し、xAIチームやNVIDIA、そして多くのパートナーやサプライヤーの素晴らしい仕事ぶりを称えました。xAIのスポークスパーソンも「NVIDIAのHopper GPUとSpectrum-Xにより、我々は大規模なAIモデルトレーニングの限界を超え、イーサネット標準に基づいた超高速で最適化されたAIファクトリーを構築することができました」とコメントしています。

 

高効率ネットワークの中核技術:Spectrum SN5600スイッチとBlueField-3 SuperNIC

Spectrum-Xプラットフォームの中核を担うのは、Spectrum SN5600イーサネットスイッチで、最大800Gb/sのポート速度をサポートし、NVIDIA BlueField-3® SuperNICとともに使用され、前例のないパフォーマンスを実現しています。NVIDIA Direct Data Placement技術を用いた自適応ルーティングによって、InfiniBand並みの低遅延と短尾遅延を実現し、大規模AIモデルトレーニングにおける効率的な運用をサポートします。

これらの機能により、Spectrum-Xプラットフォームは多テナント生成AIクラウドおよび大規模企業環境に理想的な選択肢となっています。高い拡張性、低遅延、性能隔離といった特性により、AIトレーニングがより安全かつ効率的に行えるようになっています。

 

Colossus:AI進化の新たな時代を開く

Colossusスーパーコンピュータの稼働と拡張計画は、NVIDIAとxAIが技術革新の一歩を踏み出した証です。このシステムにより、AIトレーニングがこれまで以上に迅速に、低コストで実行できるようになり、安全性と安定性も確保されています。将来的にColossusのようなスーパーコンピュータがさらに増え、AI技術がますます進化していくことでしょう。NVIDIA Spectrum-Xプラットフォームは、グローバルAI産業にとって新たな基盤となり、効率の向上と無限の可能性を提供することになるでしょう。

オリジナル記事、著者:AIの番人,転載の際には、出典を明記してください:https://nipponai.jp/article/nvidia-xai-colossus/

(0)
AIの番人AIの番人
上一篇 2024-10-29 08:49
下一篇 2024-10-30 09:10

関連推薦