2026.05.26 ソフトバンク、GPUクラウド提供 Infrinia AI Cloud OS搭載 10月開始、AI基盤を強化

 ソフトバンクは25日、ネオクラウド事業として、AI(人工知能)データセンター向けソフトウエアスタック「Infrinia AI Cloud OS」を搭載したクラウドサービス「AIデータセンター GPUクラウド」を2026年10月から提供すると発表した。提供に先立ち、同日からベータ版を展開し、ソフトバンクとグループ会社で利用を始める。

 新サービスは、マルチテナント環境に対応したKubernetes as a Service(KaaS)や、LLM(大規模言語モデル)の推論機能をAPIとして提供するInference as a Service(Inf-aaS)を利用できる「Infrinia AI Cloud OS」と、同社のAI計算基盤を組み合わせたクラウドサービス。国内のデータセンターに構築した「NVIDIA GB200 NVL72」など最新のGPU搭載AI計算基盤を活用する。

 日本国内で安全にデータを管理・運用しながら、AIモデルの学習から推論、データ処理まで幅広いAIワークロードを効率的かつ柔軟に実行できる。GPU管理やKubernetesによる運用、AIワークロードの実行などを一元管理・自動化し、開発環境の構築や計算資源の調整にかかる手間を省く。

 特長として、AI学習から推論まで幅広い用途に対応するGPU基盤を提供する。NVIDIA Blackwell GPU間をNVIDIA NVLinkで接続し、高性能ストレージと組み合わせることで、マルチテナント環境でもLLMの学習や複雑な推論処理に適した環境を実現する。

 KaaSでは、コンテナの一元管理や自動管理により、開発環境の構成変更、スケーリングなどの運用負荷を軽減する。Inf-aaSでは、Kubernetes上でのモデル推論基盤の構築・運用を自動化し、独自開発のAIモデルや任意のAIモデルを選ぶだけで、推論環境を迅速に利用できるようにする。

 同社は今後、通信基盤を生かしてAI時代の社会インフラを構築する「Telco AI Cloud」構想に基づき、「AIデータセンター GPUクラウド」と「AI-RAN」を統合する。AIの計算処理を学習から推論まで最適化し、低遅延・高信頼でソブリン性を備えた分散型AIインフラの構築を目指す。