2026.02.26 さくらインターネット、「さくらのAI Engine」にTTS API VOICEVOX対応し音声AI処理を国内基盤で完結

 さくらインターネットは25日、生成AI(人工知能)の推論機能をAPI形式で提供する「さくらのAI Engine」で、「音声合成(TTS)API」の提供を開始したと発表した。実行エンジンにオープンソースの音声合成(TTS)ソフトウエアVOICEVOXを採用し、音声入力・会話生成・音声合成までの一連処理を国内基盤上で完結できる環境を整備した。

 音声合成(TTS)APIは、テキストから自然な日本語音声を生成する機能をクラウド経由で提供。開発者や企業は、自社のアプリケーションやサービスに音声合成機能を容易に組み込める。コールセンターの一次応対自動化、対話型サービス、各種デジタルコンテンツなどでの活用を見込む。

 VOICEVOXの音声モデルを第一弾として利用可能にしたのが特徴。表現力の高い音声生成に対応するとともに、国内基盤で処理を完結できるため、データ管理や運用面での安心性を訴求する。今回のTTS 追加により、同基盤上で音声入力・会話生成・音声合成までを一貫して構築できるようになった。