最近、気になっていたアニメ風読み上げAI「にじボイス」を試してみました! APIがあって自分でも好きに音声生成できるのが面白かったので、簡単にレポートを残しておきます。
キャラクター数がとにかく多い
まず驚いたのはキャラクター数の多さ! イメージとしては、声優さんがそれぞれ違うキャラクターを演じている感じです。

無料分は5,000文字!追加は10,000文字ごとに¥825
APIでは初回に5,000文字分が無料で付いてきます。 追加分は10,000文字ごとに825円(税込)。 ざっくり言うと、Twitterで140文字を35回しゃべらせると5,000文字が一瞬で飛びます。
声質と抑揚がいい感じ
試しに「陽斗・エイデン・グリーンウッド」というキャラで喋らせてみましたが、声質はかなり自然。 「!」をつけると抑揚がちゃんとついて、思った以上に人間っぽい。
実際のAPIリクエスト例(curl)
公式ドキュメントに沿って、まずはcurlでテスト。
curl --request POST \
--url https://api.nijivoice.com/api/platform/v1/voice-actors/29cdf589-e581-4ab0-8467-0cd0c7ba640f/generate-voice \
--header 'accept: application/json' \
--header 'content-type: application/json' \
--header 'x-api-key: YOUR_API_KEY' \
--data '
{
"format": "mp3",
"script": "おおーっ!いい感じじゃん",
"speed": "0.8"
}
'
レスポンス例はこんな感じ。
{
"generatedVoice": {
"audioFileUrl": "https://storage.googleapis.com/***audio.mp3",
"audioFileDownloadUrl": "https://storage.googleapis.com/***audio.mp3",
"duration": 662,
"remainingCredits": 4977
}
}
生成スピードがとにかく速い。
生成された音声はGoogleストレージに保存されて、残りの文字数もちゃんと返してくれます。
ただ、テストで「おおー!いい感じじゃん」と喋らせようとしたら、curlではなぜか「あい」とだけ出力される謎の現象がありました(笑)。 もしかしてエンコードの問題?
Pythonで試したら安定した
念のためPythonの requests でも試したらこちらは問題なし。 生成も2〜3秒で終わるので、ほぼリアルタイムで使えそう。
import requests
url = "https://api.nijivoice.com/api/platform/v1/voice-actors/29cdf589-e581-4ab0-8467-0cd0c7ba640f/generate-voice"
payload = {
"format": "mp3",
"script": "おおーっ!いい感じじゃん!",
"speed": "0.8"
}
headers = {
"accept": "application/json",
"content-type": "application/json",
"x-api-key": "YOUR_API_KEY"
}
response = requests.post(url, json=payload, headers=headers)
print(response.text)
実際に出力された音声
テストで生成した音声を共有します👇
カラオケbotにも使えそう
ちなみにテストで「ビブラートのかけ方とか意識してみるといいんじゃね?」(59文字)を喋らせたところ、こちらも2〜3秒で即出力されました。
カラオケ1曲ごとに50文字くらい感想を喋らせると仮定すると…
1曲5分 × 100曲 → 8時間のカラオケでだいたい5,000文字
追加分は10,000文字で825円 → 1回あたり約400円
ちょっとした交際費と思えば全然アリ! リアルタイムで声をかけてくれるカラオケbotとか作ったら楽しそうです。
まとめ
にじボイス、APIの手軽さと生成速度がとても良い感じ。 キャラの数も多くて抑揚も自然なので、会話botやカラオケの相棒にしてみたい人はぜひ試してみてください!