Synthesizer V
Synthesizer V(シンセサイザーブイ)は、Dreamtonics株式会社が開発した歌声合成ソフトウェアである。 概要UTAU用合成エンジン『Moresampler』の開発者Kanru Hua(華侃如)によって開発された歌声合成ソフトウェアであり、Moresamplerをベースに新たに設計し直された5番目のソフトウェアである。従来のサンプルベース歌声合成と人工知能による歌声合成のハイブリッド手法によるエンジンを搭載。これにより、サンプルベースのエンジンには見られない自然さと人工知能を使用しているがユーザーの介入が制限されているシンセサイザーでは見られない高度な制御性を両立している。言語表示は英語、日本語、韓国語、中国語に対応しており、Windows、macOS、Linux64bitに対応。また、MIDIファイルやvpr(VOCALOID5)、vsqx(VOCALOID3、4)、ust(UTAU)、ccs(CeVIO)、sk(Sharpkey)といった他社のファイルの読み込みも対応しているため、既存のデータでも歌わせることが可能。 エディターはブラウザで使用できるが機能が制限されている「Web Synthesizer V」、公式サイトからダウンロード、もしくは歌声データベースに付属しているが機能が制限されている「Synthesizer V Studio Basic」、有料だが機能制限のない「Synthesizer V Studio Pro」がある。 エンジンアップデートに合わせて既存AIライブラリも頻繁かつ複数アップデートされ合成品質が改善されていく点が特徴的である。この特徴は他の歌声合成ソフトウェアにはほぼ見られない(CeVIOも頻繁なアップデートを行うがほとんど機能追加や不具合修正に留まっており、合成品質そのものが変化するアップデートは少ない)。 歴史2018年8月19日に技術プレビュー版(ベータ版)が公開され、同年12月23日に第一世代(SVR1)の正式版が公開された。正式版は起動時10秒待てば無料で評価版として全ての機能が使えるシステムで、製品版のシリアルナンバーを購入することでそれを省略できるようになっていた。現在はシリアルナンバーは購入不能となっている。 2020年7月には第二世代となる「SVR2」にアップデート。ハイブリッドアプローチが更に突き詰められ、呼気音とささやき音をより澄んだものに改善するニューラルネットワークが導入されている。この世代よりパッケージ版の発売が開始された。 2020年12月にはAI歌唱合成に対応した「Synthesizer V AI」がアップデートの形でリリース。[1]楽譜データを入力することで、AIが自動で人間らしい歌声をシミュレーションして合成するようになった。 バージョン1.5.0(2021年12月23日)では収録言語にとらわれない多言語歌唱合成(全てのAIライブラリが日本語・中国語・英語を発声可能に)、1.6.0(2022年3月25日)からは声色を調整できるボーカルスタイル(各AIライブラリで実装スタイルは異なる)、簡易ピッチモードが実装。 1.7.0(2022年7月21日)ではAIリテイク(複数の発声パターンを合成し差し替える機能)、High Dynamics Voice Model(発声のランダムさ)が実装されたが、ユーザー間での1.7.0の合成品質の評判が悪く、1.7.1ではバージョン選択機能が実装され、ライブラリのバージョンを選択できるようになった。また、1.7.1b1リリースから正式版の配信前にベータ版が配布されるようになった。 1.8.0(2022年11月24日)からは、HDVMに代わってDiffusion Probabilistic Modelsベースの合成技術を導入し、合成品質が1.7.0以前以上のものに改善された。多言語歌唱合成機能も改良され、ノートごとの言語選択に対応した。また、Pro版に無料ライブラリとして「Mai」が付属するようになった。1.8.1(2023年2月16日)では男性歌声データベースの低音の出力が改良された。また、ボーカルスタイルをパラメータ化しなめらかに変化させられるようになったほか、パラメータパネルの表示が歌声パネルの設定を反映するようになり以前の表示より直感的なものとなった。 1.9.0(2023年6月21日)からは広東語での歌唱に対応。また、ピッチ調整に「ラップ」モードが追加され(英語・中国語のみ)、ラップボーカルを制作しやすくなった。また多言語歌唱合成がよりネイティブスピーカーに近い発音となるよう改良された。簡易ピッチモードは「歌唱」モードに変更されノートごとに適用できるようになったほか、パラメータが追加されピッチカーブを調整しやすくなった。ラップボーカル向けのライブラリとして「Ritchy」「D-Lin」の機能限定版が無料公開された。 1.10.0(2023年10月19日)からはRLHF(ヒューマンフィードバックによる強化学習)を導入し、人間によるフィールドバックを学習内容に反映する事でピッチ生成が強化された。また、ユーザーからもAIリテイクでのフィードバックを行えるようになり、今後のアップデートに反映される。また、日本語ラップに対応した。 1.11.0(2024年4月4日)からはARA2に対応し、ARA2対応DAWとの連携が強化され、スペイン語での歌唱に対応した。また、オーディオデータのボーカル音声からノート・ピッチ・歌詞を抽出するボーカルMIDI変換機能が実装された。 製品AnimenAnimenは台湾のエンターテイメント会社。バーチャル・シンガー専門ブランド「VOLOR」としてSynthesizer Vを販売している。同社のオンラインストアANiCUTEで販売されている他、日本でもゲンブのみAH-Softwareが販売を代行している。 なお、闇音レンリは無償ライブラリである。
AHSAHSはVOCALOIDやVOICEROIDを販売している日本のソフトウェア販売会社。Dreamtonics製Synthesizer Vの日本における販売も代行している。
DreamtonicsSynthesizer Vの開発元であるDreamtonics社による製品。他社製品と異なりいずれの製品もイメージキャラクターは設定されておらず、製品イメージとしてはSaki〜Kevinはアルファベット1文字、 默辰以降はアルファベット2文字のロゴマークが設定されている。 直近でリリースされた一部中国語製品を除くほとんどの製品は日本ではAH-Softwareが販売を代行しているほか、公式ストアからドル/ユーロ/人民元建てでの購入も可能。ただし、中国語製品は中国国内のリリースから遅れてリリースされる事があり、AHS経由での販売は更に遅れる。 なお、MaiはPro版ユーザー限定の無償ライブラリである。
ブシロードミュージックブシロードミュージックは日本のレコード会社。メディアミックスプロジェクト「BanG Dream!」のキャラクターをモデルとした「夢ノ結唱プロジェクト」としてCeVIO AIソングボイスを販売している。 CeVIOでは制作されていないPASTEL、HALOもSynthesizer Vでの制作を発表している。
インターネットインターネット(INTERNET)はVOCALOIDやDAW等を販売している日本のソフトウェア販売会社。
KAMITSUBAKI STUDIOKAMITSUBAKI STUDIO(神椿スタジオ)は日本のインディーズレーベル。「音楽的同位体プロジェクト」として所属アーティストの声を元にしたCeVIO AIソングボイスを販売している。
Studio ENTREStudio ENTREは日本のスタートアップスタジオ。アニメーション制作会社ゴンゾとのコラボレーション企画「GEMVOX」としてキャラクターごとに異なるエンジンでのAIシンガーの販売を予定している。
平行四界平行四界(Quadimension)は中国人による同人音楽プロジェクトで、かつてVOCALOIDで星塵を開発した。
Eclipsed Sounds
AUDIOLOGIE
VOICEMITH
ボイスライブラリ対応表
脚注
関連項目外部リンク |