NEUTRINO – NEURAL SINGING SYNTHESIZER へようこそ

NEUTRINO – NEURAL SINGING SYNTHESIZER へようこそ

NEUTRINO – NEURAL SINGING SYNTHESIZER をダウンロードいただきありがとうございます。
この記事ではインストール方法や使い方などを説明します。
※下記内容はNEUTRINO本体付属のREADME.txtにも記載されております。そちらも併せてご覧ください。

About

NEUTRINO – NEURAL SINGING SYNTHESIZER はニューラルネットワークを用いた歌声シンセサイザーです。
本ソフトウェアはフリーウェアです。
楽譜から発声タイミング・音の高さ・声質・声のかすれ具合などをニューラルネットワークで推定します。上記の推定されたパラメータを元にvocoderで音声を合成します。
本ソフトの名称はまだ聞いたことのないような楽曲・ジャンルを開拓してほしいという思いを込めて名付けました。あなたの創作・発見の一助になれれば幸いです。

2022年8月現在、1名の歌声ライブラリ(めろう(Merrow))が同梱されています。
その他の歌声ライブラリに関しては、 別途歌声ライブラリフォルダよりダウンロード・解凍・コピーを行ってください。
制作した音声ファイルについては、各歌声ライブラリの利用規約の範囲でご利用ください。詳細はmodelフォルダ以下の各歌声ライブラリ付属のLICENSEファイルをご覧ください。

より詳細な内容、テクニック、エディタの情報など、こちらに分かりやすくまとまっております。もしよろしければご覧ください。
AI歌声合成ソフト「NEUTRINO」の使い方 2020秋
AIシンガー調声アイデア NEUTRINOで使えるテクニック
NEUTRINO用Editorが来た! マジ最強なので使い方解説する

インストール

任意のフォルダにダウンロードしたファイルを解凍してください。
Run.bat(またはRun.sh)をダブルクリックで実行後、サンプルの音声ファイル(sample1_syn.wav)がoutputフォルダ以下に出力されていれば正常に動作しています。
アンインストールの際はフォルダ毎削除してください。

オンライン版のセットアップ手順はこちらの記事をご覧ください。
Linuxでのセットアップ手順はこちらの記事をご覧ください。

下記のリンクより過去バージョンを含む全てのバージョンをダウンロードできます。
NEUTRINO 各Version置き場

各モジュールについて

musicXML_to_label

Input  : score/musicxml/*.musicxml
Output : label/full/*.lab
       : label/mono/*.lab

MusicXMLをニューラルネットワークの入力に用いるlabel形式に変換します。
楽譜作成にはMuseScoreを推奨しています。 [ファイル]->[エクスポート]でファイルの種類を非圧縮MusicXMLファイルにすることでMusicXML形式のファイルを出力できます。
他のソフトでは出力が”*.xml”になるので、Run.batのSUFFIXをxmlに変更してください。

NEUTRINO

# predict timing 
Input  : label/full/*.lab
       : model/MERROW/*.bin
Output : label/timing/*.lab

# predict acoustic feature 
Input  : label/full/*.lab
       : label/timing/*.lab
       : model/KIRITAN/*.bin
Output : output/*.f0, *.mgc, *.bap

labelから発声タイミングと音の高さ・声質・声のかすれ具合を推定します。
ModelDirで歌声ライブラリを変更することができます。(MERROW or NAKUMO or SEVENなど)
NumThreadsで使用するプロセッサ数を変更できます。

StyleShiftで楽譜全体をNキー上げて打ち込み、ピッチ変更機能でNキー分下げるような処理を行うことができます。
Run.batの”StyleShift”という項目を-5~5ぐらいの値に設定してお試しください。
例えば、”2″に設定すると2個上のキーの歌い方、”-2″にすると2個下のキーの歌い方になります。
上手く使うことで、得意な音域の歌い方にしたり、低いキーの落ち着いた歌い方を出すことができます。

WORLD

Input  : output/*.f0, *.mgc, *.bap
Output : output/*.wav

音の高さ・声質・声のかすれ具合から音声波形をボコーダー(WORLD)で合成します。
NumThreadsで使用するプロセッサ数を変更できます。
PitchShiftで音高を変えられます。
FormantShiftで声質を変えられます。上げると子供っぽく、下げると大人っぽくなります。(0.85-1.15辺りがお勧めです。)

※こちらはβ版のオプションとなります。
SmoothPitchでピッチを滑らかにできます。0~100[%]の間で強さを設定できます。
SmoothFormantでフォルマントを滑らかにできます。0~100[%]の間で強さを設定できます。
EnhanceBreathinessで息成分を強くすることができます。0~100[%]の間で強さを設定できます。
声に色々な変化を加えられる一方で、アタックが弱くなったりノイズが大きくなる場合がございます。
歌声ライブラリによって掛かり方も異なりますので、適宜調整してください。

NSF

Input  : output/*.f0, *.mgc, *.bap
	 model/MERROW/model_nsf.bin
Output : output/*.wav

音の高さ・声質・声のかすれ具合から音声波形をニューラルネット(NSF)で合成します。
NSFはニューラルネットワークを用いて肉声に近い高品質な音声波形を高速に生成する手法の一つです。低音の詰まった感じ(over-smoothing)が無く、クリアでアタック感がある音声です。
適正音域であれば、音質的な外れがほぼ無く品質も安定して高いです。

一方でWORLDはピッチシフト・フォルマントシフトなどの加工に強く、適正音域から大きく外れた音声にも強いです。 どちらも一長一短ありますので、適宜使い分けていただければ幸いです。

(下記はWindows版のみの設定)
デフォルトではCPUで合成処理が行われます。
GPUを使用する場合は”set UseGpu=false”の部分を”set UseGpu=true”と変更してください。
複数枚のGPUが搭載されている場合、”GpuId”の値を変更することで使用するGPUを選択することができます。

使い方(Windows版)

  1. 楽譜(MusicXML)の作成
    MuseScoreなどの楽譜作成ソフトでxxx.musicxmlを作成
    score/musicxml以下に配置
  2. 設定の編集
    Run.batをメモ帳で開く
    BASENAMEを作成したmusicxmlの名前に変更
  3. コマンドプロンプトを現在のフォルダで起動
    エクスプローラのアドレスバーに「cmd」と入力してEnter
    ※参考リンク
    『コマンドプロンプトを素早く起動する方法』(『現在開いているフォルダから直接開く方法』の項目をご参照ください)
  4. Run.batを実行
    コマンドプロンプト上で”Run.bat”と入力
    output以下に音声ファイルが出力されます。
    logを出力する場合は、”Run.bat > log.txt”などと入力してください。

推奨動作環境

動作環境Windows 10 / 11
MacOS (Apple Silicon / Intel)
オンライン (Google Colab)
Linux (Ubuntu)
CPUIntel Core i5
AMD RYZEN 5
Apple M1
GPU(オプション)NVIDIA製のGPU(6GB以上のGPUメモリを推奨)
メモリ8GB 以上
ディスク空き容量10GB 以上の空き容量

備考

Windows版の一部機能(GPUによる高速レンダリング)をご利用いただくには【NVIDIA製のGPU(6GB以上のGPUメモリを推奨)】が必要です。ご利用の前にNVIDIAのドライバーを最新のものへアップデートをしてください。
※参考:アップデート方法はこちら

オンライン版ではNEUTRINOの全機能をご利用いただけます。ウェブブラウザ上で動作が完結するため、 NVIDIA製のGPUも不要でスマートフォンからでも動作します。
オンライン版のセットアップ手順はこちらの記事をご覧ください。

その他詳細は下記記事をご覧ください。
NEUTRINO – Electron v1.x系アップデート
使用可能な文字一覧
MusicXMLについて
NEUTRINO 各Version置き場

よくある質問

・NEUTRINOが動作しない、ボーカルの生成ができない
NEUTRINOのエンジンのアップデート・高速化に伴い、一部のCPU / GPUが動作対象外となりました。

  • CPU: Intel第11世代以前のPentium・Celeronシリーズ及び、Intel第三世代以前のCoreシリーズ
  • GPU: 一部のGTX700シリーズ及び、GTX600シリーズ以前のGeForceシリーズ

もし対象のCPU・GPUをお使いの場合は、旧バージョン(v.0.551)もしくはオンライン版のご利用もご検討ください。

・musicxml to label.exeのログに「未定義の歌詞があります」というようなエラーが表示される
こちらのエラーが表示されている場合、「ひらがな・カタカナ以外の歌詞が入力されている音符」、もしくは「何も歌詞が入力されていない音符」が楽譜中にあります。
「未定義の歌詞があります」というエラー表示の箇所に小節番号(もしくはin measure 13など)が併記されておりますので、該当個所をご確認ください。

ロゴ・アイコンについて

ロゴは設定資料のページよりダウンロードできます。
基本的にはブラックまたはホワイトの複製でご利用ください。カラーの背景や画像、イラストにロゴをのせることは可能です。複雑な背景にロゴを入れる場合、ロゴ全体がはっきりと読めるようにしてください。

お願い

感想や要望、バグなどございましたらお問い合わせフォーム・メール・Twitterからお願いいたします。

ご支援

もしよろしければこちらからご支援よろしくお願いいたします。
いただいた支援金は、活動費・機器購入費・収録関連費に充てさせていただきます。
PIXIV FANBOX : https://shachi-neutrino.fanbox.cc/

謝辞

本ソフトウェアの制作にあたり、素晴らしいソフトウェア・データベースをご提供いただきました方々に感謝します。そして、テストやデザインなどご協力ご助言いただきました皆様に心から感謝します。本当にありがとうございました。