Moresampler 0.7.1

二ヶ月ぶりの再開。

本家
Bowlroll

呼びかけとなりますが、「よくわからない」から、反応せず古いバージョンとか使うのは開発側もユーザー側も損になりますので、ぜひコメントとか、ツイッターとか、メールでも、連絡してくれるとありがたい。

現状よく問題されてるのはResampler Wrapperとの連携がうまくできないこと、それだとWAV互換機能の有効(LLSMの他にwavも書き出す)と内蔵の合成加速機能を無効化(マルチスレッド化をオフ)が必要。

使用するにはmoreconfig.txtのなかで
 resampler-compatibility on(デフォルトはoff)
 multithread-synthesis off (デフォルトはon)
にする必要があります。

Moresampler単体運用だと、加速機能内蔵のため、Resampler Wrapper必要ありません。

==
以下、本バージョンの変更点。

0.7.1 (2016年8月22日)
* 本バージョンは一部の数学演算関連機能を再構成しました
* 問題修正:辺界連結時たまに雑音が発生する問題
* 問題修正:Mrフラグがマイナスの場合で爆音が発生する問題
* 問題修正:uフラグ使用時ノートの偏移量の誤り
* 機能改善:テクスト-スピーチ辺界識別モデルの設定を改善。oto生成精度が高まれる。
* 機能改善:uフラグ使用時非正規化数を使用すると合成速度が大幅(1000%)に低下する問題を回避
* 新機能:oto生成機能においてローマ字が使用可能となりました

原文:

0.7.1 (Aug. 22, 2016)

* This version has undergone some code refactoring on math-related functions.
* Bug fix: occasional glitches at concatenation boundaries.
* Bug fix: pops caused by setting Mr flag to a negative value.
* Bug fix: wrong offset of notes with 'u' flag enabled.
* Improved feature: retrained the text-speech alignment model with better configuration. Oto generation accuracy has been improved.
* Improved feature: avoid denormal floating point numbers which may slow down synthesis by 1000% when 'u' flag is on.
* New feature: oto generation mode now supports romaji voicebanks.


Moresampler 0.7.0

Resampler から、更なる先へ....


全機能内蔵解決しました。もう迷わない。

Moresampler 0.7.0
- 公式
- BowlRoll

0.7.0 (2016年 6月7日)

* 改良:Mtフラグの効果(シャープさ、緊張さ)を改良した。
* 改良:Wavtoolモードにおけるノート辺界で時々生むグリッチ音を低減
* 新機能:音源フォルダーをMoresampler.exeにドラッグアンドドロップして、原音を分析して自動的oto.iniを生成する。
本機能は実験性的であり、またまた改良が必要。
現状は「連続的発話した」「日本語」「ひらかな/カタカナのファイル名」の原音がサポートされます。
サブフォルダはサポートされおりません。フォルダーの中に .wavを置いてください。
現状サポートされたのは連続音(VCV)スタイルだけ。使う前に元のoto.iniを別途バックアップしてく下さい。

* 新機能:Mr フラグ, 「シンガーのフォルマント」を3KHzのところで生成します。
範囲は[-100, 100](負は位相反転)、整数、デフォルト値0。
* 新機能: Moresamplerは .aiff/.aifファイルの入力をサポートしました。

* 設定可能新機能

meta-flag-1/2/3/4 ....
この機能はカスタマイズするフラグを作れます。
複数のフラグを一つのメタフラグへ組み合わせられます。入力の労力低減につなげるかと。
メタフラグはM+数字、M1、M2などで有効します。
うしろに.と数字をつけると、%として有効範囲を調整します。(元フラグの最大値に制限される)
例:
meta-flag-1 MG50MD30MC20Mb30Mt50
ノートで「eMo20M1.50」を入力する場合、eMo20MG25MD15MC10Mb15Mt25と等価します。
(メタフラグの効果は50%にしました)

analysis-suppress-subharmonics on/off
有効すると、自動的低調波を入力音声から取り除く(存在していた場合)。
叫び声ではありがちな気音成分が損なわれた部分に対して有効かと。

====

0.7.0 (Jun. 7, 2016)
* Improved feature: the effect of 'Mt' flag is improved on sharp/intense voices.
* Improved feature: prevent glitches at note boundaries introduced in wavtool mode.
* New feature: drag a voicebank folder onto moresampler.exe to automatically analyze the audio and generate oto.ini.
This is an experimental feature which still has lots of things to improve. Currently only continuous-speech Japanese voicebanks with filenames written in Hiragana and/or Katakana are supported. The folder shouldcontain .wav files and those in the subfolders won't be loaded. The output is VCV-style oto.ini. Please backup the oto.ini file before using this feature.
* New feature: added 'Mr' flag which creates a "singer's formant" around 3kHz.
Range: [-100, 100], real number; default: 0.
* New feature: Moresampler now supports .aiff/.aif files as input.
* New configuration & feature:
meta-flag-1/2/3/4/... This feature allows customization of flags. Multiple flags can be combined into one meta flag which saves effort when typing flag sequences in UTAU's note settings panel. Meta flags are activatived in the format M+number (e.g. M1, M2, M3). By putting dot and a number after a meta flag, the effectiveness can be scaled by the number (as long as the result of scaling is still within the allowed range of each flag). For example, the following configuration
meta-flag-1 MG50MD30MC20Mb30Mt50
and flag sequence 'eMo20M1.50' expands to 'eMo20MG25MD15MC10Mb15Mt25'.

analysis-suppress-subharmonics on/off

When set to "on", automatically remove the subharmonics (if there are any) from input speech during analysis. This might be helpful for screamy voices but slightly degrades the quality of breathy voices.


Moresampler 0.6.4

まずは謝罪ですが、結局DLL内蔵は失敗したので、0.6.4でもMoresampler32にvcomp140d.dll、Moresampler64にvcomp140.dllを一緒にコピーする必要があります。
なんか難しいとか思うと、引き続き-legacyの方を使うことにオススメします。

公式

Bowlrollでミラー




更新履歴:
0.6.4 (2016年5月)
* 問題修正: "load-frq on/strict"のオプションでよくクラッシュしてしまう問題
* 問題修正: ライブラリーの呼び出しの仕方でピッチ推定性能が悪化してしまう問題
* 問題修正: デフォルトのwavtoolに"$direct=true"と"u"フラグの出力結果が一致しない問題

0.6.4 (May. 5, 2016)
* Bug fix: occasional crashes with "load-frq on/strict" option.
* Bug fix: pitch estimation errors caused by an improper library call.
* Bug fix: "$direct=true" and 'u' flag give results inconsistent with the default
wavtool.


Moresampler ができること(0.6.3準拠)

Moresamplerが出来るのは

1. wavtoolも兼ねることで、原理的位相最適化を自動的行う。
2. moreconfig.txtの設定で
*「44100Hz~192000Hz、8/16/24/32bit」の出力選択が可能
*全域伸縮もしくはループを強制(通常はオート、ノートにあるフラグが優先)
*同時にWAVも出力出来るが、他所のWAVTOOLの性能を超える場合も
*ログファイルを有効して、問題箇所を探せる(この場合開発元に送ろうね)
*分析機能を最適化して、困難な原音を挑める(玄人向け、ここでは無視する)
**例えば音源の中のフォルダーごとにmoreconfig.txtを置いてそれぞれ最適化する高等技術も

3.多彩なフラグ

やっていたうちにMoresamplerのフラグ群はしばらくResamplerの中に一番多彩となった、だと自負してます。

現在サポートしていたのは以下のフラグ:

>既存互換フラグ:g,t,P、A、b、e
gフラグ:レンジは-100~100、デフォルト0、+で男性/オトナ的、-で女性/ロリっぽく
tフラグ:レンジは-1200~1200、デフォルト0、音程微調整、1=半音の1/100
Pフラグ:レンジは0~100、デフォルト86、ピークコンプレサー、本家Resampler.exe準拠
Aフラグ:レンジは-100~100、デフォルト0、音量モジュレーション。リアルなビブラート作成に有用
bフラグ:レンジは-20~100、デフォルト0、無声音成分を強調/低減する
eフラグ:強制伸縮フラグ、(なお、Meと:eの場合が強制ループ。)

>Moresampler 拡張独自フラグ。二文字、Me以外使い所は音作りに集中する。
>Mt、Mb、Mo、Md、Ms、Mm、ME、Me
Mt:緊張感の有る/なしの声に。レンジは-100~100
Mb:息成分を増減する。100にするとウィスキーボイスに。レンジは-100~100
Mo:発音時の口開け具合を増減する。レンジは-100~100
Md:ドライさ、このフラグの効果はかなり微妙で。高周波(6KHz帯域)の方が使えられそう。
Ms:安定感。レンジは0~10。デフォルトは0
ノートの出音がちょっとした雑音のある場合は増やして安定させることが可能。**機能自体はanalysis-anti-distortionと一緒なので、雑音が頻発する場合moreconfig.txtでこの項目を有効するのも手です。
Mm:旧来の発音モデルと行き渡りする。0.3.0以前で使用されたモデルとそれ以降で使用された最新のモデルの間で補間する。レンジは0~100、デフォルトは100。
ME:フォルマントを強調する。マイナスすると声がボケる。レンジは0~100、デフォルトは0。
Me:強制ループフラグ。前述通り。

なお、本家サイトにサンプル音声が上げられるためオススメです。


Moresampler mrq関連

アップデート重ねたら、Moresamplerが現在もっとも豐富な機能群、フラグ群を提供していたが、逆に言うと一番わかり辛くなっていたかも知れない。

どうしてこうなったというと、高音質の「可能性を求めて」導入した構造が、ヒイキでもあるから良くなるも悪くなるもある。今まで他のUTAU向けResamplerで多少にいい加減な設定で行けるのも、Moresamplerでは行けなくなって、雑音とか、クラッシュとか、わかりやすい不具合として出てしまう。

よって、いわゆる周波数表、Resampler向けのfrqと相当するmrqファイルは、Moresamplerでは極めて重要となります。出音に問題があればまずこちらを疑え。

幸い、周波数表自体長い間頼れるツール、Frqeditorがすでに存在してますが、mrqも対応してもらっていた。
Frqeditorで選べる手法は、「すでに手作りで、問題ないと考えていた周波数表」があるかどうかで分岐する。

ここで闇音レンリさんを借りて説明しよう。

これは「表示→スペクトラムスペクトラムを表示」を有効して、Mrqが未作成の場合です。
「ツール→オプション→合成エンジン」では、すでにMoresamplerが選ばられて、mrqを編集する予定でした。


眺めると、レンリさんは周波数表としてfrqすでに同時に配布したようです。
「ツール→オプション→合成エンジン」をResampler.exeに変更すると、以下のようになります。
明るい原音のスペクトラムに、音階を表する赤い水平線と、有声音(濁音)を表する青い線が描いてる。
一部青い線が暗い部分まではみ出してますが、この場合問題ありません。
(ここでの意味は「無声箇所を有声音(清音)へ誤認する」が、そもそも周期成分なかったので無声のままとなります)

1. 既存FRQは問題ないと判断する場合、コピーする。
編集→周波数表を変換

とこの画面に

FRQからMRQへ変換出力されます。

で、これは「必ずも問題ない」というわけではなく、そもそも周波数表自体作っていなかった場合、Resamplerが生成したFRQをそのまま入っていたやつをMoresamplerに食わせると普通に暴走するから確認をしてねー


2. 自力で分析させる
元々Moresamplerは精度辺り他を上回ってるし、上位ライブラリーも試してますので、自力で分析するのはかなりオススメしてます。


「編集→すべての周波数表を再作成→よろしいですか?YES」でここに入ります。

通常は「両方初期化する」を選んで、MRQとLLSM両方Moresamplerが一括生成します。
*:この手順をやってからUTAUで既存UST使うと、凄い速さで出力されます。


で、問題になりそうはこういう状況:

(緑でピックアップした箇所のように)基本周波数赤線はあってますが、有声音の部分に一部青い線が引いてない場合、有声音を無声音を誤認するため、そのままモデリングすると、致命な雑音(しゃー)が出ています。

この件だと、現在(0.6.3)はこの通りで正しく検出されます。


未だにF0と有声/無声音検出(voiced/unvoiced、V/U辺界検出)を改良する余地はあって、開発側は引き続き努力しますが、基本的どこか限界があって、どんな原音でも大丈夫、というのはなかなか無いとおもいます。
なんの問題もなかった、というのは人様が作った上位ライブラリーで、他人の努力があった、ということが多い。

自分が作ったモノだと、相当の可能性でMoresamplerが声上がってしまうと思います。

で、最新版使ってるけどどうする?
残念ながら....自分で描くしかないぞ.....

描く場合、こちら画力ないので説明出来ない!(え


Moresampler 0.6.4 以降の導入について

自分:「シアトルが、シアトルが私を待ってる....」
ミクさん:「仕事しろ」

====
というわけで、まずはMoresamplerの導入について。
1. ファイル


(**画像差し替えました)
moreconfig.txtと、moresampler-legacy /moresampler32 /moresampler64 3つの中に、
一つを選んでUTAUのフォルダーへコピーしてください。

(0.6.3まで、moresampler32にvcomp140.dll、moresampler64にvcomp140d.dllついてにコピーする必要ありますが、今後廃止する予定)
(*逆だった! 64-140, 32-140d
(**内蔵できないと判明しました。



迷ったらLegacy使って下さい。XPなどを含めて最低限動けます。

あと、特にリネームする必要もないですが、リネームする場合これからの導入ステップに反映して下さい。

2.ツール設定。

ツール1とツール2両方をmoresampler.exeにする。
*:リネームしてなかったらこの場合moresampler-legacy.exeとなります。

なお、ツール1をwavtool.exeとか使いたい場合、moreconfig.txtの

"resampler-compatibility”をonに変更して下さい。
WAVファイルが1kbとかではなくちゃんと生成します。
ただ音質悪化しますので基本的非推奨です。

3. 他のUTAU設定


以上の通りに設定して下さい。

以上でMoresamplerが最低限動けると思います



Moresampler 0.6.2 & 0.6.3

ミクエキスポ→高田夜桜ミクライブ!のジャパンツアー終了して落ち着いてない間、Moresamplerが2点のリリースをもしました。

今後はしばらく開発に使える時間、及び実装したい技術のストックが少なくなり、しばらく休眠する予定ということでもあって、発覚した致命的バグを直して、しばらく放置するとのこと
です。

0.6.2元サイト記事
0.6.3元サイト記事

0.6.3ミラー

更新履歴:
0.6.3 (2016年4月18日)
* 問題修正: 音高が抑えたノートにMCフラグ使うときクラッシュする問題
* 問題修正: オーバーラップノートのノート、そのPropertyがない場合クラッシュする問題
* 問題修正: frqeditorの「周波数表を初期化」するコールが無効の問題

0.6.2 (2016年4月16日)
* 新機能: UTAUの「$direct=true」をサポート。原音をモジュレーションなしに直出力する。一部の呼吸音用素材に有用。なお、Moresamplerは選択した範囲の最終ノートが$direct=trueの場合レンダリングされない問題がある。
この問題はUTAUのresamplerとwavtoolとの通信インターフェイス設計の起因であり、解決出来ません。
* 新機能: "u"フラグ、上記問題の迂回策を提供する。u="unmodified/untouched”(触らない、改変されない)。
* 新機能: Growlエフェクトとして新しく3つのMoresampler Extension Flagsを提供した。
MC: 粗雑感, 範囲は [0, 100], 実数
MG: グロウル, 範囲は [0, 100], 実数
MD: 歪み, 範囲は [0, 100], 実数
* 改良: 音高予測エラーが約1/10まで低減

=====

0.6.3 (Apr. 18, 2016)
* Bug fix: crashes when MC flag is applied on a note whose pitch is shifted down.
* Bug fix: crashes when "overlap" note property is negative.
* Bug fix: not responding to frqeditor's "initialize frequency map" call.

0.6.2 (Apr. 16, 2016)
* New feature: support UTAU's "$direct=true" note setting, which let the sample
bypass modifications, going directly to output. Useful for sound effects such
as breathing. Notice: Moresampler won't render if the last note in the selected
region has "$direct=true"; this problem is unsolvable due to the design of
UTAU <-> resampler & wavtool interface.
* New feature: added 'u' flag, which has the same effect as "$direct=true" but
provides a workaround to the above problem. 'u' means 'unmodified/untouched'.
* New feature: 3 Moresampler Extension Flags for growling-like effects were added.
MC: coarseness, range: [0, 100], real number
MG: growl, range: [0, 100], real number
MD: distortion, range: [0, 100], real number
* Improved feature: pitch estimation error rate has been reduced by ten folds.