ミク語変換について
これは何?
初音ミク等VOCALOIDシリーズで、メロディに流し込むための歌詞データを生成するためのWebサービスです。
作った動機
初音ミクをいろいろ触っていると歌詞のテキスト起こしが意外と大変でした。
だいたい以下のようなことをする必要があります。
- 漢字はすべてカナにする
- 助詞の「は」「へ」は発音どおり「わ」「え」にする
- 他にも表記と発音が違うものは発音どおりにする
- 「を」は「お」にした方が自然な発音になる
- 促音の「っ」は直前の母音にした方がうまくいくことが多い(曲による)
- 長音の「ー」はそのままでも良いが、これも直前の母音にした方が加工しやすいかも(好みの問題)
- 英単語もローマ字かカナに変換する
そんなわけでそういった変換を自動でやってくれるプログラムを作りました。一番大変な上記1~3はMeCabを入れれば全部やってくれるので、実は促音の処理を書くくらいです。
ver0.93で英単語を変換する機能をつけました。ルー語変換を真似て、文章読み上げエンジン Bilingual Emacspeak Project の辞書を使っています。
履歴
2015.12.12 ver0.98
サーバのrubyバージョンアップにより動かなくなっていたのを修正
2014.4.12 ver0.97
クロスドメインでJavaScriptから利用できるようAPIにJSONP形式追加
2009.1.30 ver0.96
日本語と英語で別トラック用に分けて出力するオプション追加
Cookie関係バグ修正
2008.11.28 ver0.95
すべての文字をひらがなに変換するオプションを追加。ローマ字変換と両方指定するとローマ字指定が優先
ローマ字変換時に改行がおかしくなるバグ修正
2008.9.7 ver0.94
ローマ字変換機能追加。Ruby/Romkanを使わせていただきました
2008.6.15 ver0.93
英単語→カタカナ変換機能追加。「薮からstick」のような歌詞も変換可能
カタカナはひらがなに変換せず出力するようにした
API出力のヘッダがtext/htmlになっていたのをtext/xmlに修正
APIのエンコード指定省略時のバグ修正
2008.5.25 ver0.92
出力を文節(らしき場所)で区切るオプション追加
オプションの設定をCookieに記憶するようにした
一部の記号文字(「」?!、。・…)を削除するようにした
プログラムから呼び出せるようにAPIを用意した
2008.1.20 ver0.91
長音の変換をオプションで選べるようにした
2008.1.14 ver0.90
Webサービスとして公開
2008.1.5
変換クラス公開