以下の内容はhttps://redhologerbera.hatenablog.com/entry/2025/06/09/214431より取得しました。


音源からScoreを生成するSongscriptionを試す。

本日はAI枠です。

 近年様々な汎用的なAIサービスが登場していますが、ある機能に特化した変換AIアルゴリズムもしくはサービスを○○to○○とあらわすことがあります。

 例えばTextToSpeechはテキストから声(スピーチ)を生成する技術ですし、TextTo3Dは自然言語から3Dモデルを生成する技術です。

 近年筆者が注目していた技術としてAudioToScoreがあります。

 Scoreは楽譜であり、音源から楽譜を作るAIを指します。 スコアというものは人間が演奏を行うにあたり使用する言語であり、音楽を表現するために用いられますが、このAIでは逆のプロセスとしてすでに存在する音楽(音源)から楽譜を生成するという耳コピ、採譜に近いことを行うアルゴリズムです。

〇AudioToScoreの研究

AudioToScoreの研究は様々な機関で古くから行われてきたようです。

例えば2006年にはPeretzによって特定の音楽的障害を持つ脳損傷患者の研究のなかで、音楽認知システムに関して触れています。

https://arxiv.org/pdf/2405.13527 また日本では九州大学の中村栄太先生がAudioToScoreの研究をされており、『耳コピAI』として論文を執筆、データを公開されています。

eita-nakamura.github.io

audio2score.github.io

〇Songscription

SongscriotionはWeb上で動くAudioToScoreサービスです。

Googleアカウントなどでサインアップすることで無料で使用することができます。

使い方は簡単でTranscribe formの項目で楽器を選択し、音源をアップロード/YoutubeのURLを挿入後実行するだけです。

25年6月時点ではPiano以外にfluteやギター、バイオリンが対応していますがBeta版で、筆者が試したところ制度はPianoに比べて極端に悪いと感じました。

しかしながらサックスやドラム、トランペットなど今後の展開が気になります。

実行を行うとTimeSignatureKey Signatureを設定します。これは拍子と調合(キー)のことであり、Key Signatureは設定しなくても問題ないように思えましたが、TimeSignatureはわかっている場合は設定しないと3拍子など勝手に設定されるため基本的に設定したほうが良い結果になりました。

処理が開始される前に権利関係とプライバシーの同意を求められます。

これをパスすると処理が開始されます。処理の工程を見るとまずは音源解析後MIDIを作成し、そのあとスコアに並べているようです。

完了するとスコアが表示されます。作成できる上限は3分となっています。

また、MIDIによるピアノロールも観ることができます。

このスコアデータはMusicXMLやPDFでDLできます。

本日は以上になります。

耳コピの助けになるのに合わせて筆者はHarmonyKeysと呼ばれる楽譜を渡すことで自動演奏ツールを作成しています。 これと相性が良いと思っています。

〇参考

https://www.kecl.ntt.co.jp/people/kameoka.hirokazu/publications/Kameoka2009IPSJMagazine08.pdf




以上の内容はhttps://redhologerbera.hatenablog.com/entry/2025/06/09/214431より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14