https://redhologerbera.hatenablog.com/entry/2025/06/09/214431

本日はAI枠です。

　近年様々な汎用的なAIサービスが登場していますが、ある機能に特化した変換AIアルゴリズムもしくはサービスを○○to○○とあらわすことがあります。

　例えばTextToSpeechはテキストから声（スピーチ）を生成する技術ですし、TextTo3Dは自然言語から3Dモデルを生成する技術です。

　近年筆者が注目していた技術としてAudioToScoreがあります。

　Scoreは楽譜であり、音源から楽譜を作るAIを指します。　スコアというものは人間が演奏を行うにあたり使用する言語であり、音楽を表現するために用いられますが、このAIでは逆のプロセスとしてすでに存在する音楽（音源）から楽譜を生成するという耳コピ、採譜に近いことを行うアルゴリズムです。

〇AudioToScoreの研究

AudioToScoreの研究は様々な機関で古くから行われてきたようです。

例えば2006年にはPeretzによって特定の音楽的障害を持つ脳損傷患者の研究のなかで、音楽認知システムに関して触れています。

https://arxiv.org/pdf/2405.13527 また日本では九州大学の中村栄太先生がAudioToScoreの研究をされており、『耳コピAI』として論文を執筆、データを公開されています。

eita-nakamura.github.io

audio2score.github.io

〇Songscription

SongscriotionはWeb上で動くAudioToScoreサービスです。

Googleアカウントなどでサインアップすることで無料で使用することができます。

使い方は簡単でTranscribe formの項目で楽器を選択し、音源をアップロード/YoutubeのURLを挿入後実行するだけです。

25年6月時点ではPiano以外にfluteやギター、バイオリンが対応していますがBeta版で、筆者が試したところ制度はPianoに比べて極端に悪いと感じました。

しかしながらサックスやドラム、トランペットなど今後の展開が気になります。

実行を行うとTimeSignatureとKey Signatureを設定します。これは拍子と調合（キー）のことであり、Key Signatureは設定しなくても問題ないように思えましたが、TimeSignatureはわかっている場合は設定しないと3拍子など勝手に設定されるため基本的に設定したほうが良い結果になりました。