以下の内容はhttps://www.bioerrorlog.work/entry/ace-step-15-local-m2-macbookより取得しました。


音楽生成AI "ACE-Step 1.5" をローカルで動かす | M2 MacBook Air

ACE-Step 1.5をローカルで試してみたメモです。

はじめに

軽量に動作する高性能な音楽生成AIとして噂のACE-Step 1.5を、ローカルのM2 MacBookで動かして遊んでみます。

# 作業環境
MacBook Air
チップ: Apple M2
メモリ: 16GB

The English translation of this post is here.

音楽生成AI "ACE-Step 1.5" をローカルで動かす

ACE-Step 1.5 インストール

公式ガイドに従ってインストールしていきます。

まず、Pythonパッケージマネージャーのuvがインストールされていなければ、そちらをインストールします。

# macOS / Linux
curl -LsSf https://astral.sh/uv/install.sh | sh

# Windows (PowerShell)
powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"

uvの基本的な使い方については以前記事にまとめたので、よければこちらも。

www.bioerrorlog.work

uvをインストールしたら、ACE-Step 1.5のコードをcloneしてインストールします。

git clone https://github.com/ACE-Step/ACE-Step-1.5.git
cd ACE-Step-1.5
uv sync

これでライブラリインストールは完了です。

利用方法としては、下記の5つが提示されています。

  • Gradio Web UI
  • Studio UI
  • Python API
  • REST API
  • CLI

今回はGradio Web UIでやってみます。

Gradio Web UIでACE-Step 1.5を動かす

下記コマンドで、Gradio Web UIを起動します。

uv run acestep

起動が終わったら、http://localhost:7860/にブラウザアクセスすると、Gradio Web UIが使えるようになっています。

起動したGradio Web UIの画面

次に、"Initialize Service"ボタンを押して、モデルをダウンロードします。

今回は、とりあえず各種設定は全て初期状態のままボタンを押しました。

Initialize Serviceボタンを押す

これでモデルのダウンロードが始まります。

私の場合は、このダウンロードにだいたい40分くらいかかりました。


ダウンロードが終わったら、いよいよ生成していきます。

今回は、"Click Me"ボタンを押してプロンプトと歌詞をランダム生成し、"Generate Music"で音楽を生成してみます。

"Click Me"でプロンプトをランダム生成してから、"Generate Music"で音楽生成してみる

大体5~10分ほどで生成が完了しました。

エラー対応: RuntimeError: MPS backend out of memory

1回目の試行では、私の環境では下記のエラーが発生しました:

RuntimeError: MPS backend out of memory (MPS allocated: 11.74 GiB, other allocations: 9.95 GiB, max allowed: 18.13 GiB). Tried to allocate 10.99 MiB on private pool. Use PYTORCH_MPS_HIGH_WATERMARK_RATIO=0.0 to disable upper limit for memory allocations (may cause system failure).

GPUメモリが不足しているとのこと。

エラーメッセージの示唆通り、環境変数PYTORCH_MPS_HIGH_WATERMARK_RATIO=0.0を設定することで、メモリ上限を無効化します。

export PYTORCH_MPS_HIGH_WATERMARK_RATIO=0.0

このように環境変数を設定してからGradio Web UIを起動すると、無事エラーなく音楽生成できるようになりました。

生成結果例

生成した曲の例をお見せします。

プロンプトは先述の通り、"Click Me"ボタンによって自動で生成されたものを利用しています:

A melancholic German singer-songwriter track with fingerpicked acoustic guitar, subtle piano, and heartfelt female vocals. The intimate production captures the pain of heartbreak and the journey toward healing.

結果はこちら:

歌詞はドイツ語。

MacBook Airで軽く試せるものでありながら、生成結果もかなりいい感じなんじゃないでしょうか。

おわりに

AIモデルの進歩は止まりません。

軽くて高性能なモデルがこれからもどんどん出てきて、色々遊べるようになると面白そうですね。

以上!

[関連記事]

www.bioerrorlog.work

www.bioerrorlog.work

参考




以上の内容はhttps://www.bioerrorlog.work/entry/ace-step-15-local-m2-macbookより取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14