以下の内容はhttps://retrospective.hatenadiary.com/entry/20241230/1735560803より取得しました。


2024年12月30日現在のmacのローカルでmlx-whisperを動かすメモ

MacBook Air (13インチ, M3, 2024)を使っています

参考資料

動かしたいもの github.com

pyenv・venv を使った環境準備について qiita.com

結局環境で詰まっていた

そういえばpythonをちゃんと入れるのははじめてなのでした。

作業用ディレクト

mkdir ~/src/mlx-whisper

homebrewとpyenv

homebrewをインストール

brew.sh

pythonをpyenv経由でインストール。バージョン切り替え可能

brew install pyenv
pyenv init
pyenv install 3.11
pyenv rehash
pyenv versions
pyenv local 3.11

https://qiita.com/kjunichi/items/7453814cb902158f9836 ここらでターミナルを立ち上げ直し

venvでpipで入るライブラリを特定ディレクトリごとに別管理(と理解)

cd ~/mlx-whisper
pyenv exec python -m venv myenv
source myenv/bin/activate
brew install ffmpeg
pip install mlx-whisper

文字起こし

音声といっても動画でもいい。ffmpegで扱えれば大丈夫。

source myenv/bin/activate
mlx_whisper --output-format tsv  --language ja --model mlx-community/whisper-large-v3-turbo  文字起こし対象音声ファイル > hoge.txt

ラウドネスノーマライザー

[FFmpeg] 音声を聞きやすく調整する »キリンスキ

ffmpeg -i INPUT.mp4 -af "loudnorm=I=-14" -c:v copy output.mp4

時間の部分を削除

時間のところを省きたかったので、閉じブランケットを区切りとして2列目のみを取り出す & 空白文字をとる

cut -d ']'  -f 2 hoge.txt |  sed -e 's/^ *//'  | grep -v '^\s*$' | uniq

スペース区切りで適当にしてもよかったかもしれない

cut -f 4,5,6,7,8,9,10 -d " " | uniq

pythonのインストールメモ

これも試す qiita.com




以上の内容はhttps://retrospective.hatenadiary.com/entry/20241230/1735560803より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14