
参考資料
動かしたいもの github.com
pyenv・venv を使った環境準備について qiita.com
結局環境で詰まっていた
そういえばpythonをちゃんと入れるのははじめてなのでした。
作業用ディレクトリ
mkdir ~/src/mlx-whisper
homebrewとpyenv
homebrewをインストール
pythonをpyenv経由でインストール。バージョン切り替え可能
brew install pyenv pyenv init pyenv install 3.11 pyenv rehash pyenv versions pyenv local 3.11
https://qiita.com/kjunichi/items/7453814cb902158f9836 ここらでターミナルを立ち上げ直し
venvでpipで入るライブラリを特定ディレクトリごとに別管理(と理解)
cd ~/mlx-whisper pyenv exec python -m venv myenv source myenv/bin/activate brew install ffmpeg pip install mlx-whisper
文字起こし
音声といっても動画でもいい。ffmpegで扱えれば大丈夫。
source myenv/bin/activate mlx_whisper --output-format tsv --language ja --model mlx-community/whisper-large-v3-turbo 文字起こし対象音声ファイル > hoge.txt
ラウドネスノーマライザー
ffmpeg -i INPUT.mp4 -af "loudnorm=I=-14" -c:v copy output.mp4
時間の部分を削除
時間のところを省きたかったので、閉じブランケットを区切りとして2列目のみを取り出す & 空白文字をとる
cut -d ']' -f 2 hoge.txt | sed -e 's/^ *//' | grep -v '^\s*$' | uniq
スペース区切りで適当にしてもよかったかもしれない
cut -f 4,5,6,7,8,9,10 -d " " | uniq
pythonのインストールメモ
これも試す qiita.com