以下の内容はhttps://nowokay.hatenablog.com/entry/2026/01/21/185655より取得しました。


GLM-4.7-FlashのGGUFをLM Studioで動かすときにはRepetition Penaltyを無効にする必要がある

GLM-4.7-Flashが出ていたのでGGUFをLM Studioで試したけどどうもおかしかったのだけど、Repetition Penaltyを無効にすると解決。

出てたので試してたのだけど。
https://nowokay.hatenablog.com/entry/2026/01/20/114010

こんな感じで出力がおかしかったのです。

Repetition Penalty(繰り返しペナルティ)を無効にすると解決しました。

他のパラメータもUnslothさんの推奨どおりにするとこうですが、まだうまくいっていない。
GLM-4.7-Flash: How To Run Locally | Unsloth Documentation

まともにコード生成しています。

まあ、それでもコンパイルエラーが出ててあまり優秀とはいえないけど。

あと、Flash Attentionをオフにすると推論が速くなります。




以上の内容はhttps://nowokay.hatenablog.com/entry/2026/01/21/185655より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14