以下の内容はhttps://kazuhito00.hatenablog.com/entry/2024/09/04/225352より取得しました。


Qwen2-VLをColaboratoryでお試し🦔

Alibaba が 公開した Qwen2-VL を Colaboratoryでお試ししています👀
いくらか試していますが、かなり認識性能が高い気がします。
多言語対応していて、日本語入力、日本語回答が出来るのもポイント高いですね。

 

動画の処理も可能なのですが、、、
かなりGPU RAMが必要なので、強めのGPU用意必須です。
ColaboratoryのサンプルではT4 GPU前提で作成していて、動画は冒頭5秒のみ1fpsでの処理で動かしています。

 

今回お試ししたノートブックは以下にコミットしています🦔

github.com




以上の内容はhttps://kazuhito00.hatenablog.com/entry/2024/09/04/225352より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14