以下の内容はhttps://touch-sp.hatenablog.com/entry/2022/09/11/172732より取得しました。


AutoGluon の MultiModalPredictor まとめ

公開日:2022年9月11日
最終更新日:2022年11月26日

AutoGluonのMultiModalPredictorを使った記事をいくつか書きました。
すぐにアクセスできるように記事をまとめてみました。

記事は適宜更新していきます。

表データの分類

画像やテキストを含む表データの分類の学習を行う記事です。
touch-sp.hatenablog.com

画像分類

自前のデータに対して画像分類の学習を行う記事です。
touch-sp.hatenablog.com
touch-sp.hatenablog.com

物体検出

MultiModalPredictor(problem_type="object_detection")

AutoGluonからMMDetectionを使用する記事です。

MMDetection(推論のみ)

touch-sp.hatenablog.com

MMDetection(学習+推論)

touch-sp.hatenablog.com

CLIP(Contrastive Language-Image Pre-Training)

MultiModalPredictor(pipeline="zero_shot_image_classification")

ゼロショット画像分類

CLIP(Contrastive Language-Image Pre-Training)を使ったゼロショット画像分類の記事です。
touch-sp.hatenablog.com

画像検索

CLIP(Contrastive Language-Image Pre-Training)を使った画像検索の記事です。
touch-sp.hatenablog.com

OCR

MultiModalPredictor(problem_type="ocr_text_recognition")

AutoGluonからMMOCRを使用する記事です。
touch-sp.hatenablog.com




以上の内容はhttps://touch-sp.hatenablog.com/entry/2022/09/11/172732より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14