以下の内容はhttps://takmin.hatenablog.com/entry/2025/07/14/022034より取得しました。


2025/07/13第64回CV勉強会@関東「CVPR2025読み会」(前編)資料まとめ

第64回コンピュータビジョン勉強会@関東は恒例の「CVPR2025読み会」を7月13日と8月24日の前後編で行うことになりました。

前編は、ソニー株式会社様のBridge Terminalをお借りして開催いたしました。

以下、資料やリンク等をまとめておきます。

登録サイト

kantocv.connpass.com

Togetterあらためposfie

posfie.com

YouTube

www.youtube.com

コンピュータビジョン勉強会@関東

sites.google.com

資料まとめ

発表者 発表内容 資料
shade-tree Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models
keiichi ito AnomalyNCD: Towards Novel Anomaly Class Discovery in Industrial Scenarios https://drive.google.com/file/d/1zx9SUqUh3ed_CCwMlxy2IuiuXKfl_B4F/view?ts=68732f86
x_ttyszk The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition https://speakerdeck.com/x_ttyszk/kantocv20150713-panaf-fgbg
peisuke VGGT: Visual Geometry Grounded Transformer https://speakerdeck.com/peisuke/vggt-visual-geometry-grounded-transformer-3019a999-11ea-430f-9412-2e2f0f35ec34
potyy HiPART: Hierarchical Pose AutoRegressive Transformer for Occluded 3D Human Pose Estimation
Shin-kyoto S4-Driver: Scalable Self-Supervised Driving Multimodal Large Language Model with Spatio-Temporal Visual Representation https://speakerdeck.com/shinkyoto/cvmian-qiang-hui-at-guan-dong-cvpr2025-vlmzi-dong-yun-zhuan-model-s4-driver
Oguryu417 TKG-DM: Training-free Chroma Key Content Generation Diffusion Model

後編はこちから申し込み出来ます。

第64回 コンピュータビジョン勉強会@関東(後編) - connpass




以上の内容はhttps://takmin.hatenablog.com/entry/2025/07/14/022034より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14