以下の内容はhttps://takmin.hatenablog.com/entry/2025/07/14/022034より取得しました。

2025/07/13第64回CV勉強会＠関東「CVPR2025読み会」（前編）資料まとめ

コンピュータビジョン勉強会学会

第64回コンピュータビジョン勉強会＠関東は恒例の「CVPR2025読み会」を7月13日と8月24日の前後編で行うことになりました。

前編は、ソニー株式会社様のBridge Terminalをお借りして開催いたしました。

以下、資料やリンク等をまとめておきます。

登録サイト

kantocv.connpass.com

Togetterあらためposfie

YouTube

www.youtube.com

コンピュータビジョン勉強会＠関東

sites.google.com

資料まとめ

発表者	発表内容	資料
shade-tree	Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models
keiichi ito	AnomalyNCD: Towards Novel Anomaly Class Discovery in Industrial Scenarios	https://drive.google.com/file/d/1zx9SUqUh3ed_CCwMlxy2IuiuXKfl_B4F/view?ts=68732f86
x_ttyszk	The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition	https://speakerdeck.com/x_ttyszk/kantocv20150713-panaf-fgbg
peisuke	VGGT: Visual Geometry Grounded Transformer	https://speakerdeck.com/peisuke/vggt-visual-geometry-grounded-transformer-3019a999-11ea-430f-9412-2e2f0f35ec34
potyy	HiPART: Hierarchical Pose AutoRegressive Transformer for Occluded 3D Human Pose Estimation
Shin-kyoto	S4-Driver: Scalable Self-Supervised Driving Multimodal Large Language Model with Spatio-Temporal Visual Representation	https://speakerdeck.com/shinkyoto/cvmian-qiang-hui-at-guan-dong-cvpr2025-vlmzi-dong-yun-zhuan-model-s4-driver
Oguryu417	TKG-DM: Training-free Chroma Key Content Generation Diffusion Model

後編はこちから申し込み出来ます。

第64回コンピュータビジョン勉強会＠関東（後編） - connpass

以上の内容はhttps://takmin.hatenablog.com/entry/2025/07/14/022034より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14