Recognize Anything Model (RAM)
画像からの物体認識+ラベリングの強いのきた

Grounded-SAMはセグ化強いがラベル付与に別モデル(Tag2Text)が要る
添付はGrounded-SAM+Tag2Text
も凄い☺️けど学習したカテしか認識できないのに、RAMはオープンボキャブラリーらしい
https://t.co/97OvCd5v61

70 326