CLIPを用いてテキストと画像の意味的関連性の予測、画像を認識する際に注視しやすい部分を表現した画像「顕著性マップ」(2枚目画像)の可視化方法を学ぶレシピ。

未知の画像の分類、自然言語で入力されたキーワードによる画像検索に使用することができます。

https://t.co/vSw8FqdiNK

3 2