CLIP: Learning Transferable Visual Models From Natural Language Supervision 논문 리뷰

2025. 8. 22. 16:46

BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models (0)	2025.10.02
AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE 리뷰 (0)	2025.08.24
Generative Adversarial Nets 리뷰 (1)	2025.06.30

Background