X-CLIP: End-to-End Multi-grained Contrastive Learning for Video-Text Retrieval [MM 2022]
2023-11-17 10:36

X-CLIP: End-to-End Multi-grained Contrastive Learning for Video-Text Retrieval [MM 2022]

이번 논문은 CLIP을 활용한 Video-Text Retrieval 논문인 X-CLIP입니다.
Video-Text Retrieval은 비디오와 텍스트를 각각 임베딩하여 벡터로 만든 후, 쿼리에 대한 유사도가 가장 높은 비디오들을 ...
논문 리뷰
006

댓글