/users
/posts
/slides
/apps
/books
mysetting
/users
/posts
/slides
/apps
/books
11:25 5/30
skyil.tistory.com
11:25
skyil.tistory.com
컴퓨터와 수학, 몽상 조금
https://skyil.tistory.com/
컴퓨터공학, 딥러닝, 수학 등을 다룹니다.
저작도구: tistory
최종 피드 수집: 2024-12-20 07:46
전체 (145)
8M
Knowing Where to Focus: Event-aware Transformer for Video Grounding 리뷰 [ICCV 2023]
오늘 리뷰할 논문은 Fully Supervised Moment Retrieval 논문입니다. 이미 몇 차례 소개드린 적이 있지만, moment retrieval은 논문이나 데이터셋에 따라 Temporal Senctence Grou
논문 리뷰
+ 더보기
0
0
0
읽기모드
9M
거대 언어 모델(LLM) 찍먹하기: GPT, LLaMA을 중심으로
오늘날 거대 언어 모델(Large Language Models; LLM)은 기술의 최첨단부터 일반 사용자까지 사회 전반에 영향을 주고 있습니다. ChatGPT의 사용자수는 이제 1억 8천만 명에 달하며, CVPR 2024에 공개된
공부 노트
+ 더보기
0
0
4
읽기모드
9M
Weakly Supervised Temporal Sentence Grounding with Gaussian-based Contrastive Proposal Learning 리뷰 [CVPR 2022]
오늘 리뷰할 논문은 Weakly Supervised Temporal Sentence Grounding을 수행한 논문입니다. Temporal Sentence Grounding은 어떤 영상에서 주어진 자연어 형태의 쿼리와 연관된 mo
논문 리뷰
+ 더보기
0
0
1
읽기모드
9M
An Information-Theoretic Understanding of Maximum Manifold Capacity Representations 리뷰 [NeurIPS 2023 Workshop]
오늘 리뷰할 논문은 이전 리뷰에서 소개했던 multi-view self-supervised learning (MVSSL) 방법론인 Maximum Manifold Capacity Representation (MMCR)을 정보 이론
논문 리뷰
+ 더보기
0
0
1
읽기모드
9M
Efficient Coding of Natural Images using Maximum Manifold Capacity Representations 리뷰 [NIPS 2023]
오늘 리뷰할 논문은 뉴욕대학교의 정수연 교수님 연구팀이 발표한 Self-Supervised Representation Learning 방법인 Maximum Manifold Capacity Representation (MMCR)에
논문 리뷰
+ 더보기
0
0
0
읽기모드
10M
Localizing Moments in Long Video Via Multimodal Guidance 리뷰 [ICCV 2023]
이번에 리뷰할 논문은 이전에 리뷰한 Moment-DETR에 이어, moment retrieval 분야의 논문입니다. 다만 Moment-DETR이 150초 길이의 짧은 영상(QVHIGHLIGHTS 데이터셋)에서의 moment ret
0
0
0
읽기모드
10M
QVHIGHLIGHTS: Detecting Moments and Highlights in Videos via Natural Language Queries 리뷰 [NIPS 2021]
오늘 리뷰할 논문은 Moment Retrieval과 Highlight Detection을 위한 데이터셋인 QVHIGHRIGHTS와 Moment-DETR 방법론을 제안한 논문입니다. 데이터셋도 데이터셋이지만 Moment-DETR이
논문 리뷰
+ 더보기
0
0
2
읽기모드
10M
Open-Vocabulary Object Detection via Vision and Language Knowledge Distillation 리뷰 [ICLR 2022]
이번에 리뷰할 논문은 Open-Vocabulary Object Detection이라는 task를 제안한 논문입니다. 본 논문에서는 Object Detector가 검출 가능한 객체의 종류를 늘리기 위해 학습 데이터에 포함된 객체의
논문 리뷰
+ 더보기
0
0
7
읽기모드
11M
RELIT: Weakly Supervised Vision-and-Language Pre-training with Relative Representation 리뷰 [arxiv 2023]
이전 리뷰에 이은 Weakly Supervised Vision-Language Pretraining (WVLP) 논문 리뷰입니다. 칭화대에서 작성된 논문이며 코드는 공개할 예정인지 논문에 링크만 달려있네요. 본 논문에서는 기존 W
논문 리뷰
+ 더보기
0
0
0
읽기모드
11M
Unsupervised Vision-and-Language Pre-training via Retrieval-basedMulti-Granular Alignment 리뷰 [CVPR 2022]
오늘 읽어볼 논문은 이미지 데이터와 텍스트 데이터 간의 연관 정보가 주어지지 않은 상황에서 모달 간 정합을 수행하는 Weakly Supervised Vision and Language Pre-training (WVLP) 관련 논문
논문 리뷰
+ 더보기
0
0
0
읽기모드
11M
대학에서의 마지막 1년, 2024년 계획
2024년이 밝았다.
2020년, 대학교 2학년으로 진학하며 내 약점인 컴퓨터 공학 기초를 보완하고, 조금이나마 나은 사람이 되어보고자 계획을 남기기 시작한 지 어느새 4년이다. 지금까지 모든 목표를 달성했다고는 할 수 없지만,
회고 & 계획
+ 더보기
0
0
0
읽기모드
11M
나를 찾아 헤매었던, 2023년 회고
2023년 1분기 회고
2023년 상반기 회고
다시 태어난 것만 같은 기분의 전역을 뒤로하고 두려움 반, 기대 반을 담아 2023년 계획을 작성한 지 1년이 흘렀다.
코로나로 집에서 1년, 군대에서 2년을 보내고 3년 만에 복귀한
회고 & 계획
+ 더보기
0
0
0
읽기모드
1y
로지스틱 회귀 모델의 비용 함수 미분해보기
로지스틱 회귀는 입력을 두 가지의 범주로 분류하는 선형 이진 분류 모델이다.
선형 회귀 식에 로지스틱 함수를 씌워 출력값을 0-1 사이의 확률 값으로 만들어 분류를 수행한다.
$$ \hat p = h_\theta (\mathbf{
공부 노트
+ 더보기
0
0
3
읽기모드
1y
서포트 벡터 머신(SVM)의 최적화
본 포스팅은 고려대학교 강필성 교수님의 강의를 참고하여, SVM의 최적화 방법을 다룬 포스팅입니다. SVM의 기본 정의만 궁굼하신 분은 제 이전 포스팅을 참고해주세요!
서포트 벡터 머신은 두 데이터 집합을 나누는 결정 경계의 마진
공부 노트
+ 더보기
0
0
0
읽기모드
1y
Clover : Towards A Unified Video-Language Alignment and Fusion Model 리뷰 [CVPR 2023]
이번 논문은 V-T Retrieval과 VQA 두 downstream task에서 모두 좋은 성능을 보이며, 동시에 효율적인 Universal Video-Language pre-training 방법을 제안한 Clover입니다.
V
논문 리뷰
+ 더보기
0
0
0
읽기모드
1y
X-CLIP: End-to-End Multi-grained Contrastive Learning for Video-Text Retrieval [MM 2022]
이번 논문은 CLIP을 활용한 Video-Text Retrieval 논문인 X-CLIP입니다.
Video-Text Retrieval은 비디오와 텍스트를 각각 임베딩하여 벡터로 만든 후, 쿼리에 대한 유사도가 가장 높은 비디오들을
논문 리뷰
+ 더보기
0
0
12
읽기모드
1y
CLIP4Clip: An Empirical Study of CLIP for End to End Video Clip Retrieval 리뷰 [Neurocomputing 2022]
이번 논문은 Video-Text Retrieval task에서 baseline 모델로 자주 등장하여 언제 읽어야지 하고 있던 CLIP4Clip입니다. 비디오의 클립(전체 비디오를 몇 초 정도의 짧은 영상으로 분할한 것)을 검색하기
논문 리뷰
+ 더보기
0
0
0
읽기모드
1y
공돌이 22년, 주짓수를 시작하다.
본 포스팅은 포보스 선정 (아님) 군자동 최고의 주짓수 맛집 스트라이브 주짓수에서 아무런 후원 없이 작성되었습니다.
공돌이 외길 인생 22년.
인생에 스포츠란 e-스포츠 밖에 없던 필자(솔랭 이블린 원챔)가 주짓수를 시작하게
내 이야기
+ 더보기
0
0
0
읽기모드
1y
LocVTP: Video-Text Pre-training for Temporal Localization 리뷰 (ECCV 2022)
여느 Vision 연구분야와 마찬가지로 비디오 영역에서도 자연어와 비전 feature의 align을 통해 전이 가능하고 좋은 표현력을 갖는 representation을 학습하고자 하는 Video-Text Pre-training (
논문 리뷰
+ 더보기
0
0
0
읽기모드
1y
Distilling Vision-Language Pre-training to Collaborate with Weakly-Supervised Temporal Action Localization 리뷰 [CVPR 2023]
기존의 Weakly-Supervised Temporal Action Localization (W-TAL) 방법론들은 대부분 classification-based pre-training (CBP) 방법을 사용하였습니다. (BaS-N
논문 리뷰
+ 더보기
0
0
1
읽기모드
About
Badge
Contact
Activity
Terms of service
Privacy Policy