컴퓨터와 수학, 몽상 조금 - mysetting

11:25 5/30

skyil.tistory.com

mobile screenshot relative

11:25

skyil.tistory.com

mobile screenshot

컴퓨터와 수학, 몽상 조금
https://skyil.tistory.com/

컴퓨터공학, 딥러닝, 수학 등을 다룹니다.

저작도구: tistory

최종 피드 수집: 2025-08-20 01:47

전체 (145)

1y

Knowing Where to Focus: Event-aware Transformer for Video Grounding 리뷰 [ICCV 2023]

오늘 리뷰할 논문은 Fully Supervised Moment Retrieval 논문입니다. 이미 몇 차례 소개드린 적이 있지만, moment retrieval은 논문이나 데이터셋에 따라 Temporal Senctence Grou

논문 리뷰

000

1y

거대 언어 모델(LLM) 찍먹하기: GPT, LLaMA을 중심으로

오늘날 거대 언어 모델(Large Language Models; LLM)은 기술의 최첨단부터 일반 사용자까지 사회 전반에 영향을 주고 있습니다. ChatGPT의 사용자수는 이제 1억 8천만 명에 달하며, CVPR 2024에 공개된

공부 노트

005

1y

Weakly Supervised Temporal Sentence Grounding with Gaussian-based Contrastive Proposal Learning 리뷰 [CVPR 2022]

오늘 리뷰할 논문은 Weakly Supervised Temporal Sentence Grounding을 수행한 논문입니다. Temporal Sentence Grounding은 어떤 영상에서 주어진 자연어 형태의 쿼리와 연관된 mo

논문 리뷰

001

1y

An Information-Theoretic Understanding of Maximum Manifold Capacity Representations 리뷰 [NeurIPS 2023 Workshop]

오늘 리뷰할 논문은 이전 리뷰에서 소개했던 multi-view self-supervised learning (MVSSL) 방법론인 Maximum Manifold Capacity Representation (MMCR)을 정보 이론

논문 리뷰

001

1y

Efficient Coding of Natural Images using Maximum Manifold Capacity Representations 리뷰 [NIPS 2023]

오늘 리뷰할 논문은 뉴욕대학교의 정수연 교수님 연구팀이 발표한 Self-Supervised Representation Learning 방법인 Maximum Manifold Capacity Representation (MMCR)에

논문 리뷰

002

1y

Localizing Moments in Long Video Via Multimodal Guidance 리뷰 [ICCV 2023]

이번에 리뷰할 논문은 이전에 리뷰한 Moment-DETR에 이어, moment retrieval 분야의 논문입니다. 다만 Moment-DETR이 150초 길이의 짧은 영상(QVHIGHLIGHTS 데이터셋)에서의 moment ret

001

1y

QVHIGHLIGHTS: Detecting Moments and Highlights in Videos via Natural Language Queries 리뷰 [NIPS 2021]

오늘 리뷰할 논문은 Moment Retrieval과 Highlight Detection을 위한 데이터셋인 QVHIGHRIGHTS와 Moment-DETR 방법론을 제안한 논문입니다. 데이터셋도 데이터셋이지만 Moment-DETR이

논문 리뷰

002

1y

Open-Vocabulary Object Detection via Vision and Language Knowledge Distillation 리뷰 [ICLR 2022]

이번에 리뷰할 논문은 Open-Vocabulary Object Detection이라는 task를 제안한 논문입니다. 본 논문에서는 Object Detector가 검출 가능한 객체의 종류를 늘리기 위해 학습 데이터에 포함된 객체의

논문 리뷰

007

1y

RELIT: Weakly Supervised Vision-and-Language Pre-training with Relative Representation 리뷰 [arxiv 2023]

이전 리뷰에 이은 Weakly Supervised Vision-Language Pretraining (WVLP) 논문 리뷰입니다. 칭화대에서 작성된 논문이며 코드는 공개할 예정인지 논문에 링크만 달려있네요. 본 논문에서는 기존 W

논문 리뷰

000

1y

Unsupervised Vision-and-Language Pre-training via Retrieval-basedMulti-Granular Alignment 리뷰 [CVPR 2022]

오늘 읽어볼 논문은 이미지 데이터와 텍스트 데이터 간의 연관 정보가 주어지지 않은 상황에서 모달 간 정합을 수행하는 Weakly Supervised Vision and Language Pre-training (WVLP) 관련 논문

논문 리뷰

001

1y

대학에서의 마지막 1년, 2024년 계획

2024년이 밝았다.
2020년, 대학교 2학년으로 진학하며 내 약점인 컴퓨터 공학 기초를 보완하고, 조금이나마 나은 사람이 되어보고자 계획을 남기기 시작한 지 어느새 4년이다. 지금까지 모든 목표를 달성했다고는 할 수 없지만,

회고 & 계획

000

1y

나를 찾아 헤매었던, 2023년 회고

2023년 1분기 회고
2023년 상반기 회고
다시 태어난 것만 같은 기분의 전역을 뒤로하고 두려움 반, 기대 반을 담아 2023년 계획을 작성한 지 1년이 흘렀다.
코로나로 집에서 1년, 군대에서 2년을 보내고 3년 만에 복귀한

회고 & 계획

000

1y

로지스틱 회귀 모델의 비용 함수 미분해보기

로지스틱 회귀는 입력을 두 가지의 범주로 분류하는 선형 이진 분류 모델이다.
선형 회귀 식에 로지스틱 함수를 씌워 출력값을 0-1 사이의 확률 값으로 만들어 분류를 수행한다.
$$ \hat p = h_\theta (\mathbf{

공부 노트

004

1y

서포트 벡터 머신(SVM)의 최적화

본 포스팅은 고려대학교 강필성 교수님의 강의를 참고하여, SVM의 최적화 방법을 다룬 포스팅입니다. SVM의 기본 정의만 궁굼하신 분은 제 이전 포스팅을 참고해주세요!
서포트 벡터 머신은 두 데이터 집합을 나누는 결정 경계의 마진

공부 노트

000

1y

Clover : Towards A Unified Video-Language Alignment and Fusion Model 리뷰 [CVPR 2023]

이번 논문은 V-T Retrieval과 VQA 두 downstream task에서 모두 좋은 성능을 보이며, 동시에 효율적인 Universal Video-Language pre-training 방법을 제안한 Clover입니다.
V

논문 리뷰

000

1y

X-CLIP: End-to-End Multi-grained Contrastive Learning for Video-Text Retrieval [MM 2022]

이번 논문은 CLIP을 활용한 Video-Text Retrieval 논문인 X-CLIP입니다.
Video-Text Retrieval은 비디오와 텍스트를 각각 임베딩하여 벡터로 만든 후, 쿼리에 대한 유사도가 가장 높은 비디오들을

논문 리뷰

0012

1y

CLIP4Clip: An Empirical Study of CLIP for End to End Video Clip Retrieval 리뷰 [Neurocomputing 2022]

이번 논문은 Video-Text Retrieval task에서 baseline 모델로 자주 등장하여 언제 읽어야지 하고 있던 CLIP4Clip입니다. 비디오의 클립(전체 비디오를 몇 초 정도의 짧은 영상으로 분할한 것)을 검색하기

논문 리뷰

000

1y

공돌이 22년, 주짓수를 시작하다.

본 포스팅은 포보스 선정 (아님) 군자동 최고의 주짓수 맛집 스트라이브 주짓수에서 아무런 후원 없이 작성되었습니다.
공돌이 외길 인생 22년.
인생에 스포츠란 e-스포츠 밖에 없던 필자(솔랭 이블린 원챔)가 주짓수를 시작하게

내 이야기

000

1y

LocVTP: Video-Text Pre-training for Temporal Localization 리뷰 (ECCV 2022)

여느 Vision 연구분야와 마찬가지로 비디오 영역에서도 자연어와 비전 feature의 align을 통해 전이 가능하고 좋은 표현력을 갖는 representation을 학습하고자 하는 Video-Text Pre-training (

논문 리뷰

000

1y

Distilling Vision-Language Pre-training to Collaborate with Weakly-Supervised Temporal Action Localization 리뷰 [CVPR 2023]

기존의 Weakly-Supervised Temporal Action Localization (W-TAL) 방법론들은 대부분 classification-based pre-training (CBP) 방법을 사용하였습니다. (BaS-N

논문 리뷰

001