2025-02-12 09:10

DeepSeek 논문 정리

DeepSeek 논문 정리
틀린 부분이 있을 수 있습니다.
DeepSeek-R1-Zero
DeepSeek-V3-Base 를 기반으로 RL 만을 이용해 학습
처음부터 시작하면 시간과 돈이 많이 들기 때문에 교사 모델로부터 지식 증류...
DevOps
000

댓글