머신러닝 모델 서빙 비용 1/4로 줄이기
2022-12-13 00:00

머신러닝 모델 서빙 비용 1/4로 줄이기

들어가며
하이퍼커넥트의 AI 조직에서는 다양한 머신러닝 모델을 서빙하고 있습니다. 보통의 서버와는 달리, 머신러닝 모델의 처리량(throughput)을 높이기 위해서는 특수 자원인 GPU가 필요합니다. 그런데 GPU를
사용하면 성...

댓글