머신러닝 모델 서빙 비용 1/4로 줄이기 - mysetting

머신러닝 모델 서빙 비용 1/4로 줄이기

2022-12-13 00:00

머신러닝 모델 서빙 비용 1/4로 줄이기

들어가며
하이퍼커넥트의 AI 조직에서는 다양한 머신러닝 모델을 서빙하고 있습니다. 보통의 서버와는 달리, 머신러닝 모델의 처리량(throughput)을 높이기 위해서는 특수 자원인 GPU가 필요합니다. 그런데 GPU를
사용하면 성...

Hyperconnect Tech Blog

004

댓글