About the role
- 오픈소스 모델을 효율적으로 실행·관리하고, 비용과 신뢰성을 최적화
- GPU, CPU, 메모리 리소스 전반에서 높은 성능과 안정성 확보
- 모델 추론을 모니터링 및 트러블슈팅하여 낮은 지연 시간과 높은 처리량 유지
- 엔지니어와 협력해 확장 가능하고 신뢰성 있는 모델 서빙 솔루션 구현
- Run and manage open-source models efficiently, optimizing for cost and reliability
- Ensure high performance and stability across GPU, CPU, and memory resources
- Monitor and troubleshoot model inference to maintain low latency and high throughput
- Collaborate with engineers to implement scalable and reliable model serving solutions
Requirements
- 주도성과 독립성을 중시하는 분
- “명확함은 실행에서 나온다”는 믿음을 가지고, 완벽한 계획을 기다리기보다 프로토타입·테스트·반복을 통해 실행하는 분
- 스타트업 환경의 혼란 속에서도 침착하고 효과적으로 일할 수 있는 분 —— 우선순위 변화나 제로 베이스 구축도 두려워하지 않는 분
- 속도 지향적으로, 완벽한 결과보다 지금 가치 있는 무언가를 전달하는 것을 중요하게 여기는 분
- 피드백과 실패를 성장의 일부로 보고, 지속적으로 실력을 발전시키려는 분
- 겸손함, 배움에 대한 열정, 실행력을 가지고 있으며, 동료들과 함께 성장하는 분
- vLLM, HuggingFace TGI 등의 모델 서빙 플랫폼 사용 경험
- Kubernetes, Ray, Modal, RunPod, LambdaLabs 등을 활용한 GPU 오케스트레이션 경험
- 트래픽 수요에 따라 지연 시간·비용을 모니터링하고 시스템을 효율적으로 확장할 수 있는 능력
- 백엔드 엔지니어를 위한 추론 엔드포인트 설정 경험
- Experience with model serving platforms such as vLLM or HuggingFace TGI
- Proficiency in GPU orchestration using tools like Kubernetes, Ray, Modal, RunPod, LambdaLabs
- Ability to monitor latency, costs, and scale systems efficiently with traffic demands
- Experience setting up inference endpoints for backend engineers
- 수평적 조직 구조와 진정한 오너십
- 제품 방향성과 합의 기반 의사결정에 전면적으로 참여
- 유연한 근무 형태
- 제품, 데이터, 엔지니어링 전반에 걸쳐 높은 영향력을 가지는 역할
- 업계 최고 수준의 보상 및 성과 기반 보너스
- 글로벌 제품 개발에 참여할 기회
- 다양한 복지 —— 주택 임대 보조, 우수한 회사 구내식당, 야근 식사 제공
- 건강, 치과, 안과 보험
- 본인 및 가족을 위한 글로벌 여행 보험
- 무제한·유연한 휴가 제도
- Flat structure & real ownership
- Full involvement in direction and consensus decision making
- Flexibility in work arrangement
- High-impact role with visibility across product, data, and engineering
- Top-of-market compensation and performance-based bonuses
- Global exposure to product development
- Lots of perks - housing rental subsidies, a quality company cafeteria, and overtime meals
- Health, dental & vision insurance
- Global travel insurance (for you & your dependents)
- Unlimited, flexible time off
ATS Keywords
Tip: use these terms in your resume and cover letter to boost ATS matches.
Hard skills
model servingmodel inferencetroubleshootingGPU orchestrationlatency monitoringcost optimizationscalabilityhigh throughputperformance optimizationbackend inference endpoints
Soft skills
independenceprototypingcalmness under pressurespeed orientationgrowth mindsethumilitypassion for learningcollaborationexecutionadaptability