AI Research Scientist

• LLM Post-training 팀의 목표(지식/추론 강화, 인간 선호도 정렬, 에이전트형 도구 활용 성능 향상) 달성
• 확장 가능한 데이터 구축 방법론 및 초고품질 데이터 필터링 시스템 개발
• DPO·RLHF·RLVR 등 최신 학습 기법을 활용한 사후 학습 기술 연구 및 적용
• Workspace Benchmark Set 구축을 통해 모델의 실용성과 성능 극대화
• 강화학습을 통한 LLM 성능 개선(수학, 코드, 일반 추론, 도구 사용)
• 효율적이고 효과적인 추론 기법 연구 및 적용
• 에이전트형 도구 사용을 위한 확장 가능한 데이터 합성 파이프라인 설계
• 언어별 보상모델 및 정확한 지시사항 수행 능력 향상 연구

AI Research Engineer - LLM Post-training

Job Level

About the role

Requirements

Applicant Tracking System Keywords

Hard skills

Soft skills

Certifications