
AI Research Engineer - LLM Post-training
Upstage
full-time
Posted on:
Location Type: Office
Location: Yongin • 🇰🇷 South Korea
Visit company websiteJob Level
Mid-LevelSenior
About the role
- LLM Post-training 팀의 목표(지식/추론 강화, 인간 선호도 정렬, 에이전트형 도구 활용 성능 향상) 달성
- 확장 가능한 데이터 구축 방법론 및 초고품질 데이터 필터링 시스템 개발
- DPO·RLHF·RLVR 등 최신 학습 기법을 활용한 사후 학습 기술 연구 및 적용
- Workspace Benchmark Set 구축을 통해 모델의 실용성과 성능 극대화
- 강화학습을 통한 LLM 성능 개선(수학, 코드, 일반 추론, 도구 사용)
- 효율적이고 효과적인 추론 기법 연구 및 적용
- 에이전트형 도구 사용을 위한 확장 가능한 데이터 합성 파이프라인 설계
- 언어별 보상모델 및 정확한 지시사항 수행 능력 향상 연구
Requirements
- 관련 분야 석사 이상의 학위
- LLM post-training/fine-tuning을 수행하여 특정 문제에서 최고 성능을 달성해본 경험 (Strongly wanted)
- ML과 NLP 토픽으로 국제 학회에서 출판 기록 (1저자 혹은 교신저자)
- AI 관련 연구 또는 프로덕트 개발을 리딩한 경험 (May helpful)
- LLM Post-training을 위한 데이터 수집, 생성, 정제 수행 경험 (May helpful)
- 국제 혹은 국내 AI 대회 (Kaggle 등) 상위권 입상 (May helpful)
- 제한된 자원과 시간에서 성능 최적화를 수행할 수 있는 능력
- 논리적 실험 설계 및 가설/검증 기반 결과 도출 능력
- 레슨런을 효과적/효율적으로 전파하고 논의할 수 있는 의사소통 능력
- 대규모 모델 학습 프레임워크 사용 경험(e.g. DeepSpeed) (우대)
- LLM 기반 제품 개발 경험 (우대)
- 데이터 수집, 정제, annotation 경험 (우대)
- AI 및 NLP 관련 국제 학회 1저자/교신저자 출판 기록 (우대)
- 글로벌 고객 대응을 위한 영어 커뮤니케이션 능력 (우대)
Benefits
- 유연근무제도 운영
- 간식 스테이션, 안마의자, 허먼밀러 등 쾌적한 근무환경 제공
- 근무에 필요한 장비를 500만원 예산 내에서 자유롭게 선택 가능
- 업무 관련 소프트웨어, 도서, 자료, 교육 및 어학 수강비 등 성장에 필요한 비용 지원
- 운동비 지원, 직장 단체보험 및 종합건강검진 지원
Applicant Tracking System Keywords
Tip: use these terms in your resume and cover letter to boost ATS matches.
Hard skills
LLM post-trainingfine-tuningmachine learningnatural language processingreinforcement learningdata collectiondata generationdata refinementexperimental designhypothesis testing
Soft skills
communicationproblem-solvingperformance optimizationlogical reasoningteam leadership
Certifications
Master's degree