Toss
AIEngineer(Model)
Neural analysis suggests this role is
optimal for Mid+ candidates.
“AI Engineer (Model) at Toss. Skills: LLM Model Training, Data Engineering, Model Evaluation. Build high-quality datasets. Refine data through experimentation”
What You'll Achieve.
Replace high-cost LLM cases; Build internal model capabilities; Enhance Korean language capabilities; Enhance Toss domain capabilities
Industry & Context.
Quantitative analysis; Iterative model improvement; Problem definition; Solution development
What They're Looking For.
Must Have
LLM/VLM model training experience, Data generation-learning-evaluation cycle experience, Experiment design and quantitative analysis, Model improvement through iterative experiments, Learning pipeline optimization experience, Post-training technique familiarity, SFT, DPO, RL, LoRA, Quantization knowledge
Nice to Have
Large-scale distributed learning experience, Synthetic data generation pipeline design, LLM evaluation/benchmark design automation, Domain-adapted model training experience, LLM open source contribution experience
What You'll Do.
Build high-quality datasets
Refine data through experimentation
Explore optimal data distributions
Build stable data pipelines
Explore optimal learning pipelines
Explore learning strategies
Satisfy performance constraints
Satisfy latency constraints
Satisfy cost constraints
Solve case-specific problems
Build evaluation benchmarks
Evaluate general performance
Analyze evaluation results
Derive insights for data
Derive insights for learning
How You'll Work.
Team & Collaboration
Applied AI Team; Data organization
Full Job Description
# 합류하게 될 팀에 대해 알려드려요 - Applied AI Team은 토스 구성원이 AI로 더 잘 일할 수 있도록 만드는 팀이에요. AI를 단순히 가져다 쓰는 것을 넘어, 현업의 문제 안으로 직접 들어가 AI 기반 제품과 워크플로우를 처음부터 끝까지 설계하고 운영해요. - 그중 모델 파트는 토스가 외부 상용 LLM에 의존하던 고비용 유스케이스를 직접 학습한 모델로 내재화하는 일을 해요. - 단기적으로는 고비용 LLM 사용 케이스를 내재화 모델로 대체해 나가고, 장기적으로는 Open weights LLM을 기반으로 한국어와 토스 도메인 역량을 강화하며, 사내 데이터와 피드백을 지속적으로 반영하는 continual learning 체계를 구축하는 것을 목표로 해요. - AI Engineer (Model)은 데이터 구축부터 모델 학습, 평가 체계까지 모델을 만드는 전 과정을 책임지며, 토스가 자체 모델 역량을 갖추는 데 핵심적인 역할을 하게 돼요. - **토스 데이터 조직에 대해 더 알아보고 싶다면?** [→ *토스 Data Division 위키*](https://recruit-data-division.oopy.io/) # 합류하면 함께 할 업무에요 데이터 구축 - 토스의 실제 서비스 데이터를 LLM이 학습할 수 있는 고품질 데이터셋으로 구축해요. - 실험 기반으로 데이터를 정제하고, 최적의 데이터 분포를 탐색하며, 이를 안정적으로 재현하는 데이터 파이프라인을 구축해요 모델 학습 - Post-training, continual learning을 위한 최적의 학습 파이프라인을 탐색해요 - 케이스별 요구 성능·latency·비용 제약을 만족하는 학습 전략을 탐색하여 주어진 문제를 해결해요. 평가 benchmark 구축 - 토스 서비스에서의 실제 성능과 범용 성능을 종합적으로 평가하는 benchmark를 구축해요. - 평가 결과 분석을 통해 새로운 데이터와 학습 방식에 대한 인사이트를 도출해요 # 이런 분과 함께하고 싶어요 - LLM/VLM 모델을 직접 학습해 실제 문제를 개선해 본 경험이 필요해요. 데이터 생성-학습-평가로 이어지는 사이클을 돌려보신 분을 찾아요. - 실험을 설계하고 결과를 정량적으로 분석하는 데 능숙한 분이 필요해요. 가설을 스스로 정의하고, 반복 실험으로 모델을 개선해 오신 분 - 모델링 사이클을 빠르게 돌리기 위해 학습 파이프라인을 최적화해 본 경험이 필요해요. 가설-실험-개선을 빠르게 반복할 수 있어야 해요. - 다양한 post-training 기법에 익숙한 분을 찾아요. SFT, DPO, RL, LoRA, Quantization 등 학습 전략을 상황에 맞게 선택하실 수 있어야 해요 # 이런 경험이 있으면 더 좋아요 - 대규모 학습을 위한 분산 학습(DeepSpeed, FSDP, Megatron 등) 경험 - Synthetic data 생성 파이프라인을 설계하고 데이터 품질이 성능에 미치는 영향을 분석해 본 경험 - LLM evaluation / benchmark를 직접 설계하고 자동화한 경험 - 특정 도메인(금융, 의료, 법률, 커머스 등)의 데이터를 활용하여 domain-adapted model을 학습하고 서비스에 배포해 본 경험 - LLM 오픈소스(transformers, vLLM 등)에서 발생한 이슈를 해결하거나 커뮤니티에 기여해 본 경험 # 이력서는 이렇게 작성하시는 걸 추천해요 - 참여한 프로젝트에서 본인이 정의한 문제, 선택한 접근법, 실험 방법과 성능 개선 내용을 구체적으로 적어주세요. 특히 모델 적용 전후의 정량 지표가 있다면 좋아요 - 데이터·학습·평가 중 어느 단계에서 어떤 의사결정과 트레이드오프가 있었는지, 또는 잘 안 됐던 시도와 거기서 얻은 결론도 환영해요 - LLM 오픈소스 모델/소프트웨어 사용 중 발생한 버그를 해결하거나, 부족한 기능을 개선하기 위해 기여한 경험이 있다면 적어주세요 # 토스로의 합류여정 - 서류 접수 > 프리 인터뷰 > 직무 인터뷰 > 문화적합성 인터뷰 > 레퍼런스 체크 > 처우 협의 > 최종 합격 - 프리 인터뷰에서는 지원서 기반의 주요 경험과 직무
Applying for this AI Engineer (Model) role?
Most applicants get filtered before a human reads their resume. See if yours makes the cut.
ANONYMOUS · UNFILTERED
What do employees actually say about Toss?
Real rants from real employees. Read before you apply.