Research topics
연구 주제
- LLM inference and serving system optimization
- Agentic AI systems: scheduling, orchestration, and tool-use pipelines
- Parameter-efficient fine-tuning (PEFT / LoRA) on constrained infrastructure
- Mixture-of-Experts (MoE) model serving and expert routing efficiency
- GPU resource management and memory optimization for large models
- LLM 추론 및 서빙 시스템 최적화
- 에이전틱 AI 시스템: 스케줄링, 오케스트레이션, 툴 사용 파이프라인
- 제한된 인프라에서의 파라미터 효율적 파인튜닝 (PEFT / LoRA)
- Mixture-of-Experts (MoE) 모델 서빙 및 전문가 라우팅 효율화
- 대형 모델을 위한 GPU 자원 관리 및 메모리 최적화