연구분야
운영체제부터 생성형 AI까지, 시스템과 AI의 경계를 잇는 실용적 연구를 수행합니다.
운영체제
커널/런타임 레벨에서 지연을 줄이고 안정성을 높이는 기법을 연구합니다. 실사용 환경을 전제로 계측·검증까지 이어집니다.
주요 주제
- 스케줄러·메모리 관리, I/O 스택 최적화
- 컨테이너·가상화, eBPF 기반 관측성
- 파일시스템/스토리지 일관성·신뢰성
접근법
- 프로파일링/트레이싱 기반 병목 추적
- 실험 설계·A/B·마이크로벤치
- 페일세이프/리커버리 시나리오 검증
스택
Linux
eBPF
Perf/Ftrace
KVM/QEMU
LLM
모델 경량화·튜닝·안정적 추론 파이프라인을 연구합니다. 시스템 제약 하에서의 효율과 품질을 균형 있게 다룹니다.
주요 주제
- 지시문 튜닝·도메인 적응
- 지식 편향/환각 저감, 안전성
- KV 캐시·양자화·서빙 최적화
접근법
- 데이터 커리큘럼·우선순위 샘플링
- 프롬프트 엔지니어링/체인 설계
- 정량 평가(accuracy/latency/cost)
스택
PyTorch
vLLM
TensorRT
LoRA/QLoRA
RAG (Retrieval-Augmented Generation)
검색-생성 결합으로 정확성과 최신성을 확보합니다. 인덱싱·리랭킹·컨텍스트 구성의 전 과정을 정밀 튜닝합니다.
주요 주제
- 청킹/슬라이딩·하이브리드 인덱스
- BM25+Dense·Cross Encoder 리랭킹
- 컨텍스트 융합·근거 인용/평가
접근법
- 지식베이스 스키마 설계·버전닝
- Groundedness/Answerability 측정
- 에이전트형 Tool-Use 통합
스택
FAISS
Elasticsearch
LangChain/LlamaIndex
ColBERT/TEI
Cloud Computing
대규모 분산 시스템의 자동화·신뢰성·비용 효율을 다룹니다. 멀티·하이브리드 클라우드에서 일관된 운영을 지향합니다.
주요 주제
- K8s 스케줄링·오토스케일링
- 서버리스·이벤트 기반 아키텍처
- 관측성(Tracing/Logging/Profiling)
접근법
- SLO 기반 용량/비용 모델링
- 카나리·블루/그린·리질리언스 테스트
- Edge/Hybrid 라우팅·데이터 거버넌스
스택
Kubernetes
Istio
Prometheus/Grafana
Terraform
실시간 아바타
음성·시각·모션을 결합한 초저지연 인터랙션을 구현합니다. 네트워크 지터/패킷손실 환경에서도 안정적인 품질을 목표로 합니다.
주요 주제
- WebRTC 파이프라인·적응형 비트레이트
- Streaming ASR·VAD·TTS·Voice Conversion
- 립싱크/표정추정·경량 렌더링
접근법
- 오디오/비디오 버퍼링 지연 예측
- GPU 스케줄링·멀티스트림 최적화
- QoE 측정(유창성/동기/지연/왜곡)
스택
WebRTC
TensorRT/ONNX
A/V Codecs
Three.js/Unity
AI
모델·데이터·시스템을 통합한 엔드투엔드 AI를 연구합니다. 재현성과 운영 가능성을 우선합니다.
주요 주제
- 모델 압축·지연 최적화·경량 추론
- MLOps·데이터 품질/편향 관리
- 멀티모달 파이프라인 설계
접근법
- 실험 추적·모델 레지스트리·승인 워크플로
- 데이터 카탈로그/버전 관리
- 리스크·윤리·보안 가이드라인 반영
스택
MLflow
Weights & Biases
Airflow
CUDA/cuDNN