연구분야

운영체제부터 생성형 AI까지, 시스템과 AI의 경계를 잇는 실용적 연구를 수행합니다.

운영체제

커널/런타임 레벨에서 지연을 줄이고 안정성을 높이는 기법을 연구합니다. 실사용 환경을 전제로 계측·검증까지 이어집니다.

주요 주제

스케줄러·메모리 관리, I/O 스택 최적화
컨테이너·가상화, eBPF 기반 관측성
파일시스템/스토리지 일관성·신뢰성

접근법

프로파일링/트레이싱 기반 병목 추적
실험 설계·A/B·마이크로벤치
페일세이프/리커버리 시나리오 검증

스택

Linux eBPF Perf/Ftrace KVM/QEMU

LLM

모델 경량화·튜닝·안정적 추론 파이프라인을 연구합니다. 시스템 제약 하에서의 효율과 품질을 균형 있게 다룹니다.

주요 주제

지시문 튜닝·도메인 적응
지식 편향/환각 저감, 안전성
KV 캐시·양자화·서빙 최적화

접근법

데이터 커리큘럼·우선순위 샘플링
프롬프트 엔지니어링/체인 설계
정량 평가(accuracy/latency/cost)

스택

PyTorch vLLM TensorRT LoRA/QLoRA

RAG (Retrieval-Augmented Generation)

검색-생성 결합으로 정확성과 최신성을 확보합니다. 인덱싱·리랭킹·컨텍스트 구성의 전 과정을 정밀 튜닝합니다.

주요 주제

청킹/슬라이딩·하이브리드 인덱스
BM25+Dense·Cross Encoder 리랭킹
컨텍스트 융합·근거 인용/평가

접근법

지식베이스 스키마 설계·버전닝
Groundedness/Answerability 측정
에이전트형 Tool-Use 통합

스택

FAISS Elasticsearch LangChain/LlamaIndex ColBERT/TEI

Cloud Computing

대규모 분산 시스템의 자동화·신뢰성·비용 효율을 다룹니다. 멀티·하이브리드 클라우드에서 일관된 운영을 지향합니다.

주요 주제

K8s 스케줄링·오토스케일링
서버리스·이벤트 기반 아키텍처
관측성(Tracing/Logging/Profiling)

접근법

SLO 기반 용량/비용 모델링
카나리·블루/그린·리질리언스 테스트
Edge/Hybrid 라우팅·데이터 거버넌스

스택

Kubernetes Istio Prometheus/Grafana Terraform

실시간 아바타

음성·시각·모션을 결합한 초저지연 인터랙션을 구현합니다. 네트워크 지터/패킷손실 환경에서도 안정적인 품질을 목표로 합니다.

주요 주제

WebRTC 파이프라인·적응형 비트레이트
Streaming ASR·VAD·TTS·Voice Conversion
립싱크/표정추정·경량 렌더링

접근법

오디오/비디오 버퍼링 지연 예측
GPU 스케줄링·멀티스트림 최적화
QoE 측정(유창성/동기/지연/왜곡)

스택

WebRTC TensorRT/ONNX A/V Codecs Three.js/Unity

AI

모델·데이터·시스템을 통합한 엔드투엔드 AI를 연구합니다. 재현성과 운영 가능성을 우선합니다.

주요 주제

모델 압축·지연 최적화·경량 추론
MLOps·데이터 품질/편향 관리
멀티모달 파이프라인 설계

접근법

실험 추적·모델 레지스트리·승인 워크플로
데이터 카탈로그/버전 관리
리스크·윤리·보안 가이드라인 반영

스택

MLflow Weights & Biases Airflow CUDA/cuDNN

협업/학생 연구 문의하기