한림대학교 - OS Lab

ai


엔드투엔드 AI

AI 엔지니어링

모델·데이터·시스템을 통합해 재현 가능하고 운영 가능한 AI를 구축합니다. 성능(정확도/지연/비용)과 안전성을 균형 있게 최적화합니다.

개요

실사용 환경을 전제로 모델(압축/튜닝/추론)–데이터(품질/버전/거버넌스)–시스템(서빙/모니터링)을 하나의 파이프라인으로 설계합니다. 지연/비용/정확도 간 트레이드오프를 지표로 관리합니다.

모델링

튜닝 & 경량화

  • 지시문 튜닝/LoRA·QLoRA, 지식 증류
  • 프루닝·양자화·KV 캐시 최적화
  • 지연·메모리 제약 하 품질 유지

멀티모달

  • 텍스트·음성·이미지 파이프라인
  • 스트리밍 토큰/프레임 결합
  • 온디바이스/엣지 추론

성능 최적화

  • 배치·텐서RT·그래프 컴파일
  • 스루풋·지연 예산 관리
  • 오토스케일·캐시 정책

데이터

품질 & 버전

데이터 카탈로그/스키마/버전 관리로 재현성 확보

DQ RulesSchemaLineage

선별 & 생성

커리큘럼/우선순위 샘플링·합성 데이터

ActiveAugmentSFT

편향 & 개인정보

PII 마스킹·편향/공정성 지표·감사 로그

PIIBiasAudit

시스템 · MLOps

파이프라인

  • 실험 추적·모델 레지스트리
  • CI/CD·프로모션 게이트
  • 피처/벡터 스토어

서빙

  • Triton/vLLM/텐서RT-LLM
  • A/B·카나리·블루/그린
  • 관측성(Trace/Log/Metrics)

보안/거버넌스

  • 권한/비밀 관리·RBAC
  • 데이터 거버넌스·DLP
  • 모델/데이터 감사

안전성

  • 레드팀·어택 시나리오(프롬프트 주입/데이터 중독 등)
  • 가드레일(정책·콘텐츠 필터·툴 접근 제한)
  • 환각/근거성 평가·거짓/민감도 대응

평가

모델/태스크

  • 정확도/BLEU/ROUGE 등 태스크 지표
  • 안전·편향·근거성(groundedness)
  • 휴리스틱·휴먼 평가 병행

시스템

  • 지연(FTL/TTFT)·스루풋·비용
  • 캐시 hit·오토스케일 반응
  • SLO 위반율·에러·드리프트

스택

PyTorchTensorRTvLLM FastAPITritonCUDA/cuDNN AirflowMLflowWeights & Biases KafkaSparkOpenTelemetry
협업/상담 문의하기
End-to-End AI

AI Engineering

We build reproducible, operational AI by integrating models, data, and systems, optimizing accuracy, latency, cost, and safety together.

Overview

We architect a unified pipeline across models (compression/fine-tuning/inference), data (quality/versioning/governance), and systems (serving/monitoring), managing trade-offs between accuracy, latency, and cost.

Modeling

Tuning & Compression

  • Instruction tuning / LoRA·QLoRA, distillation
  • Pruning, quantization, KV-cache optimizations
  • Quality under latency/memory constraints

Multimodal

  • Text/Speech/Image pipelines
  • Streaming token/frame fusion
  • On-device/edge inference

Performance

  • Batching, TensorRT, graph compilation
  • Throughput & latency budgeting
  • Autoscaling & caching strategies

Data

Quality & Versioning

Catalog/schema/versioning for reproducibility

DQ RulesSchemaLineage

Curation & Synthesis

Curriculum/priority sampling, synthetic data

ActiveAugmentSFT

Bias & Privacy

PII masking, fairness metrics, audit logs

PIIBiasAudit

Systems · MLOps

Pipeline

  • Experiment tracking & model registry
  • CI/CD & promotion gates
  • Feature/Vector stores

Serving

  • Triton / vLLM / TensorRT-LLM
  • A/B, canary, blue/green
  • Observability (traces/logs/metrics)

Security & Governance

  • Secrets/RBAC
  • Data governance & DLP
  • Model/data auditing

Safety

  • Red-teaming (prompt injection, data poisoning, etc.)
  • Guardrails (policies, content filters, tool access limits)
  • Hallucination/groundedness checks, sensitivity handling

Evaluation

Task/Model

  • Accuracy/BLEU/ROUGE, etc.
  • Safety, bias, groundedness
  • Human & heuristic scoring

System

  • TTFT/latency, throughput, cost
  • Cache hit, autoscale responsiveness
  • SLO violations, errors, drift

Stack

PyTorchTensorRTvLLM FastAPITritonCUDA/cuDNN AirflowMLflowWeights & Biases KafkaSparkOpenTelemetry
Request Collaboration