한림대학교 - OS Lab

cloud


클라우드 컴퓨팅

쿠버네티스·서버리스·관측성·하이브리드 운영까지—신뢰성과 비용을 함께 잡는 실전 아키텍처를 연구합니다.

개요

분산 시스템의 확장성·가용성·효율성을 목표로 컨트롤 플레인부터 데이터 플레인, CI/CD와 운영 자동화까지 엔드투엔드로 다룹니다.

탄력적 인프라

워크로드 특성에 맞춘 자동 확장과 자원 최적화.

신뢰성·보안

장애 허용, 정책 기반 접근 제어, 규정 준수.

비용 효율

SLO/예산 기반 용량 계획과 가시화.

오케스트레이션·오토스케일링

Kubernetes 스케줄링·HPA/VPA·클러스터 오토스케일링과 서비스 메시 기반 트래픽 제어를 최적화합니다.

  • 스케줄링: bin packing, affinity/taints, NUMA/GPUs
  • 네트워킹: 서비스 메시(예: Istio), 카나리/서킷 브레이커
  • 서버리스: 이벤트 드리븐·콜드스타트 최적화

신뢰성·비용

장애에 강한 아키텍처와 운영 비용 최소화 전략을 함께 설계합니다.

  • SLO/에러버짓·카오스 테스트·리전/존 다중화
  • 스팟/프리엠티브·RI/세이빙 플랜 혼합 전략
  • 워크로드 프로파일링 기반 rightsizing·스케줄링

관측성 (Observability)

메트릭·로그·트레이싱을 통합해 병목을 가시화하고, SRE 플레이북으로 대응합니다.

  • OpenTelemetry 기반 수집·전파·샘플링
  • 서비스 수준 지표(SLI)와 알림 튜닝
  • 성능 회귀 탐지·근본 원인 분석(RCA) 자동화

하이브리드/엣지

온프레미스·멀티클라우드·엣지 환경을 단일 정책과 파이프라인으로 운영합니다.

  • 동일한 CI/CD·IaC 파이프라인(환경 간 일관성)
  • 데이터 거버넌스·주권(Residency)·지연 기반 라우팅
  • 제로트러스트 네트워킹·시크릿/키 관리

스택

Kubernetes Istio/Linkerd Helm/ArgoCD Prometheus/Grafana OpenTelemetry Terraform/Pulumi AWS/GCP/Azure
협업/학생 연구 문의하기

Cloud Computing

From Kubernetes and serverless to observability and hybrid/edge— we design reliable and cost-efficient architectures that scale.

Overview

We cover control/data planes end-to-end—scalability, availability, and efficiency—alongside CI/CD and automation.

Elastic Infra

Autoscaling & right-sizing per workload characteristics.

Reliability & Security

Fault tolerance, policy controls, compliance.

Cost Efficiency

SLO & budget-driven capacity planning with visibility.

Orchestration & Autoscaling

Optimize K8s scheduling, HPA/VPA, cluster autoscaling, and service-mesh traffic control.

  • Scheduling: bin packing, affinity/taints, NUMA/GPUs
  • Networking: service mesh (e.g., Istio), canary/circuit breaker
  • Serverless: event-driven patterns & cold-start optimization

Reliability & Cost

Design for failure while minimizing TCO with data-driven capacity models.

  • SLO/error budget, chaos testing, multi-region/zone
  • Spot/preemptible + RI/savings plan strategies
  • Workload profiling for rightsizing & scheduling

Observability

Unify metrics/logs/traces and respond with SRE playbooks.

  • OpenTelemetry collection/propagation/sampling
  • SLIs and alert tuning for actionable signals
  • Perf regression detection & automated RCA

Hybrid/Edge

Operate on-prem, multi-cloud, and edge with unified policy and pipelines.

  • Consistent CI/CD & IaC across environments
  • Data governance/residency and latency-aware routing
  • Zero-trust networking, secret & key management

Stack

Kubernetes Istio/Linkerd Helm/ArgoCD Prometheus/Grafana OpenTelemetry Terraform/Pulumi AWS/GCP/Azure
Contact for Collaboration / Student Research