토스 메이커스 컨퍼런스 2025 참석 후기: 대규모 서비스의 기술적 진화를 엿보다
목차
토스 메이커스 컨퍼런스 2025 참석 후기: 대규모 서비스의 기술적 진화를 엿보다
참석일: 2025년 7월 25일 (금) 장소: 코엑스 컨벤션센터 주요 세션: 10개 기술 세션 참석

? 들어가며
토스 메이커스 컨퍼런스 2025에 참석하며 가장 인상 깊었던 점은 **“실패를 감추지 않고 드러내며 빠르게 공유하여 다음 선택의 근거로 삼는다”**는 토스의 기술 철학이었습니다.20년 된 레거시 시스템의 현대화부터 최신 ML 플랫폼 구축까지, 각 세션에서 공유된 내용은 단순한 성공 사례가 아닌 시행착오와 해결 과정이 담긴 진솔한 경험담이었습니다.
? 핵심 인사이트
1️⃣ 레거시는 짐이 아닌 자산이다
“20년 레거시를 넘어 미래를 준비하는 시스템 만들기” 세션에서 가장 놀라웠던 점은 토스가 2020년 인수한 20년 된 결제 시스템을 완전히 새로 만들지 않고 점진적으로 현대화했다는 것입니다.
현대화 전략:
- Git 도입으로 코드 관리 체계화
- MSA 전환 (150개+ 마이크로서비스)
- 4개 AZ 분산 Kubernetes 클러스터
- Java 17/21 사용률 50% 이상 달성
핵심 교훈: 레거시를 적으로 보지 말고, 비즈니스 가치를 인정하면서 단계적으로 개선하는 것이 현실적이고 효과적입니다.
2️⃣ 분산 시스템의 새로운 패러다임
**“현장결제 서비스의 분산 트랜잭션 관리학 개론”**에서 소개된 트리 구조 기반 트랜잭션 관리는 기존의 2PC나 Saga 패턴과는 완전히 다른 접근법이었습니다.
문제: 2개 트랜잭션 → 16가지 경우의 수
4개 트랜잭션 → 256가지 경우의 수
해결: 트리 구조 + Resolve 메커니즘
- 각 노드가 직계 하위 노드 상태만 관리
- 복잡도를 O(1) 서브트리 단위로 축소
- 양방향 보정 (재시도 + 롤백)
핵심 교훈: 복잡한 문제를 해결할 때는 기존 패턴에 얽매이지 말고, 문제의 본질을 이해하여 새로운 접근법을 시도해볼 용기가 필요합니다.
3️⃣ 설정 관리도 소프트웨어 개발이다
**“수천 개의 API/BATCH 서버를 하나의 설정 체계로 관리하기”**에서 인상 깊었던 점은 설정을 코드처럼 설계하고 관리한다는 철학이었습니다.
Overlay Architecture:
App (최고 우선순위)
↓
AppGroup
↓
Phase
↓
Cluster
↓
Global (기본값)
특징:
- 템플릿 시스템으로 중복 제거
- Python 스크립트 주입으로 동적 설정
- JobDSL로 배치 작업 코드화
핵심 교훈: 설정 관리를 단순한 파일 관리로 보지 말고, 소프트웨어 개발의 관점에서 접근하면 훨씬 체계적이고 확장 가능한 시스템을 만들 수 있습니다.
?️ 아키텍처 혁신 사례
ScyllaDB로 극한 성능 달성
토스뱅크의 Online Feature Store에서 ScyllaDB를 선택한 이유와 운영 경험이 매우 실용적이었습니다.
성능 지표:
- 쓰기: 120,000 TPS, P99 < 5ms
- 읽기: P99 < 5ms 안정적 유지
- 처리량: 매일 수천만건 적재
주의사항:
- Large Partition 관리 (100MB+ 파티션 문제)
- Full Scan 쿼리 제어 필요
- 중간 Feature Server로 쿼리 검증
핵심 교훈: 새로운 기술 도입시 성능만 보지 말고, 운영 복잡도와 함정까지 고려해야 합니다.
결제 시스템의 CQRS + 이벤트 기반 전환
**“확장성과 회복탄력성을 갖춘 결제시스템 만들기”**에서 가장 인상 깊었던 점은 실제 장애 사례와 해결 과정을 숨김없이 공유한 것이었습니다.
주요 장애와 해결:
1. DB 부하 → 인덱스 힌트로 옵티마이저 제어
2. 타임아웃 불일치 → 전체 서버 체인 타임아웃 재설정
3. 이벤트 누락 → 아웃박스 패턴 + 보상 트랜잭션
4. 데이터 불일치 → 두 원장간 보정 배치 운영
핵심 교훈: 완벽한 시스템은 없다. 중요한 것은 시스템이 스스로 회복할 수 있는 구조를 만드는 것입니다.
? 개발 조직의 성장
Infrastructure as Code의 진화
**“성장하는 엔터프라이즈를 위한 인터널 서비스 제공 전략”**에서는 토스가 어떻게 계열사 확장에 대응했는지 볼 수 있었습니다.
해결 전략:
- Terraform으로 인프라 "찍어내기"
- ArgoCD로 Kubernetes 리소스 관리
- Config Store로 MSA 환경 설정 통합
- Gateway Plugin으로 공통 로직 처리
핵심 교훈: 조직이 성장할 때는 사람이 늘어나는 것보다 자동화와 추상화가 더 중요합니다.
배치 시스템의 완전한 재구축
**“레거시 정산 개편기”**에서는 20년 된 정산 시스템을 어떻게 현대적으로 재구축했는지 상세히 다뤘습니다.
성능 최적화 3법칙:
1. 캐싱: 가맹점 설정정보 메모리 캐시
2. 벌크 처리: 래퍼 클래스로 배치 처리
3. JDBC Batch Insert: N번 → 1번 처리
결과:
- 처리 성능: 최대 10배 향상
- 2,100개 배치 자동화 관리
- 하루 수천만건 안정적 처리
핵심 교훈: 성능 최적화의 핵심은 I/O 최소화입니다.
? 개발자 성장의 과학
권태기 극복의 3가지 전략
마지막 세션 **“개발자 권태기, 10년 동안 이렇게 이겨냈습니다”**는 기술적 내용은 아니었지만, 가장 실용적인 세션이었습니다.
1. 일상 무료함 탈출 (Flow 이론):
- 명확한 목표 + 적절한 난이도 + 즉각적 피드백
- 매일 작은 도전 추가
2. 동기 회복 (자기결정성 이론):
- 자율성: 스스로 선택하는 일
- 유능감: 기술적 성장 체감
- 관계성: 동료와의 협업
3. 번아웃 예방:
- 수면 위생이 핵심 (한국 OECD 수면시간 꼴등)
- 침실은 수면 전용, 20도 유지
핵심 교훈: 개발자도 사람이다. 기술적 성장만큼 심리적 웰빙도 중요합니다.
? 실시간 데이터 처리의 현실
Apache Druid vs StarRocks
“고객은 절대 기다려주지 않는다” 세션에서는 두 OLAP 엔진의 실제 사용 경험을 비교해볼 수 있었습니다.
Apache Druid:
장점: 시계열 특화, 비트맵 인덱스, 월 5천만원 절감
한계: 멱등성 부족, 스키마 변경 어려움, 운영 복잡
StarRocks:
장점: 멱등성 지원, CDC 네이티브, 조인 성능 84.6% 개선
특징: Colocation Group으로 로컬 조인
현재: 하이브리드 운영 (각각의 장점 활용)
핵심 교훈: 완벽한 솔루션은 없다. 상황에 맞는 하이브리드 접근이 현실적입니다.
? 마무리: 토스에서 배운 것들
기술 철학
- 점진적 개선: 완벽한 시작보다 지속적인 개선
- 실패 공유: 실패를 숨기지 않고 학습 자산으로 활용
- 자동화 우선: 반복 작업의 자동화로 창조적 업무에 집중
- 개발자 경험: 기술적 우수성과 개인 성장의 조화
즉시 적용해볼 것들
- 설정 관리의 체계화 (계층형 구조 도입)
- 배치 작업의 코드화 및 자동화
- 카나리 배포를 통한 안전한 시스템 전환
- 개발자 권태기 예방을 위한 작은 도전들
장기적으로 고민해볼 것들
- 레거시 시스템의 점진적 현대화 전략
- 분산 트랜잭션 관리 방식 개선
- Infrastructure as Code 도입
- 실시간 데이터 처리 아키텍처 고도화
**토스 메이커스 컨퍼런스의 가장 큰 가치는 ‘완벽한 해답’을 제시하는 것이 아니라, ‘시행착오와 학습의 과정’을 공유한다는 점이었습니다.****대규모 서비스를 운영하며 겪는 현실적인 문제들과 그 해결 과정을 통해, 기술 선택의 트레이드오프와 실무진의 고민을 엿볼 수 있었습니다.**기술 컨퍼런스 참석이 단순한 트렌드 파악을 넘어 실무에 바로 적용할 수 있는 구체적인 인사이트를 얻을 수 있는 소중한 경험이었습니다.
본 후기는 토스 메이커스 컨퍼런스 2025 참석 후 개인적인 관점에서 작성되었으며, 실제 발표 내용을 바탕으로 구성되었습니다.