신한은행, 파편화된 모니터링 체계를 인터맥스 E2E로 통합하여 장애 대응 시간을 효과적으로 단축한 비결은?
P솔루션, T솔루션 등 분산된 APM 체계를 통합하여
실시간 장애 대응 체계를 구축한 디지털 트랜스포메이션 스토리
“기존에는 인프라 운영부서에서만 모니터링을 하는 문화였다면 현재는 개발부서마다 모두 인터맥스 대시보드를 띄워두며 모니터링을 쉽게 하는 문화가 생겼습니다.” IT운영팀, 김윤국 수석
1. 신한은행이 선택한 차세대 통합 모니터링 전략
디지털 금융 서비스가 일상화되면서 신한은행의 IT 인프라 운영 복잡도는 지속적으로 증가해왔습니다. 이러한 변화의 중심에는 고객들이 가장 활발하게 이용하는 모바일 서비스들이 있었고 안정적 운영이 무엇보다 중요해졌습니다.
실제로 모바일 뱅킹 'SOL'만 해도 일평균 1,000만 건 이상의 트랜잭션을 처리하고 있으며, 이를 뒷받침하는 수천 대의 서버와 수백 개의 애플리케이션은 24시간 365일 쉴 새 없이 작동합니다. 여기에 WAS, TP, DB가 복잡하게 연계된 은행 특유의 시스템 구조까지 더해지면서, 전구간 가시성 확보는 신한은행이 반드시 해결해야 할 과제가 되었습니다.


2. 도입 배경
APM 고도화와 E2E 구현의 필요성
신한은행의 IT 운영팀은 매일 같은 고민을 반복했습니다. 시스템 모니터링은 A 솔루션으로, 네트워크는 B 솔루션으로, 애플리케이션은 C 솔루션으로 각 영역별로 다른 도구를 사용하다 보니 전체 시스템의 상태를 한눈에 파악하는 것이 불가능했죠.
더 큰 문제는 장애가 발생했을 때였습니다. 어디서 문제가 시작됐는지 알 수 없어 각 팀 담당자가 자신의 영역을 일일이 확인해야 했고, 그 과정에서 소중한 골든타임을 놓치는 일이 빈번했습니다. 장애 발생 시 개발팀은 '인프라 문제인 것 같다'고 하고, 인프라팀은 '애플리케이션 문제인 것 같다'며 정확한 문제 구간을 파악하는 데 많은 리소스가 들어가는 것이 문제였습니다. 원인을 파악하는 데만 수 일이 걸리기도 했죠.
특히 금융권 특유의 복잡한 시스템 구조가 문제를 더욱 어렵게 만들었습니다. WAS(Web Application Server)와 TP(Transaction Processor) 그리고 DB가 복잡하게 얽혀 있는 구조에서 단일 트랜잭션의 전체 흐름을 추적하는 것은 매우 높은 난이도가 요구되었습니다.
또 다른 고민은 데이터의 정량화였습니다. 텍스트 기반의 로그 파일을 일일이 분석해야 했기에 성능 트렌드를 파악하거나 개선 효과를 측정하기 어려웠습니다. 경영진에게 보고할 때마다 파편화된 데이터를 서로 다른 기준으로 통합하는 과정의 리소스가 많이 들었습니다.
💡 결정적 전환점
차세대 시스템 구축 프로젝트가 시작되면서 APM 고도화의 필요성이 대두되었습니다.
특히 E2E(End-to-End) 모니터링과 개발자가 원하는 depth까지 분석할 수 있는 체계 구축이 핵심 요구사항이었습니다.
3. 주요 활용 기능
의심스러운 로그에 대한 자세한 데이터를 대시보드를 통해 확인할 수 있게 되었습니다.
“신한은행이 인터맥스 도입을 결정한 것은 단순히 또 다른 모니터링 툴을 추가하는 것이 아니었습니다. 수년간의 구축과 안정화 과정을 거쳐 완성한 것은 신한은행만의 맞춤형 통합 모니터링 체계였죠.”
1. 트랜잭션 모니터와 액티비티 모니터로 실현한 실시간 가시성
메인 대시보드에 띄워진 '액티비티 모니터'는 전체 시스템의 병목 구간을 한눈에 보여줍니다. 수천 개의 서비스 중 어디에 문제가 있는지 색상 변화만으로 즉시 알 수 있죠. 특히 트랜잭션 모니터의 빨간점(Critical Error)은 심각한 에러를 실시간으로 표시해 즉각적인 대응을 가능하게 합니다.
2. E2E 전구간 추적의 혁신
WAS-TP-DB를 관통하는 단일 트랜잭션 ID로 전체 경로를 추적할 수 있게 되었습니다. 금융권 특유의 복잡한 TP 환경까지 완벽히 연계되어, 이제는 문제가 정확히 어느 구간에서 발생했는지 몇 초 만에 파악할 수 있습니다.
3. 콜트리 분석으로 깊이 있는 문제 해결
개발자들이 가장 만족하는 기능은 바로 콜트리 상세 분석입니다. 메소드 레벨까지 추적 가능한 콜트리를 통해 성능 병목 지점을 정확히 찾아내고, SQL 실행 시간과 바인드 변수까지 확인하여 튜닝 포인트를 즉시 파악할 수 있습니다.
4. 맞춤형 커스터마이징의 가치
제품 도입 후, 안정화 과정에서 신한은행만의 맞춤형 대시보드가 완성되었습니다. 에러별 색상 구분, 부서별 맞춤 화면 구성, 중요도별 알람 설정 등 신한은행의 운영 환경에 최적화된 시스템으로 진화했습니다.
"이제는 각 층마다, 개발부서마다 모두 인터맥스 대시보드를 띄워두고 있습니다. 과거 인프라 운영부서만 모니터링하던 문화에서 벗어나 모두가 함께 시스템을 지켜보는 문화가 생겼죠. 작은 실수도 즉시 드러나기 때문에 오히려 더 조심하고 안정적으로 운영하게 되었습니다."
4. InterMax E2E를 선택한 이유
평가 항목 | InterMax E2E | 경쟁 솔루션 |
WAS-TP-DB 완전 통합 | ✓ 유일하게 TP 구간까지 추적 | ✗ TP 구간 지원 불가 |
다양한 커스터마이징 지원 | ✓ 커스터마이징을 통한 신한은행 맞춤형 시스템 구축 | ✗ 제한적 커스터마이징 |
깊이 있는 분석 | ✓ 문제 구간 식별 후, 메소드 레벨까지 드릴다운 분석 | ✗ 구간별 분석 어려움 |
검증된 금융권 레퍼런스 | ✓ 대규모 트랜잭션 처리 안정성 입증 | ✗ 금융권 사례 부족 |
"S사는 데이터는 잘 모으지만 분석은 사람이 해야 했고, J사는 APM은 좋지만 E2E가 안 됐습니다.InterMax만이 우리가 원하는 전구간 통합 모니터링을 제공할 수 있었죠."
5. 활용법 알아보기
데이터 연계 분석을 통한 전구간 통합 모니터링
웹 애플리케이션 아키텍처에서 WAS, DB는 서로 밀접한 관계가 있음에도 불구하고, 개발(WAS)과 인프라(DB) 조직이 서로 떨어져 있기 때문에 보통은 WAS 혹은 DB 영역별 단위 분석을 수행하는 게 일반적입니다.
APM 관점 분석은 비즈니스 서비스 단위인 트랜잭션 모니터링이 가능하지만 DB 구간 상세 분석이 어렵고, DPM 관점 분석은 DB 관점 모니터링이 가능하지만 이를 수행하는 애플리케이션 상세 분석이 불가능합니다. 양 업무의 이해가 부족하면 서비스 장애가 발생했을 때, APM 담당자는 DB 응답 지연을 문제로 삼고, DPM 담당자는 APM 쪽을 문제로 보는 경우가 빈번합니다.
5-1. E2E 통합 대시보드로 전구간 실시간 모니터링
"E2E를 통한 구간별 분석이 가능하다는 점이 가장 큰 장점입니다.채널별로 전체 트랜잭션 흐름을 한눈에 파악할 수 있어 문제 구간을 즉시 식별할 수 있게 되었습니다."

주요 기능
- 서비스별 트랜잭션 흐름 시각화
- 구간별 응답시간 실시간 표시
- 병목 구간 자동 하이라이트
- 드릴다운 방식의 상세 분석
도입 효과
- 장애 원인 파악 시간 단축
- 부서간 협업 시간 절감
- 전구간 가시성 확보
- 사일로화된 모니터링 완전 통합
5-2. 트랜잭션 모니터의 빨간점으로 Critical Error 즉시 감지
“트랜잭션 모니터의 빨간점(Critical Error) 기능을 통해서 문제 발생 후 빠르게 인지 및 조치를 수행 중입니다.에러별로 색상을 커스터마이징하여 빠르게 인지할 수 있게 되었습니다.”

Critical Error 장점
- 색상 등 상세한 커스터마이징이 가능하여, 서비스별 특성에 맞게 변경 가능
5-3. 콜트리로 depth별 상세 분석 및 SQL 튜닝
"업무별로 콜트리 분석을 통해 개선 활동을 수행할 수 있는 점이 좋습니다.콜트리를 통한 depth별 분석이 가능하여 개발자가 원하는 깊이까지 분석할 수 있습니다."

콜트리 분석으로 확인 가능한 정보
✓ 각 메소드별 실행 시간 | ✓ CPU/메모리 사용량 |
✓ SQL 쿼리 및 바인드 변수 | ✓ 예외 발생 지점 |
✓ 외부 API 호출 상세 | ✓ 트랜잭션 경로 추가 |
5-4. 부서별 맞춤형 대시보드로 전사 모니터링 문화 확산
"각 층마다, 개발부서마다 모두 인터맥스 대시보드를 띄워두며 모두가 모니터링을 쉽게 하는 문화가 생겼습니다. 신한은행 환경에 맞는 커스텀 기술지원이 우수합니다."


개발팀
콜트리, SQL 성능
애플리케이션 로그
인프라팀
서버 리소스, DB 세션
네트워크 트래픽
운영팀
서비스 가용성, SLA
종합 대시보드
6. 도입 성과 요약
“장애 인지 및 원인 파악에 대한 전체적인 시간이 절감되었고 꾸준한 성능 개선 활동으로 운영 안정성이 크게 증가했습니다. 무엇보다 데이터 기반의 의사결정이 가능해진 것이 가장 큰 변화입니다.”
WAS, TP, DB가 복잡하게 연계된 시스템 구조에서 전구간 추적이 어려우신가요? 금융권이 검증한 InterMax E2E로 완벽한 End-to-End 가시성을 확보하세요!
InterMax E2E로 통합 모니터링 시작하기 👇

함께 보면 좋은 아티클

