패트릭 린(Patrick Lin) 스플렁크 옵저버빌리티 부문 수석부사장 겸 총괄 매니저

디지털 시스템이 비즈니스 핵심 인프라가 된 지금, 장애나 공격이 발생하는 순간 기업은 금전적 손실을 직면할 위험에 놓이게 됐다. 전 세계 정보통신기술(ICT) 시장에서 '디지털 회복력(Digital Resilience)이 화두로 떠오른 이유다.

패트릭 린 스플렁크 옵저버빌리티 부문 수석부사장은 호주 멜버른컨벤션센터에서 <디지털데일리>를 만나 "디지털 회복력은 비즈니스가 의존하는 시스템이 신뢰할 수 있고 안정적이며 기대한 대로 성능을 내는지 보장하는 역량"이라고 밝혔다.

스플렁크 연구에 따르면 글로벌 2000대 기업들이 시스템 장애(다운타임)로 겪는 연간 손실은 4000억달러(약 581조원) 수준이다. 시스템이 한 번 중단되는 것 만으로 주식 가치가 평균 2.5% 하락하기도 했다. 사고 중 56%는 사이버보안과 관련이 있고, 44%는 앱 및 인프라 문제에서 발생한 것으로 나타났다.

린 수석부사장은 "엔지니어들이 신규 제품 출시를 앞두고 한참 일해야 할 때, 장애 대응으로 인해 작업이 지연될 수 있다는 의미"라며 "평판 손상과 주가 영향도 배제할 수 없는 요인"이라고 설명했다. 이어 "비즈니스에 중요한 시스템은 항상 가동돼야 하고 예기치 않은 행동이 나타나면 빨리 알아내야 한다"고 덧붙였다.

일부 기업은 모니터링 체계로 옵저버빌리티를 완성할 수 있다고 이야기한다. 이에 린 수석부사장은 기본 개념부터 바로잡을 필요가 있다고 제언했다. 그는 "서버는 켜져 있을 수 있고, 꺼져 있을 수 있고, 과열되고 있을 수 있는데 (이러한 현 상태보다) 비즈니스 기능을 실제 수행하고 있는지 여부를 파악하고 분석하는 것이 더 중요하다"며 "모니터링은 장비에 집중하지만, 옵저버빌리티는 이러한 과정을 보는 도구"라고 강조했다.

스플렁크는 시스코에 인수되며 네트워크, 서버, 애플리케이션을 아우를 수 있는 통합 인공지능(AI) 옵저버빌리티 기업으로 사업 전략을 재편하고 있다. 그 일환으로 지난 9월 AI 에이전트 기반 '스플렁크 옵저버빌리티'를 발표했고, 여기에 AI 애플리케이션과 에이전트를 더해 활용성을 강화했다. 대표적으로 사건을 자동 분석하고 근본 원인을 제시하는 'AI 트러블슈팅 에이전트'가 있다.

린 수석부사장은 이제 AI옵스(AIOps)를 넘어 에이전틱옵스(AgenticOps) 시대를 준비해야 한다고 제언했다. 그는 "AIOps는 머신러닝을 통해 신호를 분석해 무슨 일이 일어나는지 이해한다면 에이전틱옵스는 문제를 분해해 특정 기능에 특화된 에이전트를 활용하는 방식"이라고 소개했다.

다만 시장에서는 데이터독 등 경쟁사 활약이 거세지고 있다. 린 수석부사장은 "시스코는 애플리케이션, 인프라, 네트워크 전반에 우수한 가시성을 가지고 있다"며 "시스코의 딥 네트워크 모델(Deep Network Model)과 스플렁크의 데이터 기반 모델은 실제 현장에서 겪는 문제를 잘 이해하도록 돕고 있다"고 자신했다. 그러면서 "데이터로 무엇을 만들 수 있는지가 경쟁력을 좌우할 것"이라고 강조했다.

출처 : 디지털데일리