"LMA"의 두 판 사이의 차이

 
(같은 사용자의 중간 판 3개는 보이지 않습니다)
7번째 줄: 7번째 줄:


==요소==
==요소==
;로깅
;[[로깅]]
* 시스템, 애플리케이션, 네트워크 장비 등에서 발생하는 모든 이벤트와 활동을 기록하는 작업
* 시스템, 애플리케이션, 네트워크 장비 등에서 발생하는 모든 이벤트와 활동을 기록하는 작업
* 로그는 시스템의 상태, 오류 발생, 보안 이벤트 등을 추적하는 데 사용된다. 이를 통해 문제가 발생했을 때 원인을 파악하거나 시스템 사용 패턴을 분석할 수 있다.
* 로그는 시스템의 상태, 오류 발생, 보안 이벤트 등을 추적하는 데 사용된다. 이를 통해 문제가 발생했을 때 원인을 파악하거나 시스템 사용 패턴을 분석할 수 있다.
* 예: 서버 로그, 애플리케이션 로그, 데이터베이스 로그 등
* 예: 서버 로그, 애플리케이션 로그, 데이터베이스 로그 등


;모니터링
;[[모니터링]]
* 시스템의 성능, 가용성, 자원 사용량 등을 실시간으로 감시하는 작업
* 시스템의 성능, 가용성, 자원 사용량 등을 실시간으로 감시하는 작업
* 이를 통해 시스템이 정상적으로 동작하고 있는지, 특정 지표가 비정상적으로 변동하고 있는지를 파악할 수 있다.
* 이를 통해 시스템이 정상적으로 동작하고 있는지, 특정 지표가 비정상적으로 변동하고 있는지를 파악할 수 있다.
* 예: CPU 사용량, 메모리 사용량, 네트워크 트래픽, 디스크 I/O 등
* 예: CPU 사용량, 메모리 사용량, 네트워크 트래픽, 디스크 I/O 등


;경보
;[[경보]]
* 모니터링 시스템에서 설정된 임계치를 초과하거나 비정상적인 상황이 발생했을 때, 운영팀에 경고를 보내는 시스템
* 모니터링 시스템에서 설정된 임계치를 초과하거나 비정상적인 상황이 발생했을 때, 운영팀에 경고를 보내는 시스템
* 알림은 이메일, 문자 메시지, 슬랙(Slack) 같은 협업 도구를 통해 전달될 수 있다.
* 알림은 이메일, 문자 메시지, 슬랙(Slack) 같은 협업 도구를 통해 전달될 수 있다.
* 예: 서버 다운, 응답 시간 지연, 메모리 사용률 급증 등
* 예: 서버 다운, 응답 시간 지연, 메모리 사용률 급증 등
==같이 보기==
{{z컬럼3|
* [[경보]]
* [[로깅]]
* [[DevOps]]
* [[모니터링]]
* [[관측가능성]]
}}


==참고==
==참고==
* https://ubuntu.com/server/docs/set-up-your-lma-stack
* https://ubuntu.com/server/docs/set-up-your-lma-stack
* https://www.mirantis.com/blog/mos-7-0-logging-monitoring-alerting-lma-enhancements
* https://www.mirantis.com/blog/mos-7-0-logging-monitoring-alerting-lma-enhancements
[[분류: 관측가능성]]
[[분류: 로깅]]
[[분류: 모니터링]]

2024년 9월 4일 (수) 00:43 기준 최신판

1 개요[ | ]

"logging, monitoring, alerting" (LMA)
"로깅, 모니터링, 경보"
  • IT 시스템의 안정적인 운영과 성능 관리, 트러블슈팅을 위해 필수적인 세 가지 핵심 요소를 통칭한다.
  • 이 세 가지 요소는 함께 동작하여, 시스템 운영자가 실시간으로 시스템 상태를 파악하고, 문제 발생 시 신속하게 대응할 수 있도록 돕는다.
  • DevOps 및 IT 운영 관리에서 매우 중요한 부분을 차지하며, 안정적인 서비스를 제공하기 위한 필수적인 도구들로 여겨진다.

2 요소[ | ]

로깅
  • 시스템, 애플리케이션, 네트워크 장비 등에서 발생하는 모든 이벤트와 활동을 기록하는 작업
  • 로그는 시스템의 상태, 오류 발생, 보안 이벤트 등을 추적하는 데 사용된다. 이를 통해 문제가 발생했을 때 원인을 파악하거나 시스템 사용 패턴을 분석할 수 있다.
  • 예: 서버 로그, 애플리케이션 로그, 데이터베이스 로그 등
모니터링
  • 시스템의 성능, 가용성, 자원 사용량 등을 실시간으로 감시하는 작업
  • 이를 통해 시스템이 정상적으로 동작하고 있는지, 특정 지표가 비정상적으로 변동하고 있는지를 파악할 수 있다.
  • 예: CPU 사용량, 메모리 사용량, 네트워크 트래픽, 디스크 I/O 등
경보
  • 모니터링 시스템에서 설정된 임계치를 초과하거나 비정상적인 상황이 발생했을 때, 운영팀에 경고를 보내는 시스템
  • 알림은 이메일, 문자 메시지, 슬랙(Slack) 같은 협업 도구를 통해 전달될 수 있다.
  • 예: 서버 다운, 응답 시간 지연, 메모리 사용률 급증 등

3 같이 보기[ | ]

4 참고[ | ]