편집을 취소할 수 있습니다. 이 편집을 되돌리려면 아래의 바뀐 내용을 확인한 후 게시해주세요.
최신판 | 당신의 편집 | ||
1번째 줄: | 1번째 줄: | ||
==개요== | ==개요== | ||
;모니터링 | ;모니터링 | ||
138번째 줄: | 137번째 줄: | ||
| 이름: 입력 인스턴스의 이름 또는 별칭 | | 이름: 입력 인스턴스의 이름 또는 별칭 | ||
| 이 입력 인스턴스가 성공적으로 수집된 로그 레코드의 바이트 수 | | 이 입력 인스턴스가 성공적으로 수집된 로그 레코드의 바이트 수 | ||
| | | counter | ||
| | | bytes | ||
|- | |- | ||
| fluentbit_input_records_total | | fluentbit_input_records_total | ||
| 이름: 입력 인스턴스의 이름 또는 별칭 | | 이름: 입력 인스턴스의 이름 또는 별칭 | ||
| 이 입력이 성공적으로 수집한 로그 레코드 수 | | 이 입력이 성공적으로 수집한 로그 레코드 수 | ||
| | | counter | ||
| | | records | ||
|- | |- | ||
| fluentbit_output_dropped_records_total | | fluentbit_output_dropped_records_total | ||
| 이름: 출력 인스턴스의 이름 또는 별칭 | | 이름: 출력 인스턴스의 이름 또는 별칭 | ||
| 출력에 의해 삭제된 로그 레코드 수. 이는 복구불가 오류가 발생했거나 해당 청크에 대한 재시도가 만료되었음을 의미합니다. | | 출력에 의해 삭제된 로그 레코드 수. 이는 복구불가 오류가 발생했거나 해당 청크에 대한 재시도가 만료되었음을 의미합니다. | ||
| | | counter | ||
| | | records | ||
|- | |- | ||
| fluentbit_output_errors_total | | fluentbit_output_errors_total | ||
| 이름: 출력 인스턴스의 이름 또는 별칭 | | 이름: 출력 인스턴스의 이름 또는 별칭 | ||
| 오류(복구불가 또는 재시도가능)가 발생한 청크 수. 이는 청크가 실패한 횟수이며 Fluent Bit 로그 출력에 표시되는 오류 메시지 수와 일치하지 않습니다. | | 오류(복구불가 또는 재시도가능)가 발생한 청크 수. 이는 청크가 실패한 횟수이며 Fluent Bit 로그 출력에 표시되는 오류 메시지 수와 일치하지 않습니다. | ||
| | | counter | ||
| | | chunks | ||
|- | |- | ||
| fluentbit_output_proc_bytes_total | | fluentbit_output_proc_bytes_total | ||
| 이름: 출력 인스턴스의 이름 또는 별칭 | | 이름: 출력 인스턴스의 이름 또는 별칭 | ||
| 이 출력 인스턴스가 성공적으로 보낸 로그 레코드의 바이트 수. 이는 이 출력에서 전송된 모든 고유 청크의 총 바이트 크기입니다. 오류로 인해 레코드가 전송되지 않으면 이 메트릭에 포함되지 않습니다. | | 이 출력 인스턴스가 성공적으로 보낸 로그 레코드의 바이트 수. 이는 이 출력에서 전송된 모든 고유 청크의 총 바이트 크기입니다. 오류로 인해 레코드가 전송되지 않으면 이 메트릭에 포함되지 않습니다. | ||
| | | counter | ||
| | | bytes | ||
|- | |- | ||
| fluentbit_output_proc_records_total | | fluentbit_output_proc_records_total | ||
| 이름: 출력 인스턴스의 이름 또는 별칭 | | 이름: 출력 인스턴스의 이름 또는 별칭 | ||
| 이 출력 인스턴스가 성공적으로 보낸 로그 레코드 수. 이는 이 출력에서 전송된 모든 고유 청크의 총 레코드 수입니다. 레코드가 성공적으로 전송되지 않으면 이 메트릭에 포함되지 않습니다. | | 이 출력 인스턴스가 성공적으로 보낸 로그 레코드 수. 이는 이 출력에서 전송된 모든 고유 청크의 총 레코드 수입니다. 레코드가 성공적으로 전송되지 않으면 이 메트릭에 포함되지 않습니다. | ||
| | | counter | ||
| | | records | ||
|- | |- | ||
| fluentbit_output_retried_records_total | | fluentbit_output_retried_records_total | ||
| 이름: 출력 인스턴스의 이름 또는 별칭 | | 이름: 출력 인스턴스의 이름 또는 별칭 | ||
| 재시도가 발생한 로그 레코드 수. 이는 청크 수준에서 계산되며 전체 청크가 재시도 대상으로 표시되면 개수가 증가합니다. 출력 플러그인은 단일 청크를 업로드할 때 많은 오류 메시지를 생성하는 여러 작업을 수행할 수도 있고 수행하지 않을 수도 있습니다. | | 재시도가 발생한 로그 레코드 수. 이는 청크 수준에서 계산되며 전체 청크가 재시도 대상으로 표시되면 개수가 증가합니다. 출력 플러그인은 단일 청크를 업로드할 때 많은 오류 메시지를 생성하는 여러 작업을 수행할 수도 있고 수행하지 않을 수도 있습니다. | ||
| | | counter | ||
| | | records | ||
|- | |- | ||
| fluentbit_output_retries_failed_total | | fluentbit_output_retries_failed_total | ||
| 이름: 출력 인스턴스의 이름 또는 별칭 | | 이름: 출력 인스턴스의 이름 또는 별칭 | ||
| 청크에 대해 만료된 재시도 횟수. 각 플러그인은 청크에 적용되는 Retry_Limit를 구성합니다. 청크에 대한 Retry_Limit에 도달하면 해당 청크는 삭제되고 이 메트릭은 증가합니다. | | 청크에 대해 만료된 재시도 횟수. 각 플러그인은 청크에 적용되는 Retry_Limit를 구성합니다. 청크에 대한 Retry_Limit에 도달하면 해당 청크는 삭제되고 이 메트릭은 증가합니다. | ||
| | | counter | ||
| | | chunks | ||
|- | |- | ||
| fluentbit_output_retries_total | | fluentbit_output_retries_total | ||
| 이름: 출력 인스턴스의 이름 또는 별칭 | | 이름: 출력 인스턴스의 이름 또는 별칭 | ||
| 출력 인스턴스가 청크에 대해 재시도를 요청한 횟수 | | 출력 인스턴스가 청크에 대해 재시도를 요청한 횟수 | ||
| | | counter | ||
| | | chunks | ||
|- | |- | ||
| fluentbit_uptime | | fluentbit_uptime | ||
| | | | ||
| Fluent Bit가 실행된 시간(초) | | Fluent Bit가 실행된 시간(초) | ||
| | | counter | ||
| | | seconds | ||
|- | |- | ||
| process_start_time_seconds | | process_start_time_seconds | ||
| | | | ||
| Fluent Bit가 시작된 시점에 대한 Unix Epoch 타임스탬프 | | Fluent Bit가 시작된 시점에 대한 Unix Epoch 타임스탬프 | ||
| | | guage | ||
| | | seconds | ||
|} | |} | ||
208번째 줄: | 207번째 줄: | ||
! 메트릭 키 !! 설명 !! 단위 | ! 메트릭 키 !! 설명 !! 단위 | ||
|- | |- | ||
| | | chunks.total_chunks | ||
| Fluent Bit가 현재 버퍼링하고 있는 총 레코드 청크 수 | | Fluent Bit가 현재 버퍼링하고 있는 총 레코드 청크 수 | ||
| | | chunks | ||
|- | |- | ||
| | | chunks.mem_chunks | ||
| 현재 메모리에 버퍼링된 총 청크 수. 청크는 메모리와 파일 시스템에 동시에 있을 수 있습니다. | | 현재 메모리에 버퍼링된 총 청크 수. 청크는 메모리와 파일 시스템에 동시에 있을 수 있습니다. | ||
| | | chunks | ||
|- | |- | ||
| | | chunks.fs_chunks | ||
| 파일 시스템에 저장된 총 청크 수 | | 파일 시스템에 저장된 총 청크 수 | ||
| | | chunks | ||
|- | |- | ||
| | | chunks.fs_chunks_up | ||
| 청크가 메모리에 있으면 "업(up)" 상태입니다. 따라서 이것은 파일시스템과 메모리 모두에 있는 청크의 수입니다. | | 청크가 메모리에 있으면 "업(up)" 상태입니다. 따라서 이것은 파일시스템과 메모리 모두에 있는 청크의 수입니다. | ||
| | | chunks | ||
|- | |- | ||
| | | chunks.fs_chunks_down | ||
| 파일시스템에만 있는 , "다운(down)" 상태 청크 수 | | 파일시스템에만 있는 , "다운(down)" 상태 청크 수 | ||
| | | chunks | ||
|- | |- | ||
| | | <br> | ||
| | | <br> | ||
| | | <br> | ||
|- | |- | ||
| input_chunks.{플러그인 이름}.status.overlimit | | input_chunks.{플러그인 이름}.status.overlimit | ||
238번째 줄: | 237번째 줄: | ||
| input_chunks.{플러그인 이름}.status.mem_size | | input_chunks.{플러그인 이름}.status.mem_size | ||
| 이 입력이 로그를 청크로 버퍼링하기 위해 소비하는 메모리 크기 | | 이 입력이 로그를 청크로 버퍼링하기 위해 소비하는 메모리 크기 | ||
| | | bytes | ||
|- | |- | ||
| input_chunks.{플러그인 이름}.status.mem_limit | | input_chunks.{플러그인 이름}.status.mem_limit | ||
| 이 입력 플러그인에 적용되는 버퍼 메모리 제한(Mem_Buf_Limit) | | 이 입력 플러그인에 적용되는 버퍼 메모리 제한(Mem_Buf_Limit) | ||
| | | bytes | ||
|- | |- | ||
| input_chunks.{플러그인 이름}.chunks.total | | input_chunks.{플러그인 이름}.chunks.total | ||
| 현재 이 입력 인스턴스가 소유한 총 청크 수 | | 현재 이 입력 인스턴스가 소유한 총 청크 수 | ||
| | | chunks | ||
|- | |- | ||
| input_chunks.{플러그인 이름}.chunks.up | | input_chunks.{플러그인 이름}.chunks.up | ||
| 이 입력에 대해 메모리에 "작동"된 현재 청크 수입니다. 파일 시스템 저장소가 활성화된 경우 "업(up)" 상태 청크는 파일시스템 계층에도 포함됩니다. | | 이 입력에 대해 메모리에 "작동"된 현재 청크 수입니다. 파일 시스템 저장소가 활성화된 경우 "업(up)" 상태 청크는 파일시스템 계층에도 포함됩니다. | ||
| | | chunks | ||
|- | |- | ||
| input_chunks.{플러그인 이름}.chunks.down | | input_chunks.{플러그인 이름}.chunks.down | ||
| 이 입력에 대해 파일시스템에서 현재 "다운(down)" 상태 청크 수 | | 이 입력에 대해 파일시스템에서 현재 "다운(down)" 상태 청크 수 | ||
| | | chunks | ||
|- | |- | ||
| input_chunks.{플러그인 이름}.chunks.busy | | input_chunks.{플러그인 이름}.chunks.busy | ||
| "사용 중(busy)" 청크는 출력에 의해 처리/전송되고 있으며 새 데이터를 추가할 수 없는 청크입니다. | | "사용 중(busy)" 청크는 출력에 의해 처리/전송되고 있으며 새 데이터를 추가할 수 없는 청크입니다. | ||
| | | chunks | ||
|- | |- | ||
| input_chunks.{플러그인 이름}.chunks.busy_size | | input_chunks.{플러그인 이름}.chunks.busy_size | ||
| 현재 사용 중으로 표시된 각 청크의 바이트 크기 합계 | | 현재 사용 중으로 표시된 각 청크의 바이트 크기 합계 | ||
| | | bytes | ||
|} | |} | ||
565번째 줄: | 564번째 줄: | ||
===별칭 설정=== | ===별칭 설정=== | ||
== | ==Grafana 대시보드 및 알림== | ||
Fluent Bit의 노출된 Prometheus 스타일 메트릭을 활용하여 대시보드 및 알림를 생성할 수 있습니다. | Fluent Bit의 노출된 Prometheus 스타일 메트릭을 활용하여 대시보드 및 알림를 생성할 수 있습니다. | ||
제공된 [https://github.com/fluent/fluent-bit-docs/tree/8172a24d278539a1420036a9434e9f56d987a040/monitoring/dashboard.json 예시 대시보드]는 [https://banzaicloud.com/ Banzai Cloud]의 [https://grafana.com/grafana/dashboards/7752 로깅 오퍼레이터 대시보드]에서 많은 영감을 받았지만, <code>instance</code> 레이블 사용([https://www.robustperception.io/controlling-the-instance-label 이유는 여기 참조]), 누적 그래프, Fluent Bit 메트릭에 중점을 두는 등 몇 가지 주요 차이점이 있습니다. | 제공된 [https://github.com/fluent/fluent-bit-docs/tree/8172a24d278539a1420036a9434e9f56d987a040/monitoring/dashboard.json 예시 대시보드]는 [https://banzaicloud.com/ Banzai Cloud]의 [https://grafana.com/grafana/dashboards/7752 로깅 오퍼레이터 대시보드]에서 많은 영감을 받았지만, <code>instance</code> 레이블 사용([https://www.robustperception.io/controlling-the-instance-label 이유는 여기 참조]), 누적 그래프, Fluent Bit 메트릭에 중점을 두는 등 몇 가지 주요 차이점이 있습니다. |