데이터독의 기본적인 로그 전송 매커니즘은 로그 포인터를 로컬 메모리에 저장해서 네트워크 이슈가 발생되더라도 기본적으로 어느정도 보장된다.
그러나 메트릭의 경우 Agent 메모리 큐 사이즈를 넘어가면 메트릭을 잃게 된다.
특히 IoT 디바이스의 경우 종종 네트워크 이슈가 발생되고 메트릭이 손실되는 경우가 발생된다.
그럴 경우 Data buffering 옵션을 통해 네트워크 지연 시 발생된 메트릭을 스토리지에 저장했다가 다시 Datadog으로 전달할 수 있다. Core Agent만 적용 가능하기 때문에 Process/APM 메트릭은 불가하다.
Agent 7.27 버전부터 사용 가능하다.
forwarder_retry_queue_payloads_max_size 환경변수가 기본적으로 0이기 때문에 원하는 사이즈로 변경하면 된다.
실제 네트워크를 차단할 경우 아래와 같이 데이터독 콘솔에서는 메트릭을 확인할 수가 없다.
그럼 호스트의 디폴트 Path인 /opt/datadog-agent/run/transactions_to_retry에 아래와 같이 압축된 메트릭들이 쌓이게 된다.
실제로 다시 네트워크가 정상화 되면 아래와 같이 메트릭이 다시 수집된다.
데이터독으로 전송된 메트릭들은 스토리지에서 삭제된다.
'Integrations' 카테고리의 다른 글
AWS IAM Identity Center를 활용한 Datadog SSO 인증 (0) | 2023.06.21 |
---|---|
Datadog Host 과금 기준 (0) | 2023.03.22 |
K8s에서 Datadog agent status 확인 (0) | 2022.07.10 |