ELK
- Elasticsearch + Logstash + Kibana
- Elasticsearch는 Apache의 Lucene을 바탕으로 개발한 실시간 분산 검색 엔진이며,
- Logstash는 각종 로그를 가져와 JSON형태로 만들어 Elasticsearch로 전송하고,
- Kibana는 Elasticsearch에 저장된 Data를 사용자에게 Dashboard 형태로 보여주는 솔루션이다.
- http://elastic.co 사이트 오픈소스 제품
장점
- Google Analytics(GA)의 데이터로 사이트 접속 통계를 구할 경우 원하는 대로 데이터를 획득하기 어렵다.
- 자체 서버의 모든 로그를 100% 수집할 수 있기 때문에 데이터에 대한 신뢰성이 높다.
- 파라미터 값별로 통계를 볼 수 있기 때문에 정확한 데이터 분석이 가능하다.
- 검색엔진(lucene)이 포함되어 있어, 빠르게 데이터를 검색할 수 있다.
- 모두 오픈소스이며 자유롭게 사용이 가능하다.
사전 준비
- 로그수집 서버(AWS 추천)
- aws 접속 key가 있는 경우
- 윈도우에서 git bash 추천(http://git-scm.com). putty 접속보다 쉬움
- 리눅스 서버 CentOS 또는 Ubuntu
- Java 1.7 이상(esp. logstash는 1.8이상 필요)
- ubuntu 에서는 jdk 설치 필요
nginx 설치(샘플용)
AWS 포트 설정
- EC2 Security Groups
- 외부 접근 포트 추가(inbound)
- http(80)
- elasticsearch(9200)
- kibana(5601)
설치
- Elasticsearch
- Kibana
Logstash (FluentD로 대치 가능)
버전을 맞춰서 작업하는 것이 좋지만, 최신 버전으로 작업해도 동작함(2016/04/03 현재)
- Elasticsearch와 Kibana는 권장 버전을 맞춰야 함
- 설치 위치 /opt/ 또는 ~/local/ 권장
Elasticsearch 설치
Kibana 설치
Logstash 설치
Kibana 통계
시각화(Visualize)
Terms(request.raw, clientip.raw, ...) 또는 Filters(request: "/hello.html", ...) 이용해서 차트 생성
테이블, 라인차트, 파이차트, 지도 등 가능
만들어진 차트는 저장 가능
대시보드 만들기
저장된 차트를 한 화면에서 볼 수 있도록 추가, 레이아웃 가능
part 2
Logstash
필드 추가
field{ mutate { add_field => { "reqs" => "%{request}" } } }
분리
field{ mutate { split => ["reqs", "?"] add_field => { "uri" => "%{reqs[0]}" } add_field => { "req_uri" => "%{reqs[0]}" } # add_field => { "querystring" => "%{reqs[1]}" } } }
필드 제거
mutate { remove_field => [ "reqs", "uri" ] }
파라미터 필드 만들기
filter { mutate { add_field => { "tmp" => "%{request}" } } if [tmp] =~ "\?" { mutate { split => [ "tmp", "?" ] add_field => { "params" => "%{[tmp][1]}" } } kv { field_split => "&" source => "params" include_keys => [ "category", "utm_source" ] prefix => "param_" } } }
또는
# params if [request] =~ "\?" { kv { field_split => "&" source => "querystring" include_keys => [ "query", "redirectUrl" ] prefix => "param_" } }
이미지 제거
filter { if [message] =~ "^#|\.(css|js|ico|png|xml|jpg|JPG|gif|jpeg|eot\?) " { drop {} } }
useragent 파싱
useragent { source => "agent" }
timestamp 조정(apache log)
date { match => [ "timestamp", "dd/MMM/yyyy:HH:mm:ss Z" ] }
https://www.elastic.co/guide/en/logstash/current/plugins-filters-date.html
urldecode
urldecode { field => "params" }
Kibana
질의어 문법(query syntax)
Lucene 검색 엔진의 문법 그대로 사용(https://lucene.apache.org/core/2_9_4/queryparsersyntax.html )
request: "uri"
제외
-device : "Spider"
elasticsearch
데이터 지우기
curl -XDELETE http://localhost:9200/logstash*
Filebeat with logstash
(Optional)
logstash forwarder(deprecated) 의 경량(lightweight) 버전
logstash plugin 설치
cd ~/local/logstash ./bin/logstash-plugin install logstash-input-beats
filebeat 설치
logconf/nginx.conf 파일 변경
start shell
echo "nohup ./filebeat -e -c filebeat.yml &" > start.sh chmod +x start.sh ./start.sh
참고
Logstash grok patterns
ELKR (ElasticSearch + Logstash + Kibana + Redis) 를 이용한 로그분석 환경 구축하기
2016 ELK 스택으로 서울시 지하철 대시보드 만들기 추천
EMOCON 2015 F/W ELK 스택을 사용한 서울시 지하철 대시보드 만들기
ELK 구축하기 1 – LOGSTASH
[Ubuntu] ELK 설치 및 테스트 하기
Splunk 대체 Solution으로서의 ELK Stack
How To Install Elasticsearch, Logstash, and Kibana 4 on Ubuntu 14.04
ELK 프로그래밍 방송 영상
Logstash Configuration
Elasticsearch(Lucene) Query Syntax
Add Comment