- 새로 프로젝트를 시작하는 경우라면 MapReduce대신 Spark를 택하겠지만, 예전부터 MapReduce를 많이 사용하던 상태라면 혼용하는 방법을 선택
- 하둡 클러스터상의 다양한 도구들이 사용할 리소스를 분배, 관리하는 플랫폼이 필요.
- YARN, Mesos가 대표적
- Javascript package manager Yarn과 헷갈리면 안됨(Yarn package ↔ Hadoop YARN)
그밖의 빅데이터 프로젝트들
- Hadoop을 포함한 Apache재단 소속 오픈소스 프로젝트 들의 영향력이 절대적 이지만, Apache소속이 아닌 프로젝트들도 있음
- Presto (Facebook이 리드하는 오픈소스 빅데이터 쿼리엔진)
- Hive와 유사하지만 압도적인 성능을 가지고 있어 대안으로 인기 있음
- Elastic Search
- 스케일 가능한 검색, 인덱스 엔진
- 대시보드 도구인 Kibana가 유명하여, 손쉽게 설정하여 사용할 수 있는 ELK스택이라는 조합도 생겼음 (Elasticsearch, Kibana, Logstash)
- 오픈소스 프로젝트이지만 elastic이라는 회사에서 리드하며, 이 회사는 hosted elastic플랫폼을 서비스함
- ES는 아파치 프로젝트는 아니지만 Apache Lucene기반이며 Apache License로 소스를 제공함.
{"serverDuration": 58, "requestCorrelationId": "216a8930afb62dab"}
Add Comment