• 새로 프로젝트를 시작하는 경우라면 MapReduce대신 Spark를 택하겠지만, 예전부터 MapReduce를 많이 사용하던 상태라면 혼용하는 방법을 선택
  • 하둡 클러스터상의 다양한 도구들이 사용할 리소스를 분배, 관리하는 플랫폼이 필요.
  • YARN, Mesos가 대표적
    • Javascript package manager Yarn과 헷갈리면 안됨(Yarn package ↔ Hadoop YARN)


그밖의 빅데이터 프로젝트들

  • Hadoop을 포함한 Apache재단 소속 오픈소스 프로젝트 들의 영향력이 절대적 이지만, Apache소속이 아닌 프로젝트들도 있음
  • Presto (Facebook이 리드하는 오픈소스 빅데이터 쿼리엔진)
    • Hive와 유사하지만 압도적인 성능을 가지고 있어 대안으로 인기 있음
  • Elastic Search
    • 스케일 가능한 검색, 인덱스 엔진
    • 대시보드 도구인 Kibana가 유명하여, 손쉽게 설정하여 사용할 수 있는 ELK스택이라는 조합도 생겼음 (Elasticsearch, Kibana, Logstash)
    • 오픈소스 프로젝트이지만 elastic이라는 회사에서 리드하며, 이 회사는 hosted elastic플랫폼을 서비스함
    • ES는 아파치 프로젝트는 아니지만 Apache Lucene기반이며 Apache License로 소스를 제공함.
  • No labels
Write a comment…