• Apache Spark가 계속 힘을 얻을 것
    • 강령한 성능과 좋은 인터페이스, 확장성
    • 수많은 사용자와 개발자
  • 오픈소스 커뮤니티는 사람들이 원하는대로 발전해 나아감(민주적)
    • 최근 머신러닝에 대한 큰 관심
    • 오픈소스 기반 데이터 제품들도 머신러닝 관련 지원이 대폭 강화되는 중
    • 예: 알고리즘이 대폭 보강된 Spark ML, Tensorflow on Spark 프로젝트 등


Apache Data Project Github Stars



Apache Data Project Github contributers



정리

  • 빅데이터 분석의 시초는 GFS(2003), MapReduce(2004)논문에서 시작
  • Hadoop(2006)이 탄생하며 계속해서 발전
  • HBase등의 분산 데이터베이스들이 널리 사용중
  • 중간에 다양한 프로젝트들이 싱겼으며, 현재는 Spark로 수렴 중
  • No labels
Write a comment…