차. 향후 방향성

Created by Sansae on Aug 03, 2018

Apache Spark가 계속 힘을 얻을 것
- 강령한 성능과 좋은 인터페이스, 확장성
- 수많은 사용자와 개발자
오픈소스 커뮤니티는 사람들이 원하는대로 발전해 나아감(민주적)
- 최근 머신러닝에 대한 큰 관심
- 오픈소스 기반 데이터 제품들도 머신러닝 관련 지원이 대폭 강화되는 중
- 예: 알고리즘이 대폭 보강된 Spark ML, Tensorflow on Spark 프로젝트 등

Apache Data Project Github Stars

Apache Data Project Github contributers

정리

빅데이터 분석의 시초는 GFS(2003), MapReduce(2004)논문에서 시작
Hadoop(2006)이 탄생하며 계속해서 발전
HBase등의 분산 데이터베이스들이 널리 사용중
중간에 다양한 프로젝트들이 싱겼으며, 현재는 Spark로 수렴 중

No labels