Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

  • Kafka는 실시간에 가까운 데이터 처리.
  • Hadoop은 배치성, 대용량 데이터 처리를 위해서 사용.

Image Added

<<Apache kafka cluster architecture>>

...

    이미지출처 : http://hahaskills.com/tutorials/kafka/KafkaArch_doc.html



Info
title

kafka에 데이터 저장은 날것그대로의 데이터를 원천데이터를 저장해 놓아야 한다.

  • 원천데이터와 맞는지 데이터 정합성을 검증.
  • 가공된 데이터로는 정합성을 검증하기 어려움.



Image Added



Image Added