맵리듀스

1 개요[ | ]

MapReduce
맵리듀스
  • 배치(batch) 처리
  • 맵(분산처리) + 리듀스(결과집중)
  • 분산병렬처리 시스템[1] + 프레임워크[2]
  • 데이터가 있는 곳으로 프로그램[3]을 보내어 처리[4]
  • 장점: 저비용 고성능. 선형적 성능향상
  • 단점: 무결성 보장은 어려움
  • 한번 쓰고 여러번 읽기에 적합

 

2 처리 절차[ | ]

Tsm33-large-a11.png

  • 입력 - 분리 - 매핑 - 셔플 - 축약 - 결과

3 같이 보기[ | ]

4 참고[ | ]

  1. 환경. 운영체제 수준
  2. 개발자용. 추상클래스, 모니터링 도구 등이 제공됨
  3. .jar 파일
  4. 프로그램이 있는 곳으로 데이터를 가져와서 처리하는 것이 기존의 방식
문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}