위키

포럼

도구

하둡분산파일시스템 HDFS

Jmnote (토론 | 기여)님의 2013년 2월 20일 (수) 13:55 판 (→‎노드)

(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

2019-07-24

편집

역링크

토론

1 개요

Hadoop Distributed File System; HDFS
하둡분산파일시스템, 하둡 분산형 파일 시스템

하둡의 구성요소 중 하나^[1]
분산형 파일시스템
하둡 네트워크에 연결된 기기에 데이터를 분산 저장
노드 클러스터(개별 컴퓨터)에 분산 저장
블럭 크기: 64MB 또는 128MB^[2]
블럭 복사본을 분산 저장

목적: 데이터 유실 방지^[3], 부하 분산

대략 RDBMS의 4배 용량 필요^[4]

2 노드

클라이언트(client): 요청자. 파일을 쓰고 싶다/읽고 싶다
네임노드(namenode): 마스터 서버. 데이터노드 전체를 관리함
데이터노드(datanodes): 데이터 저장되는 서버. 최대 약 4000대까지 가능^[5]

3 특징

Read, Write 가능
Modify 불가, Append 금지

4 같이 보기

하둡

5 주석

↑ 하둡의 파일시스템으로 반드시 HDFS만 사용가능한 것은 아님. 그렇지만 국내 하둡 활용사례의 핵심은 HDFS!
↑ 해당 크기로 자른다. 단 마지막 블럭(자투리)의 경우는 그 용량만큼만 사용(블럭 크기를 다 쓰는 것이 아님)
↑ 일부 노드가 고장나더라도 다른 노드에 있는 복사본 데이터 사용 가능
↑ 복사본+메타데이터. 대충 단순 계산법
↑ 2013년 초 기준. 설계의 문제가 아니라 인프라의 문제. 네트워크 대역폭을 많이 필요로 하기 때문에 네트워크 장비가 뒷받침되어야 함.

원본 주소 "https://zetawiki.com/w/index.php?title=하둡분산파일시스템_HDFS&oldid=27246"

수정 2019-07-24 생성 2013-02-01

편집자

문서 댓글 ({{ doc_comments.length }})

{{ comment.name }} {{ comment.created | snstime }}

분류 댓글:
{{cat.name.replace(/_/g,' ')}} ({{cat.cnt}})

{{comment.page_title}}
― {{comment.name}}

CC-BY-SA 3.0 · Powered by MediaWiki

개인정보처리방침 · ABOUT