빅데이터

1 개요[ | ]

Big Data
빅 데이터, 대용량 데이터, 대규모 데이터
  • 방대한 데이터 처리 기술
  • 대량 데이터를 분석하여 비즈니스 효율성을 향상하는 일
  • 대량 데이터로부터 가치를 추출하고 결과를 분석하는 기술
  • 구조화/비구조화 등 다양성과 크기 문제로 기존DB로 처리가 어려운 데이터
  • 기존 DB 관리도구에서 다루는 것이 어려운 대량의 정형/비정형 데이터 집합
  • 일반적인 DB SW가 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터
  • 일반적인 데이터베이스 프로그램이 수집·저장·관리·분석하기 어려운 대규모 데이터[1]
  • 대규모 데이터로부터 가치를 추출하고 초고속 수집, 발굴, 분석을 지원하는 기술 및 아키텍처
  • 정형·반정형·비정형 데이터세트의 집적물, 그리고 이로부터 경제적 가치를 추출 및 분석할 수 있는 기술
  • 초고속 수집·발굴·분석을 통해 대규모 데이터로부터 저비용으로 가치를 추출할 수 있도록 고안된 새로운 세대의 기술이자 아키텍쳐[2]
  • 더 나은 의사결정, 시사점 발견 및 프로세스의 최적화를 위해 새로운 형태의 정보처리가 필요한 대용량, 초고속 및 다양성의 특성을 가진 정보 자산[3]
  • 적용분야: 검색엔진(페이지랭크), SNS, 웹서핑경로, 의료기록, 카드이용내역, CDR, 스마트폰 사용, 차량운행/교통정보, 동영상, CRM 등[4]
  • 관련요소: 분산파일시스템[5], 비관계형DB[6], 병렬처리[7], 통계[8], 오픈소스[9]

2 5V[ | ]

  • 3V: 규모(volume), 속도(velocity), 다양성(variety)
  • 4V: 규모(volume), 속도(velocity), 다양성(variety), 정확성(veracity)
  • 5V: 규모(volume), 속도(velocity), 다양성(variety), 정확성(veracity), value(가치)

3 같이 보기[ | ]

4 참고[ | ]

  1. Manyika et al. (2011)
  2. Vesset et al. (2012)
  3. Beyer & Laney (2012)
  4. 과거에도 이런 자료들은 생성되고 있었지만 관리되지 않고 버려짐
  5. HDFS
  6. NoSQL
  7. MapReduce
  8. R
  9. 비용절감
문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}