빅데이터

Jmnote (토론 | 기여)님의 2016년 2월 7일 (일) 10:57 판 (Jmnote 사용자가 빅 데이터 문서를 빅데이터 문서로 옮기면서 넘겨주기를 덮어썼습니다)

1 개요

big data
빅 데이터, 대용량 데이터, 대규모 데이터
  • 방대한 데이터
  • 대량 데이터를 분석하여 비즈니스 효율성을 향상하는 일
  • 대량 데이터로부터 가치를 추출하고 결과를 분석하는 기술
  • 구조화/비구조화 등 다양성과 크기 문제로 기존DB로 처리가 어려운 데이터
  • 기존 DB 관리도구에서 다루는 것이 어려운 대량의 정형/비정형 데이터 집합
  • 일반적인 DB SW가 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터
  • 대규모 데이터로부터 가치를 추출하고 초고속 수집, 발굴, 분석을 지원하는 기술 및 아키텍처
  • 3V: 규모(volume), 속도(velocity), 다양성(variety)
  • 4V: 규모(volume), 속도(velocity), 다양성(variety), 정확성(veracity)
  • 5V: 규모(volume), 속도(velocity), 다양성(variety), 정확성(veracity), value(가치)
  • 적용분야: 검색엔진(페이지랭크), SNS, 웹서핑경로, 의료기록, 카드이용내역, CDR, 스마트폰 사용, 차량운행/교통정보, 동영상, CRM 등[1]
  • 관련요소: 분산파일시스템[2], 비관계형DB[3], 병렬처리[4], 통계[5], 오픈소스[6]

2 같이 보기

3 주석

  1. 과거에도 이런 자료들은 생성되고 있었지만 관리되지 않고 버려짐
  2. HDFS
  3. NoSQL
  4. MapReduce
  5. R
  6. 비용절감

4 참고 자료

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}