"빅데이터"의 두 판 사이의 차이

9번째 줄: 9번째 줄:
*3V: 크기(volume), 속도(velocity), 다양성(variety)<ref>가변성(variability)를 포함하여 4V라고 하는 경우도 있음</ref>
*3V: 크기(volume), 속도(velocity), 다양성(variety)<ref>가변성(variability)를 포함하여 4V라고 하는 경우도 있음</ref>
*적용분야: [[페이지랭크]], [[SNS]], 웹서핑경로, 의료기록, 카드이용내역, [[CDR]], 스마트폰 사용, 차량운행/교통정보 등
*적용분야: [[페이지랭크]], [[SNS]], 웹서핑경로, 의료기록, 카드이용내역, [[CDR]], 스마트폰 사용, 차량운행/교통정보 등
*관련요소: 분산파일시스템<ref>HDFS</ref>, 비관계형DB<ref>NoSQL</ref>, 병렬처리<ref>MapReduce</ref>, 통계<ref>R</ref>, 오픈소스<ref>비용절감</ref>


==같이 보기==
==같이 보기==

2013년 2월 20일 (수) 11:19 판

1 개요

big data
빅 데이터, 대용량 데이터, 대규모 데이터
  • 기존 DB 관리도구에서 다루는 것이 어려운 대량의 정형/비정형 데이터 집합
  • 대량 데이터로부터 가치를 추출하고 결과를 분석하는 기술
  • 구조화/비구조화 등 다양성과 크기 문제로 기존DB로 처리가 어려운 데이터
  • 일반적인 DB SW가 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터
  • 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 초고속 수집, 발굴, 분석을 지원하는 차세대 기술 및 아키텍처
  • 3V: 크기(volume), 속도(velocity), 다양성(variety)[1]
  • 적용분야: 페이지랭크, SNS, 웹서핑경로, 의료기록, 카드이용내역, CDR, 스마트폰 사용, 차량운행/교통정보 등
  • 관련요소: 분산파일시스템[2], 비관계형DB[3], 병렬처리[4], 통계[5], 오픈소스[6]

2 같이 보기

3 주석

  1. 가변성(variability)를 포함하여 4V라고 하는 경우도 있음
  2. HDFS
  3. NoSQL
  4. MapReduce
  5. R
  6. 비용절감

4 참고 자료

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}