"정형데이터, 반정형데이터, 비정형데이터"의 두 판 사이의 차이

잔글 (봇: 자동으로 텍스트 교체 (-==참고 자료== +==참고==))
28번째 줄: 28번째 줄:
*[[텍스트 마이닝]]
*[[텍스트 마이닝]]


==참고 자료==
==참고==
*https://ko.wikipedia.org/wiki/반정형_데이터
*https://ko.wikipedia.org/wiki/반정형_데이터
*http://en.wikipedia.org/wiki/Unstructured_data
*http://en.wikipedia.org/wiki/Unstructured_data

2017년 7월 21일 (금) 02:43 판

structured data
구조화 데이터, 정형 데이터
semi-structured data
반구조화 데이터, 반정형 데이터
unstructured data, unstructured information
비구조화 데이터, 비구조화 자료, 비정형 데이터[1]

1 정형 데이터

  • 관계DB처럼 스키마 형식에 맞게 저장된 데이터

2 반정형 데이터

  • 관계형 데이터베이스나 다른 형태의 데이터 테이블과 연결된 정형 구조의 데이터 모델을 준수하지 않는 정형 데이터의 한 형태
  • 태그 등 시맨틱 구분요소가 있음

3 비정형 데이터

  • 구조가 일정하지 않은 데이터
  • 주로 관계형 모델에 잘 맞지 않는 데이터
  • 규격화된 데이터 필드에 저장되지 않은 데이터
  • 수집 소프트웨어: Fuse, Webdav, Chukwa, Flume, Scribe 외 다수[2]

4 같이 보기

5 참고

  1. "비정형 데이터" 82,900개, "비구조화된 데이터" 6,790개, "비구조화 데이터" 6,050개
  2. 각종 로그 프로그램들...
문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}