"정형데이터, 반정형데이터, 비정형데이터"의 두 판 사이의 차이

잔글 (봇: 자동으로 텍스트 교체 (-==참고 자료== +==참고==))
34번째 줄: 34번째 줄:


[[분류: 자료]]
[[분류: 자료]]
[[분류: 3 표제어]]

2019년 11월 10일 (일) 22:27 판

structured data
구조화 데이터, 정형 데이터
semi-structured data
반구조화 데이터, 반정형 데이터
unstructured data, unstructured information
비구조화 데이터, 비구조화 자료, 비정형 데이터[1]

1 정형 데이터

  • 관계DB처럼 스키마 형식에 맞게 저장된 데이터

2 반정형 데이터

  • 관계형 데이터베이스나 다른 형태의 데이터 테이블과 연결된 정형 구조의 데이터 모델을 준수하지 않는 정형 데이터의 한 형태
  • 태그 등 시맨틱 구분요소가 있음

3 비정형 데이터

  • 구조가 일정하지 않은 데이터
  • 주로 관계형 모델에 잘 맞지 않는 데이터
  • 규격화된 데이터 필드에 저장되지 않은 데이터
  • 수집 소프트웨어: Fuse, Webdav, Chukwa, Flume, Scribe 외 다수[2]

4 같이 보기

5 참고

  1. "비정형 데이터" 82,900개, "비구조화된 데이터" 6,790개, "비구조화 데이터" 6,050개
  2. 각종 로그 프로그램들...
문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}