"정형데이터, 반정형데이터, 비정형데이터"의 두 판 사이의 차이

 
(사용자 2명의 중간 판 24개는 보이지 않습니다)
1번째 줄: 1번째 줄:
==개요==
;structured data
;구조화 데이터, 정형 데이터
 
;semi-structured data
;반구조화 데이터, 반정형 데이터
 
;unstructured data, unstructured information
;unstructured data, unstructured information
;비구조화 데이터, 비구조화 자료, 비정형 데이터
;비구조화 데이터, 비구조화 자료, 비정형 데이터<ref>"비정형 데이터" 82,900개, "비구조화된 데이터" 6,790개, "비구조화 데이터" 6,050개</ref>


*구조가 정해지지 않은 데이터
==정형 데이터==
*[[관계DB]]처럼 스키마 형식에 맞게 저장된 데이터
 
==반정형 데이터==
* 관계형 데이터베이스나 다른 형태의 데이터 테이블과 연결된 정형 구조의 데이터 모델을 준수하지 않는 정형 데이터의 한 형태
* 태그 등 시맨틱 구분요소가 있음
 
==비정형 데이터==
*구조가 일정하지 않은 데이터
*주로 [[관계형 모델]]에 잘 맞지 않는 데이터
*주로 [[관계형 모델]]에 잘 맞지 않는 데이터
*규격화된 데이터 필드에 저장되지 않은 데이터
*수집 소프트웨어: Fuse, Webdav, Chukwa, Flume, Scribe 외 다수<ref>각종 로그 프로그램들...</ref>
*수집 소프트웨어: Fuse, Webdav, Chukwa, Flume, Scribe 외 다수<ref>각종 로그 프로그램들...</ref>


==같이 보기==
==같이 보기==
*[[빅데이터]]
{{z컬럼3|
*[[NoSQL]]
* [[빅데이터]]
 
* [[관계 모델]]
==주석==
* [[자연어 처리]]
<references/>
* [[텍스트 마이닝]]
* [[통계 데이터 유형]]
}}


==참고 자료==
==참고==
*https://ko.wikipedia.org/wiki/반정형_데이터
*http://en.wikipedia.org/wiki/Unstructured_data
*http://en.wikipedia.org/wiki/Unstructured_data
*[http://www.kisa.or.kr/uploadfile/201403/201403100936599231.pdf 비정형 데이터 활성화의 정치, 경제, 문화적 함의 - 박대현, 송동현]


[[분류: 자료]]
[[분류: 데이터]]
[[분류: 3 표제어]]

2022년 1월 5일 (수) 21:21 기준 최신판

structured data
구조화 데이터, 정형 데이터
semi-structured data
반구조화 데이터, 반정형 데이터
unstructured data, unstructured information
비구조화 데이터, 비구조화 자료, 비정형 데이터[1]

1 정형 데이터[ | ]

  • 관계DB처럼 스키마 형식에 맞게 저장된 데이터

2 반정형 데이터[ | ]

  • 관계형 데이터베이스나 다른 형태의 데이터 테이블과 연결된 정형 구조의 데이터 모델을 준수하지 않는 정형 데이터의 한 형태
  • 태그 등 시맨틱 구분요소가 있음

3 비정형 데이터[ | ]

  • 구조가 일정하지 않은 데이터
  • 주로 관계형 모델에 잘 맞지 않는 데이터
  • 규격화된 데이터 필드에 저장되지 않은 데이터
  • 수집 소프트웨어: Fuse, Webdav, Chukwa, Flume, Scribe 외 다수[2]

4 같이 보기[ | ]

5 참고[ | ]

  1. "비정형 데이터" 82,900개, "비구조화된 데이터" 6,790개, "비구조화 데이터" 6,050개
  2. 각종 로그 프로그램들...
문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}