텍스트 마이닝

  다른 뜻에 대해서는 내용 분석 문서를 참조하십시오.

1 개요[ | ]

text mining, text data mining, text analytics
텍스트 마이닝, 텍스트 데이터 마이닝, 텍스트 분석, 텍스트 분석학, 텍스트 애널리틱스
  • 텍스트를 대상으로 하는 데이터마이닝
  • 비정형 데이터인 문서로부터 유용한 정보를 추출하고 가공하는 기술
  • 비정형 텍스트 데이터에서 가치와 의미가 있는 정보를 찾아내는 기법
  • 비정형 텍스트 데이터에서 새롭고 유용한 정보를 찾아내는 과정 또는 기술
  • 텍스트 데이터에 존재하는 데이터 간의 관계, 패턴, 규칙을 발견하여 유용한 정보로 변환하는 과정
  • 다양한 형식의 문서에서 텍스트 데이터를 추출하고 텍스트 내에 있는 데이터 간의 관계, 패턴, 규칙을 발견하여 유용한 정보로 바꾸는 과정
  • 일반적인 문장으로 이루어진 데이터를 단어나 어절로 구분하여 출현빈도 및 동시출현의 상관관계, 출현경향, 시계열 등을 해석함으로써 유용한 정보를 추출하는 텍스트 데이터 분석방법
  • 구조화된 데이터를 구조화된 데이터로 바꾼다.
  • 대략 데이터 마이닝 + 자연어 처리

2 예시[ | ]

  • 문서 분류(classification)
  • 문서 군집(clustering)
  • 문서 요약
  • 특성 추출(feature extraction)
  • 트위터·기사댓글·상품평·영화감상평 감성분석
  • 워드 클라우드 시각화

3 분석방법 예시[ | ]

4 응용[ | ]

5 같이 보기[ | ]

6 참고[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}