R를 이용한 텍스트 마이닝

1 개요[ | ]

TEXT-MINING USING R
R를 이용한 텍스트 마이닝[1]

<img src=" " style="height:240px"/>

2 책소개 (알라딘)[ | ]

최근 가장 각광받는 프로그래밍 언어이자 오픈소스 프로그램인 R을 이용해 텍스트 분석을 실행하는 실제적인 방법을 안내한다. R은 현재 언론학, 정치학, 사회학, 컴퓨터공학, 통계학 등의 학술논문에서 소개되거나 해당 분과의 학술적 주장을 뒷받침하는 자료로서 효용을 인정받고 있다. 이런 추세에 맞춰 다양한 데이터 마이닝 기법과 데이터 처리 방법을 소개하고 이를 구현하는 R 프로그래밍 코드를 첫 줄부터 마지막 줄까지 세심하게 설명했다.

텍스트는 사회과학 연구자들이 다루는 ‘재료’이다. 이 재료를 이용해 세계와 인간을 분석하는 것이 사회과학자들의 일이다. 알고리즘에 기초한 텍스트 분석방법은 텍스트를 해석하는 인간의 지능을 유사하게 혹은 거칠게 모방한 인공지능이다. 텍스트 분석기법을 이용해 텍스트 데이터에서 정보를 추출하고 의미 있는 통계 결과를 얻어내는 것이 바로 ‘텍스트 마이닝’이다.

수년간 R를 이용한 텍스트 분석 워크숍을 진행해왔으며 스스로 R를 연구에 이용하고 있기도 한 저자의 경험을 바탕으로, 사회과학 연구자와 학생들의 눈높이와 필요에 맞춤하게 서술되었다. 사회과학 연구자들이 알고리즘 구현에 적극적으로 참여하면서 장차 사회적 맥락 정보를 텍스트 분석에 정량적 방식으로 투입하는 기법을 세울 수 있을 것이라는 기대를 갖게 한다.

3 목차[ | ]

1부 텍스트 데이터란 무엇인가?
  • 01 텍스트를 데이터로 파악하기
2부 텍스트 데이터 사전처리
  • 01 텍스트 분석을 위한 기초적 R 함수
  • 02 텍스트 분석을 위한 R의 베이스 함수
  • 03 텍스트 분석을 위한 stringr 라이브러리 함수
  • 04 말뭉치 텍스트 데이터 사전처리
  • 05 한국어 텍스트 데이터 처리
  • 06 품사분석
3부 텍스트 데이터 분석 및 결과 제시
  • 01 텍스트 데이터에 대한 기술통계분석
  • 02 토픽모형
  • 03 감정분석
4부 마무리
  • 01 R를 활용한 온라인 데이터 수집 소개
  • 02 맺음말

4 같이 보기[ | ]

5 참고[ | ]

  1. 'R을' 아닌가? ;;
문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}