"데이터과학 치트시트"의 두 판 사이의 차이

53번째 줄: 53번째 줄:
* [[Python 튜플]]
* [[Python 튜플]]
* [[Python 리스트]]
* [[Python 리스트]]
* [[파이썬 unshift, shift, push, pop]]
* [[Python 딕셔너리]]
* [[Python 딕셔너리]]
|
|

2020년 1월 18일 (토) 11:07 판

데이터과학 쿡북
데이터과학 치트시트

1 환경 구성

구분 Python R
2020 실습환경
언어
IDE
라이브러리
합본

2 프로그래밍 기초

구분 Python R
자료형
콜렉션

3 데이터 가져오기

  • 데이터 가져오기 (입력/스크래핑)
구분 Python R
하드코딩 데이터 입력
JSON
XML
HTML
웹스크래핑

4 시각화

구분 Python R
박스플롯
막대그래프
히스토그램
선도표
산점도

5 기술통계 기초

구분 Python R
평균
중앙값
최빈값
상관계수

6 통계 분석

구분 Python R
단순선형회귀
다중선형회귀
로지스틱 회귀분석
분산분석
탐색적 데이터 분석

7 데이터 마이닝

구분 Python R
장바구니분석
분류
군집분석
네트워크 분석

8 머신 러닝

구분 Python R
선형회귀
비선형 회귀
클래시피케이션
cross-validation
feature selection
penalization
decision tree
ensemble methods
support vector machine
neural network

9 텍스트 마이닝

구분 Python R
단어 수 세기
품사분석
토픽 모델링
감정 분석

10 같이 보기

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}