"데이터과학 치트시트"의 두 판 사이의 차이

 
(사용자 2명의 중간 판 16개는 보이지 않습니다)
45번째 줄: 45번째 줄:
** [[Python 문자열 패딩]]
** [[Python 문자열 패딩]]
** [[Python 문자열 format() 패딩]]
** [[Python 문자열 format() 패딩]]
* [[Python 문자열 분리결합]]
** [[Python 문자열 분리 split()]]
** [[Python 문자열 결합 join()]]
|
|
* [[R 문자열]]
* [[R 문자열]]
50번째 줄: 54번째 줄:
| [[콜렉션]]
| [[콜렉션]]
|
|
* [[Python 튜플]]
* [[Python 리스트]]
* [[Python 리스트]]
* [[Python 리스트 슬라이싱]]
** [[Python 리스트 append()]]
** [[Python 리스트 pop()]]
** [[Python 리스트 len()]]
** [[Python 리스트 extend()]]
** [[Python 리스트 insert()]]
** [[Python 리스트 remove()]]
** [[Python 리스트 패킹과 언패킹]]
** [[Python 리스트 2차원 리스트]]
** [[Python 리스트 슬라이싱]]
** [[Python 리스트 리버스인텍스]]
** [[Python 리스트 증가값]]
** [[Python 리스트 덧셈]]
** [[Python 리스트 곱셈]]
** [[Python 리스트 in]]
* [[Python 리스트 스터디]]
* [[Python 리스트 스터디]]
* [[Python 리스트 예제]]
* [[Python 리스트 예제]]
* [[파이썬 리스트 unshift, shift, push, pop]]
* [[파이썬 리스트 unshift, shift, push, pop]] - 스택, 큐
* [[Python 딕셔너리]]
* [[Python 딕셔너리]]
* [[Python 튜플, 리스트, 딕셔너리]]
** [[Python dict_keys()]]
** [[Python values()]]
** [[Python items()]]
* [[Python 튜플]]
** [[Python 튜플 길이 확인]]
* [[Python 세트]]
** [[Python 세트 add()]]
** [[Python 세트 remove()]]
** [[Python 세트 update()]]
** [[Python 세트 discard()]]
** [[Python 세트 clear()]]
** [[Python 세트 union()]]
** [[Python 세트 intersection()]]
** [[Python 세트 difference()]]
* [[Python collections 모듈]]
** [[파이썬 deque]]
** [[파이썬 OrderedDict]]
** [[파이썬 defaultdict]]
** [[파이썬 Counter]]
** [[파이썬 namedtuple]]
|
|
* [[R 벡터]]
* [[R 벡터]]
67번째 줄: 102번째 줄:
|
|
* [[R 자료형]]
* [[R 자료형]]
|-
| [[랜덤]]
|
* [[Python 랜덤]]
|
* [[R 랜덤]]
|}
|}


78번째 줄: 119번째 줄:
| 하드코딩 데이터 입력
| 하드코딩 데이터 입력
|  
|  
* [[Numpy 기초]]
* [[NumPy 하드코딩 데이터 입력]]
* [[Pandas 하드코딩 데이터 입력]]
* [[Pandas 하드코딩 데이터 입력]]
|  
|  
* [[R 하드코딩 데이터 입력]]
* [[R 하드코딩 데이터 입력]]
|-
| [[CSV]]
|
* [[Pandas 인터넷에서 CSV 데이터 받기]]
|
|-
|-
| [[JSON]]
| [[JSON]]

2020년 2월 29일 (토) 11:58 기준 최신판

데이터과학 쿡북
데이터과학 치트시트

1 환경 구성[ | ]

구분 Python R
설치
실습
  • Spyder Hello World
  • Spyder 사용법
  • Python 인터랙티브 모드
  • RStudio Hello World
  • RStudio 사용법
  • R 인터랙티브 모드

2 프로그래밍 기초[ | ]

  • ※ 결과가 예제와 동일하게 나오는지, 왜 그렇지 나오는지를 이해했다면 넘어가자.
구분 Python R
문자열
콜렉션
자료형
랜덤

3 데이터 가져오기[ | ]

  • 데이터 가져오기 (입력/스크래핑)
구분 Python R
하드코딩 데이터 입력
CSV
JSON
XML
HTML
웹스크래핑

4 시각화[ | ]

구분 Python R
박스플롯
막대그래프
히스토그램
선도표
산점도

5 기술통계 기초[ | ]

구분 Python R
평균
중앙값
최빈값
상관계수

6 통계 분석[ | ]

구분 Python R
t-검정
분산분석
카이제곱검정
단순선형회귀
다중선형회귀
로지스틱 회귀분석
분산분석
탐색적 데이터 분석

7 데이터 마이닝[ | ]

구분 Python R
장바구니분석
분류
군집분석
네트워크 분석

8 머신 러닝[ | ]

구분 Python R
선형회귀
비선형 회귀
클래시피케이션
cross-validation
feature selection
penalization
decision tree
ensemble methods
support vector machine
neural network

9 텍스트 마이닝[ | ]

구분 Python R
단어 수 세기
품사분석
토픽 모델링
감정 분석

10 같이 보기[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}