데이터과학 용어

1 개요[ | ]

데이터 과학 용어집
한국어 영어 설명
강화 학습 reinforcement learning
결정트리 decision tree
계수(coefficient) coefficient 어느 변수에 일정하게 곱해진 상수 인자
공분산 covariance 2개의 확률변수의 상관정도를 나타내는 값
과적합 overfitting
교차-타당도 cross-validation
극단치 outlier
데이터 과학 data science
데이터 마이닝 data mining 주로 대량 자료에서 데이터마이닝 기법을 통해 규칙이나 패턴과 같은 의미 있는 정보를 찾아내는 일
데이터 랭글링 data wrangling 원자료를 다른 형태로 수작업으로 전환하거나 매핑하는 과정
데이터 엔지니어 data engineer
독립 변수 independent variable
딥러닝 deep learning
랜덤 포레스트 random forest
로그 logarithm
로지스틱 회귀 logistic regression
리프트 lift
마르코프 체인 Markov Chain
머신러닝 machine learning
머신러닝 모델 machine learning model
모델 model
몬테카를로 메소드 Monte Carlo method
백프로퍼게이션 backpropagation
베이즈 정리 Bayes' Theorem
베이지안 네트워크 Bayesian network
분산(variance) variance
벡터 vector
벡터 공간 vector space
비지도 학습 unsupervised learning
빅데이터 Big Data
사전 분포 prior distribution
상관 correlation
서포트 벡터 머신 support vector machine
선형 대수 linear algebra
선형 회귀 linear regression
shell
스칼라 scalar
스타타 Stata
스트라타 strata
시계열 데이터 time series data
신뢰구간 confidence interval
알고리즘 algorithm
연속 변수 continuous variable
영가설 null hypothesis
이동 평균 moving average
이산 변수 discrete variable
인공지능 artificial intelligence (AI)
잠재 변수 latent variable
전산언어학 computational linguistics
정규 분포 normal distribution
중앙값 median
종속 변수 dependent variable
주성분 분석 principal component analysis
지도 학습 supervised learning
차원 축소 dimesion reduction
카이-스퀘어 검정 chi-square test
클래시피케이션 classification
클러스터링 clustering
파이썬 Python
판다스 Pandas
퍼셉트론 perceptron
페이지랭크 PageRank
편향 (통계) bias
평균 mean
표준정규분포 standard normal distribution
표준점수 standardized score
표준편차 standard deviation
푸아송 분포 Poisson distribution
피벗 테이블 pivot table
피처 (머신러닝) feature (machine learning)
피처 엔지니어링 feature engineering
행렬 matrix
확률 분포 probability distribution
회귀 regression
히스토그램 histogram
D3 D3
GATE GATE
k-최근접 이웃 k-nearest neighbors
k-평균 클러스터링 k-means clustering
R R
S 곡선 S curve
SAS SAS
SPSS SPSS
SQL SQL
P 값 P value
n-그램 n-gram
MATLAB MATLAB
NoSQL NoSQL
t-분포 t-distribution
objective function
naive Bayes classifier
neural network
Mean Absolute Error
Mean Squared Error
gradient boosting
gradient descent
spatiotemporal data
Root Mean Squared Error (RMSE)
quantile, quartile
serial correlation
posterior distribution
predictive analytics
predictive modeling

2 같이 보기[ | ]

3 참고[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}