"데이터과학 용어"의 두 판 사이의 차이

 
(사용자 2명의 중간 판 13개는 보이지 않습니다)
3번째 줄: 3번째 줄:


{| class='wikitable'
{| class='wikitable'
! 한국어 !! 영어 !!  
! 한국어 !! 영어 !! 설명
|-
| [[강화 학습]] || [[reinforcement learning]] ||
|-
|-
| [[결정트리]] || [[decision tree]] ||
| [[결정트리]] || [[decision tree]] ||
|-
|-
| [[계수(coefficient)]] || [[coefficient]] ||
| [[계수(coefficient)]] || [[coefficient]] || 어느 변수에 일정하게 곱해진 상수 인자
|-
|-
| [[공분산]] || [[covariance]] ||
| [[공분산]] || [[covariance]] || 2개의 확률변수의 상관정도를 나타내는 값
|-
| [[과적합]] || [[overfitting]] ||
|-
|-
| [[교차-타당도]] || [[cross-validation]] ||
| [[교차-타당도]] || [[cross-validation]] ||
|-
| [[극단치]] || [[outlier]] ||
|-
|-
| [[데이터 과학]] || [[data science]] ||
| [[데이터 과학]] || [[data science]] ||
|-
|-
| [[데이터 마이닝]] || [[data mining]] ||
| [[데이터 마이닝]] || [[data mining]] || 주로 대량 자료에서 데이터마이닝 기법을 통해 규칙이나 패턴과 같은 의미 있는 정보를 찾아내는 일
 
|-
|-
| [[데이터 랭글링]] || [[data wrangling]] ||
| [[데이터 랭글링]] || [[data wrangling]] || 원자료를 다른 형태로 수작업으로 전환하거나 매핑하는 과정
 
|-
|-
| [[데이터 엔지니어]] || [[data engineer]] ||
| [[데이터 엔지니어]] || [[data engineer]] ||
24번째 줄: 32번째 줄:
|-
|-
| [[딥러닝]] || [[deep learning]] ||
| [[딥러닝]] || [[deep learning]] ||
|-
| [[랜덤 포레스트]] || [[random forest]] ||
|-
| [[로그]] || [[logarithm]] ||
|-
| [[로지스틱 회귀]] || [[logistic regression]] ||
|-
| [[리프트]] || [[lift]] ||
|-
| [[마르코프 체인]] || [[Markov Chain]] ||
|-
| [[머신러닝]] || [[machine learning]] ||
|-
| [[머신러닝 모델]] || [[machine learning model]] ||
|-
| [[모델]] || [[model]] ||
|-
| [[몬테카를로 메소드]] || [[Monte Carlo method]] ||
|-
|-
| [[백프로퍼게이션]] || [[backpropagation]] ||
| [[백프로퍼게이션]] || [[backpropagation]] ||
30번째 줄: 56번째 줄:
|-
|-
| [[베이지안 네트워크]] || [[Bayesian network]] ||
| [[베이지안 네트워크]] || [[Bayesian network]] ||
|-
| [[분산(variance)]] || [[variance]] ||
|-
| [[벡터]] || [[vector]] ||
|-
| [[벡터 공간]] || [[vector space]] ||
|-
| [[비지도 학습]] || [[unsupervised learning]] ||
|-
|-
| [[빅데이터]] || [[Big Data]] ||
| [[빅데이터]] || [[Big Data]] ||
|-
| [[사전 분포]] || [[prior distribution]] ||
|-
|-
| [[상관]] || [[correlation]] ||
| [[상관]] || [[correlation]] ||
|-
| [[서포트 벡터 머신]] || [[support vector machine]] ||
|-
| [[선형 대수]] || [[linear algebra]] ||
|-
| [[선형 회귀]] || [[linear regression]] ||
|-
| [[쉘]] || [[shell]] ||
|-
| [[스칼라]] || [[scalar]] ||
|-
| [[스타타]] || [[Stata]] ||
|-
| [[스트라타]] || [[strata]] ||
|-
| [[시계열 데이터]] || [[time series data]] ||
|-
|-
| [[신뢰구간]] || [[confidence interval]] ||
| [[신뢰구간]] || [[confidence interval]] ||
40번째 줄: 92번째 줄:
|-
|-
| [[연속 변수]] || [[continuous variable]] ||
| [[연속 변수]] || [[continuous variable]] ||
|-
| [[영가설]] || [[null hypothesis]] ||
|-
| [[이동 평균]] || [[moving average]] ||
|-
|-
| [[이산 변수]] || [[discrete variable]] ||
| [[이산 변수]] || [[discrete variable]] ||
|-
|-
| [[인공지능]] || [[artificial intelligence]] ([[AI]]) ||
| [[인공지능]] || [[artificial intelligence]] ([[AI]]) ||
|-
| [[잠재 변수]] || [[latent variable]] ||
|-
|-
| [[전산언어학]] || [[computational linguistics]] ||
| [[전산언어학]] || [[computational linguistics]] ||
|-
| [[정규 분포]] || [[normal distribution]] ||
|-
| [[중앙값]] || [[median]] ||
|-
|-
| [[종속 변수]] || [[dependent variable]] ||
| [[종속 변수]] || [[dependent variable]] ||
|-
| [[주성분 분석]] || [[principal component analysis]] ||
|-
| [[지도 학습]] || [[supervised learning]] ||
|-
|-
| [[차원 축소]] || [[dimesion reduction]] ||
| [[차원 축소]] || [[dimesion reduction]] ||
56번째 줄: 122번째 줄:
|-
|-
| [[클러스터링]] || [[clustering]] ||
| [[클러스터링]] || [[clustering]] ||
|-
| [[파이썬]] || [[Python]] ||
|-
| [[판다스]] || [[Pandas]] ||
|-
| [[퍼셉트론]] || [[perceptron]] ||
|-
| [[페이지랭크]] || [[PageRank]] ||
|-
|-
| [[편향 (통계)]] || [[bias]] ||
| [[편향 (통계)]] || [[bias]] ||
|-
| [[평균]] || [[mean]] ||
|-
| [[표준정규분포]] || [[standard normal distribution]] ||
|-
| [[표준점수]] || [[standardized score]] ||
|-
| [[표준편차]] || [[standard deviation]] ||
|-
| [[푸아송 분포]] || [[Poisson distribution]] ||
|-
| [[피벗 테이블]] || [[pivot table]] ||
|-
|-
| [[피처 (머신러닝)]] || [[feature (machine learning)]] ||
| [[피처 (머신러닝)]] || [[feature (machine learning)]] ||
|-
|-
| [[피처 엔지니어링]] || [[feature engineering]] ||
| [[피처 엔지니어링]] || [[feature engineering]] ||
|-
| [[행렬]] || [[matrix]] ||
|-
| [[확률 분포]] || [[probability distribution]] ||
|-
| [[회귀]] || [[regression]] ||
|-
| [[히스토그램]] || [[histogram]] ||
|-
|-
| [[D3]] || [[D3]] ||
| [[D3]] || [[D3]] ||
67번째 줄: 161번째 줄:
| [[GATE]] || [[GATE]] ||
| [[GATE]] || [[GATE]] ||
|-
|-
| [[히스토그램]] || [[histogram]] ||
| [[k-최근접 이웃]] || [[k-nearest neighbors]] ||
|-
| [[k-평균 클러스터링]] || [[k-means clustering]] ||
|-
| [[R]] || [[R]] ||
|-
| [[S 곡선]] || [[S curve]] ||
|-
| [[SAS]] || [[SAS]] ||
|-
| [[SPSS]] || [[SPSS]] ||
|-
| [[SQL]] || [[SQL]] ||
|-
| [[P 값]] || [[P value]] ||
|-
| [[n-그램]] || [[n-gram]] ||
|-
| [[MATLAB]] || [[MATLAB]] ||
|-
| [[NoSQL]] || [[NoSQL]] ||
|-
| [[t-분포]] || [[t-distribution]] ||
|-
| || [[objective function]] ||
|-
| || [[naive Bayes classifier]] ||
|-
| || [[neural network]] ||
|-
| || [[Mean Absolute Error]] ||
|-
| || [[Mean Squared Error]] ||
|-
|-
| || [[gradient boosting]] ||
| || [[gradient boosting]] ||
|-
|-
| || [[gradient descent]] ||
| || [[gradient descent]] ||
|-
| || [[spatiotemporal data]] ||
|-
| || [[Root Mean Squared Error]] ([[RMSE]]) ||
|-
| || [[quantile]], [[quartile]] ||
|-
| || [[serial correlation]] ||
|-
| || [[posterior distribution]] ||
|-
| || [[predictive analytics]] ||
|-
| || [[predictive modeling]] ||
|}
|}


==같이 보기==
==같이 보기==
* [[데이터 과학]]
{{z컬럼3|
* [[인공지능 용어집]]
* [[통계 용어]]
* [[데이터과학]]
* [[머신러닝 용어]]
* [[인공지능 용어]]
* [[텐서플로우 용어]]
* [[데이터과학 치트시트]]
* [[데이터과학 치트시트]]
}}


==참고==
==참고==

2021년 3월 14일 (일) 14:45 기준 최신판

1 개요[ | ]

데이터 과학 용어집
한국어 영어 설명
강화 학습 reinforcement learning
결정트리 decision tree
계수(coefficient) coefficient 어느 변수에 일정하게 곱해진 상수 인자
공분산 covariance 2개의 확률변수의 상관정도를 나타내는 값
과적합 overfitting
교차-타당도 cross-validation
극단치 outlier
데이터 과학 data science
데이터 마이닝 data mining 주로 대량 자료에서 데이터마이닝 기법을 통해 규칙이나 패턴과 같은 의미 있는 정보를 찾아내는 일
데이터 랭글링 data wrangling 원자료를 다른 형태로 수작업으로 전환하거나 매핑하는 과정
데이터 엔지니어 data engineer
독립 변수 independent variable
딥러닝 deep learning
랜덤 포레스트 random forest
로그 logarithm
로지스틱 회귀 logistic regression
리프트 lift
마르코프 체인 Markov Chain
머신러닝 machine learning
머신러닝 모델 machine learning model
모델 model
몬테카를로 메소드 Monte Carlo method
백프로퍼게이션 backpropagation
베이즈 정리 Bayes' Theorem
베이지안 네트워크 Bayesian network
분산(variance) variance
벡터 vector
벡터 공간 vector space
비지도 학습 unsupervised learning
빅데이터 Big Data
사전 분포 prior distribution
상관 correlation
서포트 벡터 머신 support vector machine
선형 대수 linear algebra
선형 회귀 linear regression
shell
스칼라 scalar
스타타 Stata
스트라타 strata
시계열 데이터 time series data
신뢰구간 confidence interval
알고리즘 algorithm
연속 변수 continuous variable
영가설 null hypothesis
이동 평균 moving average
이산 변수 discrete variable
인공지능 artificial intelligence (AI)
잠재 변수 latent variable
전산언어학 computational linguistics
정규 분포 normal distribution
중앙값 median
종속 변수 dependent variable
주성분 분석 principal component analysis
지도 학습 supervised learning
차원 축소 dimesion reduction
카이-스퀘어 검정 chi-square test
클래시피케이션 classification
클러스터링 clustering
파이썬 Python
판다스 Pandas
퍼셉트론 perceptron
페이지랭크 PageRank
편향 (통계) bias
평균 mean
표준정규분포 standard normal distribution
표준점수 standardized score
표준편차 standard deviation
푸아송 분포 Poisson distribution
피벗 테이블 pivot table
피처 (머신러닝) feature (machine learning)
피처 엔지니어링 feature engineering
행렬 matrix
확률 분포 probability distribution
회귀 regression
히스토그램 histogram
D3 D3
GATE GATE
k-최근접 이웃 k-nearest neighbors
k-평균 클러스터링 k-means clustering
R R
S 곡선 S curve
SAS SAS
SPSS SPSS
SQL SQL
P 값 P value
n-그램 n-gram
MATLAB MATLAB
NoSQL NoSQL
t-분포 t-distribution
objective function
naive Bayes classifier
neural network
Mean Absolute Error
Mean Squared Error
gradient boosting
gradient descent
spatiotemporal data
Root Mean Squared Error (RMSE)
quantile, quartile
serial correlation
posterior distribution
predictive analytics
predictive modeling

2 같이 보기[ | ]

3 참고[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}