"데이터과학 용어"의 두 판 사이의 차이

 
(사용자 2명의 중간 판 10개는 보이지 않습니다)
3번째 줄: 3번째 줄:


{| class='wikitable'
{| class='wikitable'
! 한국어 !! 영어 !!  
! 한국어 !! 영어 !! 설명
|-
| [[강화 학습]] || [[reinforcement learning]] ||
|-
|-
| [[결정트리]] || [[decision tree]] ||
| [[결정트리]] || [[decision tree]] ||
|-
|-
| [[계수(coefficient)]] || [[coefficient]] ||
| [[계수(coefficient)]] || [[coefficient]] || 어느 변수에 일정하게 곱해진 상수 인자
|-
| [[공분산]] || [[covariance]] || 2개의 확률변수의 상관정도를 나타내는 값
|-
|-
| [[공분산]] || [[covariance]] ||
| [[과적합]] || [[overfitting]] ||
|-
|-
| [[교차-타당도]] || [[cross-validation]] ||
| [[교차-타당도]] || [[cross-validation]] ||
|-
| [[극단치]] || [[outlier]] ||
|-
|-
| [[데이터 과학]] || [[data science]] ||
| [[데이터 과학]] || [[data science]] ||
|-
|-
| [[데이터 마이닝]] || [[data mining]] ||
| [[데이터 마이닝]] || [[data mining]] || 주로 대량 자료에서 데이터마이닝 기법을 통해 규칙이나 패턴과 같은 의미 있는 정보를 찾아내는 일
 
|-
|-
| [[데이터 랭글링]] || [[data wrangling]] ||
| [[데이터 랭글링]] || [[data wrangling]] || 원자료를 다른 형태로 수작업으로 전환하거나 매핑하는 과정
 
|-
|-
| [[데이터 엔지니어]] || [[data engineer]] ||
| [[데이터 엔지니어]] || [[data engineer]] ||
25번째 줄: 33번째 줄:
| [[딥러닝]] || [[deep learning]] ||
| [[딥러닝]] || [[deep learning]] ||
|-
|-
| [[백프로퍼게이션]] || [[backpropagation]] ||
| [[랜덤 포레스트]] || [[random forest]] ||  
|-
|-
| [[베이즈 정리]] || [[Bayes' Theorem]] ||
| [[로그]] || [[logarithm]] ||
|-
|-
| [[베이지안 네트워크]] || [[Bayesian network]] ||
| [[로지스틱 회귀]] || [[logistic regression]] ||
|-
|-
| [[빅데이터]] || [[Big Data]] ||
| [[리프트]] || [[lift]] ||
|-
|-
| [[상관]] || [[correlation]] ||
| [[마르코프 체인]] || [[Markov Chain]] ||
|-
|-
| [[신뢰구간]] || [[confidence interval]] ||
| [[머신러닝]] || [[machine learning]] ||
|-
|-
| [[알고리즘]] || [[algorithm]] ||
| [[머신러닝 모델]] || [[machine learning model]] ||
|-
|-
| [[연속 변수]] || [[continuous variable]] ||
| [[모델]] || [[model]] ||  
|-
|-
| [[이산 변수]] || [[discrete variable]] ||
| [[몬테카를로 메소드]] || [[Monte Carlo method]] ||
|-
|-
| [[인공지능]] || [[artificial intelligence]] ([[AI]]) ||
| [[백프로퍼게이션]] || [[backpropagation]] ||
|-
|-
| [[전산언어학]] || [[computational linguistics]] ||
| [[베이즈 정리]] || [[Bayes' Theorem]] ||
|-
|-
| [[종속 변수]] || [[dependent variable]] ||
| [[베이지안 네트워크]] || [[Bayesian network]] ||
|-
|-
| [[차원 축소]] || [[dimesion reduction]] ||
| [[분산(variance)]] || [[variance]] ||
|-
|-
| [[카이-스퀘어 검정]] || [[chi-square test]] ||  
| [[벡터]] || [[vector]] ||
|-
|-
| [[클래시피케이션]] || [[classification]] ||
| [[벡터 공간]] || [[vector space]] ||
|-
|-
| [[클러스터링]] || [[clustering]] ||
| [[비지도 학습]] || [[unsupervised learning]] ||
|-
|-
| [[편향 (통계)]] || [[bias]] ||
| [[빅데이터]] || [[Big Data]] ||
|-
|-
| [[피처 (머신러닝)]] || [[feature (machine learning)]] ||
| [[사전 분포]] || [[prior distribution]] ||
|-
|-
| [[피처 엔지니어링]] || [[feature engineering]] ||
| [[상관]] || [[correlation]] ||
|-
|-
| [[히스토그램]] || [[histogram]] ||
| [[서포트 벡터 머신]] || [[support vector machine]] ||
|-
| [[D3]] || [[D3]] ||
|-
| [[GATE]] || [[GATE]] ||
|-
| [[k-최근접 이웃]] || [[k-nearest neighbors]] ||
|-
| [[k-평균 클러스터링]] || [[k-means clustering]] ||
|-
| [[잠재 변수]] || [[latent variable]] ||
|-
| [[리프트]] || [[lift]] ||
|-
|-
| [[선형 대수]] || [[linear algebra]] ||
| [[선형 대수]] || [[linear algebra]] ||
81번째 줄: 77번째 줄:
| [[선형 회귀]] || [[linear regression]] ||
| [[선형 회귀]] || [[linear regression]] ||
|-
|-
| [[로그]] || [[logarithm]] ||
| [[]] || [[shell]] ||
|-
|-
| [[로지스틱 회귀]] || [[logistic regression]] ||
| [[스칼라]] || [[scalar]] ||
|-
|-
| [[머신러닝]] || [[machine learning]] ||
| [[스타타]] || [[Stata]] ||
|-
|-
| [[머신러닝 모델]] || [[machine learning model]] ||
| [[스트라타]] || [[strata]] ||
|-
|-
| [[마르코프 체인]] || [[Markov Chain]] ||
| [[시계열 데이터]] || [[time series data]] ||
|-
|-
| [[행렬]] || [[matrix]] ||
| [[신뢰구간]] || [[confidence interval]] ||
|-
|-
| [[평균]] || [[mean]] ||
| [[알고리즘]] || [[algorithm]] ||
|-
|-
| [[중앙값]] || [[median]] ||  
| [[연속 변수]] || [[continuous variable]] ||
|-
|-
| [[모델]] || [[model]] ||  
| [[영가설]] || [[null hypothesis]] ||
|-
|-
| [[몬테카를로 메소드]] || [[Monte Carlo method]] ||
| [[이동 평균]] || [[moving average]] ||
|-
|-
| [[이동 평균]] || [[moving average]] ||
| [[이산 변수]] || [[discrete variable]] ||
|-
|-
| [[정규 분포]] || [[normal distribution]] ||  
| [[인공지능]] || [[artificial intelligence]] ([[AI]]) ||
|-
|-
| [[영가설]] || [[null hypothesis]] ||
| [[잠재 변수]] || [[latent variable]] ||
|-
|-
| [[극단치]] || [[outlier]] ||
| [[전산언어학]] || [[computational linguistics]] ||
|-
|-
| [[과적합]] || [[overfitting]] ||
| [[정규 분포]] || [[normal distribution]] ||  
|-
|-
| [[페이지랭크]] || [[PageRank]] ||
| [[중앙값]] || [[median]] ||  
|-
|-
| [[퍼셉트론]] || [[perceptron]] ||  
| [[종속 변수]] || [[dependent variable]] ||
|-
|-
| [[판다스]] || [[Pandas]] ||
| [[주성분 분석]] || [[principal component analysis]] ||
|-
|-
| [[피벗 테이블]] || [[pivot table]] ||
| [[지도 학습]] || [[supervised learning]] ||
|-
|-
| [[푸아송 분포]] || [[Poisson distribution]] ||
| [[차원 축소]] || [[dimesion reduction]] ||
|-
|-
| [[주성분 분석]] || [[principal component analysis]] ||
| [[카이-스퀘어 검정]] || [[chi-square test]] ||  
|-
|-
| [[사전 분포]] || [[prior distribution]] ||
| [[클래시피케이션]] || [[classification]] ||
|-
|-
| [[확률 분포]] || [[probability distribution]] ||
| [[클러스터링]] || [[clustering]] ||
|-
|-
| [[파이썬]] || [[Python]] ||  
| [[파이썬]] || [[Python]] ||  
|-
|-
| [[R]] || [[R]] ||
| [[판다스]] || [[Pandas]] ||
|-
| [[퍼셉트론]] || [[perceptron]] ||  
|-
|-
| [[회귀]] || [[regression]] ||
| [[페이지랭크]] || [[PageRank]] ||
|-
|-
| [[랜덤 포레스트]] || [[random forest]] ||  
| [[편향 (통계)]] || [[bias]] ||
|-
|-
| [[강화 학습]] || [[reinforcement learning]] ||
| [[평균]] || [[mean]] ||
|-
|-
| [[S 곡선]] || [[S curve]] ||
| [[표준정규분포]] || [[standard normal distribution]] ||
|-
|-
| [[SAS]] || [[SAS]] ||
| [[표준점수]] || [[standardized score]] ||
|-
|-
| [[SPSS]] || [[SPSS]] ||  
| [[표준편차]] || [[standard deviation]] ||
|-
|-
| [[SQL]] || [[SQL]] ||
| [[푸아송 분포]] || [[Poisson distribution]] ||
|-
|-
| [[스타타]] || [[Stata]] ||
| [[피벗 테이블]] || [[pivot table]] ||
|-
|-
| [[스트라타]] || [[strata]] ||
| [[피처 (머신러닝)]] || [[feature (machine learning)]] ||
|-
|-
| [[지도 학습]] || [[supervised learning]] ||
| [[피처 엔지니어링]] || [[feature engineering]] ||
|-
|-
| [[서포트 벡터 머신]] || [[support vector machine]] ||
| [[행렬]] || [[matrix]] ||
|-
|-
| [[표준편차]] || [[standard deviation]] ||
| [[확률 분포]] || [[probability distribution]] ||
|-
|-
| [[표준정규분포]] || [[standard normal distribution]] ||
| [[회귀]] || [[regression]] ||
|-
|-
| [[표준점수]] || [[standardized score]] ||
| [[히스토그램]] || [[histogram]] ||
|-
|-
| [[스칼라]] || [[scalar]] ||
| [[D3]] || [[D3]] ||
|-
|-
| [[]] || [[shell]] ||
| [[GATE]] || [[GATE]] ||
|-
|-
| || [[spatiotemporal data]] ||
| [[k-최근접 이웃]] || [[k-nearest neighbors]] ||
|-
|-
| || [[Root Mean Squared Error]] ([[RMSE]]) ||
| [[k-평균 클러스터링]] || [[k-means clustering]] ||
|-
|-
| || [[quantile]], [[quartile]] ||
| [[R]] || [[R]] ||
|-
|-
| || [[serial correlation]] ||
| [[S 곡선]] || [[S curve]] ||
|-
|-
| || [[posterior distribution]] ||  
| [[SAS]] || [[SAS]] ||
|-
|-
| || [[predictive analytics]] ||
| [[SPSS]] || [[SPSS]] ||  
|-
|-
| || [[predictive modeling]] ||
| [[SQL]] || [[SQL]] ||
|-
|-
| [[P 값]] || [[P value]] ||
| [[P 값]] || [[P value]] ||
|-
|-
| [[n-그램]] || [[n-gram]] ||
| [[n-그램]] || [[n-gram]] ||
|-
| [[MATLAB]] || [[MATLAB]] ||
|-
|-
| [[NoSQL]] || [[NoSQL]] ||  
| [[NoSQL]] || [[NoSQL]] ||  
|-
| [[t-분포]] || [[t-distribution]] ||
|-
|-
| || [[objective function]] ||
| || [[objective function]] ||
197번째 줄: 199번째 줄:
| || [[gradient descent]] ||
| || [[gradient descent]] ||
|-
|-
| [[MATLAB]] || [[MATLAB]] ||
| || [[spatiotemporal data]] ||
|-
| || [[Root Mean Squared Error]] ([[RMSE]]) ||
|-
| || [[quantile]], [[quartile]] ||
|-
| || [[serial correlation]] ||
|-
| || [[posterior distribution]] ||
|-
| || [[predictive analytics]] ||
|-
| || [[predictive modeling]] ||
|}
|}


==같이 보기==
==같이 보기==
* [[데이터 과학]]
{{z컬럼3|
* [[인공지능 용어집]]
* [[통계 용어]]
* [[데이터과학]]
* [[머신러닝 용어]]
* [[인공지능 용어]]
* [[텐서플로우 용어]]
* [[데이터과학 치트시트]]
* [[데이터과학 치트시트]]
}}


==참고==
==참고==

2021년 3월 14일 (일) 14:45 기준 최신판

1 개요[ | ]

데이터 과학 용어집
한국어 영어 설명
강화 학습 reinforcement learning
결정트리 decision tree
계수(coefficient) coefficient 어느 변수에 일정하게 곱해진 상수 인자
공분산 covariance 2개의 확률변수의 상관정도를 나타내는 값
과적합 overfitting
교차-타당도 cross-validation
극단치 outlier
데이터 과학 data science
데이터 마이닝 data mining 주로 대량 자료에서 데이터마이닝 기법을 통해 규칙이나 패턴과 같은 의미 있는 정보를 찾아내는 일
데이터 랭글링 data wrangling 원자료를 다른 형태로 수작업으로 전환하거나 매핑하는 과정
데이터 엔지니어 data engineer
독립 변수 independent variable
딥러닝 deep learning
랜덤 포레스트 random forest
로그 logarithm
로지스틱 회귀 logistic regression
리프트 lift
마르코프 체인 Markov Chain
머신러닝 machine learning
머신러닝 모델 machine learning model
모델 model
몬테카를로 메소드 Monte Carlo method
백프로퍼게이션 backpropagation
베이즈 정리 Bayes' Theorem
베이지안 네트워크 Bayesian network
분산(variance) variance
벡터 vector
벡터 공간 vector space
비지도 학습 unsupervised learning
빅데이터 Big Data
사전 분포 prior distribution
상관 correlation
서포트 벡터 머신 support vector machine
선형 대수 linear algebra
선형 회귀 linear regression
shell
스칼라 scalar
스타타 Stata
스트라타 strata
시계열 데이터 time series data
신뢰구간 confidence interval
알고리즘 algorithm
연속 변수 continuous variable
영가설 null hypothesis
이동 평균 moving average
이산 변수 discrete variable
인공지능 artificial intelligence (AI)
잠재 변수 latent variable
전산언어학 computational linguistics
정규 분포 normal distribution
중앙값 median
종속 변수 dependent variable
주성분 분석 principal component analysis
지도 학습 supervised learning
차원 축소 dimesion reduction
카이-스퀘어 검정 chi-square test
클래시피케이션 classification
클러스터링 clustering
파이썬 Python
판다스 Pandas
퍼셉트론 perceptron
페이지랭크 PageRank
편향 (통계) bias
평균 mean
표준정규분포 standard normal distribution
표준점수 standardized score
표준편차 standard deviation
푸아송 분포 Poisson distribution
피벗 테이블 pivot table
피처 (머신러닝) feature (machine learning)
피처 엔지니어링 feature engineering
행렬 matrix
확률 분포 probability distribution
회귀 regression
히스토그램 histogram
D3 D3
GATE GATE
k-최근접 이웃 k-nearest neighbors
k-평균 클러스터링 k-means clustering
R R
S 곡선 S curve
SAS SAS
SPSS SPSS
SQL SQL
P 값 P value
n-그램 n-gram
MATLAB MATLAB
NoSQL NoSQL
t-분포 t-distribution
objective function
naive Bayes classifier
neural network
Mean Absolute Error
Mean Squared Error
gradient boosting
gradient descent
spatiotemporal data
Root Mean Squared Error (RMSE)
quantile, quartile
serial correlation
posterior distribution
predictive analytics
predictive modeling

2 같이 보기[ | ]

3 참고[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}