대규모 언어 모델

(LLM에서 넘어옴)

1 개요[ | ]

large language model (LLM)
대형 언어 모델, 대규모 언어 모델, 거대 언어 모델
  • 수많은 파라미터(보통 수십억 웨이트 이상)를 보유한 인공 신경망으로 구성되는 언어 모델
  • 자기 지도 학습이나 반자기지도학습을 사용하여 레이블링되지 않은 상당한 양의 텍스트로 훈련된다.
  • 2018년경에 나타났으며 다양한 작업을 위해 수행된다.
  • 이전의 특정 작업의 특수한 지도 학습 모델의 훈련 패러다임에서 벗어나 자연어 처리 연구로 초점이 옮겨졌다.
  • 대규모 언어 데이터(인터넷) + 대규모 모델(수많은 파라미터)

2 같이 보기[ | ]

3 참고[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}