"Training Compute-Optimal Large Language Models"의 두 판 사이의 차이

(새 문서: ==개요== ;Training Compute-Optimal Large Language Models ==같이 보기== * [[ ]] ==참고== * https://arxiv.org/abs/2203.15556)
 
 
(같은 사용자의 중간 판 2개는 보이지 않습니다)
3번째 줄: 3번째 줄:


==같이 보기==
==같이 보기==
* [[ ]]
* [[Scaling Laws for Neural Language Models]]


==참고==
==참고==
* https://arxiv.org/abs/2203.15556
* https://arxiv.org/abs/2203.15556
* https://medium.com/nlplanet/two-minutes-nlp-scaling-laws-for-neural-language-models-add6061aece7
[[분류: 2022년]]

2024년 1월 24일 (수) 11:46 기준 최신판

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}