2024/01/08

언어모델(Language Model) 문장이 얼마나 자연스러운지를 확률적으로 계산 및 예측하는 모델 컴퓨터는 사람의 말을 곧바로 이해할 수 없기 때문에 자연어 처리(NLP)라는 과정이 필요함 크게 통계학적 언어 모델과 딥러닝 기반의 언어 모델이 있으며, 최근에는 딥러닝 중에서도 인공신경망을 가장 많이 이용 대규모 언어모델(LLM; Large Language Model) 모델 사이즈를 키워 대용량의 텍스트 데이터를 학습시킨 성능을 극대화한 언어모델 기존의 머신러닝 모델에 비해 파라미터 수가 아주 많음 파라미터(parameter, 매개변수) 머신러닝에서 모델이 스스로 내부에서 결정하는 변수 또는 가중치 뉴런 사이에서 정보를 전달하는 시냅스와 같은 역할 GPT-3 모델에는 약 1750억 개의 파라미터가 사용됨..
구구르밍
'2024/01/08 글 목록