임베딩(embedding) ● 컴퓨터는 자연어를 직접 처리할 수 없기 때문에 자연어를 숫자나 벡터 형태로 변환하는 과정이 필요● 단어나 문장을 수치화해 벡터 공간으로 표현하는 과정을 의미● 딥러닝의 입력값으로 많이 사용됨● 임베딩에는 문법적인 정보가 포함되어 임베딩 품질이 좋다면 단순한 모델로도 좋은 결과를 얻을 수 있음 단어 임베딩 ● 말뭉치에서 각각의 단어를 벡터로 변환하는 기법● 의미와 문법적 정보를 지니고 있으며, 단어를 표현하는 방법에 따라 다양한 모델이 존재 01. 원-핫 인코딩(one-hot encoding) ● 단어를 숫자 벡터로 변환하는 가장 기본적인 방법● 요소들 중 단 하나의 값만 1이고, 나머지 요솟값은 0인 인코딩을 의미● 원-핫 인코딩으로 나온 결과를 원-핫 벡터라고 ..