답변을 생성할 때 필요한 데이터는 사용자가 원하는 정보이다.- 사용자의 질문과 관련있는 데이터여야한다. 관련이 있다는것을 어떻게 판단할까?관련성 파악을 위해 vector를 활용한다.- 단어 또는 문장의 유사도를 파악해서 관련성을 측정한다. 벡터를 어떻게 생성하는가?Embedding 모델을 활용해서 vector를 생성한다.임베딩 모델은 문장에서 비슷한 단어가 자주 붙어있는 것을 학습한다. ex) 왕은 왕자의 아버지다 / 여왕은 왕자의 어머니다=> "왕자의" 라는 단어 앞에 등장하는 "왕"과 "여왕"은 유사할 가능성이 높다벡터 데이터베이스란1. Embedding 모델을 활용해 생성된 vector를 저장- 단순히 vector만 저장하면 안되고 metadata도 같이 저장해야한다 **이 부분이 상당히 중요하다..