
Retrieval-Augmented Generation 시스템을 좀 아는 분들을 위한 개념 정리 Q&A❓ Q1. 문서 청크별 Key-Value (KV) 캐시란 무엇인가요?RAG 시스템에서 "문서 청크별 KV 캐시"가 어떤 개념인지 비전문가가 이해할 수 있게 설명해 주세요.✅ A1.문서 청크별 Key-Value 캐시는, 문서를 미리 잘게 나눈 후 각 조각(청크)에 대해 **언어 모델이 내부적으로 처리할 정보(Attention 계산용 Key, Value 행렬)**를 미리 계산해 저장해 두는 방식입니다.기존 RAG 시스템은 사용자가 질문을 던질 때마다 관련 문서를 검색하고, 그때마다 문서를 LLM에 넣어 일일이 계산을 해야 해서 시간이 오래 걸립니다. 반면 KV 캐시는 미리 계산해둔 결과를 즉시 불러와 사용하..