0. Perplexity?
Perplexity는 실시간 웹 검색과 AI 기술을 결합한 대화형 검색 엔진 서비스의 이름입니다. Perplexity AI는 사용자의 질문에 대해 정확하고 최신의 정보를 제공하는 것을 목표로 합니다. 이 서비스는 다양한 AI 모델을 활용하여 검색 결과를 생성합니다.Pro 버전의 경우, 사용자가 선택할 수 있는 여러 고급 AI 모델을 제공합니다. 이 모델들은 다음과 같습니다:
- GPT-4o
- Claude-3.5 Sonnet
- Sonar Large
- Claude 3 Opus
- Sonal huge
이러한 다양한 모델 중에서 사용자가 원하는 모델을 선택하여 검색을 수행할 수 있습니다. 각 모델은 고유한 특성과 성능을 가지고 있어, 사용자의 필요에 따라 적절한 모델을 선택할 수 있습니다.
Perplexity 특징
- 다양한 모드가 존재해 검색 범위를 제안하거나 Task에 맞게 모드를 선택할 수 있음.(Ex: 웹, 학문, 수학 모드 등)
- 학문 모드로 설정하면 전체 웹 서치 결과와 유사하게 나오지만, 학술지나 관련 논문의 링크가 바로 걸려있음.
- 웹사이트에서 무료로 접속 가능, Focus 탭을 활용하여 보다 디테일한 자료 수집 가능
Perplexity 장점
- 링크와 함께 최신 정보의 검색결과를 손쉽게 얻을 수 있음
- AI와 인터넷 검색 결합, 이용한 정보 출처 / 링크 제공
- 링크를 제공하면 내용을 학습/요약 등 작업 가능
- 이전 대화 기록을 유지, 대화를 이어서 다시 시작할 수 있음
- 질문에 오류가 있을 시, 새롭게 질문하는 것이 아닌 수정 가능
- 출처를 제시함에 따라 근거 있는 답변 제시 가능
- 각 포커싱 별로 전문적인 답변을 얻을 수 있음
- 이용자들이 손쉽게 이용할 수 있는 깔끔한 인터페이스 제공
Perplexity 단점
- 한국어와 영어로 질문하는 답변의 차이
- 아직 한국 정보가 Perplexity에 조금 약한편으로 정보량이 적음
- 있는 정보들을 기반으로 대답을 하기 때문에, 물어봤을 때 할말이 없거나 정보량이 적은 내용에서는 급격히 줄어드는 대답량
1. ChatGPT VS Perplexity 차이점
정보 소스와 최신성
Perplexity AI는 실시간으로 인터넷에서 정보를 검색하여 최신 데이터를 제공합니다. 반면 ChatGPT는 특정 시점까지 학습된 데이터를 기반으로 하므로 최신 정보 제공에 한계가 있을 수 있습니다. 단, ChatGPT 역시 RAG를 도입하여 최신 정보를 검색하여 답변을 제공하고 있습니다. (그러나 일반적으로 출처를 제공하지 않음.)
출처 제공
Perplexity AI는 답변의 출처를 명확히 표시하여 정보의 신뢰성을 높입니다. ChatGPT는 일반적으로 출처를 제공하지 않아 답변의 근거를 확인하기 어려울 수 있습니다.
주요 기능
Perplexity AI는 검색 기능에 특화되어 있으며, AI가 검색 결과를 요약해줍니다. ChatGPT는 대화형 인터페이스에 집중하여 다양한 주제에 대한 대화와 창의적 작업을 수행할 수 있습니다.
정확성과 신뢰성
Perplexity AI는 신뢰할 수 있는 출처에서 정보를 가져와 높은 정확성을 제공합니다. ChatGPT는 다양한 주제에 대해 일반적인 지식을 제공하지만, 때로는 부정확한 정보를 생성할 수 있습니다.
이러한 차이점들로 인해 Perplexity AI와 ChatGPT의 선택이 달라질 수 있습니다. 최신 정보나 신뢰할 수 있는 출처가 필요한 경우 Perplexity AI가 더 적합할 수 있으며, 다양한 창의적 작업이나 일반적인 대화에는 ChatGPT가 유용할 수 있습니다.
Perplexity에서 ChatGPT 4o 모델을 사용한 경우, 소스를 함께 제공하고 사용자 인터페이스 등의 신뢰도 측면에서 Perplexity가 ChatGPT보다 좋다고 생각함.
2. Perplexity 프로세스를 도입한 RAG
Perplexity가 ChatGPT와 비교되면서 함께 좋은 평가를 받고 있는 이유가 무엇일까요?
-> Perplexity의 모델 성능이 큰 비중을 차지하고 있지는 않습니다. Perplexity 역시 ChatGPT 4o, Claude, Llama 3.1와 같은 모델을 사용하기 때문입니다.
-> Perplexity AI는 실시간 웹 검색과 다양한 출처를 활용한 종합적인 정보 제공에 초점을 맞추고 있기 때문에 좋은 평가를 받고 있는 것입니다.
이러한 이유로 실제 RAG 프로세스를 구현할 때, Perplexity 모델로 교체한다고 해서 성능이 크게 개선되지는 않을 것입니다. 이에 기존 문서 기반 RAG 프로세스 성능 개선을 위해 Perplexity 프로세스 도입을 제안합니다.
제안된 Perplexity 프로세스
- 사용자가 질문을 입력합니다.
- LLM은 관련된 일련의 관련 질의문을 제공합니다.
- 각 질의에 대해 Google에서 일련의 검색 결과를 얻습니다.
- 각 검색 결과에 대해 웹 페이지를 크롤링하고 원시 텍스트를 저장합니다.
- 원래 사용자 질문과 크롤링된 텍스트를 고려하여 적절한 컨텍스트를 구축합니다.
- LLM은 제공된 맥락을 바탕으로 질문에 답합니다.
실제 서비스를 고려한 프로세스
실제 서비스에 도입할 때는, 특정 도메인에 대한 문서(가이드문서, 실무참고서 등)만 Vector DB에 저장해두고 검색하고 요약하는 것이 비용적으로 효율적이고 정확합니다.
하지만 “사고발생 시 동일증권으로 가입했을 때 장단점은 무엇인가요?”라는 질문을 받으면 동일증권에 대한 컨텍스트를 찾기는 하나, 문서 내 글에서 장단점이라고 언급하지 않았기 때문에 답변을 어려워하는 경향이 있습니다.
반면에, Perplexity는 웹을 검색하고 요약해 답변을 도출하므로, 위와 같이 도메인 문서를 제공받지 않은 상태에서도 “사고발생 시 동일증권으로 가입했을 때 장단점은 무엇인가요?”에 대해 특정 블로그에 잘 정리해둔 글을 컨텍스트화 해서 LLM에 제공하면 정확한 답변을 도출하기도 합니다.
1. 문서 검색 답변과 웹 검색 답변을 함께 제공
문서 검색 + 웹 검색 → LLM이 2가지 버전의 답변 제공
2. 문서 검색 답변이 관련이 없는 경우 웹 검색을 진행함.
문서 검색 → LLM 답변 → 관련도 체크 → (관련 없을 시) 웹 검색 → LLM 답변
3. 결론
이 글에서는 ChatGPT와 비교되고 있는 Perplexity의 특징과 차이점에 대해 알아봤습니다.
또한, Perplexity 프로세스 도입을 통해 기존 RAG 프로세스 성능 개선 방법에 대해 제안하고 있습니다.
1. 기존 문서 기반 RAG는 답변을 잘하는 편이지만, 복잡한 질문을 하면 답변의 정확도가 떨어지는 문제가 있음.
-> 이에 웹 검색 및 소스 제공을 통해 정확도와 신뢰도를 모두 확보하고 있는 Perplexity 프로세스 도입을 제안함.
2. 하지만, 관련도 체크, 웹 검색 노드를 추가하면 답변 도출 시간이 오래 걸려 두가지 선택지가 존재함.
-> 복잡한 질문이 적어 기존 문서 기반 RAG의 정확도가 높다면, 관련도 체크를 통해 관련이 없을 경우만 웹 검색을 실행. 웹 검색 노드로 거의 넘어갈 일이 없어 비용이 적게 듬.
-> 답변 도출 시간이 가장 중요한 고려 대상이고 복잡한 질문이 많은 경우, 웹 검색 컨텍스트와 문서 검색 컨텍스트를 결합해 답변을 도출함.
이러한 방법을 통해 RAG 성능 개선을 이뤄낼 수 있고, 상황에 맞게 노드를 연결하여 사용하면 좋을 듯 합니다.
(Langraph를 사용해 해당 기능들을 용이하게 관리할 수 있습니다.)
'RAG' 카테고리의 다른 글
[RAG] Document Loader 비교 (feat. PDF, Markdown 변환) (6) | 2024.09.11 |
---|---|
[RAG] Llama 3.1 프롬프트 형식 (0) | 2024.09.09 |