RAG42 : 포티투마루가 개발한 검색 증강 생성 기술

rag42
쿠팡


RAG42 소개

RAG42는 포티투마루(42 Maru)가 개발한 검색 증강 생성 기술(Retrieval-Augmented Generation)을 말한다. RAG42는 방대한 양의 데이터에서 AI가 필요로 하는 특정 정보를 정확하게 검색해 내는 기술이며, LLM(대규모 언어 모델)은 이 RAG를 통해 답변을 도출하게 된다.


기술

스마트 임베딩

스마트 임베딩은 데이터에 대한 의미를 이해하고 표현하는 기술을 말한다. RAG42는 스마트 임베딩을 통해 데이터를 벡터 공간에 표현해 낸다. 이 벡터 공간에서 데이터 사이의 유사성을 계산하여, 관련성이 높은 데이터를 검색하는 것이다.

딥러닝 기반 리트리벌

딥러닝 기반 리트리 벌은 스마트 임베딩을 통해 표현된 데이터를 검색하는 기술이다. RAG42는 딥러닝 모델을 사용하여, 데이터의 유사성뿐만 아니라, 데이터의 중요도까지 고려하여 검색하게 된다.

인스트럭트 튜닝을 통한 프롬프트 엔지니어링

프롬프트 엔지니어링은 AI에게 주는 지시를 최적화하는 기술로써, 인스트럭트 튜닝을 통해, AI에게 주는 프롬프트를 최적화합니다. 그리고 이를 통해, AI가 보다 정확하고 유용한 답변을 생성할 수 있도록 만들어낸다.

특징

①정확한 검색 : 대규모 원천 데이터로부터 초거대 인공지능이 필요로 하는 특정 정보나 지식만 정확하게 검색해 내는 기술을 통해 초거대 언어 모델이 해당 정보를 더욱 정확하게 이해하고 활용할 수 있도록 도와준다

②다양한 분야에서의 활용 : 인공지능 기반의 대화형 서비스나 검색 엔진 등에서 유용하게 사용될 수 있다. 예를 들어, 사용자가 원하는 정보를 검색할 때, RAG42는 사용자의 의도를 파악하고, 그에 맞는 정보를 정확하게 제공해 줄 것이다.

③사용자의 의도 파악 : 사용자가 원하는 정보를 검색할 때, 사용자의 의도를 파악하고, 그에 맞는 정보를 정확하게 파악하고 제공한다.

④외부 지식 활용 : Retriever 기반 언어 모델 구조 프레임워크의 장점을 입증했다. 그리고 answer span이 문단 내에 그대로 존재하지 않는 종류의 QA task에서도 확장 적용이 가능하다는 장점이 있다.

⑤빠른 속도 : 대규모 원천 데이터를 빠르게 처리할 수 있으며, 초거대 언어 모델이 필요로 하는 정보를 빠르게 전달해 줄 것이다.

단점

대규모 원천 데이터로부터 초거대 인공지능이 필요로 하는 특정 정보나 지식만 정확하게 검색해 내는 기술이기 때문에, 검색 결과가 제한적일 수 있다는 점이 단점으로 지적되고 있다. 그리고 RAG42가 초거대 언어 모델이 해당 정보를 더욱 정확하게 이해하고 활용할 수 있도록 도와주는 기술이지만, 아직도 여전히 초거대 언어 모델의 한계와 오류는 존재하기 때문에 이 부분을 기억해둬야 한다.

활용

RAG42는 다양한 분야에서 활용될 것으로 보인다. 특히 인공지능 기반의 대화형 서비스나 검색 엔진 등에서 유용하게 사용될 수 있을 것이다. 예를 들자면 사용자가 원하는 정보를 검색할 때, RAG42는 사용자의 의도를 파악하고, 그에 맞는 정보를 정확하게 제공해 줄 것이다.

마무리

RAG42는 아직 출시 초기 단계이지만, 향후 문제가 되는 단점들을 보완하고 성능과 기능을 개선시킬 것이라고 한다. 그리고 많은 기업과 기관에서 관심을 가지고 있으며, 대규모 언어 모델의 정확성과 신뢰성을 높이는 데 기여할 것으로 기대된다.

42maru


이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.