에이전틱 AI / / 2025. 9. 27. 23:49

챗지피티 vs. AI 에이전트 구성 요소

반응형

AI 에이전트 시스템을 이해하기 위해서 이를 구성하는 가장 기본적이고 핵심적인 요소를 이해하는 것이 중요합니다. 이는 거대 언어 모델(LLM)을 활용한 에이전트를 만든다는 것이 무엇인지 이해하는 데 기본이 됩니다. 이를 통해서 OpenAI, 구글 Gemini, Claud 에서 공개한 API를 무슨 용도로 어떻게  사용해야하는지도 이해할 수 있습니다.

AI 에이전트의 기본 구성 요소에 대해서는 [똑똑한 AI 에이전트 - 복잡한 프레임워크는 이제 그만]에서 설명을 했습니다. 여기서는 우리에게 익숙한 챗지피티를 에이전트의 구성 요소의 관점에서 살펴보겠습니다. 편의상 구글의 Gemini를 사용해서 그 구성을 이해하고 설명하려고 합니다. 무료라고 해서 그 동안 계속 사용을 해 오고 있는데요. 꽤 좋은 성능을 보여주고 있고 따로 ChatGPT를 다시 찾지 않고도 잘 살고 있거든요.

1. 채팅 앱

2022년 11월 30일 ChatGPT가 처음 출시되고 출시된지 두 달 만에 1억 명을 돌파하여, 기술 역사상 가장 빠르게 성장한 소비자 애플리케이션 중 하나로 떠들석 하던 때가 기억이 납니다.(참고로 틱톡은 약 9개월, 인스타그램은 30개월이 걸렸습니다.) 이 후로 계속 인공지능 관련 놀라운 뉴스로 어질 어질 했죠. OpenAI에서 GPT-3 모델에 대한 첫  API를 공개한 것은 그보다 빠른 2020년 6월 11일입니다. 처음에는 프라이빗 베타였고 점차 공개 범위를 넓혀서 2023년 7월 GPT-4 API가 모든 사용자에게 유로로 공개가되었습니다. 막상 API를 접했을 때 이미 ChatGPT가 모든 걸 다 해결해 주고 있는 것처럼 보였고, 추가로 더 할 수 있는 것은 아무 것도 없는 것처럼 보였습니다. 솔직히 그 느낌이 아직도 잘 없어지지는 않네요.

우리가 익숙하게 사용하고 있는 챗지피티, 제미나이챗가 어떻게 구성되어 있을까를 살펴보려고 합니다. AI 에이전트의 구성 요소와 거대 언어 모델 채팅 앱이 가지고 있는 구조는 동일합니다. 제미나이챗이 어떻게 구성되어 있는지 하나씩 살펴보겠습니다.

1.1. 거대 언어 모델(LLM)

우리가 가장 편하게 접할 수 있고 내가 인공지능을 사용하고 있다는 것을 스스로 알 수 있도록 해 주는 것은 채팅 어플리케이션입니다. 오픈에이아이의 챗지피티, 구글의 제미나이가 그런 것이죠. 내가 특별히 생각하지 않고 아무 말이나 해도 아주 잘 답변을 해 줍니다. 우리가 다 알고 있지만 그 뒤에는 거대 언어 모델이라고 불리는 두뇌 역할을 하는 인공지능 모델이 있습니다.

제미나이에 간단히 제 소개를 먼저 해 보겠습니다.

위 그림에서 실제 답변을 해주는 거대 언어 모델은 Gemini-2.5-Flash라는 모델입니다(1번). 아주 단순하게 이야기하면 머리에 순간 떠오르는 단어를 아무 생각없이 내 뱉어내는 아는 게 아주 많은 똑똑한 인공지능 거대 언어 모델(LLM)  중 하나입니다. 사용자가 뜬금없이 자기 소개를 하고 있습니다.(2번) 그러면 제미나이는 확율적으로 가장 많이 나올법한 대답(머리에 순간 떠오르는)을 내놓는 것입니다.(3번)

앞에서 ‘머리에 떠오르는’, ‘아무 생각없이’ 같은 말로 이야기했지만 실제로는 아주 아는게 많고 똑똑하다고 설명을 하는 것이 더 적절한 표현입니다. 실제로는 어떤 질문을 해도 아래 보이는 것처럼 아주 명석한 답변을 내 놓거든요.

챗지피티가 인기를 얻고 대중적으로 많이 사용된 이유도 어떤 질문을 해도 척척 대답해주는 놀라운 능력때문이었죠. 역사, 철학, 수학 뿐 아니라 소설을 쓰고 시를 쓰는 등 정말 못 하는 것이 없다고 표현하는 게 더 적절합니다. 하지만 초기에 챗지피티의 한계로 명확히 공개된 것은 현재에 대한 지식은 없다는 것이었습니다. 더 정확히는 거대 언어 모델이 학습을 한 데이터 외의 내용은 모른다는 것이 었습니다.

1.2. 강화된 LLM

공부한 열심히 했던 거대 언어 모델은 현재 밖에서 벌어지고 있는 일을 알 수 없고, 공부하지 않는 내용에 대해서는 알 지 못 합니다. 좀 더 생각해 보면 방금 어떤 질문에 답변을 해 줬지만, 그 질문도 현재 벌어진 일이니 학습을 한 적이 없어서 기억하지 못 하는 것에 속합니다. 이를 개선하고 좀 더 강력한 능력을 갖춘 강화된 LLM(augmented LLM)이 나오게 되었습니다.

1.2.1. 도구(tool)와 기억력(memory) 그리고 지식 검색(retrieval)

초기에는 챗 어플리케이션에 “오늘의 날씨를 알려줘”라고 하면 아주 친절한 말로 “저는 실시간 데이터는 알지 못 합니다.”라는 답변이 돌와 왔습니다. 하지만 요즘은 “내가 살고 있는 곳의 날씨를 알려줘”라고 해도 답변을 받을 수 있습니다. 저는 이미 앞에서 “나는 시드니에 살고 있다”라고 알려줬다는 것을 제미나이챗에 알려줬습니다. 아래 제가 받은 대답입니다.

여기서 우리는 2가지를 알 수 있습니다. 첫번째는 채팅앱이 제가 살고 있는 곳을 기억(memory)하고 있다는 것입니다. 둘째는 외부에 있는 정보를 검색하는 도구(tool)를 가지고 있다는 것입니다.

제미나이챗에서 지식검색(retrieval)은 젬(Gem)이라고 하는 기능으로 구현되어 있습니다.(챗지피는 GPTs라고 하는 기능이 있습니다.) 나만이 가지고 있는 자료나 외부에 공개할 수 없는 자료를 등록을 해 두고 필요한 경우 그 자료를 참조하도록 하는 것입니다. 

아래는 Gem에 소설 이상한 나라 엘리스를 추가하고(1번) 특별 요청 사항으로 엘리스관련된 질문은 첨부한 소설을 확인해서 답변을 해달라고 요청한 것입니다.(2번)

그랬더니 제가 질문한 내용을 첨부한 소설에서 검색을 해서 답변을 주고 참고한 내용도 같이 볼 수 있도록 해 주었습니다.

2. AI 에이전트 기본 요소를 갖춘 채팅앱

챗지피티, 제미나이챗을 거대 언어 모델과 동일하게 생각하는 사람들이 많지만 실제로는 같은 것이 아닙니다. 채팅앱은 거대 언어 모델을 사용하는 어플리케이션의 하나입니다. 그리고 실제로 강화된 LLM이라고 부를 때도 어디에 강화된 기능을 추가했는지를 깊이 생각해 보면 채팅 어플리케이션에 강화된 기능이 추가된 것으로 보입니다.

앞에서 살펴본 채팅앱의 기능을 확인하고 나니 이제는 채팅앱의 기본 구성 요소가 아래와 같을 것이라는 것을 알게 되었습니다.

AI 에이전트를 중심으로 기본 구성 요소를 설명한 것을 아직 못 보셨다면 이제 한번 읽어보시기를 권합니다.

 

똑똑한 AI 에이전트 - 복잡한 프레임워크는 이제 그만

AI 에이전트가 복잡한 작업을 자율적으로 처리한다는 비전은 매력적이지만, 현실에서 안정적이고 효과적인 에이전트를 구축하는 것은 전혀 다른 문제입니다. 많은 개발팀이 복잡한 프레임워크

aifocus.10000lab.xyz

 

반응형
  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유