안녕하세요! 오랜만에 인사드립니다. 오늘은 요즘 핫한 주제 "MCP(Model Context Protocol)"이 아닌 😜, MCP가 뜨게 된 배경과 AI Agent가 어디까지 왔는지 알아보고자 합니다.
LLM의 발전과 AI 에이전트의 등장
LLM(Large Language Model)은 방대한 양의 텍스트 데이터로 학습된 인공 신경망 기반 모델로, 텍스트를 이해하고 생성하는 능력을 갖추고 있습니다.
OpenAI가 발표한 GPT부터 Llama 등의 대규모 언어 모델(LLM)이 공개되면서, 텍스트 생성, 이해, 번역, 요약 등 다양한 자연어 작업에서 놀라운 성능을 보여주었습니다. 사람들은 AI의 시대가 왔다며 신기해했지만, 그것도 잠시, LLM의 한계를 보게 되었습니다. 대중적으로 생각하는 AI의 목표는 자동화, 즉 인간의 작업을 대신할 수 있을지에 반해, LLM은 아직 그 부분에 도달하지 못했었습니다.
그래서 등장한 단어가 AI Agent 입니다.
AI 에이전트는 환경을 감지하고, 그 환경 내에서 자율적으로 행동하며, 특정 목표를 달성하기 위해 의사결정을 수행하는 시스템입니다. AI 에이전트와 LLM의 관계는 사람의 두뇌와 인체(팔&다리) 관계와 유사합니다. LLM은 AI 에이전트의 '두뇌' 역할을 하며, 에이전트 시스템은 이 두뇌를 활용하여 실제 환경에서 목표를 달성하기 위한 동작을 하게 됩니다.
인간의 사고를 따라하게 하자!
AI가 점점 더 복잡한 문제를 다룰 수 있게 되면서, 단순히 대답만 잘하는 AI는 한계가 명확했습니다. 이를 해결하기 위해 등장한 대표적인 기법이 바로 Reasoning+Acting(ReAct)와 Chain of Thought(CoT)입니다.
이 두 방식은 각각 (1) AI가 어떻게 생각하고 행동할 것인가, 그리고 (2) 생각을 얼마나 잘 드러낼 수 있는가에 초점을 맞추고 있습니다.
ReAct는 추론과 행동을 번갈아 동작하는 방법입니다.
현재 상황을 분석한 후, 그에 따라 어떤 행동을 할지 결정하고, 결과를 평가하는 과정을 반복하며, 문제를 해결해갑니다.
Chain of Thought는 LLM이 복잡한 추론 문제를 해결할 때 단계별로 생각하는 과정을 명시적으로 드러내는 방법입니다.
중간 추론 단계를 모두 표현함으로써 정확도를 크게 향상시킬 수 있습니다.
이 두가지는 서로 다른 관점을 보지만, 둘 다 AI에게 인간의 사고 구조를 따라하게 하는데 의미가 있습니다.
결론적으로, AI Agent가 스스로 계획하고 도구를 활용해 작업을 수행하는 기반이 됩니다.
⚒️ Tools: AI Agent의 손과 발
AI 에이전트가 진정한 자율성을 갖추기 위해서는 외부 환경과 상호작용할 수 있는 '도구'가 필요합니다.
이러한 도구들은 LLM의 능력을 단순 텍스트 생성에서 지시 가능한 두뇌로 확장시켜 줍니다. 도구의 사용 형태로는 가장 대표적인 예시가 웹 검색, 코드 실행, 파일 분석 등이 있습니다.
위에서 말한대로, AI가 인간의 사고방식을 모방해, 추론하고 생각하여 어떤 도구를 언제 사용할지 결정합니다.
이것들을 체인처럼 연결해 여러 도구를 동시에 사용할 수 있으면, 좀 더 자유롭게 손과 발을 다루게 되지 않을까요?
AI Agent 프레임워크의 등장
AI Agent가 기술적으로 가능하다 하더라도, 결국 접근성의 문제입니다. 많은 사람들이 잘 알지 못하고, 개발이 어렵거나, 사용이 어려우면, 대중화 되지 못하죠.
AI Agent라는 단어가 등장한 시점에는 Agent를 구성할수 있는 프레임워크가 없고 (있다하더라도 미비한 정도), 어떤 방식의 Agent를 구성해야 할지에 대한 로드맵이 부재했습니다.
지금은 아닙니다!
AI Agent가 급부상하면서, AI 에이전트의 개발과 배포를 용이하게 하기 위해 다양한 프레임워크가 등장했으며, 이는 에이전트 기술의 대중화에 크게 기여하고 있습니다. 대표적인 프레임워크로는 Langgraph, AutoGen, CrewAI 등이 있습니다.
- LangGraph는 LangChain 팀에서 개발한 에이전트 개발 프레임워크로, 상태를 저장 및 추적하고, 에이전트 흐름을 그래프 구조로 구성해, 복잡한 조건부 작업을 처리할 때 유리합니다.
- CrewAI는 여러 전문화된 에이전트가 협업하는 시스템을 쉽게 구축할 수 있도록 설계된 프레임워크입니다. 다양한 전문성이 필요한 복잡한 프로젝트에 적합합니다.
- AutoGen은 마이크로소프트 연구소에서 개발한 멀티에이전트 대화 프레임워크로, 여러 에이전트가 서로 대화하며 복잡한 문제를 해결하는 데 특화되어 있습니다.
MCP vs. A2A: Agent 프로토콜의 등장!
LLM의 발전과 함께, 다양한 AI 서비스가 발표되고, AI Agent가 이후 등장하며, 사람들은 통일된 규격에 대한 부재를 경험하게 되었습니다. 그러니까 AI Agent가 다양한 툴을 사용할 수 있어야 하는데, 모든 서비스가 각자의 방식대로 돌아가고 있고, 기존의 오래된 서비스 등은 더욱 AI Agent의 툴로 사용되기 어려웠습니다.
여기서 MCP(Model Context Protocol)가 등장합니다.
MCP(Model Context Protocol)는 Anthropic이 발표한 일종의 프로토콜로 AI 시스템과 말이 통하도록 정해놓은 일종의 규격을 말합니다.
As AI assistants gain mainstream adoption, the industry has invested heavily in model capabilities, achieving rapid advances in reasoning and quality. Yet even the most sophisticated models are constrained by their isolation from data—trapped behind information silos and legacy systems. Every new data source requires its own custom implementation, making truly connected systems difficult to scale.MCP addresses this challenge. It provides a universal, open standard for connecting AI systems with data sources, replacing fragmented integrations with a single protocol. The result is a simpler, more reliable way to give AI systems access to the data they need.
https://www.anthropic.com/news/model-context-protocol
이후, OpenAI가 MCP를 지원하며 MCP의 인기는 급상승했습니다.
MCP의 자세한 구조는 이글을 읽어보시면 좋을 것 같습니다: https://channel.io/ko/blog/articles/what-is-mcp-52c77e72
MCP는 AI 업계의 표준이 될까요?
AI에 수많은 앱이 연결되는 세상, 머지않았습니다
channel.io
이후, Google에서 새로운 에이전트-에이전트 프로토콜인 A2A (Agent to Agent)를 오픈소스로 공개했는데요, 그만큼 프로토콜에 대한 요구가 많았던 것 같습니다.
https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/
Announcing the Agent2Agent Protocol (A2A)- Google Developers Blog
A new era of Agent Interoperability AI agents offer a unique opportunity to help people be more productive by autonomously handling many daily recurring or complex tasks. Today, enterprises are increasingly building and deploying autonomous agents to help
developers.googleblog.com
A2A is an open protocol that complements Anthropic's Model Context Protocol (MCP), which provides helpful tools and context to agents.
MCP는 LLM 중심의 컨텍스트 관리와 외부 도구 연동에 초점을 둔 것에 반해, A2A는 에이전트 간의 직접적인 통신 및 협업을 위한 프로토콜로 설계되어, 두 프로토콜은 경쟁보다는 상호 보완적인 관계로 AI 프로토콜의 표준화에 같이가지 않을까 전망합니다.
이렇게 AI Agent의 필요한 요소들과 새롭게 등장한 기술들을 훑어보며, AI Agent가 어떻게 발전하고 있는지 알아보았습니다.
아직 AI Agent가 완전히 작업을 대체할 순 없지만, 어느정도 필요한 요소들을 갖춰가고 있지 않나 생각합니다. 읽어주셔서 감사합니다!
'IT Note > Data&AI' 카테고리의 다른 글
Kafka의 필요성: 분산 데이터 환경의 필수품 (0) | 2024.12.15 |
---|---|
국내 최초 CSAP SaaS 인증 공공솔루션 개발 네이버클라우드로 시작하기 (그런데 Redis를 곁들인..) (0) | 2024.12.14 |
Query Optimization (feat. watsonx.data) (0) | 2024.11.28 |
제 1회 2024년 당근 테크 밋업에 갔다온 후기 (0) | 2024.10.20 |
호다닥 톺아보는 데이터저장소 친구들(feat. DB,DW,DL,LH) (1) | 2024.10.08 |