AI Agent 101 : AI Agent란 무엇인가?

티스토리 뷰

AI·LLM

AI Agent 101 : AI Agent란 무엇인가?

최영선 2026. 5. 15. 21:55

많은 팀이 LLM을 처음 도입할 때 가장 먼저 보는 장면은 채팅창입니다. 질문을 넣으면 대답이 나오고, 말투도 그럴듯하며, 요약과 설명도 빠르게 해냅니다. 여기까지만 보면 LLM은 결국 "똑똑한 답변 엔진"처럼 보입니다.

문제는 실제 업무를 맡기는 순간 시작됩니다. 고객 문의를 분류하고, 검색 결과를 모으고, 필요한 API를 호출하고, 실패 시 다시 시도하고, 마지막으로 작업 결과를 정리해 반환하려면 텍스트 생성만으로는 부족합니다. 시스템은 외부 도구를 호출하고, 중간 결과를 읽고, 다음 행동을 결정해야 합니다.

그래서 현업에서는 chatbot과 agent를 같은 범주로 두지 않습니다. 둘 다 LLM을 쓰더라도 운영 관점에서 보는 추상화 수준이 다르기 때문입니다. chatbot은 응답 품질이 중심이고, agent는 목표 달성 과정 전체가 중심입니다.

이 글은 AI Agent 101 시리즈의 첫 번째 글입니다.

이 글에서는 AI Agent를 "말을 잘하는 모델"이 아니라 "목표를 받고 작업 루프를 실행하는 시스템"으로 이해해 보겠습니다.

이 글에서 다룰 문제

chatbot과 agent를 가르는 가장 실용적인 기준은 무엇일까요?
tool use가 없는 시스템도 agent라고 부를 수 있을까요?
Observe → Think → Act → Check 루프는 왜 거의 모든 agent 설계의 출발점일까요?
어떤 업무는 agent가 필요하고, 어떤 업무는 chatbot이나 RAG로 충분할까요?
agent를 처음 설계할 때 가장 먼저 그려야 할 위험은 무엇일까요?

왜 이 글이 중요한가

AI Agent라는 표현은 이미 너무 넓게 쓰이고 있습니다. 어떤 문맥에서는 단순한 function calling 래퍼도 agent라고 부르고, 어떤 문맥에서는 장기 메모리와 멀티 에이전트 협업까지 들어가야 agent라고 부릅니다. 용어 경계가 흐리면 설계 경계도 같이 흐려집니다.

이 혼선은 제품 설계에서 바로 비용으로 이어집니다. 외부 행동이 필요 없는 작업에 agent 루프를 붙이면 지연 시간과 토큰 비용만 커지고, 반대로 실제로는 다단계 실행이 필요한 업무를 단일 응답 모델로 처리하면 실패를 설명하거나 복구하기 어려워집니다. 즉, agent를 정확히 정의하는 일은 철학이 아니라 아키텍처 결정입니다.

무엇보다 이후 시리즈 전체를 읽기 위한 공통 멘탈 모델이 여기서 정해집니다. context engineering, tool use, workflow, memory, evaluation, operations 모두 결국 "goal을 받고 루프를 어떻게 안전하게 돌릴 것인가"라는 한 문장 위에 쌓입니다.

AI Agent를 이해하는 가장 좋은 방법: 목표를 받은 작업 루프로 보는 것입니다

AI Agent를 가장 안정적으로 이해하는 방법은 agent를 하나의 앱 기능이 아니라 작업 루프를 가진 실행 시스템으로 보는 것입니다. 입력이 단순 메시지인지, 목표인지부터 구분해 보면 차이가 선명해집니다. chatbot은 대체로 한 턴 응답에서 끝나지만, agent는 목표를 달성할 때까지 관찰하고 결정하고 실행하고 점검합니다.

이 관점이 중요한 이유는 agent의 실패 모드도 여기서 나오기 때문입니다. 잘못된 도구를 고를 수 있고, 같은 도구를 반복 호출할 수 있고, 중간 결과를 잘못 해석할 수 있고, 이미 실패한 계획을 끝까지 밀어붙일 수 있습니다. 즉, agent는 정답 생성 문제이면서 동시에 제어 흐름 문제입니다.

실무에서는 이 구조를 먼저 받아들인 팀이 더 빨리 안정화합니다. 답변 품질만이 아니라 step 수, tool 선택, retry, stop 조건, state 누수까지 함께 설계하기 때문입니다.

Agent의 핵심은 "LLM이 똑똑한가"보다 "목표를 향해 관찰·판단·행동·검증을 반복하는 제어 루프를 안전하게 만들었는가"에 있습니다.

핵심 개념

Chatbot과 Agent를 먼저 분리해야 합니다

구분	Chatbot	Agent
입력	사용자 메시지	목표(goal)
출력	텍스트 응답	작업 완료 또는 산출물
외부 상호작용	거의 없음	tool 호출, file/API 접근
반복	보통 1턴	목표 달성까지 N턴
상태	대화 기록	작업 상태 + memory

기술적으로 agent도 내부에서는 LLM 호출입니다. 하지만 시스템 설계에서는 차이가 큽니다. 사람이 읽고 끝나는 텍스트를 만들면 chatbot에 가깝고, 시스템이 그 출력을 받아 다음 행동을 실행하면 agent에 가까워집니다. 이 차이를 분리해 두면 어떤 기능에 human-in-the-loop가 필요한지도 훨씬 빨리 판단할 수 있습니다.

거의 모든 agent는 같은 루프를 반복합니다

아래 루프는 단순해 보이지만, 실제 agent framework 대부분이 이 구조의 변형입니다.

goal: "Tell me whether I need an umbrella in Tokyo today"

[loop 1]
  observe: known info = (only the goal)
  think:   "I need today's weather; call the weather API"
  act:     get_weather(city="Tokyo")
  check:   result = {temp: 18, condition: "rain"}

[loop 2]
  observe: rain is forecast
  think:   "Rain means yes, an umbrella is needed"
  act:     final_answer("Yes, rain is forecast in Tokyo today")
  check:   goal achieved → stop

Observe → Think → Act → Check 루프를 머리에 넣어 두면 ReAct, workflow graph, tool loop, checkpoint 같은 용어가 모두 같은 그림 위에 놓입니다. 또한 디버깅할 때도 어느 단계가 무너졌는지 나눠서 볼 수 있습니다. 도구 호출이 틀렸는지, 생각 단계가 틀렸는지, 체크 단계가 빠졌는지 구분할 수 있어야 운영이 됩니다.

tool use가 붙는 순간 시스템 성격이 바뀝니다

response = llm.chat("What's the weather in Tokyo?")
# → "I'm sorry, I don't have access to real-time information."

goal = "Tell me whether I need an umbrella in Tokyo today"
agent = Agent(tools=[get_weather], llm=llm)
result = agent.run(goal)
# → "Yes, rain is forecast in Tokyo today (18°C, rain)"

차이를 만드는 핵심은 tools=[get_weather]입니다. 도구가 등록되는 순간 모델은 단순 답변 엔진이 아니라 외부 시스템을 경유할 수 있는 제어기 역할을 맡게 됩니다. 그래서 agent 설계에서는 model choice 못지않게 tool contract가 중요합니다. 어떤 도구가 있고, 어떤 입력을 받고, 어떤 실패를 반환하는지가 agent 품질을 좌우합니다.

손으로 한 번 흉내 내보면 구조가 명확해집니다

def get_weather(city: str) -> dict:
    # In production this calls a real API. Mock here.
    fake = {"Tokyo": {"temp": 18, "condition": "rain"},
            "Seoul": {"temp": 22, "condition": "clear"}}
    return fake.get(city, {"error": "unknown city"})

goal = "Tell me whether I need an umbrella in Tokyo today"

# observe
context = {"goal": goal, "history": []}

# think (you decide)
next_action = ("get_weather", {"city": "Tokyo"})

# act
result = get_weather(**next_action[1])
context["history"].append((next_action, result))

# check
print(context)
# {'goal': '...', 'history': [(('get_weather', {'city': 'Tokyo'}),
#                              {'temp': 18, 'condition': 'rain'})]}

이 연습이 좋은 이유는 framework가 본질을 가리기 전에 구조를 먼저 보게 해주기 때문입니다. 결국 모든 agent는 현재 컨텍스트를 보고 다음 행동을 정하고, 그 행동의 결과를 다시 컨텍스트에 넣는 시스템입니다. 프레임워크는 이 반복을 편하게 만들 뿐, 구조 자체를 바꾸지는 않습니다.

흔히 헷갈리는 지점

"답변을 잘하면 agent다"라고 생각하기 쉽지만, 실제 기준은 외부 행동과 반복 실행입니다.
tool이 없는 시스템도 넓게는 agent라고 부를 수 있지만, 실무에서는 tool use가 없는 경우 운영상 이점이 크게 줄어듭니다.
더 강한 모델이면 agent가 필요 없다고 생각하기 쉽지만, 실시간 정보와 외부 action은 모델 크기로 해결되지 않습니다.
모든 자동화 문제에 agent를 붙이면 좋아질 것 같지만, 외부 행동이 없으면 chatbot이나 RAG가 더 단순하고 안정적입니다.
최종 답변만 맞으면 된다고 보기 쉽지만, production에서는 경로와 비용과 재시도 횟수도 평가 대상입니다.

운영 체크리스트

이 기능이 정말 외부 action을 필요로 하는지 먼저 분리했는가
Observe → Think → Act → Check 루프를 글이나 다이어그램으로 설명할 수 있는가
최대 step 수와 종료 조건을 설계했는가
tool 실패와 잘못된 중간 판단을 분리해서 기록할 수 있는가
chatbot, RAG, agent 중 어떤 추상화가 맞는지 비용 기준까지 포함해 판단했는가

정리

AI Agent는 단순히 말을 잘하는 모델이 아닙니다. 목표를 받고, 필요한 외부 도구를 호출하고, 중간 결과를 바탕으로 다음 행동을 정하며, 검증까지 포함한 루프를 반복하는 시스템입니다. 이 정의를 먼저 분명히 해야 이후 설계 선택이 흔들리지 않습니다.

현업에서는 "agent를 쓴다"는 말보다 "어떤 업무를 어떤 루프로 자동화한다"는 표현이 더 유용합니다. 그래야 stop condition, tool contract, retry, memory, evaluation을 같은 그림 안에서 설계할 수 있습니다. 결국 agent 설계는 모델 프롬프트만의 문제가 아니라 제어 흐름과 운영 경계의 문제입니다.

이 글의 목적은 화려한 예제를 보여 주는 데 있지 않습니다. 시리즈 전체를 읽는 동안 계속 재사용할 기준선을 만드는 데 있습니다. 다음 글부터는 이 기준선 위에서 context engineering, tool use, workflow, memory를 하나씩 더 구체적으로 쌓아 올리겠습니다.

시리즈 목차

AI Agent란 무엇인가? (현재 글)
컨텍스트 엔지니어링 (예정)
Tool Use 기초 (예정)
Agent Workflow 설계 (예정)
Memory와 State (예정)
Multi-Agent 시스템 (예정)
Agent 평가 (예정)
에러 처리와 안정성 (예정)
운영 (예정)
첫 Agent 만들기 (예정)

참고 자료

공식 문서

'AI·LLM' 카테고리의 다른 글

AI Agent 101 : Tool Use 기초 (0)	2026.05.16
AI Agent 101 : 컨텍스트 엔지니어링 (0)	2026.05.16
RAG 벤치마크 완성 (8)	2026.05.14
종단 간 RAG 파이프라인 평가 (0)	2026.05.14
VectorDB 선택 기준 (0)	2026.05.14

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2026/05 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

글 보관함

최영선의 블로그

티스토리 뷰