11/27/2025

AI Model과 Agent



예전만 해도 우리는 AI에게 이렇게 말했습니다.

“파리 가는 비행기 표 좀 찾아줘.”

그러면 AI는 친절하게 대답했죠.

“여기 시간표 입니다. 예매는 링크를 눌러서 직접 하세요.”

하지만 위 대화는 완전히 변경되었습니다. OpenAI가 결제 기업 스트라이프(Stripe)와 “인스턴트 체크아웃” 기능을 도입했기 때문입니다. (아직은 지역적 한계가 있음) 이제 사용자가 “이 티켓 예매해줘”라고 말하면, ChatGPT는 등록된 카드로 실제 결제를 진행합니다.

이 현상은 “순수 모델(Model)”의 시대가 저물고, 행동하는 “에이전트(Agent)”의 시대가 본격적으로 열린 것입니다.

본 글에서는 단순히 기술의 변화를 언급하는 것보다, 어떤 원리로 AI가 내 지갑을 열 수 있게 된것인지, 이 변화가 우리에게 어떤 영향을 줄 것인지 살펴 보도록 하겠습니다.


모델 중심(Model-centric): “뇌(Brain)만 있는 천재의 한계”

우리가 흔히 알고 있는 초기의 ChatGPT는 Model-centric의 산물입니다. “유리병 속에 든 뇌” 였죠.

모델은 인터넷의 모든 텍스트를 읽고 학습했습니다. 그래서 아는 것이 엄청나게 많습니다. 변호사 시험도 보고, 의사 면허 시험도 봅니다. 그러나 모델에게는 치명적인 결함이 있었습니다.

  1. 손발이 없다: 인터넷 뱅킹 앱을 켤 손가락이 없습니다.
  2. 신분증이 없다: 결제를 하려면 로그인을 해야 하는데, AI 모델 자체는 “계정”이나 “카드 정보”를 가질 수 없었습니다.
  3. 책임감이 없다: 모델은 다음 단어를 확률적으로 뱉어낼 뿐, “비행기 표를 예매했다.”고 말해놓고 실제 예약을 안해도 죄책감을 느끼지 않습니다.

그래서 AI는 말만 청산 유수인 심부름은 못 시키는 답답한 천재 였습니다.


에이전트 중심(Agent-centric): “뇌(Brain)에게 손과 발을 달아주다”

올해, 빅테크 기업들은 방향을 틀었습니다. “더 똑똑한 뇌를 만드는 건 이제 가성비가 안나온다. 대신 뇌에게 손발을 달아주자” 이것이 바로 Agent-centric의 핵심 철학 입니다.

OpenAI는 “에이전틱 커머스 프로토콜”을 발표했습니다. 쉽게 말해서 AI에게 안전하게 신용카드를 쥐어주는 기술입니다. 사용자가 미리 결제 시스템에 카드를 등록해두면, AI는 카드 번호를 몰라도 “결제 토큰”이라는 암호만 던져서 결제를 승인 받습니다.

2024년 엔트로픽은 더 과격한 방식을 택했습니다. AI(Claude)에게 아예 모니터 화면을 보여주고 마우스와 키보드 권한을 줬습니다.

“이 엑셀 파일 열어서, A열에 있는 사람들한테 이메일 보내줘”라고 시키면, AI가 실제로 마우스 커서를 움직여 엑셀을 켜고, 복사/붙여넣기를 하며 이메일을 보냅니다. API가 없는 구형 소프트웨어까지 AI가 조작할 수 있게 된 사건입니다.


에이전트는 어떻게 결제 하는가?

위에서 언급한 내용을 보면 “AI가 돈을 쓴다니 무섭다.”고 생각할 수 있습니다. 그러나 그 내부를 들여다보면 마법이 아니라 매커니즘이 작동합니다.

예를 들어 “스타벅스에서 아이스 아메리카노 주문해줘”

1. 의도파악 - 뇌의 역할

  • 생각: “사용자가 커피를 원한다. 이건 대화로 해결할게 아니라 주문 행동이 필요해.”
  • 판단: Order_Coffee라는 도구를 써야겠군

2. 파라미터 추출 - 뇌의 역할

  • 생각: “메뉴는 아이스 아메리카노, 매장은 사용자의 현재 위치 근처인 강남점, 사이즈는 기존으로 설정하자.”

3. 도구 호출 - 손의 역할

  • 여기서 AI는 텍스트를 응답하는게 아니라 코드(함수)를 호출합니다.
  • run_function: Startbucks_Order(item=”Ice Americano”, store=”Gangnam”, payment_token=”.....”)

4. 인간 승인 - 안전 장치

  • 화면에 팝업이 뜹니다.
  • 시스템: “강남점에 아메리카노 5000원 결제할까요? [승인/거절]
  • 사용자: [승인] 클릭

5. 실행 및 결과 보고

  • 시스템이 실제 스타벅스 서버로 주문을 넣고 “주문 번호”를 받아옵니다.
  • AI: “주문 완료했습니다. 번호는 A-55입니다.”

즉, AI 모델 자체가 돈을 만드는게 아니라, AI가 “결제 앱”을 리모컨처럼 조종하는 것입니다. 이것이 바로 에이전트의 본질입니다.


에이전트를 천재처럼 만드는 법

앤드류 응(Andrew Ng)은 “2025년 AI 경쟁력은 모델의 IQ가 아니라, 일하는 방식(Workflow)에 있다”고 얘기했습니다. 멍청한 모델도 다음과 같은 패턴으로 일하면 천재처럼 성과를 낼 수 있다는 의미입니다.


성찰: “나 실수 안 했나?”

AI가 코드를 짰는데 에러가 발생한 상황에 대해 과거 모델은 그냥 멈추거나 틀린 코드를 주는데, 에이전트는 “어? 에러 메시지가 떴네? 3번째 줄 문법이 틀렸구나, 다시 고쳐서 실행해보자.” (스스로 수정 후 성공)


도구 사용: “모르면 찾아봐”

“오늘 삼성전자 주가 어때?”라는 질문에 에이전트는 뇌피셜로 말하지 않습니다. 실시간 주식 API를 호출해서 현재 얼마인지 팩트를 말합니다.


계획

“이번 주말 부산 여행 코스 짜고 예약해줘”라는 질문에 에이전트는 아래처럼 행동합니다.

  1. KTX 시간표 조회
  2. 호텔 검색 (사용자 취향 반영)
  3. 맛집 리스트업
  4. 사용자 컨펌 후 일괄 결제

멀티 에이전트: “팀으로 일하라”

복잡한 소프트웨어 개발을 할때, 에이전트로 팀을 구성합니다.

  • 기획자 AI: 요구사항 정리
  • 개발자 AI: 코드 작성
  • 테스터 AI: 코드 실행 및 버그 찾기 (개발자 AI를 혼냄)

이들이 서로 대화하며 밤새 프로그램을 완성해 놓습니다.


검색의 종말과 대행의 시작

이 기술의 변화는 우리 삶과 경제에 어떤 충격을 줄까요?


광고 시장의 붕괴와 재편

검색의 시대가 끝날 수 있다고 생각될 수 있습니다.

과거에는 “제주도 호첼” 검색 -> 블로그 10개 읽으면서 광고 봄 -> 비교 후 예약 (1시간 소모)

미래에는 “제주도 호텔 괜찮은 곳 예약해줘”(1-3분 소모) 라고 말해서 예약이 되면, 검색 광고 모델이 수익원인 서비스들은 큰 위기를 맞습니다. 그리고 예약 서비스를 제공하는 곳은 AI의 추천 목록 1순위에 들어가는 것이 기업의 생존 과제가 될 수 있습니다.


SaaS

지금까지는 엑셀을 돈 내고 사서, 사용법을 우리가 공부해야 했습니다. 앞으로는 “재무제표 정리해주는 AI” 자체를 구독할 수 있습니다. 소프트웨어의 기능이 아니라, 그 소프트웨어가 만들어내는 결과를 사는 시대로 바뀔 수 있습니다.


우리가 경계해야 할 것들

모든 기술에는 그림자가 있습니다. 즉, “결제하는 AI”는 새로운 위험을 만들 수 있습니다.

에이전트가 오작동을 일으켜, “생수를 주문해줘”라는 명령에 무한 루프가 걸려 물을 1000개를 주문한다면? 그래서 중요한 순간에 반드시 인간 개입(Takeover) 모드를 발동시킵니다. “결제하시겠습니까?” 라는 최종 결정은 인간에게 넘기는 것이죠.

또한, AI 내 카드로 해킹 사이트에서 결제하면 누구 책임일까요?

  • AI 개발사?
  • 결제 모듈사?
  • 행위를 한 사용자?

이제 AI는 결제도 하고, 화면도 보고, 마우스도 움직입니다. 이것은 “에이전트 혁명”입니다. 과거의 AI가 말을 잘하는 비서였다면, 지금의 AI는 일 잘하는 파트너입니다. 이제 우리는 작업자의 마인드에서 벗어나야 합니다. 에이전트에게 명확한 목표를 주고, 결과물을 검토하고 승인하는 관리자의 역량이 중요해졌다고 생각됩니다.

Share:

잠깐, 글이 유익했나요?

Donate!

0 Comments:

댓글 쓰기