5/10/2026

LLM 라우팅, 요청에 적합한 모델 선택하기

LLM 라우팅, 요청에 적합한 모델 선택하기
요즘 팀에서는 Token 비용에 대한 관심이 많다. '토큰 이코노미'에 대해서 대부분 비슷할꺼라 생각된다. 단일 모델(예산 범위내에서 가장 좋은 모델)로 제품을 만들고, 다른 사용 사례에도 확장하는 형태로 대부분 사용한다. 이유는 간단하...

5/09/2026

5/07/2026

4/21/2026

4/20/2026

우리는 왜 Agent를 이야기 하고 있는가?

우리는 왜 Agent를 이야기 하고 있는가?
요즘 AI Agent에 대한 이야기가 많다. 툴을 붙이고 모델이 판단하고 다음 행동을 고르고 필요하면 다시 도구를 호출한다. 마치 소프트웨어가 스스로 다음 단계를 정하는 것처럼 보인다. 이 변화는 생각보다 낯설지 않다. 오히려 오래된 소...

4/11/2026

4/10/2026