레이블이 LLM인 게시물을 표시합니다. 모든 게시물 표시
레이블이 LLM인 게시물을 표시합니다. 모든 게시물 표시

5/10/2026

LLM 라우팅, 요청에 적합한 모델 선택하기

LLM 라우팅, 요청에 적합한 모델 선택하기
요즘 팀에서는 Token 비용에 대한 관심이 많다. '토큰 이코노미'에 대해서 대부분 비슷할꺼라 생각된다. 단일 모델(예산 범위내에서 가장 좋은 모델)로 제품을 만들고, 다른 사용 사례에도 확장하는 형태로 대부분 사용한다. 이유는 간단하...

5/09/2026

3/03/2026

데이터는 누구의 일인가?

데이터는 누구의 일인가?
전사 데이터의 ‘기반’과 서비스 데이터의 ‘제품화’ 사이에서 요즘 생각이 많습니다. 회사에서 “데이터”라는 단어는 자주 하나로 뭉개집니다. 전사 데이터도 데이터고, 서비스 로그도 데이터고, 추천 점수도 데이터입니다. 하지만 같은 단어...

1/12/2026

RAG의 환각에 대한 대응

RAG의 환각에 대한 대응
현 거대 언어 모델(LLM)은 지난 몇 년간 급격한 성장을 이루었습니다. 단순히 AI 모델을 사용하는 것을 넘어, 자사의 방대한 내부 데이터를 LLM에 연동하여 실질적인 비즈니스 가치를 창출하고자 하는 요구에 직면해 있습니다. 이런 배경에는 RAG(R...

12/30/2025

가독성의 은밀한 비용, 코드 포맷팅이 LLM 예산을 어떻게 소모하는가?

가독성의 은밀한 비용, 코드 포맷팅이 LLM 예산을 어떻게 소모하는가?
아카이브( arXiv.org )에서 흥미로운 논문 을 읽었고 내용을 정리해봅니다. 소프트웨어 엔지니어링 역사에서 “가독성”은 성역과도 같은 가치였습니다. 코드는 컴퓨터가 실행하기 위해 작성되지만, 인간이 읽기 위해서도 작성된다는 이야기가 많았지요. 그...

12/24/2025

WeKnora v0.2.0 런칭

WeKnora v0.2.0 런칭
얼마전 Tencent에서 WeKnora v0.2.0을 런칭했습니다. 그런데 최근의 움직임과 약간 다른 느낌이 들었습니다. 최근 구글의 Gemini나 OpenAI의 모델들이 100만 토큰 이상의 방대한 컨텍스트를 한 번에 처리하기 시작하면서, 이제 RA...

11/29/2025

AI가 읽는 제품과 서비스를 설계

AI가 읽는 제품과 서비스를 설계
지난 30년 동안 웹의 역사는 인간을 위한 설계, 즉 “사용자 경험(UX)”의 역사였습니다. 1990년대의 투박한 텍스트 기반 인터페이스에서 매끄러운 모바일 터치 인터페이스에 이르기까지, 기술적 진보의 중심은 “인간의 눈과 손”이었습니다. 그러나 20...

11/28/2025

AI가 읽기 쉬운 Web을 위한 llms.txt

AI가 읽기 쉬운 Web을 위한 llms.txt
우리는 매일 웹사이트에 접속합니다. 화려한 디자인, 편리한 메뉴 구성, 광고 배너들이 우리를 반깁니다. 하지만 이 모든 시각적 요소들은 AI에게는 그저 소음에 불과하다는 사실을 알고 계셨나요? ChatGPT, Claude, Gemini와 같은 대규모 ...