오늘 Mistral에서 4가지 새로운 모델을 출시했습니다. "Ministral" 소형 모델 시리즈(14B, 8B, 3B) 3가지와 매개변수 675B, 유효 매개변수 41B를 갖춘 Mistral Large 3 모델입니다.
위에서 언급한 모든 모델은 Vision이 가능하고, 라이센스는 Apache 2.0 입니다.
특히 3B 모델은 약 3GB 정도의 작은 파일에 담긴 Vision 기능을 갖추고 있습니다. (이거에 기대가 커요)
https://huggingface.co/spaces/mistralai/Ministral_3B_WebGPU 에서 브라우저로 테스트 해볼 수 있습니다. WebGPU를 통해 실행할 수 있을 정도입니다.
위 데모는 3GB 모델을 가져온 후, 웹캠 영상을 스트리밍하여 모델이 보고 있는 영상에 대해 텍스트 프롬프트를 실행할 수 있습니다.
꽤 괜찮네요 :)