모델 목록으로
MistralAI오픈소스
Voxtral-Mini-3B-2507
Voxtral-Mini-3B-2507은 미스트랄AI가 개발한 음성 특화 기초 모델입니다. 30.0B의 파라미터 규모를 가지며, 최대 32K의 컨텍스트 길이를 지원합니다.
파라미터
30.0B
컨텍스트
32K
라이선스
Apache 2.0
출시일
2025-07-15
API 가격
이 모델의 API 가격 정보는 현재 공개되지 않았습니다
강점
- ・오디오 처리를 위한 특화 설계
- ・넓은 32K 컨텍스트 길이
- ・오픈소스 Apache 2.0 라이선스
약점
- ・소형 모델 대비 높은 연산 수요
- ・텍스트 전용 모델 대비 성능 격차
- ・모델 크기로 인한 상당한 메모리 소비
활용 사례
- ・고급 오디오 데이터 분석
- ・긴 오디오 클립의 맥락적 이해
- ・오픈소스 기반 음성 개발
심층 분석
Architecture
Multimodal Audio Chat (3B)
Based on Mistral Small 3.1 backbone
Context Window
32K tokens
Up to 30 min transcription
Release Date
July 15, 2025
License
Apache 2.0
Modalities
Audio + Text
Speech understanding and transcription
Languages
8+ languages
EN, FR, DE, ES, IT, PT, NL, HI
강점
- ・Open-source speech understanding model
- ・Apache 2.0 license
- ・Multilingual with automatic language detection
- ・Function calling from voice input
- ・Lightweight 3B for edge deployment
- ・Cost-effective transcription
약점
- ・32K context limits long audio processing
- ・Smaller model may miss nuances
- ・No image/video modality
경쟁사 비교
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| Voxtral Small 24B | - | - | - | Higher |
| OpenAI Whisper | - | - | - | Comparable |
| GPT-4o Audio | - | - | - | Higher |
Voxtral Mini 3B is Mistral's lightweight open-source speech understanding model. Released July 2025 under Apache 2.0, it offers transcription, Q&A, summarization, and function calling from voice at less than half the price of comparable APIs.
분석 생성일: 2026-05-24