모델 목록으로
MistralAI오픈소스

Voxtral-Small-24B-2507

Voxtral-Small-24B-2507은 미스트랄AI가 개발한 음성 특화 기초 모델입니다. 약 240B의 파라미터 규모를 가지며, 32K의 컨텍스트 윈도우를 지원합니다.

파라미터

240.0B

컨텍스트

32K

라이선스

Apache 2.0

출시일

2025-07-15

API 가격

이 모델의 API 가격 정보는 현재 공개되지 않았습니다

강점

  • 대규모 파라미터 수
  • 오디오 처리 특화
  • 오픈소스 Apache 2.0 라이선스

약점

  • 매우 큰 모델 파일 크기
  • 상당한 연산 자원 요구
  • 중간 규모의 컨텍스트 길이

활용 사례

  • 고급 음성 인식
  • 오디오 데이터 분석
  • 음성 기반 AI 시스템 구축

심층 분석

Architecture

Multimodal Audio Chat (24B)

Based on Mistral Small 24B backbone

Context Window

32K tokens

Up to 40 min for understanding

Release Date

July 15, 2025

License

Apache 2.0

Modalities

Audio + Text

Speech understanding and transcription

Languages

8+ languages

Multilingual with auto-detection

강점

  • Production-scale speech understanding
  • Apache 2.0 open-source
  • 40 min audio understanding capability
  • Function calling from voice
  • Native multilingual support
  • Retains text understanding of Mistral Small 3.1

약점

  • Larger model requires more compute
  • 32K context window
  • No vision modality

경쟁사 비교

ModelArenaSWEGPQAPrice
Voxtral Mini 3B---Lower
GPT-4o Audio---Higher
Google Gemini Audio---Comparable

Voxtral Small 24B is Mistral's production-scale open-source speech understanding model. Released July 2025 under Apache 2.0, it handles up to 40 minutes of audio for understanding tasks with built-in Q&A, summarization, and function calling from voice.

분석 생성일: 2026-05-24