モデル一覧に戻る
MistralAIオープンソース

Voxtral-Mini-3B-2507

Voxtral-Mini-3B-2507は、MistralAIによって開発された音声特化の基盤モデルです。30.0Bのパラメータ規模を持ち、最大32Kのコンテキスト長に対応しています。

パラメータ

30.0B

コンテキスト長

32K

ライセンス

Apache 2.0

リリース日

2025-07-15

API料金

このモデルのAPI料金情報は現在未公開です

強み

  • 音声処理に特化した設計
  • 32Kの広いコンテキスト長
  • Apache 2.0のオープンライセンス

弱み

  • 小規模モデル比で高い計算資源が必要
  • テキスト特化モデルとの性能差
  • モデルサイズによるメモリ消費

活用例

  • 高度な音声データの解析
  • 長文音声のコンテキスト理解
  • オープンソースベースの音声開発

深度分析

モデル: voxtral-mini-3b-2507 分野: ラベル 翻訳するテキスト: アーキテクチャ

Multimodal Audio Chat (3B)

Based on Mistral Small 3.1 backbone

モデル: voxtral-mini-3b-2507 フィールド: label 翻訳するテキスト: コンテキストウィンドウ

32K tokens

Up to 30 min transcription

モデル: voxtral-mini-3b-2507 フィールド: ラベル 翻訳するテキスト: リリース日

July 15, 2025

モデル: voxtral-mini-3b-2507 分野: ラベル 翻訳するテキスト: ライセンス

Apache 2.0

**Modalities**

Audio + Text

Speech understanding and transcription

モデル: voxtral-mini-3b-2507 分野: ラベル 翻訳するテキスト: 言語

8+ languages

EN, FR, DE, ES, IT, PT, NL, HI

強み

  • オープンソースの音声理解モデル
  • Apache 2.0ライセンス
  • 自動言語検出対応の多言語モデル
  • 音声入力からの関数呼び出し
  • エッジ展開向けの軽量3Bモデル
  • コスト効率の良い文字起こし

弱み

  • 32Kコンテキスト制限による長時間音声処理
  • 小型モデルのためニュアンスを見逃す可能性あり
  • 画像/動画モダリティなし

競合比較

ModelArenaSWEGPQAPrice
Voxtral Small 24B---Higher
OpenAI Whisper---Comparable
GPT-4o Audio---Higher

Model: voxtral-mini-3b-2507 Field: summary

Voxtral Mini 3Bは、Mistral社による軽量なオープンソース音声理解モデルです。2025年7月にApache 2.0ライセンスで公開され、音声からの文字起こし、質疑応答、要約、関数呼び出しを、同等のAPIの半額以下で提供します。

分析生成日: 2026-05-30