모델 목록으로
Zhipu AI독점

GLM-ASR-2512

GLM-ASR-2512는 Zhipu AI가 개발한 음성 대형 모델입니다. 고급 음성 처리 기능을 갖춘 비공개 소스 모델로 제공됩니다.

파라미터

Undisclosed

컨텍스트

라이선스

Proprietary

출시일

2025-12-10

API 가격

이 모델의 API 가격 정보는 현재 공개되지 않았습니다

강점

  • 최첨단 오디오 처리 기능
  • Zhipu AI의 고급 설계
  • 최신 모델 아키텍처

약점

  • 비오픈소스 라이선스
  • 불투명한 내부 구조
  • 가능한 사용 제한

활용 사례

  • 고급 음성 인식 과제
  • 오디오 데이터의 분석 및 처리
  • 차세대 오디오 AI 개발

심층 분석

Model Type

Automatic Speech Recognition (ASR)

Parameters

1.5B (Nano variant)

CER

0.0717 (industry-leading)

Languages

17 (WER ≤ 20%)

Audio Duration Limit

≤ 30 seconds

File Size Limit

≤ 25 MB

강점

  • Industry-leading CER of 0.0717
  • Exceptional dialect support including Cantonese
  • Low-volume speech robustness (whisper/quiet speech)
  • Outperforms OpenAI Whisper V3 on multiple benchmarks
  • Efficient custom dictionary for specialized terminology

약점

  • 30-second audio duration limit per request
  • 25 MB file size limit
  • Primarily optimized for Chinese/English markets
  • Closed-source API (Nano variant is open-source)
  • May require multiple requests for long audio files

경쟁사 비교

ModelArenaSWEGPQAPrice
OpenAI Whisper V3 LargeN/AN/AN/A$0.006/min
Google Cloud Speech-to-Text V2N/AN/AN/A$0.016/min
Azure Speech to TextN/AN/AN/A$1/hour
AssemblyAI Universal-2N/AN/AN/A$0.015/min

GLM-ASR-2512 is Zhipu AI's next-generation speech recognition model achieving a character error rate of 0.0717, reaching internationally leading standards. It excels at Chinese, English, and Cantonese recognition with robust performance in noisy environments and low-volume speech scenarios. The API version supports real-time transcription for meetings, customer service, and document input.

분석 생성일: 2026-05-24