모델 목록으로
Zhipu AI독점
GLM-ASR-2512
GLM-ASR-2512는 Zhipu AI가 개발한 음성 대형 모델입니다. 고급 음성 처리 기능을 갖춘 비공개 소스 모델로 제공됩니다.
파라미터
Undisclosed
컨텍스트
라이선스
Proprietary
출시일
2025-12-10
API 가격
이 모델의 API 가격 정보는 현재 공개되지 않았습니다
강점
- ・최첨단 오디오 처리 기능
- ・Zhipu AI의 고급 설계
- ・최신 모델 아키텍처
약점
- ・비오픈소스 라이선스
- ・불투명한 내부 구조
- ・가능한 사용 제한
활용 사례
- ・고급 음성 인식 과제
- ・오디오 데이터의 분석 및 처리
- ・차세대 오디오 AI 개발
심층 분석
Model Type
Automatic Speech Recognition (ASR)
Parameters
1.5B (Nano variant)
CER
0.0717 (industry-leading)
Languages
17 (WER ≤ 20%)
Audio Duration Limit
≤ 30 seconds
File Size Limit
≤ 25 MB
강점
- ・Industry-leading CER of 0.0717
- ・Exceptional dialect support including Cantonese
- ・Low-volume speech robustness (whisper/quiet speech)
- ・Outperforms OpenAI Whisper V3 on multiple benchmarks
- ・Efficient custom dictionary for specialized terminology
약점
- ・30-second audio duration limit per request
- ・25 MB file size limit
- ・Primarily optimized for Chinese/English markets
- ・Closed-source API (Nano variant is open-source)
- ・May require multiple requests for long audio files
경쟁사 비교
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| OpenAI Whisper V3 Large | N/A | N/A | N/A | $0.006/min |
| Google Cloud Speech-to-Text V2 | N/A | N/A | N/A | $0.016/min |
| Azure Speech to Text | N/A | N/A | N/A | $1/hour |
| AssemblyAI Universal-2 | N/A | N/A | N/A | $0.015/min |
GLM-ASR-2512 is Zhipu AI's next-generation speech recognition model achieving a character error rate of 0.0717, reaching internationally leading standards. It excels at Chinese, English, and Cantonese recognition with robust performance in noisy environments and low-volume speech scenarios. The API version supports real-time transcription for meetings, customer service, and document input.
출처
분석 생성일: 2026-05-24