모델 목록으로
Zhipu AI오픈소스

GLM-ASR-Nano-2512

GLM-ASR-Nano-2512는 Zhipu AI가 개발한 음성 대형 모델입니다. 약 20.0B 파라미터를 가지며 Apache 2.0 라이선스 하에 출시됩니다.

파라미터

20.0B

컨텍스트

라이선스

Apache 2.0

출시일

2025-12-10

API 가격

이 모델의 API 가격 정보는 현재 공개되지 않았습니다

강점

  • 20.0B의 충분한 파라미터 규모
  • Apache 2.0 라이선스 하의 공개된 사용
  • 효율적인 모델 파일 크기

약점

  • 특화 기능에 대한 세부사항 미확인
  • 구체적인 운영 비용 지표 부재
  • 다국어 지원 범위에 대한 정보 없음

활용 사례

  • 고급 음성 인식 시스템 구축
  • 오디오 데이터의 텍스트 변환 처리
  • 오픈소스 오디오 AI 개발

심층 분석

Model Type

Automatic Speech Recognition (ASR)

Parameters

1.5B

Average Error Rate

4.10 (lowest among comparable models)

Languages

17 (WER ≤ 20%)

License

Apache 2.0

GitHub Stars

806

강점

  • Open-source with Apache 2.0 license
  • Compact 1.5B parameter model suitable for edge deployment
  • Outperforms Whisper V3 on Chinese benchmarks
  • Exceptional Cantonese and dialect recognition
  • Low-volume speech robustness for quiet environments

약점

  • 1.5B parameters still require significant compute for edge devices
  • Primarily optimized for Chinese language family
  • English performance may lag behind specialized English models
  • Requires transformers 5.0.0 from source for best results
  • Model weight format changed after December 27, 2025

경쟁사 비교

ModelArenaSWEGPQAPrice
OpenAI Whisper V3 LargeN/AN/AN/AOpen source
Whisper V3 SmallN/AN/AN/AOpen source
Moonshine ASRN/AN/AN/AOpen source
NVIDIA Canary 1BN/AN/AN/AOpen source

GLM-ASR-Nano-2512 is Zhipu AI's open-source speech recognition model with 1.5B parameters, achieving the lowest average error rate (4.10) among comparable open-source models. Released under Apache 2.0, it excels at Chinese, English, and Cantonese recognition with unique low-volume speech robustness. Available on Hugging Face and ModelScope.

분석 생성일: 2026-05-24