모델 목록으로
アリババ독점

Qwen3.5-27B

Qwen3.5-27B는 알리바바가 개발한 추론 모델입니다. 약 2700억 파라미터 규모이며, 101만 토큰의 극도로 긴 컨텍스트 윈도우를 지원합니다.

파라미터

270.0B

컨텍스트

1010K

라이선스

https://huggingface.co/Qwen/Qwen2.5-72B/blob/main/LICENSE

출시일

2026-02-25

API 가격

이 모델의 API 가격 정보는 현재 공개되지 않았습니다

강점

  • 고급 추론 능력 제공
  • 대규모 컨텍스트 처리
  • 대규모 파라미터 구성

약점

  • 소스 코드 비공개 라이선스
  • 큰 모델 파일 크기
  • 높은 런타임 자원 요구사항

활용 사례

  • 복잡한 논리적 추론 과제
  • 초장문 문서 분석
  • 고급 지식 추출

심층 분석

Release Date

February 24, 2026

Parameters

27B

Dense model — all parameters active

Architecture

Hybrid: Gated DeltaNet + Gated Attention (dense)

Context Window

262,144 tokens (native)

Modalities

Text, Image, Video

VRAM (Q4)

~16 GB

VRAM (BF16)

~54 GB

Inference Speed

~35 tok/s on RTX 3090 at Q4

License

Apache 2.0

MMLU-Pro

86.1

강점

  • Best creative writing quality in the Qwen3.5 family — denser computation produces more consistent prose
  • Strong reasoning: GPQA Diamond 85.5, MMLU-Pro 86.1, IFEval 95.0
  • Fits on a single 24GB GPU at Q4 quantization (~16GB VRAM)
  • Dense architecture means simpler deployment — no MoE routing complexity
  • Natively multimodal with vision and video support

약점

  • Slower inference (~35 tok/s) compared to the 35B-A3B MoE model (196 tok/s)
  • Lacks the raw speed for batch processing and real-time agent workflows
  • Trails the 35B-A3B on throughput-sensitive tasks despite having more active parameters
  • Not available as an API model through major providers (primarily self-hosted)
  • Quantization at Q4 may impact quality for nuanced creative tasks

경쟁사 비교

ModelArenaSWEGPQAPrice
Qwen3.5-35B-A3B~1390~65~83Open-source
Qwen3.5-9B~1370~6081.7Open-source
Llama 4 Scout~1380~65~80Open-source
Qwen3.5-27B~1400~6885.5Open-source
Mistral Large 2~1370~64~78Open-source

Qwen3.5-27B is the only dense model in the mid-range of the Qwen3.5 family, offering 27B parameters with all of them active on every token. Released February 24, 2026 under Apache 2.0, it excels at creative writing and complex reasoning where every parameter contributes to output quality. It runs at ~35 tok/s on a single RTX 3090 at Q4, fitting comfortably in 16GB VRAM.

분석 생성일: 2026-05-24