Youri-7B
An open-source model specialized for Japanese, developed by rinna. With 7 billion parameters, it is lightweight yet has been trained optimized for Japanese language processing. It is available for commercial use under the Apache 2.0 license.
파라미터
7B
컨텍스트
8K
라이선스
Apache 2.0
출시일
2025-06-01
일본어 처리 능력
Model developed by a Japanese company or specialized for Japanese. Highest Japanese understanding and generation capability.
API 가격
이 모델의 API 가격 정보는 현재 공개되지 않았습니다
강점
- ・Commercial use allowed under Apache 2.0
- ・Top-rated domestic model in academic evaluation
- ・Lightweight and fast
- ・Active research community
약점
- ・Context length is 8K
- ・Lagging in commercial deployment
- ・Some performance aspects inferior to ELYZA
- ・No API availability
활용 사례
- ・Japanese NLP research
- ・Prototyping with lightweight models
- ・Fine-tuning intended for commercial use
- ・Education and academic use
심층 분석
Parameters
7B
70亿参数,轻量级
License
Llama 2 Community License
条件性商用许可
Open LLM Leaderboard Avg.
47.11%
基础模型平均分
Japanese LM Harness (7-Avg.)
62.71
RakutenAI论文中的比较基准
HuggingFace Downloads
83,474+
累计下载量
Base Model
Llama-2-7b-hf
基于Meta的Llama2架构
강점
- ・深度优化日语:针对日语任务进行持续预训练,日语生成和理解能力显著提升
- ・开源且轻量:7B参数,Apache 2.0许可(注:底层为Llama 2许可),易于部署和商用
- ・多版本可用:提供基础、指令跟随(Instruction)和对话(Chat)三个版本,满足不同场景需求
약점
- ・英语与推理能力相对基础:在MMLU、TruthfulQA、GSM8k等英语基准上得分较低
- ・数学推理能力弱:在GSM8k等数学基准上表现不佳(8.64%),限制其在复杂逻辑任务中的应用
- ・基于Llama2的Tokenizer:可能对日语长文本或特定字符的处理效率不如原生日语Tokenizer优化
경쟁사 비교
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| RakutenAI-7B | N/A | N/A | N/A | Free (Apache 2.0) |
| ELYZA-japanese-Llama-2-7b | N/A | N/A | N/A | Free (Llama 2 License) |
| Japanese StableLM Base Gamma 7B | N/A | N/A | N/A | Free (Stability AI License) |
Youri-7B 是由日本AI公司rinna开发并开源的7B参数大型语言模型,专注于日语任务优化。该模型基于Meta的Llama-2-7b-hf架构,通过在约400亿token的日英混合语料上进行持续预训练,显著提升了其日语文本生成、理解和指令跟随的能力。其模型名称“Youri”源自日本神话生物“妖狸”。
在定位上,Youri-7B旨在为研究人员和开发者提供一个性能强劲、易于部署的日语开源LLM基础。它并非追求在所有全球基准上与顶尖模型竞争,而是致力于在日语特定任务上达到领先水平,同时保持合理的计算资源需求。该模型的关键创新在于其高效的日语适配策略,证明了在强英文基础模型上进行定向语言持续预训练的有效性。
该模型系列已衍生出多个变体,包括针对单轮指令跟随优化的youri-7b-instruction和针对多轮对话优化的youri-7b-chat,进一步拓展了其应用场景。尽管其在通用英语推理任务上表现平平,但对于日语文本生成、日英翻译、日语内容创作等垂直领域,它提供了一个极具性价比的开源解决方案。
출처
- rinna/youri-7b · Hugging Face
- rinna/youri-7b-chat · Hugging Face
- rinna/youri-7b-instruction · Hugging Face
- RakutenAI-7B: Extending Large Language Models for Japanese (arXiv)
- 2023年10〜11月公開の日本語LLM (7B) 3種を横断比較 | yumem.io
- 【Youri 7B】日本最高峰の精度を叩き出す! | WEEL
- rinna、Metaの大規模言語モデル「Llama 2」の日本語継続事前学習モデル「Youri 7B」を公開 | ロボスタ
- rinna、日本語LLM「Youri 7B」シリーズを公開 - INTERNET Watch
분석 생성일: 2026-05-23