Youri-7B
rinnaが開発した日本語特化型オープンソースモデル。70億パラメータで軽量ながら、日本語処理に最適化された学習が施されている。Apache 2.0ライセンスで商用利用が可能。
パラメータ
7B
コンテキスト長
8K
ライセンス
Apache 2.0
リリース日
2025-06-01
日本語性能
日本企業が開発したモデルまたは日本語に特化したモデル。日本語の理解・生成能力が最も高い。
API料金
このモデルのAPI料金情報は現在未公開です
強み
- ・Apache 2.0で商用利用可能
- ・学術的評価が最も高い国産モデル
- ・軽量で高速
- ・研究コミュニティが活発
弱み
- ・コンテキスト長が8K
- ・商用展開が遅れている
- ・性能面でELYZAに及ばない部分がある
- ・API提供がない
活用例
- ・日本語NLP研究
- ・軽量モデルでのプロトタイピング
- ・商用利用を想定したファインチューニング
- ・教育・学術用途
深度分析
パラメータ
7B
70亿参数,轻量级
License
Llama 2 Community License
条件性商用许可
Open LLM Leaderboard Avg.
47.11%
基础模型平均分
Japanese LM Harness (7-Avg.)
62.71
RakutenAI论文中的比较基准
HuggingFace Downloads
83,474+
累计下载量
Base Model
Llama-2-7b-hf
基于Meta的Llama2架构
強み
- ・深度优化日语:针对日语任务进行持续预训练,日语生成和理解能力显著提升
- ・开源且轻量:7B参数,Apache 2.0许可(注:底层为Llama 2许可),易于部署和商用
- ・多版本可用:提供基础、指令跟随(Instruction)和对话(Chat)三个版本,满足不同场景需求
弱み
- ・英语与推理能力相对基础:在MMLU、TruthfulQA、GSM8k等英语基准上得分较低
- ・数学推理能力弱:在GSM8k等数学基准上表现不佳(8.64%),限制其在复杂逻辑任务中的应用
- ・基于Llama2的Tokenizer:可能对日语长文本或特定字符的处理效率不如原生日语Tokenizer优化
競合比較
| Model | Arena | SWE | GPQA | Price |
|---|---|---|---|---|
| RakutenAI-7B | N/A | N/A | N/A | Free (Apache 2.0) |
| ELYZA-japanese-Llama-2-7b | N/A | N/A | N/A | Free (Llama 2 License) |
| Japanese StableLM Base Gamma 7B | N/A | N/A | N/A | Free (Stability AI License) |
Youri-7B 是由日本AI公司rinna开发并开源的7B参数大型语言模型,专注于日语任务优化。该模型基于Meta的Llama-2-7b-hf架构,通过在约400亿token的日英混合语料上进行持续预训练,显著提升了其日语文本生成、理解和指令跟随的能力。其模型名称“Youri”源自日本神话生物“妖狸”。
在定位上,Youri-7B旨在为研究人员和开发者提供一个性能强劲、易于部署的日语开源LLM基础。它并非追求在所有全球基准上与顶尖模型竞争,而是致力于在日语特定任务上达到领先水平,同时保持合理的计算资源需求。该模型的关键创新在于其高效的日语适配策略,证明了在强英文基础模型上进行定向语言持续预训练的有效性。
该模型系列已衍生出多个变体,包括针对单轮指令跟随优化的youri-7b-instruction和针对多轮对话优化的youri-7b-chat,进一步拓展了其应用场景。尽管其在通用英语推理任务上表现平平,但对于日语文本生成、日英翻译、日语内容创作等垂直领域,它提供了一个极具性价比的开源解决方案。
出典
- rinna/youri-7b · Hugging Face
- rinna/youri-7b-chat · Hugging Face
- rinna/youri-7b-instruction · Hugging Face
- RakutenAI-7B: Extending Large Language Models for Japanese (arXiv)
- 2023年10〜11月公開の日本語LLM (7B) 3種を横断比較 | yumem.io
- 【Youri 7B】日本最高峰の精度を叩き出す! | WEEL
- rinna、Metaの大規模言語モデル「Llama 2」の日本語継続事前学習モデル「Youri 7B」を公開 | ロボスタ
- rinna、日本語LLM「Youri 7B」シリーズを公開 - INTERNET Watch
分析生成日: 2026-05-23