モデル一覧に戻る
rinnaオープンソース

Youri-7B

rinnaが開発した日本語特化型オープンソースモデル。70億パラメータで軽量ながら、日本語処理に最適化された学習が施されている。Apache 2.0ライセンスで商用利用が可能。

パラメータ

7B

コンテキスト長

8K

ライセンス

Apache 2.0

リリース日

2025-06-01

日本語性能

🇯🇵ネイティブJP

日本企業が開発したモデルまたは日本語に特化したモデル。日本語の理解・生成能力が最も高い。

API料金

このモデルのAPI料金情報は現在未公開です

強み

  • Apache 2.0で商用利用可能
  • 学術的評価が最も高い国産モデル
  • 軽量で高速
  • 研究コミュニティが活発

弱み

  • コンテキスト長が8K
  • 商用展開が遅れている
  • 性能面でELYZAに及ばない部分がある
  • API提供がない

活用例

  • 日本語NLP研究
  • 軽量モデルでのプロトタイピング
  • 商用利用を想定したファインチューニング
  • 教育・学術用途

深度分析

パラメータ

7B

70亿参数,轻量级

License

Llama 2 Community License

条件性商用许可

Open LLM Leaderboard Avg.

47.11%

基础模型平均分

Japanese LM Harness (7-Avg.)

62.71

RakutenAI论文中的比较基准

HuggingFace Downloads

83,474+

累计下载量

Base Model

Llama-2-7b-hf

基于Meta的Llama2架构

強み

  • 深度优化日语:针对日语任务进行持续预训练,日语生成和理解能力显著提升
  • 开源且轻量:7B参数,Apache 2.0许可(注:底层为Llama 2许可),易于部署和商用
  • 多版本可用:提供基础、指令跟随(Instruction)和对话(Chat)三个版本,满足不同场景需求

弱み

  • 英语与推理能力相对基础:在MMLU、TruthfulQA、GSM8k等英语基准上得分较低
  • 数学推理能力弱:在GSM8k等数学基准上表现不佳(8.64%),限制其在复杂逻辑任务中的应用
  • 基于Llama2的Tokenizer:可能对日语长文本或特定字符的处理效率不如原生日语Tokenizer优化

競合比較

ModelArenaSWEGPQAPrice
RakutenAI-7BN/AN/AN/AFree (Apache 2.0)
ELYZA-japanese-Llama-2-7bN/AN/AN/AFree (Llama 2 License)
Japanese StableLM Base Gamma 7BN/AN/AN/AFree (Stability AI License)

Youri-7B 是由日本AI公司rinna开发并开源的7B参数大型语言模型,专注于日语任务优化。该模型基于Meta的Llama-2-7b-hf架构,通过在约400亿token的日英混合语料上进行持续预训练,显著提升了其日语文本生成、理解和指令跟随的能力。其模型名称“Youri”源自日本神话生物“妖狸”。

在定位上,Youri-7B旨在为研究人员和开发者提供一个性能强劲、易于部署的日语开源LLM基础。它并非追求在所有全球基准上与顶尖模型竞争,而是致力于在日语特定任务上达到领先水平,同时保持合理的计算资源需求。该模型的关键创新在于其高效的日语适配策略,证明了在强英文基础模型上进行定向语言持续预训练的有效性。

该模型系列已衍生出多个变体,包括针对单轮指令跟随优化的youri-7b-instruction和针对多轮对话优化的youri-7b-chat,进一步拓展了其应用场景。尽管其在通用英语推理任务上表现平平,但对于日语文本生成、日英翻译、日语内容创作等垂直领域,它提供了一个极具性价比的开源解决方案。

分析生成日: 2026-05-23