모델 목록으로
rinna오픈소스

Youri-7B

An open-source model specialized for Japanese, developed by rinna. With 7 billion parameters, it is lightweight yet has been trained optimized for Japanese language processing. It is available for commercial use under the Apache 2.0 license.

파라미터

7B

컨텍스트

8K

라이선스

Apache 2.0

출시일

2025-06-01

일본어 처리 능력

🇯🇵Native JP

Model developed by a Japanese company or specialized for Japanese. Highest Japanese understanding and generation capability.

API 가격

이 모델의 API 가격 정보는 현재 공개되지 않았습니다

강점

  • Commercial use allowed under Apache 2.0
  • Top-rated domestic model in academic evaluation
  • Lightweight and fast
  • Active research community

약점

  • Context length is 8K
  • Lagging in commercial deployment
  • Some performance aspects inferior to ELYZA
  • No API availability

활용 사례

  • Japanese NLP research
  • Prototyping with lightweight models
  • Fine-tuning intended for commercial use
  • Education and academic use

심층 분석

Parameters

7B

70亿参数,轻量级

License

Llama 2 Community License

条件性商用许可

Open LLM Leaderboard Avg.

47.11%

基础模型平均分

Japanese LM Harness (7-Avg.)

62.71

RakutenAI论文中的比较基准

HuggingFace Downloads

83,474+

累计下载量

Base Model

Llama-2-7b-hf

基于Meta的Llama2架构

강점

  • 深度优化日语:针对日语任务进行持续预训练,日语生成和理解能力显著提升
  • 开源且轻量:7B参数,Apache 2.0许可(注:底层为Llama 2许可),易于部署和商用
  • 多版本可用:提供基础、指令跟随(Instruction)和对话(Chat)三个版本,满足不同场景需求

약점

  • 英语与推理能力相对基础:在MMLU、TruthfulQA、GSM8k等英语基准上得分较低
  • 数学推理能力弱:在GSM8k等数学基准上表现不佳(8.64%),限制其在复杂逻辑任务中的应用
  • 基于Llama2的Tokenizer:可能对日语长文本或特定字符的处理效率不如原生日语Tokenizer优化

경쟁사 비교

ModelArenaSWEGPQAPrice
RakutenAI-7BN/AN/AN/AFree (Apache 2.0)
ELYZA-japanese-Llama-2-7bN/AN/AN/AFree (Llama 2 License)
Japanese StableLM Base Gamma 7BN/AN/AN/AFree (Stability AI License)

Youri-7B 是由日本AI公司rinna开发并开源的7B参数大型语言模型,专注于日语任务优化。该模型基于Meta的Llama-2-7b-hf架构,通过在约400亿token的日英混合语料上进行持续预训练,显著提升了其日语文本生成、理解和指令跟随的能力。其模型名称“Youri”源自日本神话生物“妖狸”。

在定位上,Youri-7B旨在为研究人员和开发者提供一个性能强劲、易于部署的日语开源LLM基础。它并非追求在所有全球基准上与顶尖模型竞争,而是致力于在日语特定任务上达到领先水平,同时保持合理的计算资源需求。该模型的关键创新在于其高效的日语适配策略,证明了在强英文基础模型上进行定向语言持续预训练的有效性。

该模型系列已衍生出多个变体,包括针对单轮指令跟随优化的youri-7b-instruction和针对多轮对话优化的youri-7b-chat,进一步拓展了其应用场景。尽管其在通用英语推理任务上表现平平,但对于日语文本生成、日英翻译、日语内容创作等垂直领域,它提供了一个极具性价比的开源解决方案。

분석 생성일: 2026-05-23