이 모델의 강점은 무엇인가요?

Commercial use allowed under Apache 2.0 Top-rated domestic model in academic evaluation Lightweight and fast Active research community

이 모델의 약점은 무엇인가요?

Context length is 8K Lagging in commercial deployment Some performance aspects inferior to ELYZA No API availability

어떤 용도에 가장 적합한가요?

Japanese NLP research Prototyping with lightweight models Fine-tuning intended for commercial use Education and academic use

모델 목록으로

rinna오픈소스

Youri-7B

Name: Youri-7B
Author: rinna

An open-source model specialized for Japanese, developed by rinna. With 7 billion parameters, it is lightweight yet has been trained optimized for Japanese language processing. It is available for commercial use under the Apache 2.0 license.

파라미터

컨텍스트

라이선스

Apache 2.0

출시일

2025-06-01

일본어 처리 능력

🇯🇵Native JP

Model developed by a Japanese company or specialized for Japanese. Highest Japanese understanding and generation capability.

API 가격

이 모델의 API 가격 정보는 현재 공개되지 않았습니다

강점

・Commercial use allowed under Apache 2.0
・Top-rated domestic model in academic evaluation
・Lightweight and fast
・Active research community

약점

・Context length is 8K
・Lagging in commercial deployment
・Some performance aspects inferior to ELYZA
・No API availability

활용 사례

・Japanese NLP research
・Prototyping with lightweight models
・Fine-tuning intended for commercial use
・Education and academic use

심층 분석

Parameters

70亿参数，轻量级

License

Llama 2 Community License

条件性商用许可

Open LLM Leaderboard Avg.

47.11%

基础模型平均分

Japanese LM Harness (7-Avg.)

62.71

RakutenAI论文中的比较基准

HuggingFace Downloads

83,474+

累计下载量

Base Model

Llama-2-7b-hf

基于Meta的Llama2架构

강점

・深度优化日语：针对日语任务进行持续预训练，日语生成和理解能力显著提升
・开源且轻量：7B参数，Apache 2.0许可（注：底层为Llama 2许可），易于部署和商用
・多版本可用：提供基础、指令跟随（Instruction）和对话（Chat）三个版本，满足不同场景需求

약점

・英语与推理能力相对基础：在MMLU、TruthfulQA、GSM8k等英语基准上得分较低
・数学推理能力弱：在GSM8k等数学基准上表现不佳（8.64%），限制其在复杂逻辑任务中的应用
・基于Llama2的Tokenizer：可能对日语长文本或特定字符的处理效率不如原生日语Tokenizer优化

경쟁사 비교

Model	Arena	SWE	GPQA	Price
RakutenAI-7B	N/A	N/A	N/A	Free (Apache 2.0)
ELYZA-japanese-Llama-2-7b	N/A	N/A	N/A	Free (Llama 2 License)
Japanese StableLM Base Gamma 7B	N/A	N/A	N/A	Free (Stability AI License)

개요

Youri-7B 是由日本AI公司rinna开发并开源的7B参数大型语言模型，专注于日语任务优化。该模型基于Meta的Llama-2-7b-hf架构，通过在约400亿token的日英混合语料上进行持续预训练，显著提升了其日语文本生成、理解和指令跟随的能力。其模型名称“Youri”源自日本神话生物“妖狸”。在定位上，Youri-7B旨在为研究人员和开发者提供一个性能强劲、易于部署的日语开源LLM基础。它并非追求在所有全球基准上与顶尖模型竞争，而是致力于在日语特定任务上达到领先水平，同时保持合理的计算资源需求。该模型的关键创新在于其高效的日语适配策略，证明了在强英文基础模型上进行定向语言持续预训练的有效性。该模型系列已衍生出多个变体，包括针对单轮指令跟随优化的`youri-7b-instruction`和针对多轮对话优化的`youri-7b-chat`，进一步拓展了其应用场景。尽管其在通用英语推理任务上表现平平，但对于日语文本生成、日英翻译、日语内容创作等垂直领域，它提供了一个极具性价比的开源解决方案。

벤치마크 및 성능

Youri-7B 的性能评估主要来自两个体系：针对日语任务的 **Stability-AI/lm-evaluation-harness** 和针对英语通用任务的 **Open LLM Leaderboard**。 ### 1. 日语 LM Harness 基准性能（来源：RakutenAI-7B论文对比） | 任务 | 指标 | Youri-7B | RakutenAI-7B (领先者) | | :--- | :--- | :--- | :--- | | **7-Avg. (排除XLSum-ja)** | 平均分 | **62.71** | **69.80** | | JCommonSenseQA (3-shot) | acc | 76.94 | 84.27 | | JNLI (3-shot) | acc | 51.11 | 48.69 | | MARC-ja (3-shot) | acc | 90.96 | 96.29 | | JSQuAD (2-shot) | em | 57.45 | 79.09 | | JAQKET v2 (1-shot) | em | 78.09 | 80.67 | | MGSM (5-shot) | acc | **6.40** | **22.40** | | xWino (0-shot) | acc | 78.00 | 77.16 | *注：Youri-7B 在 NLI 和常识推理上表现不俗，但在数学推理（MGSM）和阅读理解（JSQuAD）上与顶尖模型有显著差距。* ### 2. 英语通用基准性能（来源：Open LLM Leaderboard） | 任务 | 指标 | Youri-7B | | :--- | :--- | :--- | | **平均分** | - | **47.11%** | | AI2 Reasoning Challenge (25-shot) | acc_norm | 49.06% | | HellaSwag (10-shot) | acc_norm | 74.89% | | MMLU (5-shot) | acc | 42.22% | | TruthfulQA (0-shot) | mc2 | 36.03% | | Winogrande (5-shot) | acc | 71.82% | | GSM8k (5-shot) | acc | **8.64%** | *注：该模型在常识推理（HellaSwag）上表现较好，但在知识密集型（MMLU）、数学推理（GSM8k）和事实准确性（TruthfulQA）上得分较低，反映了其作为特定语言优化模型的通用性局限。*

상세 비교

커뮤니티 평가

在日本开发者社区和研究界，Youri-7B 被视为2023年底发布的重要开源日语LLM之一，与CALM2、Japanese StableLM等模型共同推动了日本本土大模型的发展。 **正面评价**： - **日语能力认可**：许多评测文章（如yumem.io的比较）指出，Youri系列模型在遵循日语指令和进行日语对话方面表现稳定，特别是`youri-7b-chat`在角色扮演和多轮对话任务中表现突出，能较好地维持人设。 - **实用价值**：由于提供基础、指令、聊天三个版本以及量化模型，降低了开发者的使用门槛，被用于学术研究、原型开发和特定日语内容生成任务。 - **引用与基准**：在后续研究中（如RakutenAI-7B论文），Youri-7B常作为重要的基线模型被引用和对比，证明了其在日语LLM发展史上的基准地位。 **指出的局限**： - **知识准确性**：有开发者测试（如weel.co.jp的文章）发现，Youri-7B在回答需要精确事实知识的问题（如日本山峰高度排名）时可能出错，其知识库的准确性和时效性有待验证。 - **长文本与复杂推理**：受限于Llama2的Tokenizer和7B参数规模，在处理超长文本或需要复杂数学、逻辑推理的任务时效果不佳。 - **与新一代模型的差距**：随着RakutenAI-7B等基于更新架构（如Mistral）的模型出现，Youri-7B在绝对性能上已不再是顶尖，更多被视为一个经典的、可靠的开源基线。

활용 사례

1. **日语文本自动补全与创作**： - **场景**：为博客、小说、剧本等创作日语内容草稿，或对现有日语文本进行续写。 - **示例**：输入一个日语句子开头，模型能生成风格连贯的后续段落。如搜索结果所示，输入“西田幾多郎は、”后，模型能生成哲学相关的延续文本。 - **选择理由**：日语流畅度优于未经优化的通用模型，且成本极低。 2. **日语聊天机器人与角色扮演**： - **场景**：构建客服机器人、虚拟助手或具有特定人设的聊天角色。 - **示例**：使用`youri-7b-chat`模型，通过设定角色规则（如“モグモグ星人”），进行多轮互动对话，模型能较好遵守设定并回应。 - **选择理由**：`youri-7b-chat`专为多轮对话优化，响应更自然，适合交互式场景。 3. **日英互译辅助**： - **场景**：为翻译工作者或需要快速获取日语文本大意的用户提供初稿翻译。 - **示例**：在聊天模式下，先设定任务为“将以下日语翻译成英语”，然后输入日语段落，模型能生成可读的英文翻译。 - **选择理由**：模型在预训练中包含了大量日英对照语料，具备基础的翻译能力，且免费可用。 4. **日语指令跟随与信息提取**： - **场景**：从日语文档中提取关键信息、进行文本分类或完成简单的问答任务。 - **示例**：使用`youri-7b-instruction`模型，输入“次の日本語を英語に翻訳してください。”和一段日语，模型能直接输出翻译结果。 - **选择理由**：指令微调版本在理解和执行单轮明确指令方面表现更佳，适用于批处理任务。