RAG-R1: Incentivizing Search and Reasoning Capabilities of LLMs Through Multi-Query Parallelism
RAG-R1: Стимулирование возможностей поиска и рассуждения LLM посредством параллелизма мультизапросов В этой статье представлена RAG-R1, новая структура обучения, разработанная для улучшения возможностей рассуждения и поиска больших языковых моделей (LLM), позволяя им адаптивно использовать как внутренние, так и внешние знания. Структура устраняет ограничения существующих методов генерации с расширенным поиском (RAG), такие как нестабильность обучения, большое время вывода и ограниченные возможности из-за режима одиночного запроса. RAG-R1 расширяет процессы генерации и поиска до параллелизма мультизапросов, сокращая время вывода и повышая производительность модели. Структура обучения включает этапы тонкой настройки с контролируемым обучением формату и обучение с подкреплением, расширенное поиском. Эксперименты на нескольких контрольных тестах вопросов и ответов показывают, что RAG-R1 превосходит существующие методы, достигая значительного увеличения производительности и сокращения времени вывода. Подход позволяет LLM правильно отвечать на вопросы. Основными вкладами этой работы являются структура RAG-R1, расширение до параллелизма мультизапросов и продемонстрированная современная производительность в задачах вопросов и ответов. #LLM #RAG #ОбучениеСПодкреплением #МультиЗапрос #ВопросыОтветы #ИИ #NLP #Поиск документ - https://arxiv.org/pdf/2507.02962v1 подписаться - https://t.me/arxivdotorg отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM
RAG-R1: Стимулирование возможностей поиска и рассуждения LLM посредством параллелизма мультизапросов В этой статье представлена RAG-R1, новая структура обучения, разработанная для улучшения возможностей рассуждения и поиска больших языковых моделей (LLM), позволяя им адаптивно использовать как внутренние, так и внешние знания. Структура устраняет ограничения существующих методов генерации с расширенным поиском (RAG), такие как нестабильность обучения, большое время вывода и ограниченные возможности из-за режима одиночного запроса. RAG-R1 расширяет процессы генерации и поиска до параллелизма мультизапросов, сокращая время вывода и повышая производительность модели. Структура обучения включает этапы тонкой настройки с контролируемым обучением формату и обучение с подкреплением, расширенное поиском. Эксперименты на нескольких контрольных тестах вопросов и ответов показывают, что RAG-R1 превосходит существующие методы, достигая значительного увеличения производительности и сокращения времени вывода. Подход позволяет LLM правильно отвечать на вопросы. Основными вкладами этой работы являются структура RAG-R1, расширение до параллелизма мультизапросов и продемонстрированная современная производительность в задачах вопросов и ответов. #LLM #RAG #ОбучениеСПодкреплением #МультиЗапрос #ВопросыОтветы #ИИ #NLP #Поиск документ - https://arxiv.org/pdf/2507.02962v1 подписаться - https://t.me/arxivdotorg отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM