FormulaOne: Measuring the Depth of Algorithmic Reasoning
FormulaOne: Оценка глубины алгоритмического мышления В документе представлена FormulaOne, новая платформа для оценки алгоритмических способностей AI моделей, особенно в областях, выходящих за рамки соревновательного программирования. Она сосредоточена на реальных исследовательских задачах, находящихся на пересечении теории графов, логики и алгоритмов. Платформа включает в себя задачи, связанные с практической крупномасштабной оптимизацией, и генерируется с использованием монадической логики второго порядка (MSO) на графах. Проблемы тесно связаны с теоретической информатикой, и авторы предполагают, что значительный алгоритмический прогресс, выходящий за рамки известных результатов, может повлечь за собой глубокие теоретические последствия, возможно, опровергнув центральные гипотезы, такие как SETH. Современные AI модели, в том числе o3 от OpenAI, показывают плохие результаты на FormulaOne, что указывает на разрыв между текущими возможностями AI и пониманием на экспертном уровне. Авторы выпускают полный корпус вместе с комплексной платформой оценки и ознакомительным набором данных. FormulaOne предназначена для того, чтобы служить сложной средой для тестирования и улучшения способности AI решать сложные реальные проблемы, особенно в контексте обучения с подкреплением. #ИИ #Алгоритмы #Бенчмарк #ТеорияГрафов #Логика #Рассуждения #FormulaOne документ - http://arxiv.org/pdf/2507.13337v1 подписаться - https://t.me/arxivdotorg отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM
FormulaOne: Оценка глубины алгоритмического мышления В документе представлена FormulaOne, новая платформа для оценки алгоритмических способностей AI моделей, особенно в областях, выходящих за рамки соревновательного программирования. Она сосредоточена на реальных исследовательских задачах, находящихся на пересечении теории графов, логики и алгоритмов. Платформа включает в себя задачи, связанные с практической крупномасштабной оптимизацией, и генерируется с использованием монадической логики второго порядка (MSO) на графах. Проблемы тесно связаны с теоретической информатикой, и авторы предполагают, что значительный алгоритмический прогресс, выходящий за рамки известных результатов, может повлечь за собой глубокие теоретические последствия, возможно, опровергнув центральные гипотезы, такие как SETH. Современные AI модели, в том числе o3 от OpenAI, показывают плохие результаты на FormulaOne, что указывает на разрыв между текущими возможностями AI и пониманием на экспертном уровне. Авторы выпускают полный корпус вместе с комплексной платформой оценки и ознакомительным набором данных. FormulaOne предназначена для того, чтобы служить сложной средой для тестирования и улучшения способности AI решать сложные реальные проблемы, особенно в контексте обучения с подкреплением. #ИИ #Алгоритмы #Бенчмарк #ТеорияГрафов #Логика #Рассуждения #FormulaOne документ - http://arxiv.org/pdf/2507.13337v1 подписаться - https://t.me/arxivdotorg отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM