### 问题/痛点描述 目前从指导和代码上 ,还未发现支持aime2026 ### 建议方案 参考aime2025和aime2024数据集的实现方式 ### 备选方案 _No response_ ### 预期价值 aime2026数据集为开源数据,是衡量衡量模型精度重要指标 ### 参与意向 - [ ] 我愿意参与此功能的开发或测试
问题/痛点描述
目前从指导和代码上 ,还未发现支持aime2026
建议方案
参考aime2025和aime2024数据集的实现方式
备选方案
No response
预期价值
aime2026数据集为开源数据,是衡量衡量模型精度重要指标
参与意向