类似deepseek的推理模型并不能很好地处理多模态的任务类型,本文提出一种视觉增强的强化学习,增强模型在视觉推理方面的能力
阅读全文
论文阅读-北大发布的物理题求解评价新指标
阅读全文