阿里巴巴MarcoPolo团队推出Marco-o1推理模型

aixiPa

MarcoPolo团队发布了大规模推理模型Marco-o1，专注于复杂现实问题的解决与开放任务的解答。模型通过思维链精调、MCTS扩展解空间和创新推理策略提升推理能力，并在多语言翻译领域表现卓越。在MGSM英文和中文数据集上准确率分别提升6.17%和5.60%。基于Qwen2-7B-Instruct，Marco-o1展现了在标准化与开放性领域的领先性能，已开源于Hugging Face与GitHub。

GitHub