aixiPa MarcoPolo团队发布了大规模推理模型Marco-o1,专注于复杂现实问题的解决与开放任务的解答。模型通过思维链精调、MCTS扩展解空间和创新推理策略提升推理能力,并在多语言翻译领域表现卓越。在MGSM英文和中文数据集上准确率分别提升6.17%和5.60%。基于Qwen2-7B-Instruct,Marco-o1展现了在标准化与开放性领域的领先性能,已开源于Hugging Face与GitHub。 GitHub