实测四大国产AI编程模型:谁能在复杂外卖调度项目中胜出?GLM-4.7表现惊艳!
2025年底,国内各大模型厂商非常给力,相继发布了Kimi-K2-0905、Doubao-Seed-Code、GLM-4.7、MiniMax-M2.1等大模型。经实测,国产大模型在AI编程方面,已经完全可以用于真实项目了,大家可以下载CodeBuddyIDE和Trae国内版进行实测。
本文将使用Trae SOLO模式来测试国产大模型的编程能力。为了避免大模型抄答案,本文不会使用网上类似闹钟、贪吃蛇等简单的测试用例,而使用外卖员配送调度优化的例子,更接近真实的项目。
模型信息
Trae SOLO模式支持Doubao-Seed-Code、GLM-4.7、GLM-4.6、MiniMax-M2.1、MiniMax-M2、Kimi-K2-0905。我们首先列出各国产模型的发布厂商、发布日期和多模态支持情况。可以看到除了Kimi-K2-0905发布稍早外,其他三个模型都是近两个月内发布的。
| 模型名称 | 发布厂商 | 发布日期 | 多模态 |
|---|---|---|---|
| Kimi-K2-0905 | 月之暗面 | 2025年9月5日 | 不支持 |
| Doubao-Seed-Code | 火山引擎 | 2025年11月11日 | 支持 |
| GLM-4.7 | 智谱AI | 2025年12月23日 | 不支持 |
| MiniMax M2.1 | MiniMax | 2025年12月24日 | 不支持 |
提示词
我们使用了外卖员配送调度优化的测试用例。这个测试用例非常复杂,涵盖前端、GIS、算法等内容。为了保证公平,我们没有使用Trae优化输入内容,没有对大模型生成的开发方案进行任何修改,开发过程中没有进行任何人工干预。我们的提示词如下:
在当前文件夹中,使用vite、vue3、typescript、ant-design-vue、leaflet编写一个外卖员配送调度优化程序。假设有n家餐馆(默认n=10),m个买家(默认m=8),k个骑手(默认k=5),求解出配送距离最短和配送时间最短两种方案并在地图上用动画表示出来。街道、餐馆、买家、骑手位置可以随机生成,餐馆、买家、骑手一定位于街道上。提供一个重绘街道按钮重新生成街道、餐馆、买家、骑手位置。提供一个重置骑手按钮,可以随机设置骑手在街道上的位置。提供一个开始配送按钮,可以根据选择的优化方案(配送距离最短、配送时间最短),在地图上动态演示配送效果。
测试结果
我们使用Trae SOLO模式进行测试。Trae国内版虽然可以免费使用,但是经常排队,有时候会排到180多个人,10分钟都轮不上。下表中的运行时长包含排队时间,没有任何意义。
| 模型名称 | 使用人数 | 运行时长 | 测试结果 | 改错次数 |
|---|---|---|---|---|
| Doubao-Seed-Code | 不需要排队 | 15分钟 | 基本能用,无动画 | 0 |
| GLM-4.7 | 严重排队 | 55分钟 | 美观,有动画 | 1 |
| MiniMax-M2.1 | 偶尔排队 | 51分钟 | 美观,有动画 | 2 |
| Kimi-K2-0905 | 严重排队 | 4小时 | 完全无法使用 | 10 |
Doubao-Seed-Code
这是Doubao-Seed-Code开发的程序,地图不够美观,餐馆、买家、骑手只简单的在地图上使用文字表示,没有生成配送动画,配送路线也没有沿着街道,但是可以正常使用。

GLM-4.7
这是GLM-4.7开发的程序,生成的街道质量很高,餐馆、买家、骑手都使用了图标,非常美观。点击开始配送按钮,骑手沿着街道移动的动画非常流畅,并能给出配送结果,非常完美。

MiniMax-M2.1
这是MiniMax-M2.1生成的程序,生成的街道质量没有GLM-4.7高,餐馆、买家、骑手使用了文字图标,也很漂亮。点击开始配送按钮,骑手沿着街道移动的动画也非常流畅,最后也可以分析出结果。

Kimi-K2-0905
Kimi-K2-0905就比较惨不忍睹了,刚开始生成的页面还能展示,只是没有街道、餐馆、买家和骑手。跟大模型反馈后,越改错误越多,后面怎么改都改不对了。

总结
经过实测,GLM-4.7是最强国产模型,MiniMax M2.1次之,Doubao-Seed-Code和Kimi-K2-0905都比较弱。