🏆 EmbodiedBench 排行榜
模型在 EmbodiedBench 上的排名。分数越高 = 具身智能能力越强。
| # | 模型 | 最佳套件得分 | 得分 |
|---|---|---|---|
| 1 | Claude-3.5-Sonnet 4 个环境平均 | Claude-3.5-Sonnet (—) | 56% |
| 2 | Claude-3.7-Sonnet 4 个环境平均 | Claude-3.7-Sonnet (—) | 51.2% |
| 3 | GPT-4o 4 个环境平均 | GPT-4o (—) | 50.5% |
| 4 | Gemini-2.0-Flash 4 个环境平均 | Gemini-2.0-Flash (—) | 43.6% |
| 5 | Gemini-1.5-Pro 4 个环境平均 | Gemini-1.5-Pro (—) | 40.8% |
| 6 | Qwen-VL-Max 4 个环境平均 | Qwen-VL-Max (—) | 38.7% |
| 7 | Gemini-1.5-Flash 4 个环境平均 | Gemini-1.5-Flash (—) | 36.2% |
| 8 | GPT-4o-mini 4 个环境平均 | GPT-4o-mini (—) | 23.3% |