https://github.com/MINT-SJTU/STI-Bench

STI-Bench : Are MLLMs Ready for Precise Spatial-Temporal World Understanding?
https://github.com/MINT-SJTU/STI-Bench

Last synced: 12 months ago
JSON representation

STI-Bench : Are MLLMs Ready for Precise Spatial-Temporal World Understanding?

Host: GitHub
URL: https://github.com/MINT-SJTU/STI-Bench
Owner: MINT-SJTU
License: mit
Created: 2025-04-06T13:31:56.000Z (about 1 year ago)
Default Branch: main
Last Pushed: 2025-04-19T14:48:55.000Z (about 1 year ago)
Last Synced: 2025-04-19T18:44:11.767Z (about 1 year ago)
Language: Python
Size: 16.9 MB
Stars: 9
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

StarryDivineSky - MIRA-SJTU/STI-Bench - Bench是一个用于评估大型语言模型（MLLMs）在精确时空世界理解能力方面的基准测试项目。它由上海交通大学MIRA实验室开发，旨在探究MLLMs是否能够准确理解和推理现实世界的时空关系。该基准测试包含多种任务，例如时空定位、事件排序和预测等，涵盖了不同粒度和复杂度的时空推理场景。STI-Bench利用合成数据和真实世界数据来评估MLLMs的性能，并提供了一套完整的评估指标。项目特色在于其对时空理解的细粒度评估，能够帮助研究人员深入了解MLLMs在处理时空信息方面的优势和不足。通过STI-Bench，研究人员可以更好地开发和改进MLLMs，使其在需要精确时空推理的应用中表现更佳，例如自动驾驶、机器人导航和智能城市管理等。该项目提供数据集、评估代码和基线模型，方便研究人员进行实验和比较。 (多模态大模型 / 资源传输下载)