Back to directory

VisualAgentBench

Free270

Towards Large Multimodal Models as Visual Foundation Agents

Visit website Compare

About

Towards Large Multimodal Models as Visual Foundation Agents

Key Features

gpt
llm-agent
multimodal-large-language-models

Pricing

Free

Open source. You supply your own LLM API keys.

Categories

General

Details

Sourcegithub ↗

VerifiedJuly 18, 2026

GitHub stars★ 270