登录成功后会自动刷新界面
测试AI模型
评估和比较基于文本任务的人工智能语言模型(LLMs),支持可选的文件/图片附件。支持多提供商(OpenAI、Google、Anthropic、DeepSeek),YAML格式自定义任务,以及HTML/CSV报告。