全球首个历史基准!普林复旦打造AI历史助手,AI破圈人文学科
全球首个历史基准!普林复旦打造AI历史助手,AI破圈人文学科普林斯顿大学AI实验室与复旦大学历史学系联手推出了全球首个聚焦历史研究能力的AI评测基准——HistBench,并同步开发了深度嵌入历史研究场景的AI助手——HistAgent。这一成果不仅填补了人文学科AI测试的空白,更为复杂史料处理与多模态理解建立了系统工具框架。
普林斯顿大学AI实验室与复旦大学历史学系联手推出了全球首个聚焦历史研究能力的AI评测基准——HistBench,并同步开发了深度嵌入历史研究场景的AI助手——HistAgent。这一成果不仅填补了人文学科AI测试的空白,更为复杂史料处理与多模态理解建立了系统工具框架。
近几年的高考季,城市数据团都会推出一些相关的研究。
就在刚刚,夸克官宣了他们最新的夸克高考志愿大模型。虽然他们没咋提Agent这个词,但是我依然觉得,这玩意比Agent还Agent。我左想右想,也没想到,夸克会在高考结束的这个时间点,发了可能是我觉得目前AI里,最落地最有用最有社会意义的产品。
下手帮你干活直接交付结果。 当搜索不再只是获取信息的工具,而能直接帮你完成购物决策、行程规划甚至输出专业报告——这一愿景随着纳米AI超级搜索智能体的发布成为现实。
你有没有想过,编程这件事情可能彻底变了?开发者正在从单纯使用AI工具,转向将AI视为构建软件的全新基础。这不是什么小调整,而是一场彻底的范式转变。想想看,那些我们一直习以为常的核心概念——版本控制、代码审查、甚至"开发者"的定义——都在因为AI agent驱动的工作流而被重新定义。
如果去标记“得帆信息”——这家成立十年的软件公司历史,2025年春节,一定是个刻骨铭心的时间点。这本是个欢庆的时点,得帆信息的创始人&CEO张桐却忧心忡忡。他已经多年不写代码,却用美国AI Coding(AI编程)工具Cursor,花两天就写出一套网页版的CRM后,张桐得出结论:
最近两年,随着AI改造各行各业的深入,AI报考志愿也开始成为一年一度的热门工具,每年帮助数千万的高考毕业生从成千上万所高校中,选择最适合自己的学校。
AnySphere 联合创始人兼 CEO Michael Truell 所构建的 Cursor,不仅是当前增长最快的 AI 编程产品之一,更是未来“后代码时代”的早期形态。
6 月 9 日消息,据外媒TechXplore 报道,由 AI 视频技术公司 Runway 主办的年度 AI 电影节于 6 月 5 日在纽约拉开帷幕,全球十部短片首次登上大银幕亮相。Runway CEO 克里斯托瓦尔・巴伦苏埃拉说:“三年前这听起来还是天方夜谭。现在,全球已有数百万人使用我们当年仅是梦想的工具,创作出数十亿条视频。”
在旧金山AI工程师世博会上,Simon Willison用自创「骑自行车的鹈鹕」图像生成测试,幽默回顾过去半年LLM的飞速发展。亲测30多款AI模型,强调工具+推理成最强AI组合!