做出1000万份高考志愿的夸克,决定公开他们的深度研究Agent秘方。

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
做出1000万份高考志愿的夸克,决定公开他们的深度研究Agent秘方。
5880点击    2025-07-02 10:56

高考志愿填报结束啦!敲锣打鼓ing


我长舒一口气。当然不是因为我要上大学,而是这段时间兼职了一把“志愿顾问”。


过去十天里,我帮亲戚、朋友、朋友的朋友、朋友的朋友的朋友......


生成了快四五十份报告,给夸克这几周生成的1000万份高考志愿报告贡献了


0.0005%


没想到我跟夸克的缘分未了啊,昨天还参加了夸克内部的技术分享,拿到了一些一手信息,马上写成文章给大家分享分享。


做出1000万份高考志愿的夸克,决定公开他们的深度研究Agent秘方。


夸克能在那么短的时间,在高考这个场景成为国内规模最大的深度研究(Deep Research)应用,这也是深度研究 Agent 第一次在大规模场景中,完成了真正的落地闭环。


先用简单一段话,定义一下深度研究 Agent


「深度研究Agent」(Deep Research Agents)


由大语言模型(LLMs)驱动的 AI 代理,具备动态推理、自适应规划、多轮外部数据获取与工具调用能力,并能自动生成完整分析报告,用于完成复杂的信息研究任务。


具体来说,深度研究 Agent 以大语言模型为“脑”,通过网页浏览器或结构化 API 实时获取外部知识,并使用定制化工具箱或标准接口(如 MCP:模型上下文协议)调用分析工具。这种架构让智能体可以自主执行复杂的、端到端的研究流程,将推理过程与多模态资源(例如文字、图像、结构化数据等)无缝融合在一起。


举个栗子,我印象最深的一份高考报告是一个朋友的妹妹,


河北考生,物化生组合,560分,对药学感兴趣,家长预算有限,希望选个学费不高、就业不错的院校。


因为夸克的报告可以生成多次,所以我前后试了很多关键词:公办本科、药学专业、就业导向、经济型城市等等,


做出1000万份高考志愿的夸克,决定公开他们的深度研究Agent秘方。


做出1000万份高考志愿的夸克,决定公开他们的深度研究Agent秘方。


最后生成的志愿报告里,给出了合理的冲稳保结构,还特别标注了该校的学费标准、就业率,从院校选择逻辑,到专业排布建议,再到家长普遍关心的调剂风险、转专业政策、就业导向,都给出了合理甚至贴心的解释。


甚至附带了一句“该校所在城市有XX制药集团,与本专业联系紧密”。


我当时真的服了。


它是真的在思考:


什么是对这个考生真正重要的信息。


能做到这一步,夸克志愿报告 Agent 是基于高考志愿大模型,用了两个工具和一个工作流架构,我来一个个拆解!


做出1000万份高考志愿的夸克,决定公开他们的深度研究Agent秘方。


当你给夸克提要求后,在规划阶段它就会先根据分数信息初始志愿表,明确考生的大概分数段水平,然后通过定向提问补充信息,像是个人偏好的城市之类的,


再根据输入规划策略,分成学校、专业、地域、未来就业、家庭背景、个人情况等维度,类似的方法也被隔壁 OpenAI 采用。


再具体一点说,就是在执行过程中,Agent通过多轮“工具调用+反思调整”的机制,来动态优化志愿方案。


比如,如果我们给出的信息中倾向“留在省内(广州、深圳优先)、 不考虑偏远地区”的意向时,模型会自动生成搜索指令:


优先推荐广州、深圳的高校,其次考虑广东省内其他城市院校,排除偏远地区选项;若优质选项受限,Agent还能主动反思扩展搜索范围,如增加广东周边发达城市,或在高层次高校(如985)上适度放开地域限制,为考生争取冲一冲的机会。


而且,夸克这个高考 Agent 具备处理复杂、甚至是自相矛盾的诉求的能力。比如说“数学成绩差,但想报考计算机”这种学科之间的矛盾,系统就会触发深度研究 Agent 流程,提示我这一选择可能存在的能力匹配问题。


这就很人性化了,就是它不是一味的只是去迁就的给出提问所匹配的答案,而是真的会认真思考问题,然后给出相当合理化的建议,


就像我们真的会去找的咨询师一样,ta不是完全顺着你的要求来的,而是知道什么是更好的,什么是不适合你的。


思考过程讲完了,那执行过程用到的两个工具:搜索工具和志愿填报工具。


单是搜索工具就收录了快9000个站点,20多亿网页,我们熟悉的阳光高考、就业信息网、学信网等等都包含进去了,


而且在中间流程还加了多重事实性校验,毕竟高考年年变,没有比这个更考验模型信息获取和整合能力更好的场景了。


刚好我最近看到了一份《DEEP RESEARCH AGENTS: A SYSTEMATIC EXAMINATION AND ROADMAP》的论文,


跟夸克这次做了一些对比,找到了更多更加真实的数据。首先就是深度研究智能体们都在用什么工具获取信息?


目前还是使用API检索为主(左),浏览器为辅(右)。


做出1000万份高考志愿的夸克,决定公开他们的深度研究Agent秘方。


做出1000万份高考志愿的夸克,决定公开他们的深度研究Agent秘方。


做出1000万份高考志愿的夸克,决定公开他们的深度研究Agent秘方。


截止目前为止已经有36个深度研究Agent(实际上肯定不止)


这里面的主力模型就是 gpt 和 qwen 系列,主要就是集中在今年的5月份发布的,所以说夸克能在那么短时间做到千万报告输出真的很牛🐂


做出1000万份高考志愿的夸克,决定公开他们的深度研究Agent秘方。


做出1000万份高考志愿的夸克,决定公开他们的深度研究Agent秘方。


我甚至还交流到了志愿填报工具的一些实现细节,


这个是实打实跟其他家拉开距离的。


填志愿,看起来是选学校、选专业,但实际是一场复杂的非结构化任务:


每个学生的报考需求都不同,甚至每个省份的投档制度、专业组规则都不一样,那怎么能在一个工具里考虑到这么多细节:


比如,当前的省控线与专业组制度、志愿序之间的差异化、调剂可能引发的方向偏移、家庭意愿和个人偏好之间的平衡、本科后的考研/就业预期路径,


这些东西不说自己报考的时候会忘记,就是弄明白其中一个就要花不少时间了。


那夸克这个高考志愿大模型是怎么做的呢?


它做了件很吃力不讨好的事,将综合历年录取位次情况及专业省份扩缩招情况,判断专业综合位次,根据分段选科统计建模,不同选科不同分段下的波动范围,来匹配各种分数段竞争程度,


说白了就是尽可能盘点所有的影响因子,估算出你今年得分是处于什么水平。


当新专业、新学校出现时怎么办?


夸克就会选取同校相似专业(专业类型相近且招生条件相同),然后根据相似度做加权。


如果没有有效的相似专业或者为本省首次招生院校,他们会选取相似学校相似专业在本省的去年分,做相似度加权。


然后在缺失有效信息下会回退学校分/等策略 。


真的很复杂,而且是平时靠人力报考的话一个人完全做不到的事情,


所以,看似非常个性化的场景需求也是能够探索出一个结构,配合大量训练,调试出一个能够适配所有人的思考流程,


这些就是我一直认同的行业里的优势,


只要你这样做了,这个产品就肯定差不了,


也肯定可以跟一般的通用Agent拉开极大的距离。


为什么做高考?


分享会有个细节让我印象特别深。


他们说,夸克高考这块,最早就是为了“解决考生和家长找不到信息”的需求起步的。


在大家还停留在“某度搜高校”阶段,夸克就尝试“智能搜索+结构抽取”去做“高考AI助手”。


2024年,夸克也是率先将其AI搜索能力在高考信息服务中落地,升级高考AI搜索,,


当时大家的反馈就很积极,高考季期间“夸克高考”AI搜索的使用量超过了1亿次。


但你可能没想到,一个志愿报告的生成背后,调动的是十几项结构查询、数百次规则匹配、几十页文案编写。


更厉害的是,夸克还不收钱。


它在做的是用真实场景打磨出真正的AI代理决策力。你看到的不是一份报告,而是一个AI在说:


“我理解你的困惑,我替你跑完了那些你不想做、做不好的事。”


而这些,最终都反映在了产品体验里。


当然,除了志愿报告,夸克还有很多意外之喜。


比如:


  • 它会提醒你“查验信息”“关注录取短信”,还有防诈骗指南;


  • 它会提示你“录取后第一件事是什么”“打招生办问转专业政策”等等;


  • 甚至会提醒你“有没有遗漏保底学校”“是否确认调剂”。


这种细节体验,也让我意识到一个事:


夸克做这个产品,不是为了秀AI能力,而是真的当一件服务来做。


目前除了高考,夸克还上线了通用的深度研究,含金量有多高,相信不需要我再说了 。


而且在分享会最后,夸克算法负责人蒋冠军也分享了夸克的下一步,


我稍微总结了一下


高考志愿填报,是夸克率先试验深度研究能力的任务型场景,他们会把在这里积累下来的范式、数据处理方式、逻辑建模方法,逐步推广到更多需要高质量决策的领域。


比如健康、比如教育、比如未来的职业选择场景。


这是我第一次,感觉到AI正在变成一个“社会角色”。


而我们能做的,就是继续和它一起并肩作战,


把一个又一个复杂难题,拆成有希望的未来。


这一次,夸克让AI成为志愿专家;


下一次,它也许能成为你人生中每一个关键决定的合伙人。


深度研究的时代,


才刚刚开始。


文章来自于微信公众号“卡尔的AI沃茨”,作者是“AI沃茨”。


关键词: AI , 夸克AI , AI浏览器 , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


3
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

4
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

5
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/