
有关智能体/Agent,和上下文协议/MCP的一些概念,以及为什么它重要
有关智能体/Agent,和上下文协议/MCP的一些概念,以及为什么它重要由于语言泛化,今天出现了很有趣的现象:「Agent 是什么」,这个问题没有了标准的定义。一个常见的观点是:Agent 是一种让 AI 以类似人的工作和思考方式,来完成一系列的任务。一个 Agent 可以是一个 Bot,也可以是多个 Bot 的协同。
由于语言泛化,今天出现了很有趣的现象:「Agent 是什么」,这个问题没有了标准的定义。一个常见的观点是:Agent 是一种让 AI 以类似人的工作和思考方式,来完成一系列的任务。一个 Agent 可以是一个 Bot,也可以是多个 Bot 的协同。
AI竟能精准模拟博士生资格考试?只需将评委的履历和论文输入ChatGPT,就能创建数字形象,模拟面试问题,顺利通过考试。
未来,专家级Agents也许会达到“赢者通吃”的水平。
AGI明年降临?清华人大最新研究给狂热的AI世界泼了一盆冷水:人类距离真正的AGI,还有整整70年!若要实现「自主级智能,需要惊人的10²⁶参数,所需GPU总价竟是苹果市值的4×10⁷倍!
最近AI一直是很火的话题,Deepseek也是一夜爆火,但是实际使用下来发现Deepseek好像和其他大模型一样,并没有什么厉害之处,而且官网经常服务器繁忙。
2021 年年初,我在一个学长的数据公司做投放。这家公司主要是给大厂提供人脸识别标注数据、街道场景标注数据和自然语言标注数据。其中前两个是非常成熟,大厂需求也最多,而自然语言数据需求量几乎说少得可怜。
相比让Alexa重新焕发生机,AI可能会产生的幻觉或只是个小问题。
CMU团队用LCPO训练了一个15亿参数的L1模型,结果令人震惊:在数学推理任务中,它比S1相对提升100%以上,在逻辑推理和MMLU等非训练任务上也能稳定发挥。更厉害的是,要求短推理时,甚至击败了GPT-4o——用的还是相同的token预算!
一贯匆匆的人群罕见地汇聚在了一起,用手机、相机层层包围着一个正在独立行走的人形机器人,不断有人上前靠近打卡。稍后,这个来自深圳当地具身智能企业“众擎”的机器人,凭借灵活自然的行动,让相关视频在社交平台上广为流传,甚至引得英伟达工程师在X平台上感叹,“这是真的吗,还是Sora或者什么生成的?”
OpenManus的星数增长曲线堪称开源项目的"教科书级"案例*在这个被AI工具层层壁垒和邀请码围墙分割的时代,每一次开源的突破都如同黑暗中的曙光。作为一名长期关注AI最新前沿的科技自媒体,我有幸见证并参与了OpenManus这个项目从无到有、从星星之火到燎原之势的全过程。
根据TechCrunch的统计,2024年共有49家初创公司完成了融资轮次,融资金额达到1亿美元或以上。去年有三家公司超过了一轮“超级融资”(mega-round),而七家公司的融资额达到10亿美元或更高。
谷歌发布了1000亿文本-图像对数据集,是此前类似数据集的10倍,创下新纪录!基于新数据集,发现预训练Scaling Law,虽然对模型性能提升不明显,但对于小语种等其他指标提升明显。让ViT大佬翟晓华直呼新发现让人兴奋!
无论是在全国两会会场,还是在西湖大学的教室里,施一公的衣服上总会别着西湖大学的校徽。作为全国政协委员、西湖大学校长,这位科学家也多次将科研与社会问题相结合,递交多份调研报告和建议。
TimeDistill通过知识蒸馏,将复杂模型(如Transformer和CNN)的预测能力迁移到轻量级的MLP模型中,专注于提取多尺度和多周期模式,显著提升MLP的预测精度,同时保持高效计算能力,为时序预测提供了一种高效且精准的解决方案。
近日,人工智能编码助手 Cursor 的开发商 Anysphere 正在与投资者洽谈新一轮融资,估值可能高达 100 亿美元。这一估值较三个月前的交易翻了四倍,但与近期其他知名 AI 初创公司的融资倍数相符,主要基于其收入增长。
AI21Labs 近日发布了其最新的 Jamba1.6系列大型语言模型,这款模型被称为当前市场上最强大、最高效的长文本处理模型。与传统的 Transformer 模型相比,Jamba 模型在处理长上下文时展现出了更高的速度和质量,其推理速度比同类模型快了2.5倍,标志着一种新的技术突破。
本报告分析了过去16小时内在Twitter(X)平台上出现的关于Manus AI的国外用户反馈。通过系统收集和分析多位用户的评论,我们发现Manus AI被广泛视为AI代理领域的重大突破,被多位用户比喻为"AI代理的DeepSeek时刻"。
如日中天的AI,在两会上稳稳占据C位。雷军的“终端标准”、周鸿祎的“安全即服务”、刘庆峰的“算力突围”、齐向东的“纵深防御”……这些大佬们的提案看似分散,实则暗藏一条清晰的主线:
Manus背后公司名为“蝴蝶效应”,真的带火了整个智能体赛道——
一直以来,AI 领域的研究者都喜欢让模型去挑战那些人类热衷的经典游戏,以此来检验 AI 的「智能程度」。
美政府掀起了一阵AI First狂潮,而幕后推手正是科技狂人马斯克。他领衔的DOGE正打造一款AI神器GSAi,要提升政府内部12000名员工的效率,甚至还要开发一款AI编码智能体。一场效率革命,正悄然开启。
随着大模型在长文本处理任务中的应用日益广泛,如何客观且精准地评估其长文本能力已成为一个亟待解决的问题。
想了想,应该有不少读者想看我对 Manus 的评价,还是不偷懒,分享直播实测 8 小时的真实感受。
最近我一头扎进了 MCP 协议的奇妙世界,深入研究后只想说,掌握了它,开发进程真的就像装上了火箭助推器,随时原地起飞!😎
历史上首个能通过双盲同行评审的AI系统Carl诞生了。它是Autoscience研究所的成果,能完成从构思到展示的整个研究过程,撰写的论文已被国际顶会ICLR接受,其能力令人惊叹。
科学和玄学以一种意想不到的方式结合了。
在人工智能一次又一次的“飞跃”背后,究竟是什么在驱动它不断演进?AI演进的灵魂代码藏在哪里?
如果把人工智能的发展趋势向前推演,几乎每个国家、每个公司最终都可能基于美国技术栈或中国技术栈,去构建人工智能技术。
半个月前,Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude 3.7 Sonnet。
人工智能正迎来前所未有的变革,其中,大语言模型(LLM)的崛起推动了智能系统从信息处理向自主交互迈进。