
Manus、OpenAI Deep Research 20个用例大横评,通用Agent抛弃奥特曼了。。。吗?
Manus、OpenAI Deep Research 20个用例大横评,通用Agent抛弃奥特曼了。。。吗?Manus从第一个通用Agent变成了第一款自媒体比技术从业者先发现和评测的AI产品,评论好坏掺半。最明显的两个观点是效果虚假,没有技术报告,很多好的Agent已经能做到这一点和如何那么厉害的话,为什么英文媒体们没有报道。
Manus从第一个通用Agent变成了第一款自媒体比技术从业者先发现和评测的AI产品,评论好坏掺半。最明显的两个观点是效果虚假,没有技术报告,很多好的Agent已经能做到这一点和如何那么厉害的话,为什么英文媒体们没有报道。
思维链引发的战争。
英国初创公司 Quantexa 凭借其采用人工智能和数据分析的企业平台,多年来在打击洗钱和欺诈方面声名鹊起。
大家好,很高兴在这里向各位介绍我们的产品 Free QWQ。这是世界上第一个完全免费、无限制、无需注册登录的分布式 AI 算力平台,基于 QwQ 32B 大语言模型提供强大的 AI 服务。
生成式AI正重塑众多行业格局!传统搜索、网站与自由开发者、教育科技等行业受到冲击。AI对行业变革又有哪些推动作用?答案就在报告中。
从今天这个视角来看,DeepSeek 等国内外大模型能力是越来越强大了,大家都说 2025 年 AI 应用还会持续爆发。但对于企业来说,有了大模型,那场景都有啥,应用又长啥样?
中国互联网公司正集体迎来资产重估,科技是最根本的推力。最近一家强调科技的巨头是美团。
起猛了,DeepSeek开口说话了。而且是超低延迟实时秒回,还可以随时打断的那种,先来看一段VCR:DeepSeek以及其他任意大模型接入这样的高质量对话引擎,全程只需要两行代码。
继DeepSeek 之后,一款由国内开发的通用AI Agent产品也引发热议——
最新开源的视觉预训练方法,马毅团队、微软研究院、UC伯克利等联合出品!
Mistral AI,这家法国公司是 AI 助手 Le Chat 和多个基础模型背后的力量组成,被官方视为法国最有前途的科技初创企业之一,且可以说是能与 OpenAI 竞争的欧洲公司。然而,与其 60 亿美元的估值相比,其全球市场份额仍相对较低。
当你凝视AI,AI也在凝视你。
世界第一台合成生物智能生物计算机诞生了!人类神经元直接集成到硅片上,能编程,甚至还能活体计算。这台计算机也为碳基正名:硅基计算并非天生优越!
杜克大学计算进化智能中心的最新研究给出了警示性答案。团队提出的 H-CoT(思维链劫持)的攻击方法成功突破包括 OpenAI o1/o3、DeepSeek-R1、Gemini 2.0 Flash Thinking 在内的多款高性能大型推理模型的安全防线:在涉及极端犯罪策略的虚拟教育场景测试中,模型拒绝率从初始的 98% 暴跌至 2% 以下,部分案例中甚至出现从「谨慎劝阻」到「主动献策」的立场反转。
「即便最终赢家不是它,它也足够意义重大。」一位 LAM 产品经理这样评价 Manus AI 的行业价值。
32B小模型在超硬核「时间线索」推理谜题中,一举击败了o1、o3-mini、DeepSeek-R1,核心秘密武器便是GRPO,最关键的是训练成本暴降100倍。
随着 DeepSeek-R1 的流行与 AI4Math 研究的深入,大模型在辅助形式化证明写作方面的需求日益增长。作为数学推理最直接的应用场景,形式化推理与验证(formal reasoning and verification),也获得持续关注。
助力半导体激光芯片国产化。
晚上大聪明和阿文分别直播Manus的使用,看得我口水横流,于是尝试着找张涛问一下有没有码(都骚扰他两天了),半小时后塞给了我一个,于是,大概是福建省第一个manus用户诞生了(这里需要锣鼓喧天);
自媒体的反应堪称狂热:“通用Agent终于实现了!”“这是继DeepSeek之后的又一技术革命!”这样夸张的赞誉随处可见。从Benchmark来看,它的表现确实非常亮眼,在GAIA测试中超越了之前的各种Agent以及OpenAI的DeepResearch。
Manus居然成功火到国外了,内销转出口了?今天开始,在X和Reddit上的外国网友中,Manus的讨论声量开始变大了!拿到邀请码的歪果网友实测后赞叹:Manus太好用了。而各种开源复现项目也如雨后春笋一般冒出,人气持续爆棚。
要做「AI编程助手界的Waymo」
随着AI社交类应用在Z世代年轻人中的广泛流行,线上情绪陪伴的价值逐渐被深入挖掘。随时随地开启对话,句句有回应,事事不失联,给不少人都带来了心灵慰藉与个性化的情感支持。
短短六个月,面向消费者的生成式 AI 市场已发生翻天覆地的变化。一些产品迅速崭露头角,另一些却止步不前,还有意外的黑马一跃成为行业领跑者。
打开一个搜索框,用大白话一股脑把你开店做生意的想法说出来。
前些天,字节跳动的 AI IDE 产品 Trae 上线了国内版本,其具备「中文语境深度适配 + 全功能免费开放」的双重杀手锏,一上线就收获了不少支持者。全网一片夸赞,很少能看见批评的声音。
AI研究智能体全新升级!Meta等推出MLGym,一个专门用于评估和开发LLM智能体的Gym环境。MLGym提供了标准化的基准测试,让LLM智能体在多任务挑战中展现真正实力。
模型即产品?
CVPR 2025,混合新架构MambaVision来了!Mamba+Transformer混合架构专门为CV应用设计。MambaVision 在Top-1精度和图像吞吐量方面实现了新的SOTA,显著超越了基于Transformer和Mamba的模型。
美国硅谷的华裔精英们远不止他们......