Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页
Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页随着AI智能体的爆发,Browser Use异军突起,刚刚融资1700万美元。它能让AI智能体轻松地「读懂」网站并自动完成复杂任务,引领了一波AI应用热潮。
随着AI智能体的爆发,Browser Use异军突起,刚刚融资1700万美元。它能让AI智能体轻松地「读懂」网站并自动完成复杂任务,引领了一波AI应用热潮。
3月24日,从自然资源部获悉,国家海洋环境预报中心联合海洋出版社有限公司和三六零数字安全科技集团有限公司,以360智脑13B和Deepseek-R1-70B大模型为基座成功开发了海洋垂直领域大语言模型——“瀚海智语”(英文名称OceanDS)。
据与两家公司高管交谈的两位人士透露,OpenAI 高管在最近几个月多次与信实工业(Reliance Industries)的高管会面,讨论了潜在的产品和销售合作伙伴关系。
可引导性(steerability)是下一个关键点。你需要扩展问题的定义,或者Agent需要回来提出更多问题。在流程的最后,你要验证结果。
哎!最近推特上的网友在LMSYS Arena 发现了个泄漏的大模型 Nebula,效果据说特别好,打败了o1、o3mini、Claude3.7 Thinking等等模型:网友们通过询问和分析 API,发现这似乎是谷歌正在秘密演练的新推理模型!推测可能是 Google Gemini 2.0 Pro Thinking:
毅伯智算TORA3000性能超H20 1.8倍,FP8优化降本增效。
智元机器人已于近日完成新一轮融资,该轮投资由腾讯领投,另有多家产业方及老股东跟投,包括龙旗科技、卧龙电气、华发集团、蓝驰创投等。据悉,智元机器人将以150亿元的估值接洽新一轮融资。
苹果耳机和手表,也要装上摄像头了。为啥?要更AI。彭博社名记古尔曼接连爆料,苹果打算把AirPods和Apple Watch做成智能穿戴。为了让AI拥有环境感知能力,加装摄像头就成了其中的一个重要环节。
谷歌Gemini迈出关键一步:「睁眼看世界」。用户发现Gemini新增实时屏幕共享功能,能准确识别屏幕上的内容并实时互动;并且可以打开摄像头与物理世界交互,帮用户给釉陶「上色」。
前段时间 AI 成了带货密码,而其中卖得最好的品类之一就是 AI 键盘。
在 2024 年七月的一篇博客文章中,Meta CEO 马克·扎克伯格表示,“出售访问权限”给 Meta 公开可用的 Llama AI 模型“不是 Meta 的商业模式。”
DeepSeek之后,大模型下半场的走向如何?
我发现对于 o1、R1 等推理模型们大家是又爱又恨,
AI的快速发展正引领医疗革命,其中AI辅助诊断是最为核心的环节。
当你想将tool带入一个你无法控制的Agent时,MCP就是有用的。
进入2025年,AI Agent迎来了蓬勃发展的新阶段。
短短2小时的AI辅导换来的是学生考试成绩跃居全国前2%的惊人成果。这种模式不仅释放了学生的时间,更颠覆了教师的角色定位:AI传授知识,教师专注于灵魂引导。Alpha School究竟如何做到的?
ISP芯片越来越被重视,与AI硬件的发展,尤其是AI眼镜离不开关系。
谷歌发言人 Alex Joseph 在给The Verge的电子邮件中证实,谷歌已开始向 Gemini Live 推出新的 AI 功能,使其能够看到你的屏幕或通过你的智能手机摄像头回答有关实时问题。
3月20日,丹麦制药巨头诺和诺德执行副总裁兼首席科学官Marcus Schindler在Linkedin发布了关于诺和诺德的研发组织架构调整的消息。Marcus Schindler还提到,大数据和人工智能将成为我们科学工作的核心,使我们能够加深对疾病的理解并做出明智的决定。这些变化不仅使我们能够快速创新,而且还缩短了从不确定到确定的路径,减少了周期时间和成本,同时增加了我们成功的可能性。
在 3 月初宣布AI 增强版 Siri 跳票之后,苹果股价单日暴跌 4.85%,创下两年半来的最大跌幅,各种负面评论更是足足刷屏了两周。3 月 21 日,彭博社爆料称,苹果 CEO 蒂姆·库克已经对目前的 AI 团队失去了信心,并更换了 AI 团队的负责人——现在由 Mike Rockwell 负责,他之前是 Apple Vision Pro 团队的关键人物。
先上一张图,这是一组 AI 生成视频的封面,如果你看到这些图片就已经感到不适,再细想一下,这要是你随手下滑,自动播放的短视频呢?
最新一期TED采访中,奥特曼重申对OpenAI率先发布AGI的信念,并称没有多少人会关心。全程45分钟,他还重点分享了自己对AI未来的独特看法。
清华智能产业研究院(AIR)博三在读,去年六月份,出于对语言模型 LLM 的强烈兴趣,加入了字节 as Top Seed Intern,在人工智能的最前沿进行探索。刚好这个话题和我现在做的工作强相关,我分享一下自己的观点和亲身体验。
2024 年 9 月,我们第一次去 Haivivi 北京办公室和 CEO 李勇见面。在交谈的两小时里,他不断被会议室外的员工提醒看手机。
研究发现,LLM在创作梗图时表现出惊人的幽默感与创造力,甚至超越了人类创作者!AI创作的梗图评分更高,但最具灵魂的作品仍来自人类。
国产厨电龙头老板电器出品的全球首个烹饪大模型「食神」升级,不光接入了DeepSeek,还拓展了多模态。像推荐菜谱、指导烹饪已经是常规操作。在此基础上,它还能一眼看出你的健康状况——通过面部识别、分析体检报告,生成长期的健康膳食计划。
如今,哈佛斯坦福这类顶尖名校的中国毕业生,开始向DeepSeek等中国AI公司疯狂投简历了!与此同时,美国众议院则被曝出直接质问斯坦福、CMU等六所大学:为何招收如此多中国学生参加STEM项目?并且要求上交所有中国学生信息。
做表情包一度是很多文生图、文生视频应用的场景。Pika在去年就靠魔法猫,在国外出圈了一把。
3 月份发布的 Manus,让大众第一次感受到了 Agent 的强大。