
DeepSeek-R1持续震撼硅谷:跻身竞技榜前三,创始人梁文锋采访被“拿放大镜”看
DeepSeek-R1持续震撼硅谷:跻身竞技榜前三,创始人梁文锋采访被“拿放大镜”看“神秘东方力量”DeepSeek给硅谷带来的影响,还在不断泛起涟漪——刚刚,DeepSeek-R1跻身大模型竞技榜前三。以开源、便宜20倍的“身价”与ChatGPT-4o(2024.11.20)并列。
“神秘东方力量”DeepSeek给硅谷带来的影响,还在不断泛起涟漪——刚刚,DeepSeek-R1跻身大模型竞技榜前三。以开源、便宜20倍的“身价”与ChatGPT-4o(2024.11.20)并列。
论文一作刘少腾,Adobe Research实习生,香港中文大学博士生(DV Lab),师从贾佳亚教授。主要研究方向是多模态大模型和生成模型,包含图像视频的生成、理解与编辑。作者Tianyu Wang、Soo Ye Kim等均为Adobe Research Scientist。
本周,在阿里云通义千问 Qwen 团队提交的一篇论文中,研究人员发现了目前最热门的 MoE(混合专家模型)训练中存在的一个普遍关键问题,并提出一种全新的方法——通过轻量的通信将局部均衡放松为全局均衡,使得 MoE 模型的性能和专家特异性都得到了显著的提升。
全网最“主观”的AI产品榜单。前些日子,全球顶级 VC a16z 发布了一份相当有趣的 AI 产品榜单,本次榜单并不是按照网站流量或收入等硬性指标来收录产品的,而是邀请了 24 位 AI 行业的从业者,每人选择本年度自己最喜欢的 3 款 AI 产品,并给出了评价。
视觉版o1的初步探索,阶跃星辰&北航团队推出“慢感知”。研究人员认为:1)目前多模领域o1-like的模型,主要关注文本推理,对视觉感知的关注不够。2)精细/深度感知是一个复杂任务,且是未来做视觉推理的重要基础。
最近,妙鸭相机在新年之际有了新动作——上线 2.0 版本,支持「拍」Live 动态写真。时隔一年半,它能再次掀起水花吗?
今天的一条知乎热搜让人惊了:国内某双非名校计算机学院24届本科生就业率,还不足50%?一届学生里大半人毕业就失业,CS就业竟遭遇寒冬。而业内人士表示,高校的疯狂扩招和大模型的火爆,早就让CS普本就业进入地狱模式了。
Meta这次真的坐不住了,计划在AI上继续加码!匿名员工爆料,黑马DeepSeek的出现,让Llama 4还未发布就已经落后,Meta慌了。
本周三,各路媒体对英伟达 GeForce RTX 5090 的评测宣告解禁。基于最新 Blackwell 架构,新一代旗舰显卡无疑将成为未来几年你能买到的最好的显卡。
随着大模型(LLMs)的发展,AI 写作取得了较大进展。然而,现有的方法大多依赖检索知识增强生成(RAG)和角色扮演等技术,其在信息的深度挖掘方面仍存在不足,较难突破已有知识边界,导致生成的内容缺乏深度和原创性。
非营利研究机构AI2近日推出的完全开放模型OLMo 2,在同等大小模型中取得了最优性能,且该模型不止开放权重,还十分大方地公开了训练数据和方法。
近日中国AI大模型“六小虎”之一的智谱,管理层发生了以下变动:前Midjourney亚洲副总裁王玥婷加入智谱,主要负责多模态产品和市场;智谱首席战略官张阔、副总裁曲滕于近日离职。
要花1450元才能玩到Operator,让本来满满期待的大伙,一下难受住了。而交了钱的各位,开始兴奋的晒出各种测试结果。有网友分享,Operator通过浏览网页在3分钟之内帮打找到了附近牙医诊所,回报了地址和电话。
我宣布,今年除夕夜拿春晚当BGM,但手里正儿八经真正在做的事,已经有了!
「星际之门」更多内幕被曝光了!据称,首期投入1000亿美金,将在德州阿比林建设10座数据中心,未来要在全美打造20个超算。与此同时,奥特曼秀出了首期工厂的全景,无比震撼。
一个5000亿美元的大动作,让微软不再是OpenAI独家云计算供应商了。
Decagon 专注于 AI for Customer Support 领域,致力于用 AI Agent 彻底改变客户服务体验。他们打造的不是简单的聊天机器人,而是能不断进化的 AI Agent 引擎,能够真正理解客户的需求并高效地解决问题。
问题:何时我们会见到,第一个 AI 经营的商业实体? 答:今年,在中国
AI智能体正悄然成为我们工作和生活中的得力助手。从自动化任务到复杂规划,它们不仅能帮我们做市场调研、准备面试,还能完成复杂的决策任务。
它可以模仿人类研究者调用搜索引擎、看论文、查参考文献。繁琐冗长的论文调研,现在,只需要两分钟。
瞄准推理时扩展(Inference-time scaling),DeepMind新的进化搜索策略火了! 所提出的“Mind Evolution”(思维进化),能够优化大语言模型(LLMs)在规划和推理中的响应。
OpenAI的新Scaling Law,含金量又提高了。
苏格拉底曾提到的门诺悖论(Meno's paradox)认为,人只能学会自己已经知道的事情;而关于AI辅助编程,谷歌资深工程师最近的一篇博客告诉我们,类似的知识悖论同样存在。
OpenAI 在 “双十二” 发布会的最后一天公开了 o 系列背后的对齐方法 - deliberative alignment,展示了通过系统 2 的慢思考能力提升模型安全性的可行性。
未来,掌握持续提示工程技术的开发者,将主导下一代智能系统的进化方向。
OpenAI超级智能体,竟被中国公司抢发?智谱率先卷入L3级使用工具能力,发布全球首个面向公众、回车即用的电脑智能体GLM-PC。
新年第一天,陈天奇团队的FlashInfer论文出炉!块稀疏、可组合、可定制、负载均衡......更快的LLM推理技术细节全公开。
由无问芯穹与上海交通大学联合研究团队提出的视频生成软硬一体加速器,首次实现通过差分近似和自适应数据流解决 VDiT 生成速度缓慢瓶颈,推理速度相比 A100 提升高达 16.44 倍。
我最近发现,秘塔 AI悄悄上线了一个「阅读模式」,在手机上读PDF体验非常爽,虽然不是大功能,就是那种会让你觉得用了很舒服的小细节。
动辄4600家参展商,2025的CES(国际消费类电子产品展览会)已全数AI。在此次会上,为人熟知的硬/软件产品悉数登场。其中,陪伴类、耳机和眼镜类产品同台竞技。在这个同台竞技的场景里,出现了一个始料未及的副作用:各家项目的信息不对称被拉齐了。这可能并不是一件好事:因为,一些本来看似在去年一整年想明白的事情,再次成为争论的话题。