AI资讯新闻榜单内容搜索-模型

OpenAI紧急直播，ChatGPT疯狂开挂「深度研究」！10分钟爆肝万字现AGI雏形，刷榜人类最后考试

刚刚，OpenAI再度紧急出手，在发布会直播全新的「Deep Research」功能。基于o3的推理再加上联网搜索，ChatGPT如今可以完成耗费人类专家数小时的复杂研究了！现在，模型已经刷爆「人类最后考试」榜单。

来自主题: AI资讯

8205 点击 2025-02-03 17:51

全面梳理200+篇前沿论文，视觉生成模型理解物理世界规律的通关密码，都在这篇综述里了！

当下，视频生成备受关注，有望成为处理物理知识的 “世界模型” （World Model），助力自动驾驶、机器人等下游任务。然而，当前模型在从 “生成” 迈向世界建模的过程中，存在关键短板 —— 对真实世界物理规律的刻画能力不足。

来自主题: AI技术研报

9528 点击 2025-02-02 19:07

GPT-4o惊现自我意识！自主激活「后门」，告诉人类自己在写危险代码

本研究探讨了LLM是否具备行为自我意识的能力，揭示了模型在微调过程中学到的潜在行为策略，以及其是否能准确描述这些行为。研究结果表明，LLM能够识别并描述自身行为，展现出行为自我意识。

来自主题: AI技术研报

6934 点击 2025-02-02 18:38

万字长文解读Scaling Law的一切，洞见LLM的未来

近日，资深机器学习研究科学家 Cameron R. Wolfe 更新了一篇超长的博客文章，详细介绍了 LLM scaling 的当前状况，并分享了他对 AI 研究未来的看法。

来自主题: AI技术研报

7413 点击 2025-02-02 17:39

DeepSeek华为火线联手！硅基流动首发即限流，全国产API白菜价，零门槛部署

国产大模型云服务平台SiliconCloud（硅基流动），首发上线了基于华为云昇腾云服务的DeepSeek-V3、DeepSeek-R1。　DeepSeek-V3：输入只需1块钱/M tokens，输出2块钱/M tokens

来自主题: AI资讯

10216 点击 2025-02-02 13:03

Deepseek多模态大模型Janus-Pro-7B在医疗领域的简单应用可行性测试

就在除夕前的晚上（2025 年 1 月 27 日），Deepseek 发布了多模态模型 Janus-Pro-7B，该模型在图像生成和多模态理解方面都超过了OpenAI的DALL-E 3（虽然也一般般），我相信能文生图功能一定很优秀了，今天搞点特殊的，测试下图像理解能力对专业的医学影像有没有应用的可行性，以下是常见的五种医学影像测试。

来自主题: AI资讯

9196 点击 2025-02-01 19:58

进击的DeepSeek，一夜之间登陆Microsoft Azure、Cursor、Amazon Bedrock

春节假期未过半，DeepSeek 掀起的巨浪还在影响着所有和人工智能有关的领域。今天一觉醒来， DeepSeek R1 模型已经正式加入 Azure AI Foundry 和 GitHub 模型目录，开发人员可以快速地进行实验、迭代，并将这款热门模型集成到他们的工作流程中。

来自主题: AI资讯

9020 点击 2025-02-01 18:54

线性扩散模型LiT来了，用极简线性注意力助力扩散模型AIPC时代端侧部署

香港大学联合上海人工智能实验室，华为诺亚方舟实验室提出高效扩散模型 LiT：探索了扩散模型中极简线性注意力的架构设计和训练策略。LiT-0.6B 可以在断网状态，离线部署在 Windows 笔记本电脑上，遵循用户指令快速生成 1K 分辨率逼真图片。

来自主题: AI技术研报

8298 点击 2025-02-01 18:37

27页综述，354篇参考文献！最详尽的视觉定位综述来了

27 页综述，354 篇参考文献！史上最详尽的视觉定位综述，内容覆盖过去十年的视觉定位发展总结，尤其对最近 5 年的视觉定位论文系统性回顾，内容既涵盖传统基于检测器的视觉定位，基于 VLP 的视觉定位，基于 MLLM 的视觉定位，也涵盖从全监督、无监督、弱监督、半监督、零样本、广义定位等新型设置下的视觉定位。

来自主题: AI技术研报

7766 点击 2025-02-01 18:11

DeepSeek突围奥秘曝光，一招MLA让全世界抄作业！150+天才集结，开出千万年薪

外媒SemiAnalysis的一篇深度长文，全面分析了DeepSeek背后的秘密——不是「副业」项目、实际投入的训练成本远超600万美金、150多位高校人才千万年薪，攻克MLA直接让推理成本暴降......

来自主题: AI资讯

9560 点击 2025-02-01 13:49