英伟达全模态大模型 Nemotron 3 Nano Omni 来了,几秒搞定老黄3分钟演讲,吞吐量同类9倍
英伟达全模态大模型 Nemotron 3 Nano Omni 来了,几秒搞定老黄3分钟演讲,吞吐量同类9倍英伟达于昨日正式推出全新多模态推理模型Nemotron 3 Nano Omni,将文本、视觉、语音三大模态能力深度融合至单一模型体系,目前可免费使用。
搜索
英伟达于昨日正式推出全新多模态推理模型Nemotron 3 Nano Omni,将文本、视觉、语音三大模态能力深度融合至单一模型体系,目前可免费使用。
SenseNova U1 是商汤最新发布的一个开源的多模态模型,它的 Lite 系列 8B 和 A3B 参数版本,目前已经在 Hugging Face 和 GitHub 上开源。APPSO 也提前拿到了测试资格,我们发现商汤这款新一代原生理解生成统一模型,就开源模型来说,已经做到了最好水平。
今日,腾讯混元开源翻译模型Hy-MT1.5-1.8B-1.25bit。该模型仅0.4G,就实现了33种语言高质量互译,且下载后可直接在手机本地离线运行,翻译表现优于谷歌翻译。这一原始模型的参数规模为1.8B,为降低用户手机内存压力,腾讯混元团队通过量化压缩推出了适配中高性能手机的2-bit、适配全系列手机的1.25-bit两种方案,模型体积分别被压缩至574MB、440MB。
就在刚刚, DeepSeek 上线了识图模式,显示正在灰测中。这意味着讨论了一整年的 DeepSeek 多模态能力,终于来了!目前 DeepSeek 网页版和 App 更新后都有可能被灰测到识图模式,APPSO 第一时间给大家进行了实测。
一个从未生产过任何产品的品牌,被AI认定为"值得推荐"。从注册到上榜,两个小时。这不是故事的开头。这是315晚会上,所有人都看到的那一幕。为了搞清楚当下GEO市场的扑朔迷离,摸清楚那些GEO的坑到底是怎么产生的虚假资质、批量灌稿、数据造假,手法越来越隐蔽,规模越来越工业化。315撕开的那道口子,下面是一整座冰山。
你敢信?一个活在95年前的AI,竟写出了Python代码。GPT之父下场,用2600亿Token炼出了一个「老古董」AI——「talkie」。
Claude Design前脚刚暴击完设计行业,结果后脚自己就被暴击了。出手的是来自中国的Kimi K2.6。什么??你跟我说小克专门为设计推出的工具,竟然没打过Kimi最新通用旗舰模型??
70万行祖传代码,人走了一拨又一拨,烂尾工程停摆三年没人敢碰。直到首席开发者给Claude Code写了份「说明书」,项目两周收工。
腾讯ima最新上线了copilot模式,你可以“领养”一只小熊猫,自由设定人设、性格、说话风格。让它记住你的习惯、你的资料、你做过的事,调教出一个会说话、会干活的专属知识伙伴。
程序员们,先别忙着焦虑 AI 会抢走你的饭碗。现在更该焦虑的,可能是你们的 CTO 和 CFO 了:因为让 AI 写代码,实在太烧钱了。今天(4 月 28 日),GitHub 宣布从 2026 年 6 月 1 日起,GitHub Copilot 将告别“无限畅饮”模式,将 Copilot 从“按请求计费”转为“按使用量计费”。