AITNT-让一部分人先用AI实现商业化

AI资讯-这里有最及时全面的人工智能资讯报道

AI技术研报-这里有最前沿的人工智能技术解读

AI监管政策-这里有最深刻的人工智能政策解读

AI产品测评-这里有最详细的人工智能工具测评解析

AI商业项目-这里有洞察力最强的AI项目的商业逻辑解析

AI排行榜-这里有最新的AI产品,大模型等人工智能行业的排行榜单

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
最新文章
1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

DeepSeek啥都开源了,就是没有开源训练代码和数据。现在,开源RL训练方法只需要用1/30的训练步骤就能赶上相同尺寸的DeepSeek-R1-Zero蒸馏Qwen。

来自主题: AI技术研报
7725 点击    2025-02-22 21:30
DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT

DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT

DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT

OpenAI o1和DeepSeek-R1靠链式思维(Chain-of-Thought, CoT)展示了超强的推理能力,但这一能力能多大程度地帮助视觉推理,又应该如何细粒度地评估视觉推理呢?

来自主题: AI技术研报
7843 点击    2025-02-22 21:27
10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文实锤涌现

10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文实锤涌现

10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文实锤涌现

不到10美元,3B模型就能复刻DeepSeek的顿悟时刻了?来自荷兰的开发者采用轻量级的RL算法Reinforce-Lite,把复刻成本降到了史上最低!同时,微软亚研院的一项工作,也受DeepSeek-R1启发,让7B模型涌现出了高级推理技能。

来自主题: AI技术研报
5934 点击    2025-02-22 15:50
YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世

YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世

YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世

YOLO 系列模型的结构创新一直围绕 CNN 展开,而让 transformer 具有统治优势的 attention 机制一直不是 YOLO 系列网络结构改进的重点。这主要的原因是 attention 机制的速度无法满足 YOLO 实时性的要求。

来自主题: AI技术研报
7991 点击    2025-02-22 14:14
一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

在大语言模型领域中,预训练 + 微调范式已经成为了部署各类下游应用的重要基础。在该框架下,通过使用搭低秩自适应(LoRA)方法的大模型参数高效微调(PEFT)技术,已经产生了大量针对特定任务、可重用的 LoRA 适配器。

来自主题: AI技术研报
6764 点击    2025-02-22 13:57
抖音试水AI分身,背后透露了什么信号?

抖音试水AI分身,背后透露了什么信号?

抖音试水AI分身,背后透露了什么信号?

当流量增长趋于平缓,运营效率就是新的增长曲线。

来自主题: AI资讯
5675 点击    2025-02-22 13:33
牵手顶级大三甲,华为的AI医疗野心藏不住了!

牵手顶级大三甲,华为的AI医疗野心藏不住了!

牵手顶级大三甲,华为的AI医疗野心藏不住了!

2月18日,上海交通大学医学院附属瑞金医院举办了“2025医疗人工智能与精准诊疗发展论坛”,瑞金医院携手华为共同发布瑞智病理大模型RuiPath。

来自主题: AI资讯
8221 点击    2025-02-22 13:20
生物版 Deepseek 来了!史上最大开源 AI 生物学模型,400 亿参数引爆学界

生物版 Deepseek 来了!史上最大开源 AI 生物学模型,400 亿参数引爆学界

生物版 Deepseek 来了!史上最大开源 AI 生物学模型,400 亿参数引爆学界

生物学大模型又迎新里程碑!2025 年 2 月 19 日,来自 Arc Institute、英伟达、斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的科学家们,联合发布了生物学大模型 Evo2。

来自主题: AI资讯
7728 点击    2025-02-22 11:54
降价到三四千元,宇树科技要用小米模式让机器狗普及?

降价到三四千元,宇树科技要用小米模式让机器狗普及?

降价到三四千元,宇树科技要用小米模式让机器狗普及?

已在机器狗(四足机器人)行业占据主导地位的宇树科技,打算实现更伟大的目标——将机器狗的价格降低至三四千元,让每个人都买得起。

来自主题: AI资讯
6682 点击    2025-02-22 10:49
全网首发|一手内测字节OmniHuman-1,这就是当今最强的AI数字人。

全网首发|一手内测字节OmniHuman-1,这就是当今最强的AI数字人。

全网首发|一手内测字节OmniHuman-1,这就是当今最强的AI数字人。

半个月前,字节的OmniHuman-1模型在全球的AI圈,都掀起了巨浪。可能有些朋友不知道这是个啥,我大概通俗易懂的解释一下 一张图+一段音频,就能生成超逼真的唇形同步AI视频。

来自主题: AI资讯
7724 点击    2025-02-22 10:44
字节调整AI部门Seed,刚从Gemini加盟的吴永辉成新负责人

字节调整AI部门Seed,刚从Gemini加盟的吴永辉成新负责人

字节调整AI部门Seed,刚从Gemini加盟的吴永辉成新负责人

多位接近字节的人士对硅星人透露,字节的AI核心部门Seed正在快速调整定位和调兵遣将。刚刚从谷歌加入字节跳动的AI大牛、参与了Gemini开发的Google Fellow吴永辉博士,将成为Seed新的负责人,替换原LLM团队及Seed总负责人朱文佳,团队内部正在梳理调整汇报关系。

来自主题: AI资讯
7753 点击    2025-02-22 10:26
AI教育的“诺曼底时刻”:DeepSeek如何重塑教育生态?

AI教育的“诺曼底时刻”:DeepSeek如何重塑教育生态?

AI教育的“诺曼底时刻”:DeepSeek如何重塑教育生态?

“你家娃的寒假作业搞定了吗?”眼瞅着假期余额不足,家长们又开始在朋友圈里哀嚎:“作业还没写完!”没错,一年一度的“赶作业大战”又上演了,只不过今年,剧情有点不一样——娃们不再抓耳挠腮、苦哈哈地熬夜赶工,而是悄悄掏出了“神器”:DeepSeek等AI工具!

来自主题: AI资讯
6739 点击    2025-02-22 10:23
关于DeepSeek部署的一切,都在这里

关于DeepSeek部署的一切,都在这里

关于DeepSeek部署的一切,都在这里

DeepSeek-R1及其蒸馏版本模型突破了AI Reasoning和大规模AI性能的新基准,其中DeepSeek-R1-Zero和DeepSeek-R1,已经在推理和问题求解上树立了新的标准。本次研究聚焦于如何利用已有的机器进行模型部署,使用这些先进的模型进行开发和研究。

来自主题: AI技术研报
9207 点击    2025-02-21 18:06
「卖铲子」也疯狂!美国「DeepSeek概念」AI初创,估值达33亿美元

「卖铲子」也疯狂!美国「DeepSeek概念」AI初创,估值达33亿美元

「卖铲子」也疯狂!美国「DeepSeek概念」AI初创,估值达33亿美元

美国AI云服务商Together AI宣布完成3.05亿美元B轮融资,估值高达33亿美元!该公司押注开源模型,提供包括DeepSeek-R1在内的200多个模型API服务,并出租GPU算力,年收入已超1亿美元。

来自主题: AI资讯
6110 点击    2025-02-21 16:35
速递|00后创办的AI招聘,融资1亿美元,估值20亿美元

速递|00后创办的AI招聘,融资1亿美元,估值20亿美元

速递|00后创办的AI招聘,融资1亿美元,估值20亿美元

Mercor,由三位 21 岁的 Thiel Fellows 创办的人工智能招聘初创公司,已在 B 轮融资中筹集了 1 亿美元,公司向 TechCrunch 确认了这一消息。

来自主题: AI资讯
9147 点击    2025-02-21 16:29
蚕食人类权力不用AGI降临!「温水煮青蛙」足以让AI渐进式失控

蚕食人类权力不用AGI降临!「温水煮青蛙」足以让AI渐进式失控

蚕食人类权力不用AGI降临!「温水煮青蛙」足以让AI渐进式失控

随着人工智能的加速发展,我们常常担心AI会突然失控、超越人类控制。然而,最新研究指出,这种「突然失控」的场景或许并非最令人担忧的;AI在各个领域逐步取代人类,导致人类权力和影响力的缓慢流失,可能才是更隐蔽、更难以应对的渐变式风险。

来自主题: AI技术研报
4806 点击    2025-02-21 16:24
英伟达、Karpathy押注,Lambda如何成为 AI 开发者的“算力救世主”?

英伟达、Karpathy押注,Lambda如何成为 AI 开发者的“算力救世主”?

英伟达、Karpathy押注,Lambda如何成为 AI 开发者的“算力救世主”?

在AI计算资源日益稀缺的时代,Lambda凭借其独特的云GPU解决方案迅速崛起,成为资本市场的宠儿。最近,这家成立于2012年的AI云计算公司宣布完成4.8亿美元D轮融资,累计融资额达到8.63亿美元,跻身AI创投榜云科技赛道第二位,仅次于Coreweave。此次投资阵容强大,包括英伟达、AI技术大牛Andrej Karpathy,以及和硕、超微、纬创、纬颖等行业巨头的战略入股。

来自主题: AI资讯
8022 点击    2025-02-21 16:19
杭州95后学霸坐C位,Grok 3登顶App Store!Hinton高徒、多伦多华人博士领衔

杭州95后学霸坐C位,Grok 3登顶App Store!Hinton高徒、多伦多华人博士领衔

杭州95后学霸坐C位,Grok 3登顶App Store!Hinton高徒、多伦多华人博士领衔

官宣免费后,Grok火速登顶美区App Store榜首,同时,xAI也放出官方博文,秀了一把模型的数学、代码、ASCII Art演示。最引人瞩目的两位C位华人,均来自多伦多大学,分别和Hinton、Bengio有交集。

来自主题: AI技术研报
5938 点击    2025-02-21 16:17
谷歌超硬核教科书来了!Jeff Dean带货揭Gemini训练秘籍:在TPU上scaling

谷歌超硬核教科书来了!Jeff Dean带货揭Gemini训练秘籍:在TPU上scaling

谷歌超硬核教科书来了!Jeff Dean带货揭Gemini训练秘籍:在TPU上scaling

谷歌团队发布LLM硬核技术教科书,从「系统视图」揭秘LLM Scaling的神秘面纱。Jeff Dean强调书中藏着谷歌最强AI模型Gemini训练的更多信息。

来自主题: AI技术研报
9294 点击    2025-02-21 15:52
大模型扩展新维度:Scaling Down、Scaling Out

大模型扩展新维度:Scaling Down、Scaling Out

大模型扩展新维度:Scaling Down、Scaling Out

近年来, Scaling Up 指导下的 AI 基础模型取得了多项突破。从早期的 AlexNet、BERT 到如今的 GPT-4,模型规模从数百万参数扩展到数千亿参数,显著提升了 AI 的语言理解和生成等能力。然而,随着模型规模的不断扩大,AI 基础模型的发展也面临瓶颈:高质量数据的获取和处理成本越来越高,单纯依靠 Scaling Up 已难以持续推动 AI 基础模型的进步。

来自主题: AI技术研报
9296 点击    2025-02-21 15:43
那么多接入 DeepSeek 的,终于有一家支持 Function Call 了!!!

那么多接入 DeepSeek 的,终于有一家支持 Function Call 了!!!

那么多接入 DeepSeek 的,终于有一家支持 Function Call 了!!!

众所周知,目前 DeepSeek R1 有一个很大的痛点是不支持 Function Call 的。GitHub 上有许多开发者都表达了这一诉求。

来自主题: AI技术研报
7475 点击    2025-02-21 15:39
使用 ChatGPT 新功能 Deep Research 后,谈谈它会带来的影响

使用 ChatGPT 新功能 Deep Research 后,谈谈它会带来的影响

使用 ChatGPT 新功能 Deep Research 后,谈谈它会带来的影响

知名博主 Ben Thompson 在使用 Deep Research 后写的一篇 Deep Research and Knowledge Value[1],谈到了在信息搜索上带来的价值。

来自主题: AI资讯
8278 点击    2025-02-21 15:14
如何完美解锁DeepSeek-R1的结构化输出能力(基于LangChain)?

如何完美解锁DeepSeek-R1的结构化输出能力(基于LangChain)?

如何完美解锁DeepSeek-R1的结构化输出能力(基于LangChain)?

DeepSeek-R1这样的推理模型有着强大的深度思考能力,但也有着一些不同于通用模型的特点与用法,比如不支持函数调用,不支持结构化输出,o1甚至不支持系统提示(System Prompt)等。尽管这和它们的使用场景有关,但有时也会带来不便。今天我们就来说说结构化输出这个常见的问题。

来自主题: AI技术研报
8275 点击    2025-02-21 15:03
AITNT-国内领先的一站式人工智能新闻资讯网站 AITNT-国内领先的一站式人工智能新闻资讯网站