AI资讯新闻榜单内容搜索-3

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 3
非凡访谈丨大过年的,聊聊反诈——2016年的百度T9为何创业做AI风控智能体

非凡访谈丨大过年的,聊聊反诈——2016年的百度T9为何创业做AI风控智能体

非凡访谈丨大过年的,聊聊反诈——2016年的百度T9为何创业做AI风控智能体

花名欧冶子,同济本科、北大硕士,08年毕业后进入建行总行从事应用架构和安全架构管理工作;16年加入百度,任主任架构师(T9),兼百度云技术部TC主席,是百度飞桨AI Studio第一任产品经理;18年加入贝壳找房,任高级总监,从零搭建贝壳找房的信息安全和业务风险治理体系;23年初创立欧冶科技,23年8月获得苹果资本天使轮融资,目前PreA轮融资进行中,由非凡资本服务。

来自主题: AI资讯
6123 点击    2025-01-31 14:19
Meta微软发关键财报,市场都在问DeepSeek

Meta微软发关键财报,市场都在问DeepSeek

Meta微软发关键财报,市场都在问DeepSeek

科技巨头Meta和微软相继公布了各自截至12月31日的最新季度财报。

来自主题: AI资讯
6393 点击    2025-01-31 12:56
ModernBERT 为我们带来了哪些启示?

ModernBERT 为我们带来了哪些启示?

ModernBERT 为我们带来了哪些启示?

当谷歌在 2018 年推出 BERT 模型时,恐怕没有料到这个 3.4 亿参数的模型会成为自然语言处理领域的奠基之作。

来自主题: AI技术研报
8294 点击    2025-01-31 12:34
Fullmoon 可以在完全断网的情况下在苹果手机上使用AI 大语言模型

Fullmoon 可以在完全断网的情况下在苹果手机上使用AI 大语言模型

Fullmoon 可以在完全断网的情况下在苹果手机上使用AI 大语言模型

1月13日Mainframe公司发布了可以离线运行在苹果系统(Mac,iPad,iPhone)的本地大语言模型fullmoon: local intelligence

来自主题: AI资讯
5900 点击    2025-01-30 18:05
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

2025 年伊始,全球 AI 业界被 DeepSeek 刷屏。当 OpenAI 宣布 5000 亿美元的「星际之门」计划,Meta 在建规模超 130 万 GPU 的数据中心时,这个来自中国的团队打破了大模型军备竞赛的既定逻辑:用 2048 张 H800 GPU,两个月训练出了一个媲美全球顶尖水平的模型。

来自主题: AI资讯
6027 点击    2025-01-30 14:58
梁文锋就是AI界的黄峥

梁文锋就是AI界的黄峥

梁文锋就是AI界的黄峥

梁文锋带领着DeepSeek,还在继续搅动大模型行业。继用R1模型炸场之后,1月28日凌晨,除夕夜前一晚,DeepSeek又开源了其多模态模型Janus-Pro-7B,宣布在GenEval和DPG-Bench基准测试中击败了DALL-E 3(来自 OpenAI)和Stable Diffusion。

来自主题: AI资讯
7193 点击    2025-01-30 12:40
“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗?

“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗?

“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗?

硬件媒体Tom‘s Hardware带来开年最新热议:DeepSeek甚至绕过了CUDA,使用更底层的编程语言做优化。这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自主题: AI资讯
8365 点击    2025-01-29 12:45
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏

昨晚,杭州大模型又双叒不睡,给大伙儿拜年啦~就在春晚直播进行时,阿里通义Qwen发布新春节礼第三弹:Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。

来自主题: AI资讯
6052 点击    2025-01-29 12:40
超全推理语言模型蓝图来了!揭开o1、o3、DeepSeek-V3神秘面纱

超全推理语言模型蓝图来了!揭开o1、o3、DeepSeek-V3神秘面纱

超全推理语言模型蓝图来了!揭开o1、o3、DeepSeek-V3神秘面纱

ETH Zurich等机构提出了推理语言模型(RLM)蓝图,超越LLM局限,更接近AGI,有望人人可用o3这类强推理模型。

来自主题: AI技术研报
7043 点击    2025-01-28 12:20
滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型:7B超越DALL-E 3和StableDiffusion

滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型:7B超越DALL-E 3和StableDiffusion

滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型:7B超越DALL-E 3和StableDiffusion

DeepSeek大爆出圈,现在连夜发布新模型——多模态Janus-Pro-7B,发布即开源。在GenEval和DPG-Bench基准测试中击败了DALL-E 3和Stable Diffusion。

来自主题: AI资讯
10226 点击    2025-01-28 10:54