
长链推理表象下,大模型精细表征张冠李戴的本质
长链推理表象下,大模型精细表征张冠李戴的本质近些年,大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始,到 2022 年底的 GPT-3,再到现在国内外大模型的「百模争锋」,DeepSeek 异军突起,各类大模型应用层出不穷。
近些年,大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始,到 2022 年底的 GPT-3,再到现在国内外大模型的「百模争锋」,DeepSeek 异军突起,各类大模型应用层出不穷。
大语言模型(LLM)在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力,比如 OpenAI 的 o1 系列。
号称地表最强的M3 Ultra,本地跑满血版DeepSeek R1,效果到底如何?
224张GPU,训出开源视频生成新SOTA!Open-Sora 2.0正式发布。 11B参数规模,性能可直追HunyuanVideo和Step-Video(30B)。
四个月前,我们采访了 Chat2DB 创始人姬朋飞,文章里讲述了他从大厂离职后的创业历程。而最近 Cha2DB 针对 SQL 开发者的普遍痛点,发布了全新的 3.0 版本。
“大模型未来一定会经历几轮大的技术范式迭代。但比拼商业化能力,是足够确定的事。”
Anthropic 昨晚发布了他们最新的 Claude 3.7 Sonnet 混合推理模型,并在官网同步更新了 Claude 3.7 的系统提示词。
3月12日,华尔街见闻获悉,原字节跳动AI大将、火山引擎高管骆怡航于近日加入生数科技,担任CEO一职。去年底,字节TikTok算法负责人陈志杰也被曝出离职创业。
在当今数字产品设计领域,动画已不再是锦上添花,而是提升用户体验的关键要素。然而,对于大多数设计师来说,创建高质量的交互动画一直是一项挑战 —— 传统动画工具如 Adobe After Effects 或 Rive 不仅学习曲线陡峭,而且价格不菲。
在 AI 时代,图形界面融合了自然语言会话等多通道交互,演变出新的形态。当意图、角色、会话这一切无形的体验规则被确定之后,它们最终也将承载于具体的界面之上。无形的体验融入到有形的体验之中,在这一部分里,我们提出的 Hybrid UI 正是要定义界面这一有形的体验,保障好 AI 产品体验的最后一道门槛。
Meta此举,或是要证明他们大规模投资AI基础设施不是在蛮干。
都说通用大模型轻松拿捏翻译,结果有人来掀桌了。
AI工业3D设计领域,还存在着无限的想象空间。
“发财了,一个视频回本,收益300多。”一位群友在群里发布了自己的视频号截图。另一位群友不语,只是发布了自己同话题的视频,显示收益800多。
当彩票遇上AI,中奖的诱惑被放大,也成了一场围猎彩民的精心骗局。
近日,记者发现,国内权威医疗大模型评测平台MedBench在官网更新了榜单。多个医疗AI产品及研究团队入榜,其中蚂蚁AI健康管家团队研发的蚂蚁医疗大模型以评测榜单97.5、自测榜单98.2的高分再度夺得双料冠军。
跑得快、长得可爱、能爬山,机器狗比真狗品种还要五花八门。
开年以来,DeepSeek的梁文锋、Manus的肖弘,成为中国AI圈冉冉升起的新星。培养他们的母校浙江大学和华中科技大学也一并沾光。
在实际应用过程中,闭源模型(GPT-4o)等在回复的全面性、完备性、美观性等方面展示出了不俗的表现。
去年的诺贝尔奖梅开二度,两次颁给了AI相关领域,让所有人惊讶于AI4science的潜力。然而近日密西根大学的一项覆盖16万篇文献的大规模研究指出,AI和科学的结合仍存在错位。
Sakana AI刚刚官宣,第二代「AI科学家」独立完成论文,通过了ICLR 2025 Workshop的同行评审。这是首次完全由AI端到端生成的科学论文,获得了学术高度认可。
近日,北京大学智能学院袁晓如课题组在中国古籍内容的智能探索方面开展跨学科合作探索取得重要进展。研究通过智能自动分类机制,从大量中国古籍中提取可视化图像,建立大规模中国古代可视化集合
网易有道这个老牌翻译厂商出的AI大模型子曰翻译2.0,居然吊打了一切。。。说说我们是怎么测大模型的翻译评测这块的。测试的维度也很简单,就从我平常受到的折磨体验出发,梳理出了2点。
今天,外媒披露了谷歌在美国大模型独角兽Anthropic中的持股细节。相关文件显示,谷歌数年来累计对Anthropic注资30亿美元(约合人民币217亿元),换取了后者14%的股份。令人意外的是,这些投资并未让谷歌在Anthropic的运营中享有过多的话语权,但谷歌仍计划在今年9月以可转债的形式再追加7.5亿美元(约合人民币54亿元)投资。
就在刚刚,谷歌Gemma 3来了,1B、4B、12B和27B四种参数,一块GPU/TPU就能跑!而Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。
Hugging Face的Open R1重磅升级,7B击败Claude 3.7 Sonnet等一众前沿模型。凭借CodeForces-CoTs数据集的10万高质量样本、IOI难题的严苛测试,以及模拟真实竞赛的提交策略优化,这款模型展现了惊艳的性能。
来自北京的赵明(化名),近期自认栽了个跟头——花费近6000元为三年级孩子购置的AI学习机,宣传的“AI精准辅导”“一对一伴学”功能与实际严重不符,仅用了一个月就“吃土”了。事实上,多数家长都很难逃出学习机的困扰。小红书平台上,与学习机相关的笔记多达131万篇,关联词条中不乏:学习机到底是不是智商税、学习机有没有必要买等话题。
DiffRhythm是一款新型AI音乐生成模型,能在10秒内生成长达4分45秒的完整歌曲,包含人声和伴奏。它采用简单高效的全diffusion架构,仅需歌词和风格提示即可创作,还支持本地部署,最低只需8G显存。
揭秘如何在 20 分钟内用 AI 创建专业级界面,并分享前四大核心技巧,让你的 AI 生成的应用脱胎换骨。
大模型时代,读论文这事儿真是越来越爽了~