AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
搞不定有表格数据和多模态的Prompt?试下微软最新的提示词编排标记语言POML

搞不定有表格数据和多模态的Prompt?试下微软最新的提示词编排标记语言POML

搞不定有表格数据和多模态的Prompt?试下微软最新的提示词编排标记语言POML

最近来自微软的研究者们带来了一个全新的思路,他们开源发布了POML(Prompt Orchestration Markup Language),它的的解决方案它的核心思想非常直接:为什么我们不能像开发网页一样,用工程化的思维来构建和管理我们的Prompt呢?这个编排语言很类似IBM的PDL

来自主题: AI技术研报
6693 点击    2025-08-27 11:11
手把手教机器人:斯坦福大学提出RTR框架,让机械臂助力人形机器人真机训练

手把手教机器人:斯坦福大学提出RTR框架,让机械臂助力人形机器人真机训练

手把手教机器人:斯坦福大学提出RTR框架,让机械臂助力人形机器人真机训练

人形机器人的运动控制,正成为强化学习(RL)算法应用的下一个热点研究领域。当前,主流方案大多遵循 “仿真到现实”(Sim-to-Real)的范式。研究者们通过域随机化(Domain Randomization)技术,在成千上万个具有不同物理参数的仿真环境中训练通用控制模型,期望它能凭借强大的泛化能力,直接适应动力学特性未知的真实世界。

来自主题: AI技术研报
6482 点击    2025-08-27 11:05
榨干GPU性能,中兴Mariana(马里亚纳)突破显存壁垒

榨干GPU性能,中兴Mariana(马里亚纳)突破显存壁垒

榨干GPU性能,中兴Mariana(马里亚纳)突破显存壁垒

当大语言模型(LLM)走向千行百业,推理效率与显存成本的矛盾日益尖锐。

来自主题: AI资讯
6644 点击    2025-08-26 19:21
英伟达韩松团队新作:具有后神经架构搜索的高效语言模型

英伟达韩松团队新作:具有后神经架构搜索的高效语言模型

英伟达韩松团队新作:具有后神经架构搜索的高效语言模型

英伟达开源又放大招了! 韩松团队推出了一款全新的基于后神经架构搜索的高效语言模型——Jet-Nemotron。

来自主题: AI资讯
6105 点击    2025-08-26 19:00
ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术

如果我们的教科书里包含大量的污言秽语,那么我们能学好语言吗?这种荒唐的问题却出现在最先进 ChatGPT 系列模型的学习过程中。

来自主题: AI技术研报
6563 点击    2025-08-26 12:11
唯快不破:上海AI Lab 82页综述带你感受LLM高效架构的魅力

唯快不破:上海AI Lab 82页综述带你感受LLM高效架构的魅力

唯快不破:上海AI Lab 82页综述带你感受LLM高效架构的魅力

近年来,大语言模型(LLMs)展现出强大的语言理解与生成能力,推动了文本生成、代码生成、问答、翻译等任务的突破。代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等,已经深刻改变了人机交互方式。

来自主题: AI技术研报
5810 点击    2025-08-26 11:30
真实场景也能批量造「险」!VLM+扩散模型打造真实域自动驾驶极限测试

真实场景也能批量造「险」!VLM+扩散模型打造真实域自动驾驶极限测试

真实场景也能批量造「险」!VLM+扩散模型打造真实域自动驾驶极限测试

浙江大学与哈工大(深圳)联合推出SafeMVDrive,利用扩散模型结合VLM实现批量化多视角真实域的安全关键视频生成。该方法在保持画质与真实感的同时,显著增强了驾驶场景的危险性。生成的场景用于端到端自动驾驶系统的极限压测,可使得模型的碰撞率提升50倍。

来自主题: AI技术研报
5457 点击    2025-08-26 10:47
大模型能否为不同硬件平台生成高性能内核?南大、浙大提出跨平台内核生成评测框架MultiKernelBench

大模型能否为不同硬件平台生成高性能内核?南大、浙大提出跨平台内核生成评测框架MultiKernelBench

大模型能否为不同硬件平台生成高性能内核?南大、浙大提出跨平台内核生成评测框架MultiKernelBench

在深度学习模型的推理与训练过程中,绝大部分计算都依赖于底层计算内核(Kernel)来执行。计算内核是运行在硬件加速器(如 GPU、NPU、TPU)上的 “小型高性能程序”,它负责完成矩阵乘法、卷积、归一化等深度学习的核心算子运算。

来自主题: AI技术研报
6512 点击    2025-08-25 15:44
突破长视频生成瓶颈:南大、TeleAI推出全新AI生成范式MMPL,让创意一镜到底

突破长视频生成瓶颈:南大、TeleAI推出全新AI生成范式MMPL,让创意一镜到底

突破长视频生成瓶颈:南大、TeleAI推出全新AI生成范式MMPL,让创意一镜到底

你是否曾被 AI 生成视频的惊艳开场所吸引,却在几秒后失望于⾊彩漂移、画面模糊、节奏断裂? 当前 AI 长视频⽣成普遍⾯临 “高开低走 ” 的困境:前几秒惊艳夺⽬ ,之后却质量骤降、细节崩坏;更别提帧间串行生成导致的低效问题 —— 动辄数小时的等待,实时预览几乎难以企及。

来自主题: AI技术研报
5694 点击    2025-08-25 15:33