AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
你的设想被证实了!不微调模型也能微调Agent,Memento霸榜GAIA|UCL最新

你的设想被证实了!不微调模型也能微调Agent,Memento霸榜GAIA|UCL最新

你的设想被证实了!不微调模型也能微调Agent,Memento霸榜GAIA|UCL最新

你或许也有过这样的猜想,如何让AI智能体(Agent)变得更聪明、更能干,同时又不用烧掉堆积如山的算力去反复微调模型?

来自主题: AI技术研报
11099 点击    2025-09-01 09:58
DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费

DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费

DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费

在最近的一档脱口秀节目中,演员张俊调侃 DeepSeek 是一款非常「内耗」的 AI,连个「1 加 1 等于几」都要斟酌半天。

来自主题: AI资讯
7421 点击    2025-08-31 13:17
CodeAgent 2.0 时代开启|GitTaskBench,颠覆性定义代码智能体实战交付新标准

CodeAgent 2.0 时代开启|GitTaskBench,颠覆性定义代码智能体实战交付新标准

CodeAgent 2.0 时代开启|GitTaskBench,颠覆性定义代码智能体实战交付新标准

我们也看过各种 AI Coding 领域的评测,发现大多停留在了 「代码生成」与「封闭题目」的考核,却忽视了环境配置、依赖处理、跨仓库资源利用等开发者必经的真实需求 —— 当下众多 Benchmark 仅通过题目,已难以衡量 Code Agent 的实际效果。

来自主题: AI技术研报
8435 点击    2025-08-31 12:45
吴恩达最新来信:是时候关注并行智能体了

吴恩达最新来信:是时候关注并行智能体了

吴恩达最新来信:是时候关注并行智能体了

人多,好办事。agent多,照样好办事! 在最新的Andrew’s Letters中,吴恩达老师就指出: 并行智能体正在成为提升AI能力的新方向。

来自主题: AI资讯
7990 点击    2025-08-31 12:39
你能永远陪我聊天吗?复旦&微软提出StableAvatar: 首个端到端无限时长音频驱动的人类视频生成新框架!

你能永远陪我聊天吗?复旦&微软提出StableAvatar: 首个端到端无限时长音频驱动的人类视频生成新框架!

你能永远陪我聊天吗?复旦&微软提出StableAvatar: 首个端到端无限时长音频驱动的人类视频生成新框架!

在《流浪地球 2》中图恒宇将 AI 永生数字生命变为可能,旨为将人类意识进行数字化备份并进行意识上传,以实现人类文明的完全数字化。

来自主题: AI技术研报
7442 点击    2025-08-31 12:31
你的怀疑是对的!LLM作为Judge,既无效又不可靠,终于有论文向LLJ开炮了

你的怀疑是对的!LLM作为Judge,既无效又不可靠,终于有论文向LLJ开炮了

你的怀疑是对的!LLM作为Judge,既无效又不可靠,终于有论文向LLJ开炮了

让LMM作为Judge,从对模型的性能评估到数据标注再到模型的训练和对齐流程,让AI来评判AI,这种模式几乎已经是当前学术界和工业界的常态。

来自主题: AI资讯
8377 点击    2025-08-31 12:20
秋招超强助攻:零基础1小时上手GPT微调!全流程教程免费开源

秋招超强助攻:零基础1小时上手GPT微调!全流程教程免费开源

秋招超强助攻:零基础1小时上手GPT微调!全流程教程免费开源

针对OpenAI最新开源的GPT-OSS,这一篇面向零基础小白用户的手把手式的详细训练教程或许能帮助你完成你的第一个GPT训练项目。

来自主题: AI资讯
8157 点击    2025-08-29 16:39
AI Agent组团搞事:在你常刷的App里,舆论操纵、电商欺诈正悄然上演

AI Agent组团搞事:在你常刷的App里,舆论操纵、电商欺诈正悄然上演

AI Agent组团搞事:在你常刷的App里,舆论操纵、电商欺诈正悄然上演

近日,上海交大和上海人工智能实验室的研究发现,AI 的风险正从个体失控转向群体性的恶意共谋(Collusion)——即多个智能体秘密协同以达成有害目标。Agent 不仅可以像人类团队一样协作,甚至在某些情况下,还会展现出比人类更高效、更隐蔽的「团伙作案」能力。

来自主题: AI技术研报
8159 点击    2025-08-29 16:05
蚂蚁专用模型超越o3!仅用2K训练样本刷新医疗AI榜单纪录

蚂蚁专用模型超越o3!仅用2K训练样本刷新医疗AI榜单纪录

蚂蚁专用模型超越o3!仅用2K训练样本刷新医疗AI榜单纪录

不卷参数的专业模型,会不会被通用大模型取代? 在医疗领域,这个疑问正在被打破。

来自主题: AI资讯
8120 点击    2025-08-29 15:56