AI资讯新闻榜单内容搜索-TCOD

多轮Agent蒸馏终于不翻车！港中文x通义新方法成功率暴涨18点，训练还快32%

把强大模型的能力“蒸馏”给小模型，听起来很美—— 但放到多轮对话Agent场景里，效果往往一塌糊涂。

来自主题: AI技术研报

8580 点击 2026-05-07 10:17

近日，浙江大学副教授胡星和团队开发出一款名为 CatCoder 的 AI 框架，它能够读懂一个完整的软件项目，生成准确、可用的代码。在 Java 任务上，它在代码编译通过率和测试通过率上，比业内表现突出的代表之一 RepoCoder 最高提升了 14.44% 和 17.35%。

来自主题: AI资讯

8883 点击 2025-12-14 10:50

OpenAI 在 AI 领域引领了一波又一波浪潮，想必很多人好奇，这些创新背后的研究人员是如何通过面试的？尤其是现在，OpenAI 已经成为全球最受瞩目的 AI 公司之一，吸引了无数顶尖人才投递简历。想要加入这个团队，着实不容易。

来自主题: AI资讯

8639 点击 2025-08-15 12:43

OpenAI的神秘模型o3-alpha意外曝光，其强大的代码能力碾压众多AI。该模型疑似在东京AtCoder世界编程大赛2025中夺得亚军，最终不敌人类选手Psyho。

来自主题: AI资讯

8711 点击 2025-07-20 13:17

使用Claude Code有一段时间了，越用越香。我现在的主力编程工具组合是Cursor + Claude Code。同时，我也推荐AugmentCode + Claude Code的组合形式

来自主题: AI资讯

26538 点击 2025-06-29 12:07

大模型写代码早就是基操了，但让它写算法竞赛题或企业级系统代码，就像让只会煮泡面的人去做满汉全席 —— 生成的代码要么是 “铁板一块” 毫无章法，要么是 “一锅乱炖” 难以维护。

来自主题: AI技术研报

9962 点击 2025-04-03 15:12

计算机科学、数学、自然科学、医学、语言学、社会科学……OpenAI o1擅长什么？还有哪些不足？

来自主题: AI技术研报

11653 点击 2024-10-01 14:29

6月，IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文，数据集就是程序员们最爱的LeetCode题库。研究揭示了LLM在代码任务中出现的潜在问题和能力局限，让我们能够对模型做出进一步改进，并逐渐了解使用ChatGPT写代码的最佳姿势。

来自主题: AI技术研报

6341 点击 2024-07-09 00:54

连ChatGPT看了都直摇头的算法优化，被北大团队给搞定了。测试表明，新研究能解验证集中90%的题目，包括NOIP、Codeforce、Leetcode等比赛中的分治和动态规划题目——这些题目，很多大模型也难以解决。

来自主题: AI资讯

4535 点击 2023-11-03 22:04