
GPT-4加Agent轻松追平Devin!普林斯顿造,开源首日斩获1.6k星
GPT-4加Agent轻松追平Devin!普林斯顿造,开源首日斩获1.6k星用GPT-4打造的AI程序员,结果轻松追平Devin!普林斯顿打造的开源SWE-agent,直接开箱即用——修复GitHub存储库中真实bug。在25%的SWE-bench测试集上,它实现了与Devin相似的准确度—— 解决了12.29%的问题。
用GPT-4打造的AI程序员,结果轻松追平Devin!普林斯顿打造的开源SWE-agent,直接开箱即用——修复GitHub存储库中真实bug。在25%的SWE-bench测试集上,它实现了与Devin相似的准确度—— 解决了12.29%的问题。
让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打?GitHub上一种你没有见过的船新Benchmark火了。
GitHub三万Star项目MetaGPT上新,号称是“开源Devin”——推出数据解释器(Data Interpreter),能够应对数据实时变化、任务之间复杂的依赖关系、流程优化需求以及执行结果反馈的逻辑一致性等挑战。
“猛增至91万、涨幅高达264%、34倍”这一数据来自GitHub 上的AI开源项目统计对比。
这个名为DUSt3R的新工具,火得一塌糊涂,才上线没多久就登上GitHub热榜第二。
OpenAI也996,实锤了(doge)。
Karpathy力推代码生成任务增强流程,让GPT-4在CodeContests从19%提升到44%,不用微调不用新数据集训练,让大模型代码能力大幅提升。
混合专家(MoE)架构已支持多模态大模型,开发者终于不用卷参数量了!北大联合中山大学、腾讯等机构推出的新模型MoE-LLaVA,登上了GitHub热榜。
辛辛苦苦手写的论文,却被审稿人鉴定为“一眼ChatGPT”而被拒收。一位副教授的遭遇引发学术界关注,登上Nature专栏。她决定从此以后每篇论文都在GitHub上写,用变更记录来证明自己的清白。
一个体量仅为2B的大模型,能有什么用?答案可能超出你的想象。