AI资讯新闻榜单内容搜索-Ed

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Ed
北大、字节跳动联手发布SWE-Swiss:一把修复代码Bug的「瑞士军刀」,完整配方直指开源SOTA

北大、字节跳动联手发布SWE-Swiss:一把修复代码Bug的「瑞士军刀」,完整配方直指开源SOTA

北大、字节跳动联手发布SWE-Swiss:一把修复代码Bug的「瑞士军刀」,完整配方直指开源SOTA

近日,一项由北京大学、字节跳动 Seed 团队及香港大学联合进行的研究,提出了一种名为「SWE-Swiss」的完整「配方」,旨在高效训练用于解决软件工程问题的 AI 模型。研究团队推出的 32B 参数模型 SWE-Swiss-32B,在权威基准 SWE-bench Verified 上取得了 60.2% 的准确率,在同尺寸级别中达到了新的 SOTA。

来自主题: AI技术研报
5988 点击    2025-08-08 10:43
人大高瓴-华为诺亚:大语言模型智能体记忆机制的系列研究

人大高瓴-华为诺亚:大语言模型智能体记忆机制的系列研究

人大高瓴-华为诺亚:大语言模型智能体记忆机制的系列研究

近期,基于大语言模型的智能体(LLM-based agent)在学术界和工业界中引起了广泛关注。对于智能体而言,记忆(Memory)是其中的重要能力,承担了记录过往信息和外部知识的功能,对于提高智能体的个性化等能力至关重要。

来自主题: AI技术研报
5939 点击    2025-08-07 17:03
“神经-符号”融合规划器性能显著超越o1:借鉴人类运动学习机制|中国科学院磐石研发团队

“神经-符号”融合规划器性能显著超越o1:借鉴人类运动学习机制|中国科学院磐石研发团队

“神经-符号”融合规划器性能显著超越o1:借鉴人类运动学习机制|中国科学院磐石研发团队

科研er看过来!还在反复尝试材料组合方案,耗时又耗力? 新型“神经-符号”融合规划器直接帮你一键锁定高效又精准的科研智能规划。

来自主题: AI技术研报
7020 点击    2025-08-06 16:01
“没有AI味”的Flux.1新模型,现可以免费试用

“没有AI味”的Flux.1新模型,现可以免费试用

“没有AI味”的Flux.1新模型,现可以免费试用

AI生图,但是没有AI味,可能么? 一款全新、可编辑、照片级的AI生图模型FLUX.1 Krea [dev]现已发布,可在Krea Edit上免费试用。

来自主题: AI资讯
6723 点击    2025-08-05 17:04
字节Seed数学新模型,SOTA了

字节Seed数学新模型,SOTA了

字节Seed数学新模型,SOTA了

不仅能达IMO银牌水准,更能解决普特南数学竞赛难题,甚至超越顶尖模型o4-mini! 字节发布全新复杂数学解决模型——Seed-Prover。

来自主题: AI技术研报
7294 点击    2025-08-04 20:45
年收入2.8亿美元,一年翻倍:这类AI产品正在悄悄赚大钱

年收入2.8亿美元,一年翻倍:这类AI产品正在悄悄赚大钱

年收入2.8亿美元,一年翻倍:这类AI产品正在悄悄赚大钱

你见过一家AI财务公司在一年内将收入翻倍并实现盈利吗?当Cleo创始人Barney Hussey-Yeo在LinkedIn上宣布"Cleo刚刚达到2.8亿美元年度经常性收入,我们在一年内实现了收入翻倍并达到盈利"时,我被这个数字震撼了。在AI财务助手这个看似小众的领域,如此快速的收入增长是完全出人意料的。

来自主题: AI资讯
6121 点击    2025-08-04 12:56
港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法

现有的方法对大语言模型(LLM)「越狱」攻击评估存在误判和不一致问题。港科大团队提出了GuidedBench评估框架,通过为每个有害问题制定详细评分指南,显著降低了误判率,揭示了越狱攻击的真实成功率远低于此前估计,并为未来研究提供了更可靠的评估标准。

来自主题: AI技术研报
6256 点击    2025-08-02 13:15
字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍

字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍

字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍

用扩散模型写代码,不仅像开了倍速,改起来还特别灵活! 字节Seed最新发布扩散语言模型Seed Diffusion Preview,这款模型主要聚焦于代码生成领域,它的特别之处在于采用了离散状态扩散技术,在推理速度上表现出色。

来自主题: AI资讯
6293 点击    2025-08-01 16:04
小红书提出首个社交大模型:八大社交任务平均提升14.02%

小红书提出首个社交大模型:八大社交任务平均提升14.02%

小红书提出首个社交大模型:八大社交任务平均提升14.02%

行业首个社交大模型全景解析:既能兼顾社交理解与平台规则,又能洞察理解用户。小红书重磅推出RedOne——一款面向SNS(社交网络服务)领域的定制化LLM,旨在突破单一任务基线模型的性能瓶颈,并且构建全面覆盖SNS任务的基座模型。

来自主题: AI资讯
6180 点击    2025-08-01 12:15