
AI代码补全哪家强?两个新指标+一套新框架,让模型更懂开发者
AI代码补全哪家强?两个新指标+一套新框架,让模型更懂开发者如何让AI代码补全更懂开发者?
如何让AI代码补全更懂开发者?
虽然我前面文章介绍了很多AI 工作流,但它们都是局限在自己平台里的操作,对于外部的页面,大多无能为力。
强化学习·RL范式尝试为LLMs应用于广泛的Agentic AI甚至构建AGI打开了一扇“深度推理”的大门,而RL是否是唯一且work的一扇门,先按下不表(不作为今天跟大家唠的重点),至少目前看来,随着o1/o3/r1/qwq..等一众语言推理模型的快速发展,正推动着LLMs和Agentic AI在不同领域的价值与作用,
标识能否有效应对?
学术综述论文在科学研究中发挥着至关重要的作用,特别是在研究文献快速增长的时代。传统的人工驱动综述写作需要研究者审阅大量文章,既耗时又难以跟上最新进展。而现有的自动化综述生成方法面临诸多挑战:
AI 搜索 Agent 产品 Genspark 近期被 Anthropic 官方点名了。「Less structure, more intelligence.」是 AI 搜索 Agent 产品 Genspark 一直以来坚持的基本原则。Genspark 团队认为,过度结构化的工作流程会限制创造力和深度,赋予专业 Agent 更多自主权,自由选择并灵活运用多种工具来处理问题,反而能释放出更强的能力。
「市象」获悉,段楠已在其GitHub主页悄然更新履历:现任京东探索研究院视觉与多模态实验室负责人,带领研究团队研发视觉和多模态基础模型。此前,他曾任阶跃星辰Technical Fellow(2024-2025)和微软亚洲研究院自然语言计算团队资深首席研究员和研究经理(2012-2024)。
推理模型开始「自言自语」、量子计算进入临界点……AI大航海时代已然启航,这不是一次产品发布会,而是未来的预言书。巴黎GTC大会,黄仁勋开讲了!这次他脱下了皮衣。
全球知名开源AI平台Hugging Face近日发布开放权重模型贡献榜,中国团队Qwen和DeepSeek成功入围前15名,彰显了中国在全球开源AI领域的技术实力与影响力。该榜单表彰为开源社区提供高质量模型权重的团队,其模型广泛应用于学术与产业创新。
当大多数大学生还在为毕业去向发愁时,年轻的王超已经带着他的端侧AI梦想,在国产算力赛道上跑出了加速度。这位杭州电子科技大学在读博士生创立的杭州旷维炬锐科技有限公司,不仅在2025年斩获千万级天使融资,更凭借“让AI模型在终端设备高效运行”的核心技术,成为国产AI生态构建的重要参与者。
没有一个大模型可以一统天下。 这,或许已经成为了AI大模型时代行业里的一个共识。
搜索行为从传统浏览器向大型语言模型(LLM)平台迁移,价值超800亿美元的SEO市场根基已现裂痕,搜索迈入由语言模型主导的“生成式引擎优化(GEO)”全新范式。
谷歌DeepMind重磅出击,开源首个形式化数学猜想库,获陶哲轩力挺!从解析数论的兰道猜想开始,这个开源项目将为AI破解数学难题的未来铺路。
近日,抖音内容技术团队开源了 ContentV,一种面向视频生成任务的高效训练方案。该方案在多项技术优化的基础上,使用 256 块 NPU,在约 4 周内完成了一个 8B 参数模型的训练。尽管资源有限,ContentV 在多个评估维度上取得了与现有主流方案相近的生成效果。
张小龙说,设计就是分类,我认为写作也是一种分类,有助于定义问题和讨论问题,所以在探讨 AI 编码之前,需要分清出什么时候是在氛围编码(Vibe coding),什么时候是在用 AI 辅助编程。
大数据和大模型已成为具身智能领域业界和学术界的焦点,人们也在期待人形机器人真正步入大数据、大模型时代。然而,行业一直缺乏稳定的人形机器人全身遥操作与数据采集方案。
百事可乐首个人形机器人「百事蓝宝」正式C位出道!现场与大卫·贝克汉姆、智元机器人联合创始人兼首席技术官彭志辉同框互动,进行传统文化太极表演,这一出场,瞬间刷屏社交媒体,让人切实感受到:机器人不仅能说会道,更能成为品牌传递情绪价值的新出口。
想象一下,你是一位游戏设计师,正在为一个奇幻 RPG 游戏搭建场景。你需要创建一个 "精灵族树屋村落"—— 参天古木和树屋、发光的蘑菇路灯、半透明的纱幔帐篷... 传统工作流程中,这可能需要数周时间:先手工建模每个 3D 资产,再逐个调整位置和材质,最后反复测试光照效果…… 总之就是一个字,难。
豆包大模型1.6惊艳亮相,成为国内首款多模态SOTA模型,256k对话窗口,深度思考最长上下文。它不仅能看会想,还能动手操作GUI,国内最有潜力考清北。
6月举办的AIPCon7,又有7家Palantir的客户详细介绍并演示了Agent用例,这次有3家医疗,2家金融,1家电商,1家汽车客户。
一个名叫 “Dolores” 的聊天机器人,正在悄悄改变澳洲慢性疼痛患者的生活。它不仅能陪你聊天,
这家简化软件开发流程的AI 初创公司 Lovable 正在进行大规模融资谈判,有望成为欧洲最大的人工智能新锐企业之一。
普林斯顿大学AI实验室与复旦大学历史学系联手推出了全球首个聚焦历史研究能力的AI评测基准——HistBench,并同步开发了深度嵌入历史研究场景的AI助手——HistAgent。这一成果不仅填补了人文学科AI测试的空白,更为复杂史料处理与多模态理解建立了系统工具框架。
从 Airbnb 到 Figma,从 Ethereum 到 Scale AI,Thiel Fellowship 一直是“小天才”创业者的“秘密起点”之一。Thiel Fellowship 由 PayPal 创始人 Peter Thiel 2011 年创办,每年为每一位入选者提供 10 万美金奖金和“辍学自由”。
作者介绍: 本文作者来自通义实验室 RAG 团队,致力于面向下一代 RAG 技术进行基础研究。该团队 WebWalker 工作近期也被 ACL 2025 main conference 录用。
近几年的高考季,城市数据团都会推出一些相关的研究。
你有没有想过,写日记这件事可能彻底变了?传统的日记本就像一个沉默的容器,你把想法倾倒进去,它只是默默接受,从不回应。但现在,一种全新的日记体验正在改变这一切——它不仅能听懂你的心声,还能与你对话,帮你发现那些隐藏在字里行间的人生模式。
今天聊个让所有AI Coder都“红温”的话题:用Cursor改Bug,怎么就那么容易翻车?需求描述得清清楚楚,它却越改越乱,好不容易修好一个,又带出仨新的,简直心态爆炸!😭
高考余热尚在,依然还是有不少博主和媒体在测试各家 AI 模型解答最新高考题的能力。而现在,一个正被火热评测的主流模型迎来了重磅升级!
刚刚,LeCun竟然亲自出镜,重磅讲解了V-JEPA 2!就在外界猜测他已被边缘化之际,这位AI老将用一支视频回应了质疑:要坚定不移做世界模型!这位20年孤勇者押注的方向,是将引领AI的下一个潮流,还是走上了歧路?