AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
谢赛宁等新作上线,多模态理解生成大一统!思路竟与GPT-4o相似?

谢赛宁等新作上线,多模态理解生成大一统!思路竟与GPT-4o相似?

谢赛宁等新作上线,多模态理解生成大一统!思路竟与GPT-4o相似?

来自Meta和NYU的团队,刚刚提出了一种MetaQuery新方法,让多模态模型瞬间解锁多模态生成能力!令人惊讶的是,这种方法竟然如此简单,就实现了曾被认为需要MLLM微调才能具备的能力。

来自主题: AI技术研报
5861 点击    2025-04-13 14:11
GitHub Copilot 加入基于 AI 的代码密码扫描功能

GitHub Copilot 加入基于 AI 的代码密码扫描功能

GitHub Copilot 加入基于 AI 的代码密码扫描功能

GitHub 在其 Copilot 功能中引入了一项基于 AI 的密码扫描功能,该功能已经整合到 GitHub Secret Protection 中。

来自主题: AI技术研报
6694 点击    2025-04-13 13:36
杜蕾斯级别的创意海报,现在你用即梦3.0就能批量生了

杜蕾斯级别的创意海报,现在你用即梦3.0就能批量生了

杜蕾斯级别的创意海报,现在你用即梦3.0就能批量生了

如果你没有杜蕾斯背后强大的5A广告公司、鬼才般的创意团队、句句封神的的金牌文案、审美爆辣的视觉艺术家。借助即梦刚上线的3.0生图模型以及 Deepseek生创意和文案,你也可以轻松复刻一个「杜蕾斯级别」的刷屏海报。

来自主题: AI技术研报
6798 点击    2025-04-13 10:12
失败 AI 产品列表

失败 AI 产品列表

失败 AI 产品列表

简单分享一份下线 AI 产品的信息列表(AI Graveyard),里面囊括的产品小类非常多。

来自主题: AI技术研报
7037 点击    2025-04-12 13:47
移动端AI安全再突破!水印保护新范式:403个AI App成功保护率超8成

移动端AI安全再突破!水印保护新范式:403个AI App成功保护率超8成

移动端AI安全再突破!水印保护新范式:403个AI App成功保护率超8成

随着智能手机和物联网设备普及,移动端AI成为趋势,带来离线运行、低延迟、隐私保护等优势。然而,模型本地存储同时带来了严重风险。

来自主题: AI技术研报
6734 点击    2025-04-12 13:00
200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了

200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了

200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了

字节跳动豆包团队今天发布了自家新推理模型 Seed-Thinking-v1.5 的技术报告。从报告中可以看到,这是一个拥有 200B 总参数的 MoE 模型,每次工作时会激活其中 20B 参数。其表现非常惊艳,在各个领域的基准上都超过了拥有 671B 总参数的 DeepSeek-R1。有人猜测,这就是字节豆包目前正在使用的深度思考模型。

来自主题: AI技术研报
6965 点击    2025-04-11 16:01
SemiAnalysis大研报:Tariff → AI

SemiAnalysis大研报:Tariff → AI

SemiAnalysis大研报:Tariff → AI

报告深入分析了特朗普总统于2025年4月2日宣布的“解放日”关税措施对美国人工智能(AI)基础设施建设、相关供应链以及全球贸易格局的潜在影响。

来自主题: AI技术研报
5923 点击    2025-04-11 14:44
RAG技术演进的四大核心命题【阿里官方对RAG的理解认知】

RAG技术演进的四大核心命题【阿里官方对RAG的理解认知】

RAG技术演进的四大核心命题【阿里官方对RAG的理解认知】

随着技术的深入应用,如何高效利用大模型技术优化用户体验,同时应对其带来的诸多挑战?本文将从RAG的发展趋势、技术挑战、核心举措以及未来展望四个维度总结我们应对挑战的新的思路和方法。

来自主题: AI技术研报
8855 点击    2025-04-11 13:55
DeepSeek+开源n8n:24h推特(X)热点监控Workflow太绝了!【附赠:完整工作流文件】

DeepSeek+开源n8n:24h推特(X)热点监控Workflow太绝了!【附赠:完整工作流文件】

DeepSeek+开源n8n:24h推特(X)热点监控Workflow太绝了!【附赠:完整工作流文件】

前两天给大家分享了一个我认为最强的开源AI Workflow平台:n8n。经过这几天的研究,我用n8n实现了一套超实用的X(原Twitter)热点监控workflow(工作流)。它由两个workflow(工作流)组成

来自主题: AI技术研报
8094 点击    2025-04-11 10:27
7B小模型写好学术论文,新框架告别AI引用幻觉,实测100%学生认可引用质量

7B小模型写好学术论文,新框架告别AI引用幻觉,实测100%学生认可引用质量

7B小模型写好学术论文,新框架告别AI引用幻觉,实测100%学生认可引用质量

学术写作通常需要花费大量精力查询文献引用,而以ChatGPT、GPT-4等为代表的通用大语言模型(LLM)虽然能够生成流畅文本,但经常出现“引用幻觉”(Citation Hallucination),即模型凭空捏造文献引用。这种现象严重影响了学术论文的可信度与专业性。

来自主题: AI技术研报
6888 点击    2025-04-11 10:20
CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

在现实世界中,如何让智能体理解并挖掘 3D 场景中可交互的部位(Affordance)对于机器人操作与人机交互至关重要。所谓 3D Affordance Learning,就是希望模型能够根据视觉和语言线索,自动推理出物体可供哪些操作、以及可交互区域的空间位置,从而为机器人或人工智能系统提供对物体潜在操作方式的理解。

来自主题: AI技术研报
4680 点击    2025-04-11 09:55
预训练还没终结!港中文清华等提出「三位一体」框架,持续自我进化

预训练还没终结!港中文清华等提出「三位一体」框架,持续自我进化

预训练还没终结!港中文清华等提出「三位一体」框架,持续自我进化

港中文、清华等高校提出SICOG框架,通过预训练、推理优化和后训练协同,引入自生成数据闭环和结构化感知推理机制,实现模型自我进化,为大模型发展提供新思路。

来自主题: AI技术研报
7933 点击    2025-04-11 09:36
闭环端到端精度暴涨19.61%!华科&小米汽车联手打造自动驾驶框架ORION,代码将开源

闭环端到端精度暴涨19.61%!华科&小米汽车联手打造自动驾驶框架ORION,代码将开源

闭环端到端精度暴涨19.61%!华科&小米汽车联手打造自动驾驶框架ORION,代码将开源

近年来,端到端(End-to-End,E2E)自动驾驶技术不断进步,但在复杂的闭环交互环境中,由于其因果推理能力有限,仍然难以做出准确决策。虽然视觉 - 语言大模型(Vision-Language Model,VLM)凭借其卓越的理解和推理能力,为端到端自动驾驶带来了新的希望,但现有方法在 VLM 的语义推理空间和纯数值轨迹的行动空间之间仍然存在巨大鸿沟。

来自主题: AI技术研报
6698 点击    2025-04-11 09:28
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持

5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持

5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持

谷歌Deep Research重大升级,搭载全球顶尖Gemini 2.5 Pro模型。5分钟生成46页学术论文、复杂报告转为10分钟播客。性能超OpenAI DR 40%,价格仅为其1/10。

来自主题: AI技术研报
5857 点击    2025-04-10 12:26
UC伯克利华人开源14B「o3-mini」,代码版R1突袭OpenAI王座!

UC伯克利华人开源14B「o3-mini」,代码版R1突袭OpenAI王座!

UC伯克利华人开源14B「o3-mini」,代码版R1突袭OpenAI王座!

OpenAI o1/o3-mini级别的代码推理模型竟被抢先开源!UC伯克利和Together AI联合推出的DeepCoder-14B-Preview,仅14B参数就能媲美o3-mini,开源代码、数据集一应俱全,免费使用。

来自主题: AI技术研报
6940 点击    2025-04-10 11:52
字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

自数字人技术Omnihuman-1引起行业关注之后,字节智能创作团队再放大招。全新DreamActor-M1横空出世,一张照片一段视频,就能生成电影级视频,精准迁移表情动作,还支持多种画风。

来自主题: AI技术研报
8909 点击    2025-04-10 11:12
芯片设计效率提升2.5倍,中科大华为诺亚联合,用GNN+蒙特卡洛树搜索优化电路设计 | ICLR2025

芯片设计效率提升2.5倍,中科大华为诺亚联合,用GNN+蒙特卡洛树搜索优化电路设计 | ICLR2025

芯片设计效率提升2.5倍,中科大华为诺亚联合,用GNN+蒙特卡洛树搜索优化电路设计 | ICLR2025

芯片设计是现代科技的核心,逻辑优化(Logic Optimization, LO)作为芯片设计流程中的关键环节,其效率直接影响着芯片设计的整体性能。

来自主题: AI技术研报
2631 点击    2025-04-10 11:03
孪生世界动态仿真新突破!北大发布RainyGS:降雨/洪涝/风速精准可控

孪生世界动态仿真新突破!北大发布RainyGS:降雨/洪涝/风速精准可控

孪生世界动态仿真新突破!北大发布RainyGS:降雨/洪涝/风速精准可控

北京大学陈宝权教授团队提出RainyGS技术,通过结合物理模拟和3D高斯泼溅渲染框架,实现了真实场景中动态雨效的高质量仿真与呈现,真正实现「从真实到真实」,或者「以仿真乱真」,即Real2Sim2Real !相比现有的视频编辑工具(如 Runway),其物理真实性获得保证。

来自主题: AI技术研报
6901 点击    2025-04-10 10:51