AI资讯新闻榜单内容搜索-香港

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 香港
TRACE:因果事件建模助力视频理解大模型的时间定位能力

TRACE:因果事件建模助力视频理解大模型的时间定位能力

TRACE:因果事件建模助力视频理解大模型的时间定位能力

下班回家后你正深陷于一部两小时的综艺节目中,渴望找到那些让人捧腹的爆笑片段,却如同大海捞针。或者,在紧张刺激的足球赛中,你渴望捕捉到那决定性的绝杀瞬间,但传统 AI 视频处理技术效率低下,且模型缺乏泛化能力。为解决这些问题,香港中文大学(深圳)唐晓莹课题组联合腾讯 PCG 发布 TRACE 技术,通过因果事件建模为视频理解大模型提供精准的时间定位能力。

来自主题: AI技术研报
8008 点击    2025-03-17 09:19
18项任务200万视频编辑对,云天励飞联合多高校打造出大规模编辑数据集

18项任务200万视频编辑对,云天励飞联合多高校打造出大规模编辑数据集

18项任务200万视频编辑对,云天励飞联合多高校打造出大规模编辑数据集

为了解决视频编辑模型缺乏训练数据的问题,本文作者(来自香港中文大学、香港理工大学、清华大学等高校和云天励飞)提出了一个名为 Señorita-2M 的数据集。该数据集包含 200 万高质量的视频编辑对,囊括了 18 种视频编辑任务。

来自主题: AI技术研报
6857 点击    2025-03-12 14:41
ICLR 2025 | 原生3D+流匹配,现有SOTA被GaussianAnything超越

ICLR 2025 | 原生3D+流匹配,现有SOTA被GaussianAnything超越

ICLR 2025 | 原生3D+流匹配,现有SOTA被GaussianAnything超越

在 ICLR 2025 中,来自南洋理工大学 S-Lab、上海 AI Lab、北京大学以及香港大学的研究者提出的基于 Flow Matching 技术的全新 3D 生成框架 GaussianAnything,针对现有问题引入了一种交互式的点云结构化潜空间,实现了可扩展的、高质量的 3D 生成,并支持几何-纹理解耦生成与可控编辑能力。

来自主题: AI技术研报
6710 点击    2025-03-11 16:13
梁文锋,去香港了?

梁文锋,去香港了?

梁文锋,去香港了?

DeepSeek现身香港?

来自主题: AI资讯
4883 点击    2025-03-06 17:35
对话AFFiNE贺嘉琛:开源软件不是xx的平替,它可以成为比闭源更成功的产品

对话AFFiNE贺嘉琛:开源软件不是xx的平替,它可以成为比闭源更成功的产品

对话AFFiNE贺嘉琛:开源软件不是xx的平替,它可以成为比闭源更成功的产品

AFFiNE,一个开源的 AI 协作知识库,集成了完整文档、白板和数据库的工作空间。累计融资 1000 万美元,开源项目在 Github 上超过 4.5 万 stars。创始人、CEO 贺嘉琛,连续创业者。创业前研究天体物理,毕业于格拉斯哥与香港科技大学。

来自主题: AI资讯
8300 点击    2025-03-04 14:18
独家|Kimi仲裁案未和解,张予彤或被单独提起诉讼

独家|Kimi仲裁案未和解,张予彤或被单独提起诉讼

独家|Kimi仲裁案未和解,张予彤或被单独提起诉讼

据知情人透露:Kimi仲裁案的双方,循环智能老股东和杨植麟等,已分别于1月底和2月下旬,在HKIAC(香港国际仲裁中心)完成缴费,目前组庭也已完成。而整个事件背后更关键的主角张予彤,或将被另外单独提起诉讼。

来自主题: AI资讯
6001 点击    2025-02-24 19:22
剧本自动生成3D动画!北航中大等提出新方法,破解多人交互难题 | ICLR 2025

剧本自动生成3D动画!北航中大等提出新方法,破解多人交互难题 | ICLR 2025

剧本自动生成3D动画!北航中大等提出新方法,破解多人交互难题 | ICLR 2025

设定一个3D场景,你便可以用文字编织你的剧情。一句话,就能让两个人激烈争吵。来自北京航空航天大学、香港中文大学(深圳)、悉尼科技大学、中山大学等高校的研究者提出Sitcom-Crafter。成果已被ICLR 2025会议接收。

来自主题: AI技术研报
7980 点击    2025-02-21 08:57
单卡3090帮你一口气看完《黑悟空》,港大百度打造超长视频理解引擎VideoRAG

单卡3090帮你一口气看完《黑悟空》,港大百度打造超长视频理解引擎VideoRAG

单卡3090帮你一口气看完《黑悟空》,港大百度打造超长视频理解引擎VideoRAG

今天向大家介绍一项来自香港大学黄超教授实验室的最新科研成果 VideoRAG。这项创新性的研究突破了超长视频理解任务中的时长限制,仅凭单张 RTX 3090 GPU (24GB) 就能高效理解数百小时的超长视频内容。

来自主题: AI技术研报
4935 点击    2025-02-14 10:04
网传DeepSeek R1更容易被越狱?这有个入选顶会的防御框架SelfDefend

网传DeepSeek R1更容易被越狱?这有个入选顶会的防御框架SelfDefend

网传DeepSeek R1更容易被越狱?这有个入选顶会的防御框架SelfDefend

近日,来自香港科技大学、南洋理工大学等机构的研究团队最新成果让这一设想成为现实。他们提出的 SelfDefend 框架,让大语言模型首次拥有了真正意义上的 ' 自卫能力 ',能够有效识别和抵御各类越狱攻击,同时保持极低的响应延迟。

来自主题: AI技术研报
4611 点击    2025-02-11 14:48
社交软件还能如何进化?受微信和X的启发,我打造了一款结合AI的智能社交App!

社交软件还能如何进化?受微信和X的启发,我打造了一款结合AI的智能社交App!

社交软件还能如何进化?受微信和X的启发,我打造了一款结合AI的智能社交App!

我是李俊彦,一名香港人,也是Dspace的创始人。我在澳洲留学期间,接触了大量互联网产品,对这个领域产生了浓厚的兴趣。Dspace是一款结合人工智能与社交功能的智能社区,致力于为用户提供更高效、更有意义的社交体验。

来自主题: AI资讯
6944 点击    2025-02-11 14:44