
这个 69 岁的「AI硬件」创业者,正被数百万年轻人追捧
这个 69 岁的「AI硬件」创业者,正被数百万年轻人追捧曾德钧今年 69 岁。这是他创办「猫王品牌」的第十年。
曾德钧今年 69 岁。这是他创办「猫王品牌」的第十年。
在科技重塑医疗的新浪潮下,张强医生集团经过一年多的精心筹备、无数次严格测试和调试,全球首个静脉曲张垂直领域AI智能体VaricoSeek 1.0版对广大患者和医生开放免费使用。
幻觉(Hallucination),即生成事实错误或不一致的信息,已成为视觉-语言模型 (VLMs)可靠性面临的核心挑战。随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用,幻觉问题因其潜在的重大后果而备受关注。
继昨天《RAG太折磨人啦,试下pip install rankify,检索、重排序、RAG三合一,完美》发布之后,有许多朋友向我询问Rankify的具体使用方法和部署细节,尤其是生产环境如何处理自定义数据集和本地数据集。
从单张图像生成灵活视角3D场景的技术来了,在考古保护、自主导航等直接获取3D数据成本高昂或不可行的领域具有重要应用价值。
在互联网时代,数据已成为企业发展的必经之路。
近一年以来,AI 视频生成技术发展迅猛。自 2024 年初 Sora 问世后,大家惊喜地发现:原来 AI 可以生成如此逼真的视频,一时间各大高校实验室、互联网巨头 AI Lab 以及创业公司纷纷入局视频生成领域。
AGI的这两年,基本OpenAI压着谷歌打的两年,包括但不限于谷歌自己的失误、每次发布会的被截胡。比如这次Gemini 2.5 Pro 被 4o图片生成功能抢走了几乎所有关注点。但谷歌确实也在一直追赶,从最开始的措手不及,到现在已经开始有来有往。著名科技杂志《连线》采访了谷歌前和现员工超50人,发布了一篇长文,深度挖掘了谷歌这两年苦苦追赶Openai的内幕故事,
三维高斯泼溅(3D Gaussian Splatting, 3DGS)技术基于高斯分布的概率模型叠加来表征场景,但其重建结果在几何和纹理边界处往往存在模糊问题。
「仅需一次前向推理,即可预测相机参数、深度图、点云与 3D 轨迹 ——VGGT 如何重新定义 3D 视觉?」
AI社区掀起用大模型玩游戏之风!例如国外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC Prize组织最近也发布了一个贪吃蛇LLM评测基准SnakeBench。
一觉醒来,xAI 收购了 X(也叫推特或 𝕏)!这两家公司的 CEO 伊隆・马斯克在 X 上宣布:「xAI 通过一次全股票交易收购了 X。此次合并对 xAI 的估值为 800 亿美元,对 X 的估值为 330 亿美元(450 亿美元减去 120 亿美元的债务)。」
最近几天,OpenAI 革新的 GPT-4o 图像功能给大家带来了不少乐趣,各路社交媒体都被「吉卜力」风格的图像、视频刷了屏。机器之心还尝试了制作了《甄嬛传》的名场面(视频如下,制作方法参见《GPT-4o 整活!3 个小时、6 个镜头重现吉卜力版《甄嬛传》名场面》)。
CAMEL-AI 团队在 Manus 上线后 1 天内推出的 OWL 就是其中最具代表性的一个,项目实测成绩达到开源界 GAIA 性能天花板,达到了 58.18%,超越 Huggingface 提出的 Open Deep Research 55.15% 的表现。
为了让用户获得沉浸体验Parallel Live的直播间搭建几乎和Instagram别无二致,评论、表情、打赏等基础的互动功能也同样在应用中有所体现。这样逼真的虚拟空间就为吸引主播进入打下了一定的基础。
护城河是所有投资人和创始人都非常关注的一个概念,因为它涉及到企业的长期价值和生死存亡。AI 时代,大家对护城河同样有执念,但是越来越搞不懂什么才是这个时代的护城河了,甚至是否还有护城河都已经是一个问题。
3 月 28 日,专注于构建通用 3D 大模型的 VAST 一口气开源了两个 3D 生成项目 ——TripoSG 和 TripoSF。前者是一款基础 3D 生成模型,在图像到 3D 生成任务上远超所有闭源模型;后者则是 VAST 新一代三维基础模型 TripoSF 能在所有闭源模型中同样取得 SOTA 的基础组件,用于高分辨率的三维重建和生成任务。
晚点:过去将近 6 个月,AI 领域最重要的两件事,一是 OpenAI 去年 9 月 o1 发布,另一个是近期 DeepSeek 在发布 R1 后掀起全民狂潮。我们可以从这两个事儿开始聊。你怎么看 o1 和 R1 分别的意义?
AI的运作始终笼罩着一层神秘的「黑箱」迷雾。这种不透明让AI有时会「胡说八道」,甚至故意撒谎。Anthropic刚刚推出了一项突破性研究,用类似大脑扫描的技术,深入Claude 3.5 Haiku的「脑子」,揭开了它运行的一些秘密。
2025年3月25日,美国商务部工业与安全局(BIS)将来自中国、阿联酋、南非等地的80家企业列入实体清单,其中中国企业占54家。此次措施的核心目标是限制中国在高性能计算、量子技术及超算领域的技术进展,尤其是针对中国的军事应用。
据彭博社报道,OpenAI 接近敲定由软银领投的新一轮 400 亿美元融资。
GPT-4o原生图像一出手,直接登顶流量王座!今天凌晨,OpenAI再放大招更新GPT-4o,冲进大模型排行榜第二碾压Grok 3、GPT-4.5。创意一键生成,Midjourney瞬间黯然失色,设计师开始颤抖吧。
阿里又发了个有意思的大模型——QVQ-Max,第一版视觉推理模型,对任意图像或视频都可以进行深度思考。
刚刚,出门问问2024年报正式发布!过去一年,集团AIGC纯软件产品收入突破2.2亿元,同比增长88.5%,高毛利驱动总收入达3.9亿元。这家「AIGC第一股」以产模结合战略,跑通了国际化增长路径,用户遍布全球。
机器狗不语,只是一味地在北大未名湖畔捡垃圾。
「思维链劫持」(H-CoT)的攻击方法,成功攻破了包括OpenAI o1/o3、DeepSeek-R1等在内的多款大型推理模型的安全防线。研究表明,这些模型的安全审查过程透明化反而暴露了弱点,攻击者可以利用其内部推理过程绕过安全防线,使模型拒绝率从98%骤降2%。
从春晚舞台上的宇树科技人形机器人惊艳亮相,到深度求索(DeepSeek)以“国产ChatGPT”之姿引爆行业,人工智能正以前所未有的速度重塑生活场景。
Spatial-RAG结合了空间数据库和大型语言模型(LLM)的能力,能够处理复杂的空间推理问题。通过稀疏和密集检索相结合的方式,Spatial-RAG可以高效地从空间数据库中检索出满足用户查询的空间对象,并利用LLM的语义理解能力对这些对象进行排序和生成最终答案。
GPT4o的多模态生图前天上线之后。经过两天的发酵,含金量还在不断提升。