
如何让等变神经网络可解释性更强?试试将它分解成「简单表示」
如何让等变神经网络可解释性更强?试试将它分解成「简单表示」神经网络是一种灵活且强大的函数近似方法。而许多应用都需要学习一个相对于某种对称性不变或等变的函数。图像识别便是一个典型示例 —— 当图像发生平移时,情况不会发生变化。等变神经网络(equivariant neural network)可为学习这些不变或等变函数提供一个灵活的框架。
神经网络是一种灵活且强大的函数近似方法。而许多应用都需要学习一个相对于某种对称性不变或等变的函数。图像识别便是一个典型示例 —— 当图像发生平移时,情况不会发生变化。等变神经网络(equivariant neural network)可为学习这些不变或等变函数提供一个灵活的框架。
今年以来,具身智能正在成为学术界和产业界的热门领域,相关的产品和成果层出不穷。
Noam Shazeer 2021 年离职谷歌,3 年后又以特殊方式重回谷歌。
AI,智能体,ADAS,元智能体搜索,模型训练
以 GPT 为代表的大型语言模型预示着数字认知空间中通用人工智能的曙光。这些模型通过处理和生成自然语言,展示了强大的理解和推理能力,已经在多个领域展现出广泛的应用前景。无论是在内容生成、自动化客服、生产力工具、AI 搜索、还是在教育和医疗等领域,大型语言模型都在不断推动技术的进步和应用的普及。
代码知识原来这么重要。
8 月 21 日,2024 火山引擎 AI 创新巡展﹒上海站带来了豆包大模型最新进展。
Emory大学的研究团队提出了一种创新的方法,将大语言模型(LLM)在文本图(Text-Attributed Graph, 缩写为TAG)学习中的强大能力蒸馏到本地模型中,以应对文本图学习中的数据稀缺、隐私保护和成本问题。通过训练一个解释器模型来理解LLM的推理过程,并对学生模型进行对齐优化,在多个数据集上实现了显著的性能提升,平均提高了6.2%。
沉浸式体验Anthropic提示词工程师与「完美拍档」Claude共度的一天!
距离GPT-4首次发布已经过去了将近一年半的时间,Nature最近发表的一篇报告却探索出了这个「过气」模型的新用途——氨基酸和蛋白质的结构建模。
历时5个月,一款性能比肩擎天柱的人形机器人黑马诞生了!外观更类人,作业更智能,而且全栈自主研发,堪称是科技感和人文感完美融合。
人自信的时候,说话都会变得坦率很多。
当 ChatGPT 老早就支持使用 LaTeX 语言输入和显示数学公式时,Claude 现在终于补上了这一功能。
几何更干净、细致,工作流更合理,Meshy的3D生成能力又进化了,所有人都可以免费试用。
浙江宁波,吉利旗下极氪的汽车工厂里,10多公斤重的箱子被双手抬起,稳稳放到流水线里,而这个搬运任务已经连续执行了21天。
AI市长候选人落选,AI政治应用引争议。
一键下载最大的视频分割数据集
为了实现算力层面的提升和追赶,国内有大量的厂商和从业者在各个产业链环节努力。但面对中短期内架构、制程、产能、出口禁令等多方面的制约,我们认为从芯片层面实现单点的突破依旧是非常困难且不足的。
热潮之后是什么
AI产品整体流量合计超过50亿,环比降低7.87%,Chat助手类产品流量占据57.74%。
一些信号
Meta加强推广Llama模型,谋求AI市场领导
AI智能体时刻来了~
商业化难解。
AI视频生成技术又一里程碑
Midjourney推网页版编辑器应对Ideogram 2.0竞争。
构建支持和增强人类能力的AI工具,而不是试图完全取代人类。
沉淀高质量数据,赋能更多细分行业。
这场峰会到底说了什么?一文速览2024全球品牌都在如何用AI。