AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%

字节跳动豆包大模型团队于近日提出超连接(Hyper-Connections),一种简单有效的残差连接替代方案。面向残差连接的主要变体的局限问题,超连接可通过动态调整不同层之间的连接权重,解决梯度消失和表示崩溃(Representation Collapse)之间的权衡困境。在 Dense 模型和 MoE 模型预训练中,超连接方案展示出显著的性能提升效果,使收敛速度最高可加速 80%。

来自主题: AI技术研报
4549 点击    2024-11-07 17:41
具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队

具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队

具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队

近日,关于 Open AI 被投企业 Physical Intelligence (PI) 的一系列报道,让人们关注到具身智能大模型引发的机器人时代变革。

来自主题: AI资讯
2405 点击    2024-11-07 17:36
价值万亿的具身智能市场,大佬们如何从世界模型下刀?

价值万亿的具身智能市场,大佬们如何从世界模型下刀?

价值万亿的具身智能市场,大佬们如何从世界模型下刀?

具身智能,简单来说,就是赋予 AI 一个「身体」,让这颗聪明的大脑在物理世界中行动自如。 把这颗大脑升级成世界模型 —— 它拥有记忆、直觉和常识时,机器人可以不再机械地按训练行事,而是能够灵活变通,具体问题具体分析。

来自主题: AI技术研报
3901 点击    2024-11-07 17:33
量化前沿|利用大型语言模型构建动态金融知识图谱——FinDKG

量化前沿|利用大型语言模型构建动态金融知识图谱——FinDKG

量化前沿|利用大型语言模型构建动态金融知识图谱——FinDKG

在金融市场中,动态知识图谱(Dynamic Knowledge Graphs,DKGs)是一种表达对象之间随时间变化的多种关系的流行结构。它们可以有效地表示从复杂的非结构化数据源(如文本或图像)中提取的信息。在金融应用中,基于从金融新闻文章中获取的信息,DKGs 可用于检测战略性主题投资的趋势。

来自主题: AI技术研报
7417 点击    2024-11-07 10:32
Agent的“编排之战”|我开源了!

Agent的“编排之战”|我开源了!

Agent的“编排之战”|我开源了!

请问哪家大模型能够更准确地转化下述问题: “原告是安利股份的案件审理法院是哪家法院?”

来自主题: AI资讯
7601 点击    2024-11-07 09:49
不是OpenAI用不起,而是开源AI模型更有性价比?

不是OpenAI用不起,而是开源AI模型更有性价比?

不是OpenAI用不起,而是开源AI模型更有性价比?

尽管OpenAI因为不“open”而备受争议,每一次新模型发布、每一项功能更新,都能引发全行业的关注与跟进,并且以1570亿美元的估值成为“最贵”的AI初创企业,远超任何一家开源AI公司。同样的,Anthropic 也凭借 184 亿美元的估值领先大多数开源 AI 企业。

来自主题: AI资讯
1820 点击    2024-11-07 09:40
LLM的Prompt竟然是图灵完备的?LLM提示范式的第一个研究 | 重磅

LLM的Prompt竟然是图灵完备的?LLM提示范式的第一个研究 | 重磅

LLM的Prompt竟然是图灵完备的?LLM提示范式的第一个研究 | 重磅

近日,伊利诺伊大学香槟分校的研究团队发布了一篇开创性论文,首次从理论层面证明了大语言模型(LLM)中的prompt机制具有图灵完备性。这意味着,通过合适的prompt设计,一个固定大小的Transformer模型理论上可以计算任何可计算函数。这一突破性发现为prompt工程提供了坚实的理论基础。

来自主题: AI技术研报
4470 点击    2024-11-07 09:39
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列,参数规模达2100亿

大模型重构生命科学!最大基础模型面世,解锁DNA超长序列,参数规模达2100亿

大模型重构生命科学!最大基础模型面世,解锁DNA超长序列,参数规模达2100亿

今年,化学诺贝尔奖授予了AlphaFold,AI+Science受到空前的关注。人们惊叹于,仅仅是一个蛋白质结构预测模型,就能释放出如此巨大的行业潜力。 就在当下,在第三届中国生物计算大会上,全球规模最大的生命科学基础模型横空出世—— xTrimo V3,参数规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。

来自主题: AI资讯
2890 点击    2024-11-06 15:41