AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型

发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型

发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型

一觉醒来,Mistral AI 又发力了。 就在今天,Mistral AI 多模态家族迎来了第二位成员:一个名为 Pixtral Large 的超大杯基础模型。

来自主题: AI资讯
5368 点击    2024-11-20 08:51
AI的三门生意:修塔、搬砖和好奇心

AI的三门生意:修塔、搬砖和好奇心

AI的三门生意:修塔、搬砖和好奇心

AI中有三门生意:修塔、搬砖,和好奇心产品。

来自主题: AI资讯
7126 点击    2024-11-20 08:43
LiveBench 最新榜单:阶跃星辰位列中国大模型第一

LiveBench 最新榜单:阶跃星辰位列中国大模型第一

LiveBench 最新榜单:阶跃星辰位列中国大模型第一

国际权威榜单 LiveBench 官网发布最新的榜单成绩显示,阶跃星辰自研的万亿参数语言大模型 Step-2 在榜单中位列国产基座大模型第一

来自主题: AI资讯
7314 点击    2024-11-19 22:20
腾讯混元技术负责人之一刘威,离职创业

腾讯混元技术负责人之一刘威,离职创业

腾讯混元技术负责人之一刘威,离职创业

《智能涌现》从多名独立信源处获悉,原腾讯混元大模型技术负责人之一刘威于近日离职。 对上述信息,截至发稿前,腾讯官方暂无回应。 多名从业者对《智能涌现》表示,刘威已经在新加坡创业,瞄准的还是视频生成领域。

来自主题: AI资讯
6610 点击    2024-11-19 21:13
具身大模型学习——OCTO

具身大模型学习——OCTO

具身大模型学习——OCTO

在多样化的机器人数据集上预训练的大型策略有潜力改变机器人学习:与从头开始训练新策略相比,这种通用型机器人策略可以通过少量的领域内数据进行微调,同时具备广泛的泛化能力。

来自主题: AI资讯
6355 点击    2024-11-19 21:10
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

北大等出品,首个多模态版o1开源模型来了—— 代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。 在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。

来自主题: AI技术研报
5339 点击    2024-11-19 21:01
面向代码语言模型的安全性研究全新进展,南大&NTU联合发布全面综述

面向代码语言模型的安全性研究全新进展,南大&NTU联合发布全面综述

面向代码语言模型的安全性研究全新进展,南大&NTU联合发布全面综述

近年来,代码语言模型(Language Models for Code,简称 CodeLMs)逐渐成为推动智能化软件开发的关键技术,应用场景涵盖智能代码生成与补全、漏洞检测与修复等。

来自主题: AI资讯
6794 点击    2024-11-19 20:35
LLM为何频频翻车算术题?最新研究追踪单个神经元,「大脑短路」才是根源

LLM为何频频翻车算术题?最新研究追踪单个神经元,「大脑短路」才是根源

LLM为何频频翻车算术题?最新研究追踪单个神经元,「大脑短路」才是根源

大模型在数学问题上的表现不佳,原因在于采取启发式算法进行数学运算的,通过定位到多层感知机(MLP)中的单个神经元,可以对进行数学运算的具体过程进行解释。

来自主题: AI技术研报
7020 点击    2024-11-19 19:53