AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: 模型
聪明人用DeepSeek的正确姿势

聪明人用DeepSeek的正确姿势

聪明人用DeepSeek的正确姿势

一些推理模型的使用技巧和启示

来自主题: AI资讯
2778 点击    2025-02-18 14:20
硅谷视角深聊:Deepseek的颠覆、冲击、争议和误解

硅谷视角深聊:Deepseek的颠覆、冲击、争议和误解

硅谷视角深聊:Deepseek的颠覆、冲击、争议和误解

四万字深聊DeepSeek!2025年1月底在媒体聚集的达沃斯论坛上,微软CEO Satya Nadella以及Scale AI创始人Alexandr Wang的发言直接将DeepSeek推到风口浪尖...

来自主题: AI资讯
7634 点击    2025-02-18 14:16
北大彭宇新教授团队开源细粒度多模态大模型Finedefics

北大彭宇新教授团队开源细粒度多模态大模型Finedefics

北大彭宇新教授团队开源细粒度多模态大模型Finedefics

尽管多模态大模型在通用视觉理解任务中表现出色,但不具备细粒度视觉识别能力,这极大制约了多模态大模型的应用与发展。针对这一问题,北京大学彭宇新教授团队系统地分析了多模态大模型在细粒度视觉识别上所需的 3 项能力:对象信息提取能力、类别知识储备能力、对象 - 类别对齐能力,发现了「视觉对象与细粒度子类别未对齐」

来自主题: AI资讯
7743 点击    2025-02-17 17:37
语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

近年来,大语言模型(LLMs)取得了突破性进展,展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前,普遍的观点认为其成功依赖于自回归模型的「next token prediction」范式。

来自主题: AI技术研报
7047 点击    2025-02-17 14:37
AI时代如何避免被淘汰?吴恩达:成为职场「10倍专业人士」

AI时代如何避免被淘汰?吴恩达:成为职场「10倍专业人士」

AI时代如何避免被淘汰?吴恩达:成为职场「10倍专业人士」

人工智能科学家吴恩达指出,AI的浪潮将席卷各行各业,催生「10倍专业人士」!这不仅仅是效率的提升,更是工作方式的变革。本文将深入解读AI如何赋能职场,揭示成为「10倍人才」的秘诀!

来自主题: AI资讯
3846 点击    2025-02-17 14:14
DeepSeek冲击之下,大模型六小强如何「回应」?

DeepSeek冲击之下,大模型六小强如何「回应」?

DeepSeek冲击之下,大模型六小强如何「回应」?

马上整整1个月了!这一个月以来,全球大模型市场受DeepSeek搅动,无不方寸大乱。中外大厂、初创公司都头好秃,全被追着问:你们对DeepSeek怎么看?DeepSeek出来你们怎么办?

来自主题: AI资讯
6742 点击    2025-02-16 13:50
比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

自然语言 token 代表的意思通常是表层的(例如 the 或 a 这样的功能性词汇),需要模型进行大量训练才能获得高级推理和对概念的理解能力,

来自主题: AI技术研报
4556 点击    2025-02-16 13:12