AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
简单通用:视觉基础网络最高3倍无损训练加速,清华EfficientTrain++入选TPAMI 2024

简单通用:视觉基础网络最高3倍无损训练加速,清华EfficientTrain++入选TPAMI 2024

简单通用:视觉基础网络最高3倍无损训练加速,清华EfficientTrain++入选TPAMI 2024

近年来,「scaling」是计算机视觉研究的主角之一。随着模型尺寸和训练数据规模的增大、学习算法的进步以及正则化和数据增强等技术的广泛应用,通过大规模训练得到的视觉基础网络(如 ImageNet1K/22K 上训得的 Vision Transformer、MAE、DINOv2 等)已在视觉识别、目标检测、语义分割等诸多重要视觉任务上取得了令人惊艳的性能。

来自主题: AI技术研报
10615 点击    2024-05-22 13:33
Hinton万字访谈:用更大模型「预测下一个词」值得全力以赴

Hinton万字访谈:用更大模型「预测下一个词」值得全力以赴

Hinton万字访谈:用更大模型「预测下一个词」值得全力以赴

「这份访谈的每一秒都是精华。」最近,图灵奖得主 Geoffrey Hinton 的一个访谈视频得到了网友的高度评价。

来自主题: AI资讯
9602 点击    2024-05-22 13:23
拯救被「掰弯」的GPT-4!西交微软北大联合提出IN2训练治疗LLM「中间迷失」

拯救被「掰弯」的GPT-4!西交微软北大联合提出IN2训练治疗LLM「中间迷失」

拯救被「掰弯」的GPT-4!西交微软北大联合提出IN2训练治疗LLM「中间迷失」

近日,西交微软北大联合提出信息密集型训练大法,使用纯数据驱动的方式,矫正LLM训练过程产生的偏见,在一定程度上治疗了大语言模型丢失中间信息的问题。

来自主题: AI技术研报
10156 点击    2024-05-22 13:08
不能承受的「平庸」之重:字节跳动的AI反击战

不能承受的「平庸」之重:字节跳动的AI反击战

不能承受的「平庸」之重:字节跳动的AI反击战

不创新,死路一条 字节跳动,已无法再低调。 • 外媒报道,字节跳动2023年营收1100亿美元,可能超过腾讯、逼近Meta; • TikTok在美国渡劫,作为增长引擎的海外业务遭遇不确定性; • 字节跳动在AI竞赛上显得“迟钝”,公司内部“到2023年才开始讨论GPT”;

来自主题: AI资讯
10430 点击    2024-05-22 13:04
微软深夜再掀AI生产力革命,奥特曼登台「自曝」新模型!定制Copilot十亿打工人狂欢

微软深夜再掀AI生产力革命,奥特曼登台「自曝」新模型!定制Copilot十亿打工人狂欢

微软深夜再掀AI生产力革命,奥特曼登台「自曝」新模型!定制Copilot十亿打工人狂欢

微软昨夜刚上演了一波AI PC革命,今天又全是Copilot。而最让人意外的,竟是奥特曼本人登台预告了下一代模型将会带来新的模态和整体智能。

来自主题: AI技术研报
9257 点击    2024-05-22 13:00
阿里云大模型降价不是短期竞争行为,而是长期战略选择

阿里云大模型降价不是短期竞争行为,而是长期战略选择

阿里云大模型降价不是短期竞争行为,而是长期战略选择

今天,国内大模型圈十分热闹,先是阿里云宣布大模型降价,随后国内多家公司跟进、回应,掀起一轮行业的降价潮。

来自主题: AI资讯
10224 点击    2024-05-22 12:43
黑马!大模型竞技场榜单更新,国产玩家首次进入全球总榜前10

黑马!大模型竞技场榜单更新,国产玩家首次进入全球总榜前10

黑马!大模型竞技场榜单更新,国产玩家首次进入全球总榜前10

龙争虎斗的大模型竞技场,今天突然更新:国内大模型公司零一万物旗下的Yi-Large千亿参数闭源大模型,跃升总榜第七,也成为榜上国产大模型第一。可以看到,它的成绩几乎与GPT-4-0125-preview持平。同时,国内清华系大模型公司智谱华章的GLM-4-0116也杀进总榜,位居第15位。

来自主题: AI资讯
7084 点击    2024-05-21 19:37