AI资讯新闻榜单内容搜索-Ash

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Ash
1毛钱1百万token,写2遍红楼梦!国产大模型下一步还想卷什么?

1毛钱1百万token,写2遍红楼梦!国产大模型下一步还想卷什么?

1毛钱1百万token,写2遍红楼梦!国产大模型下一步还想卷什么?

大模型价格战,这匹国产黑马又破纪录了!最低的GLM-4 Flash版本,百万token价格已经低至0.1元,可以说是击穿地心。MaaS 2.0大升级,让企业训练私有模型的成本无限降低。

来自主题: AI资讯
10087 点击    2024-06-06 11:09
即插即用,快速适配!港大FlashST:简单通用的智慧交通时空预测模型 | ICML 2024

即插即用,快速适配!港大FlashST:简单通用的智慧交通时空预测模型 | ICML 2024

即插即用,快速适配!港大FlashST:简单通用的智慧交通时空预测模型 | ICML 2024

华南理工大学和香港大学的研究人员在ICML 2024上提出了一个简单而通用的时空提示调整框架FlashST,通过轻量级的时空提示网络和分布映射机制,使预训练模型能够适应不同的下游数据集特征,显著提高了模型在多种交通预测场景中的泛化能力。

来自主题: AI技术研报
9725 点击    2024-06-04 15:54
你好世界!LLM开启人形机器人新纪元

你好世界!LLM开启人形机器人新纪元

你好世界!LLM开启人形机器人新纪元

由业内大佬Amnon Shashua创立的Mentee Robotics,突然放出大招,将AI的能力嵌入到机器人的各个层面,实现了与世界的动态交互。

来自主题: AI技术研报
9082 点击    2024-05-31 18:25
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动

众所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例,其训练总共需要 1,720,320 GPU hours。由于这些工作负载的规模和复杂性,导致训练大模型存在着独特的系统性挑战。

来自主题: AI技术研报
6929 点击    2024-05-12 15:49
中国最fashion的AIGC应用都在这里了 | 中国AIGC产业峰会

中国最fashion的AIGC应用都在这里了 | 中国AIGC产业峰会

中国最fashion的AIGC应用都在这里了 | 中国AIGC产业峰会

AIGC新应用,到底将重塑怎样的一个新世界? 现在,只需一天的时间,你就能感受到它们正在引领的科技新范式。

来自主题: AI资讯
11427 点击    2024-04-11 17:07
知衣科技CEO郑泽宇:服装行业距离真正的智能化还很远

知衣科技CEO郑泽宇:服装行业距离真正的智能化还很远

知衣科技CEO郑泽宇:服装行业距离真正的智能化还很远

不久前,AI新光年与知衣科技创始人兼CEO郑泽宇就“人工智能如何改变服装行业”的话题进行了一次探讨。2024年伊始,这位年轻的AI高级工程师做完了2023年复盘,也做好了新一年的规划。

来自主题: AI资讯
9124 点击    2024-01-25 10:43