AI资讯新闻榜单内容搜索-模型

解析大模型中的Scaling Law

计划训练一个10B的模型，想知道至少需要多大的数据？收集到了1T的数据，想知道能训练一个多大的模型？老板准备1个月后开发布会，给的资源是100张A100，那应该用多少数据训一个多大模型最终效果最好？

来自主题: AI技术研报

13074 点击 2023-11-20 10:09

梅拉妮·米歇尔Science刊文：AI能否自主学习世界模型？

现代认知科学认为，人类会在头脑中构建关于周围真实世界的抽象模型——世界模型（world model）。获取“世界模型”的问题一直是人工智能研究的焦点。OpenAI 联合创始人兼首席科学家 Ilya Sutskever 认为， ChatGPT 已经学到了关于真实世界的复杂抽象模型。

来自主题: AI技术研报

4987 点击 2023-11-19 22:56

当专业 AI 团队介入游戏开发

有一部分业内人士开始专门钻研 AI 技术，并且尝试作为一个独立的团队与游戏厂商展开合作，为他们提供包括建立合理工作流、自主训练模型、AI 辅助概念设计等方面的解决方案。和 AI 技术一样，这种团队非常新兴，人们尚且不够全面了解他们所能做到的事情。

来自主题: AI技术研报

5072 点击 2023-11-19 22:27

AI速成公文，实用不实用？

随着人工智能技术迅猛发展，AI大模型在各垂直领域的应用日趋深入。近期，不少AI软件陆续推出了公文写作板块，或上线“公文版”，提供通知公告等法定公文，以及讲话稿、工作总结等事务性文书的写作生成服务。

来自主题: AI资讯

5203 点击 2023-11-19 12:25

「无需配对数据」就能学习！浙大等提出连接多模态对比表征C-MCR｜NeurIPS 2023

C-MCR利用现有多模态对比表征间可能存在的重叠模态，来连接不同的对比表征，从而学到更多模态间的对齐关系，实现了在缺乏配对数据的多模态间进行训练。

来自主题: AI技术研报

3285 点击 2023-11-19 12:23

Nature：大模型只会搞角色扮演，并不真正具有自我意识

大模型正变得越来越“像人”，但事实真是如此吗？现在，一篇发表Nature上的文章，直接否决了这个观点——所有大模型，都不过是在玩角色扮演而已！

来自主题: AI技术研报

4331 点击 2023-11-19 12:15

新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告3.0》

11月18日，新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告3.0》（以下简称报告）。报告显示，迭代风潮之下，大模型产品正在迅速适应并引领市场变革。其中，科大讯飞星火、商汤商量和智谱AI-ChatGLM等厂商表现总体优秀。

来自主题: AI技术研报

8340 点击 2023-11-18 23:07

让Stable Diffusion一秒出图！清华硕士加速神器爆火，已有公司接入

AI图像生成，已经进入了秒速级别，只要4步推理就能完成绘制，最快更是能在1秒之内完成。现在，清华大学联合HuggingFace的研究人员，推出了全新的绘图模型加速模块。

来自主题: AI技术研报

5541 点击 2023-11-17 21:54

社交媒体巨头 Meta 推出了用于内容编辑和生成的最新人工智能 (AI) 模型。

根据一篇推特文章报道，社交媒体巨头 Meta 推出了用于内容编辑和生成的最新人工智能 (AI) 模型。该公司正在推出两种人工智能驱动的生成模型，一个是 Emu Video，利用 Meta 之前的 Emu 模型，能够根据文本和图像输入生成视频剪辑；另一个是模型 Emu Edit 专注于图像处理，有望提高图像编辑的精度。

来自主题: AI资讯

6305 点击 2023-11-17 11:01

李开复回应 Yi 大模型套壳 LLaMA 争议：受益于开源也贡献开源

针对近日零一万物被质疑完全使用 LLaMA 架构，只对两个张量（Tensor）名称做修改，李开复在朋友圈进行了回应。

来自主题: AI资讯

6379 点击 2023-11-17 10:42