AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增

大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增

大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增

删除权重矩阵的一些行和列,让 LLAMA-2 70B 的参数量减少 25%,模型还能保持 99% 的零样本任务性能,同时计算效率大大提升。这就是微软 SliceGPT 的威力。

来自主题: AI技术研报
4286 点击    2024-01-30 13:43
实测“超越GPT-4”的百川超千亿参数模型:医疗问答业内最强?

实测“超越GPT-4”的百川超千亿参数模型:医疗问答业内最强?

实测“超越GPT-4”的百川超千亿参数模型:医疗问答业内最强?

百川智能又对产品进行了一次大更新,发布了Baichuan 3模型。这次更新后,在多个权威通用能力评测CMMLU、GAOKAO和AGI-Eval中,其英文能力已经逼近 GPT-4,在中文任务表现上甚至超越了GPT-4:

来自主题: AI资讯
9179 点击    2024-01-30 11:27
腾讯发布大模型安全与伦理报告:以负责任AI引领大模型创新

腾讯发布大模型安全与伦理报告:以负责任AI引领大模型创新

腾讯发布大模型安全与伦理报告:以负责任AI引领大模型创新

在1月24日举办的腾讯科技向善创新节2024“大模型安全与伦理专题论坛”上,腾讯发布了大模型安全白皮书《大模型安全与伦理研究报告2024:以负责任AI引领大模型创新》,并邀请业界专家进行圆桌研讨。

来自主题: AI资讯
8109 点击    2024-01-30 10:53
GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板

GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板

GPT-4准确率最高飙升64%!斯坦福OpenAI重磅研究:全新Meta-Prompting方法让LLM当老板

大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华,让GPT-4的输出更精准。

来自主题: AI资讯
9437 点击    2024-01-29 16:34
从零手搓MoE大模型,大神级教程来了

从零手搓MoE大模型,大神级教程来了

从零手搓MoE大模型,大神级教程来了

Hugging Face上有一位机器学习大神,分享了如何从头开始建立一套完整的MoE系统。

来自主题: AI技术研报
6078 点击    2024-01-29 16:30
百川智能上新超千亿大模型Baichuan 3,冲榜成绩:若干中文任务超车GPT-4

百川智能上新超千亿大模型Baichuan 3,冲榜成绩:若干中文任务超车GPT-4

百川智能上新超千亿大模型Baichuan 3,冲榜成绩:若干中文任务超车GPT-4

发布了超千亿参数的最新版本大模型Baichuan 3,是百川智能基础模型第三代——就在20天前,这家由王小川创办的大模型公司,刚刚发布过角色大模型Baichuan-NPC。

来自主题: AI资讯
7427 点击    2024-01-29 16:18
哈工大联合快手提出CogGPT:大模型也需要认知迭代

哈工大联合快手提出CogGPT:大模型也需要认知迭代

哈工大联合快手提出CogGPT:大模型也需要认知迭代

在认知科学领域,人类通过持续学习改变认知的过程被称为认知迭代(Cognitive Dynamics)。形象地说,认知迭代就像是我们大脑的「软件更新」过程,手机应用通过不断的更新来修复 bug 和增加新功能,我们的大脑也通过不断学习新知识、经验,来改善和优化思考方式。

来自主题: AI技术研报
9000 点击    2024-01-29 12:45
王延峰:迫切需要重新审视我国大模型科研组织模式

王延峰:迫切需要重新审视我国大模型科研组织模式

王延峰:迫切需要重新审视我国大模型科研组织模式

ChatGPT 掀起的通用人工智能热潮仍在快速向前,产业竞争关键要素日渐明确,中美在通用人工智能领域的竞争也进入更高的战略层面。

来自主题: AI技术研报
4827 点击    2024-01-29 12:35