AI资讯新闻榜单内容搜索-语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 语言模型
Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3

Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3

Mistral携微软引爆「小语言模型」潮!Mistral中杯代码能力完胜GPT-4,成本暴降2/3

小模型的风潮,最近愈来愈盛,Mistral和微软分别有所动作。而网友实测发现,Mistral-medium的代码能力竟然完胜了GPT-4,而所花成本还不到三分之一。

来自主题: AI技术研报
7079 点击    2023-12-17 12:15
字节跳动被曝秘密使用OpenAI技术、账户被暂停,三方回应

字节跳动被曝秘密使用OpenAI技术、账户被暂停,三方回应

字节跳动被曝秘密使用OpenAI技术、账户被暂停,三方回应

据外媒报道,在生成式AI竞争中处于落后的字节跳动想要“抄近道”,该公司一直在秘密使用OpenAI的技术开发自家大语言模型,这违反了OpenAI的服务条款。

来自主题: AI资讯
10058 点击    2023-12-16 14:21
在这些未解难题上,AI已经胜过人类数学家

在这些未解难题上,AI已经胜过人类数学家

在这些未解难题上,AI已经胜过人类数学家

DeepMind的研究团队开发了一款基于大型语言模型的人工智能系统,名为FunSearch,可以在数学和计算机科学中生成新的解。通过迭代中的进化,FunSearch能够解决复杂的数学问题,并发现新的数学知识和算法。这种基于大型语言模型的人工智能系统不仅能超越人类数学家,而且比现有的方法更有效。

来自主题: AI资讯
4908 点击    2023-12-16 10:35
大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE

大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE

大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE

大语言模型(LLM)被越来越多应用于各种领域。然而,它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则:每个词(token)的生成都需要进行一次前向传播,需要访问数十亿至数千亿参数的 LLM。这导致传统自回归解码的速度较慢。

来自主题: AI资讯
5679 点击    2023-12-15 11:37
微软提出变色龙框架,让模型自带工具箱开挂,数学推理任务准确率98%|NeurIPS 2023

微软提出变色龙框架,让模型自带工具箱开挂,数学推理任务准确率98%|NeurIPS 2023

微软提出变色龙框架,让模型自带工具箱开挂,数学推理任务准确率98%|NeurIPS 2023

教大模型调用工具,已经是AI圈关注度最高的话题之一了。这不,又有一项研究登上最新NeurIPS 2023——它是一个叫做Chameleon(变色龙)的框架,号称能将大语言模型直接变成魔法师的工具箱,来自微软与加州大学洛杉矶分校(UCLA)。

来自主题: AI资讯
5988 点击    2023-12-13 16:30
微软小模型击败大模型:27亿参数,手机就能跑

微软小模型击败大模型:27亿参数,手机就能跑

微软小模型击败大模型:27亿参数,手机就能跑

上个月,微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源,在常识推理、语言理解和逻辑推理方面的性能显著改进。

来自主题: AI资讯
6944 点击    2023-12-13 16:21
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano

2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano

2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano

都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!

来自主题: AI资讯
8123 点击    2023-12-13 15:41
用RLHF 2%的算力让LLM停止有害输出,字节提出LLM遗忘学习

用RLHF 2%的算力让LLM停止有害输出,字节提出LLM遗忘学习

用RLHF 2%的算力让LLM停止有害输出,字节提出LLM遗忘学习

随着大型语言模型(LLM)的发展,从业者面临更多挑战。如何避免 LLM 产生有害回复?如何快速删除训练数据中的版权保护内容?如何减少 LLM 幻觉(hallucinations,即错误事实)? 如何在数据政策更改后快速迭代 LLM?这些问题在人工智能法律和道德的合规要求日益成熟的大趋势下,对于 LLM 的安全可信部署至关重要。

来自主题: AI资讯
7101 点击    2023-12-13 15:35
DeepMind的新AI研究:人类最后的自留地失守了?

DeepMind的新AI研究:人类最后的自留地失守了?

DeepMind的新AI研究:人类最后的自留地失守了?

喂给大模型语料——最初是维基百科和Reddit,后来扩展到音频、视觉图像甚至雷达和热图像——后者广义上说是换了种表达方式的语言。也因此有生成式AI的创业者认为,一个极度聪明的大语言模型就是那个通往AGI最终答案,多模态的研究道路只是目前对前者的底气不足。

来自主题: AI资讯
2930 点击    2023-12-13 10:16
深度揭秘爆火MoE!GPT-4关键架构,成开源模型逆袭杀手锏

深度揭秘爆火MoE!GPT-4关键架构,成开源模型逆袭杀手锏

深度揭秘爆火MoE!GPT-4关键架构,成开源模型逆袭杀手锏

上周末,Mistral甩出的开源MoE大模型,震惊了整个开源社区。MoE究竟是什么?它又是如何提升了大语言模型的性能?

来自主题: AI资讯
6977 点击    2023-12-11 20:34