AI资讯新闻榜单内容搜索-语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 语言模型
6000字解读:当前大语言模型LLM研究的10大挑战

6000字解读:当前大语言模型LLM研究的10大挑战

6000字解读:当前大语言模型LLM研究的10大挑战

大模型赛道已经吸引了大量企业或创业者投入,那么,目前大模型赛道都有哪些主流研究方向和共同挑战?这篇文章里,作者梳理了LLM研究的十大挑战,一起来看看

来自主题: AI技术研报
4699 点击    2023-11-10 14:38
AI大语言模型LLM,为啥老被翻译成“法学硕士”?

AI大语言模型LLM,为啥老被翻译成“法学硕士”?

AI大语言模型LLM,为啥老被翻译成“法学硕士”?

LLM这个缩写在机器翻译中被误解为“法学硕士”,而不是“大语言模型”。 • 机器翻译系统通常依赖上下文和大量文本数据来学习翻译,导致LLM更容易被翻译成“法学硕士”。

来自主题: AI资讯
1628 点击    2023-11-06 09:58
最新调查:AI大模型的两大难题,要靠“绿色计算”来解决?

最新调查:AI大模型的两大难题,要靠“绿色计算”来解决?

最新调查:AI大模型的两大难题,要靠“绿色计算”来解决?

在深度学习时代,尤其是随着大型语言模型(LLMs)的出现,大多数研究人员的注意力都集中在追求新的最先进(SOTA)结果上,使得模型规模和计算复杂性不断增加。

来自主题: AI技术研报
4101 点击    2023-11-04 22:21
物理所联合院网络中心发布AI模型MatChat,预测无机材料合成路径

物理所联合院网络中心发布AI模型MatChat,预测无机材料合成路径

物理所联合院网络中心发布AI模型MatChat,预测无机材料合成路径

中国科学院物理研究所/北京凝聚态物理国家研究中心SF10组和中国科学院计算机网络信息中心共同合作,将AI大模型应用于材料科学领域,将数万个化学合成路径数据投喂给大语言模型LLAMA2-7b,从而获得了MatChat模型

来自主题: AI技术研报
5032 点击    2023-11-04 10:43
专攻芯片设计,英伟达推出定制版大语言模型ChipNeMo!

专攻芯片设计,英伟达推出定制版大语言模型ChipNeMo!

专攻芯片设计,英伟达推出定制版大语言模型ChipNeMo!

在刚刚开幕的ICCAD 2023大会上,英伟达团队展示了用AI模型测试芯片,引发了业界关注。来自英伟达的研究团队开发了一种名为ChipNeMo的定制LLM,以公司内部数据为基础进行训练,用于生成和优化软件,并为人类设计师提供帮助。

来自主题: AI资讯
4850 点击    2023-11-01 14:56
多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

视觉幻觉是常见于多模态大语言模型的一个典型问题。最近,来自中科大等机构的研究人员提出了首个多模态修正架构「啄木鸟」,可有效解决MLLM输出幻觉的问题。

来自主题: AI技术研报
2613 点击    2023-11-01 09:49
用童话训练AI模型,微软找到了探索生成模型参数的新切入点

用童话训练AI模型,微软找到了探索生成模型参数的新切入点

用童话训练AI模型,微软找到了探索生成模型参数的新切入点

即便大语言模型的参数规模日渐增长,其模型中的参数到底是如何发挥作用的还是让人难以琢磨,直接对大模型进行分析又费钱费力。针对这种情况,微软的两位研究员想到了一个绝佳的切入点

来自主题: AI技术研报
8864 点击    2023-10-31 16:46
AI翻译文言文、给古彝文编码,华南理工这一科研团队助力古文保护与传承

AI翻译文言文、给古彝文编码,华南理工这一科研团队助力古文保护与传承

AI翻译文言文、给古彝文编码,华南理工这一科研团队助力古文保护与传承

近日,“机器翻译峰会MTS2023”在中国澳门圆满落幕。在会上举办的第一届古汉语机器翻译竞赛(EvaHan2023)中,华南理工大学电子与信息学院的金连文教授团队提出基于大语言模型(LLM)的方案在比赛中较大优势获得冠军。

来自主题: AI资讯
1720 点击    2023-10-29 10:11
港大等发布GraphGPT:1/50微调参数,准确率提升10倍!无需超长token,LLM也能读懂图结构

港大等发布GraphGPT:1/50微调参数,准确率提升10倍!无需超长token,LLM也能读懂图结构

港大等发布GraphGPT:1/50微调参数,准确率提升10倍!无需超长token,LLM也能读懂图结构

GraphGPT框架将图结构模型和大语言模型进行参数对齐,利用双阶段图指令微调范式提高模型对图结构的理解能力和适应性,再整合ChatGPT提高逐步推理能力,实现了更快的推理速度和更高的图任务预测准确率。

来自主题: AI技术研报
3597 点击    2023-10-28 21:18