AI资讯新闻榜单内容搜索-大语言模型

清华联合智谱AI重磅发布：中文10000字长文写作模型和提示词技术，或将改变行业

虽然大语言模型(LLM)的能力不断突破，但在长文生成方面却一直存在瓶颈。近日，清华大学和智谱AI联合发布的最新研究成果，为解决这一难题提供了创新方案。这项名为"LongWriter"的技术，成功将AI模型的长文生成能力从约2000字提升至10000字以上，同时保持了高质量输出。这一成果通过创新的数据构建方法、模型训练策略和评估基准，为AI长文创作开辟了新天地。

来自主题: AI资讯

7409 点击 2024-08-20 15:05

从头设计抗体，腾讯、北大团队预训练大语言模型登Nature子刊

AI 技术在辅助抗体设计方面取得了巨大进步。然而，抗体设计仍然严重依赖于从血清中分离抗原特异性抗体，这是一个资源密集且耗时的过程。

来自主题: AI资讯

8280 点击 2024-08-18 17:31

上线“魔力工作室”功能，Canva将AI融入到视觉设计中丨最前线

在未来，从大语言模型的角度，「Canva可画」会向着更加垂直、更加深耕的方向来发展。

来自主题: AI资讯

5096 点击 2024-08-17 11:19

没有等来OpenAI开源GPT-4o，等来了开源版VITA

大语言模型 (LLM) 经历了重大的演变，最近，我们也目睹了多模态大语言模型 (MLLM) 的蓬勃发展，它们表现出令人惊讶的多模态能力。特别是，GPT-4o 的出现显著推动了 MLLM 领域的发展。然而，与这些模型相对应的开源模型却明显不足。开源社区迫切需要进一步促进该领域的发展，这一点怎么强调也不为过。

来自主题: AI资讯

8410 点击 2024-08-14 17:38

21.5万张X光，78万个问题！德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA

多模态大语言模型 (Multimodal Large Language Moodel, MLLM) 以其强大的语言理解能力和生成能力，在各个领域取得了巨大成功。

来自主题: AI资讯

7001 点击 2024-08-10 12:03

ACL 2024 Oral | 大模型也会被忽悠？揭秘AI的信念之旅

地球是平的吗？当然不是。自古希腊数学家毕达哥拉斯首次提出地圆说以来，现代科学技术已经证明了地球是圆形这一事实。但是，你有没有想过，如果 AI 被误导性信息 “忽悠” 了，会发生什么？来自清华、上海交大、斯坦福和南洋理工的研究人员在最新的论文中深入探索 LLMs 在虚假信息干扰情况下的表现，他们发现大语言模型在误导信息反复劝说下，非常自信地做出「地球是平的」这一判断。

来自主题: AI资讯

3247 点击 2024-08-07 11:20

Agentic Workflow新范式，基于大语言模型的工作流、业务流程、智能体大融合

2024年2月底，金融服务公司Klarna表示，其所使用的OpenAI提供技术支持的AI Agent，已接管了三分之二的客户聊天，工作量相当于700名全职代理。从引入AI Agent到取得这份耀眼的成绩，仅仅用了1个月的时间。

来自主题: AI资讯

7017 点击 2024-08-05 19:53

早期项目｜硅谷初创公司「Aizip」创建小语言模型Gizmo，应用于边缘市场

从前两年的百模大战到大语言模型 LLM（Large Language Model）的逐步落地应用，端侧AI始终是人工智能技术发展中至关重要的一环。所谓的端侧AI，即用户在使用过程中不依赖云服务器，直接在终端设备本地使用AI服务。相比于ChatGPT4.0和最新推出的Llama3.1等依赖于云端接口的主流大语言模型，设备端边缘应用的紧凑模型有较强的私密性，也具有个性化操作和节省成本等诸多优势。

来自主题: AI资讯

8366 点击 2024-08-05 15:45

小技巧大功效，「仅阅读两次提示」让循环语言模型超越Transformer++

在当前 AI 领域，大语言模型采用的主流架构是 Transformer。不过，随着 RWKV、Mamba 等架构的陆续问世，出现了一个很明显的趋势：在语言建模困惑度方面与 Transformer 较量的循环大语言模型正在快速进入人们的视线。

来自主题: AI资讯

10164 点击 2024-08-04 14:04

ICML 2024演讲爆火！Meta朱泽园揭秘大模型内心世界：不同于人类的2级推理

大语言模型 (LLM) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？

来自主题: AI技术研报

9394 点击 2024-08-03 14:25