AI资讯新闻榜单内容搜索-思维链

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 思维链
OpenAI o1式思维链,开源模型也可以有,成功案例来了

OpenAI o1式思维链,开源模型也可以有,成功案例来了

OpenAI o1式思维链,开源模型也可以有,成功案例来了

北京时间 9 月 13 日午夜,OpenAI 发布了推理性能强大的 ο1 系列模型。之后,各路研究者一直在尝试挖掘 ο1 卓越性能背后的技术并尝试复现它。当然,OpenAI 也想了一些方法来抑制窥探,比如有多名用户声称曾试图诱导 ο1 模型公布其思维过程,然后收到了 OpenAI 的封号威胁。

来自主题: AI资讯
5578 点击    2024-09-17 19:02
o1完整思维链成OpenAI头号禁忌!问多了等着封号吧

o1完整思维链成OpenAI头号禁忌!问多了等着封号吧

o1完整思维链成OpenAI头号禁忌!问多了等着封号吧

警告!不要在ChatGPT里问最新o1模型是怎么思考的——只要尝试几次,OpenAI就会发邮件威胁撤销你的使用资格。

来自主题: AI资讯
3490 点击    2024-09-14 14:53
你写提示词应该更直白一点,把Top-k直接写进Prompt,无需提示的思维链推理 | DeepMind

你写提示词应该更直白一点,把Top-k直接写进Prompt,无需提示的思维链推理 | DeepMind

你写提示词应该更直白一点,把Top-k直接写进Prompt,无需提示的思维链推理 | DeepMind

高端的食材,往往只需要最朴素的烹饪方式;高端的提示词也一样,把Top-K写进来,一个专属于你的CoT-decoding解码策略应运而生!丝毫不要怀疑LLM的推理能力,在这个维度上,它比我们懂!

来自主题: AI资讯
7790 点击    2024-09-10 10:48
北大李戈团队提出大模型单测生成新方法,显著提升代码测试覆盖率

北大李戈团队提出大模型单测生成新方法,显著提升代码测试覆盖率

北大李戈团队提出大模型单测生成新方法,显著提升代码测试覆盖率

单元测试是软件开发流程中的一个关键环节,主要用于验证软件中的最小可测试单元,函数或模块是否按预期工作。单元测试的目标是确保每个独立的代码片段都能正确执行其功能,对于提高软件质量和开发效率具有重要意义。

来自主题: AI技术研报
5358 点击    2024-09-03 16:22
LLM推理性能受输出格式影响,JSON最严重

LLM推理性能受输出格式影响,JSON最严重

LLM推理性能受输出格式影响,JSON最严重

输出格式不同,竟然还能影响大模型发挥?!

来自主题: AI资讯
9764 点击    2024-08-16 21:15
ACL 2024 Oral|我们离真正的多模态思维链推理还有多远?

ACL 2024 Oral|我们离真正的多模态思维链推理还有多远?

ACL 2024 Oral|我们离真正的多模态思维链推理还有多远?

在过去的几年中,大型语言模型(Large Language Models, LLMs)在自然语言处理(NLP)领域取得了突破性的进展。这些模型不仅能够理解复杂的语境,还能够生成连贯且逻辑严谨的文本。

来自主题: AI技术研报
8897 点击    2024-08-11 13:25
首个视频思维链推理框架Video-of-Thought来了:像人一样从感知到认知全面推理视频

首个视频思维链推理框架Video-of-Thought来了:像人一样从感知到认知全面推理视频

首个视频思维链推理框架Video-of-Thought来了:像人一样从感知到认知全面推理视频

最近,新加坡国立大学联合南洋理工大学和哈工深的研究人员共同提出了一个全新的视频推理框架,这也是首次大模型推理社区提出的面向视频的思维链框架(Video-of-Thought, VoT)。视频思维链VoT让视频多模态大语言模型在复杂视频的理解和推理性能上大幅提升。该工作已被ICML 2024录用为Oral paper。

来自主题: AI技术研报
9986 点击    2024-07-12 17:54
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点

Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点

Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点

想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等技术正是由此产生的灵感。

来自主题: AI技术研报
7498 点击    2024-06-29 00:14