
Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板
Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板AI自主研发会真的「失控」了吗?最新研究显示,Claude 3.5 Sonnet和o1-preview在2小时内的研发任务中,击败了50多位人类专家。但另一个耐人寻味的现象是,给予更长时间周期后,人类专家在8小时任务中优势显现。
AI自主研发会真的「失控」了吗?最新研究显示,Claude 3.5 Sonnet和o1-preview在2小时内的研发任务中,击败了50多位人类专家。但另一个耐人寻味的现象是,给予更长时间周期后,人类专家在8小时任务中优势显现。
创业9个月不到,李洋光是技术研发投入就烧光了2000万元,8月现金流断裂后,离开大厂,曾经想“用AGI改变世界”的李洋,创业未半,中道还背上了债务。
2024年诺贝尔物理学奖和诺贝尔化学奖于10月揭晓,获奖者分别为美国科学家约翰·J·霍普菲尔德(John J.Hopfield)与英国科学家杰弗里·E·辛顿(Geoffrey E.Hinton),以及美国生物化学家大卫·贝克(David Baker)和谷歌旗下DeepMind公司AI科学家德米斯·哈萨比斯(Demis Hassabis)和约翰·江珀(John M.Jumper)。
今早看到好多媒体文章都在说,OpenAI会在12月之前发布猎户座Orion!
NotebookLM 是谷歌开发的一款实验性的 AI 云笔记应用。它基于用户上传的内容,结合 Google Gemini 和 RAG 技术,完成文本摘要、问答、创作等任务,是个性化的笔记助手。
从o1到Cursor,再到Canva和Notebooklm,大模型正在快速进入应用落地阶段,所有创业者和开发者甚至研究者都要思考如何让这个技术直面用户,更快走入消费者市场。
大模型的能力越来越强,用户在一些重要的任务中也可以依赖大模型,比如说辅助做科研。 不过现有科研辅助相关的基准测试都太简单,跟现实世界的任务差距还是比较大的。
Jiajun Xu : Meta AI科学家,专注大模型和智能眼镜开发。南加州大学博士,Linkedin Top AI Voice,畅销书作家。他的AI科普绘本AI for Babies (“宝宝的人工智能”系列,双语版刚在国内出版) 畅销硅谷,曾获得亚马逊儿童软件、编程新书榜榜首。
近日,一篇关于自动化 AI 研究的论文引爆了社交网络,原因是该论文得出了一个让很多人都倍感惊讶的结论:LLM 生成的想法比专家级人类研究者给出的想法更加新颖!
有助于解决阻碍材料开发的化学难题。