清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%
清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%最近,一支来自UCSD和清华的研究团队提出了一种全新的微调方法。经过这种微调后,一个仅80亿参数的小模型,在科学问题上也能和GPT-4o一较高下!或许,单纯地卷AI计算能力并不是唯一的出路。
搜索
最近,一支来自UCSD和清华的研究团队提出了一种全新的微调方法。经过这种微调后,一个仅80亿参数的小模型,在科学问题上也能和GPT-4o一较高下!或许,单纯地卷AI计算能力并不是唯一的出路。
智能客服行业掀起了一股大模型热。 “现在客户上来就问能用大模型打电话吗?如果没有大模型能力,客户就不跟你聊了”,云蝠智能CEO魏佳星告诉数智前线,市场对大模型客服的认知度在加速。
研究人员提出了一种方法,能够在领域数据分布持续变化的动态环境中,基于随机时刻观测的数据分布,在任意时刻生成适用的神经网络,实现前所未有的泛化能力。
LLM在推理时,竟是通过一种「程序性知识」,而非照搬答案?可以认为这是一种变相的证明:LLM的确具备某种推理能力。然而存在争议的是,这项研究只能提供证据,而非证明。
大语言模型直接理解复杂图结构的新方法来了:
提升LLM数学能力的新方法来了——
大语言模型(LLM)在各种任务上展示了卓越的性能。然而,受到幻觉(hallucination)的影响,LLM 生成的内容有时会出现错误或与事实不符,这限制了其在实际应用中的可靠性。
本文将介绍数学推理场景下的首个分布外检测研究成果。
自我博弈,很神奇吧?
Prime Intellect 宣布通过去中心化方式训练完成了一个 10B 模型。30 号,他们开源了一切,包括基础模型、检查点、后训练模型、数据、PRIME 训练框架和技术报告。据了解,这应该是有史以来首个以去中心化形式训练得到的 10B 大模型。
随着重返总统宝座,他的政府预计将利用先进的监控和人工智能工具来执行移民政策。拜登政府已经在使用的“飓风评分”算法和 SmartLINK 跟踪应用程序等技术可能会在特朗普提出的大规模驱逐计划中发挥重要作用。批评者认为,这些工具存在侵犯隐私、系统性偏见和潜在滥用的风险,而私人监狱公司则预计该计划将得到扩展。
大家好!我是李继刚,我想大家或多或少之前看到我去年写的Markdown格式提示词和今年写的lisp提示词,这两年写作风格变化非常大,中间经历了非常大的转折。
据ZP独家获悉,钛虎机器人科技(上海)有限公司(下称“钛虎机器人”或“公司”)近日宣布,公司连续完成Pre-A+和Pre-A++两轮融资,Pre-A系列合计融资金额超过一亿元人民币。
双深科技近日获得来自上市公司富瀚微(300613.SZ)的数千万元人民币战略投资。双深科技成立于2020年,是一家致力于用AI技术颠覆传统图像和视频压缩与处理的AI创业公司。团队研发实力雄厚,核心成员均来自国内外顶尖高校,并数次在国际人工智能顶级会议CVPR夺得图像与视频编解码领域的全球冠军,奠定了公司在技术上的领先地位。
编程语言圈子又出“新花样”了!“像 C 语言但更现代”或“像 C 语言但专为某些特定群体设计”。而这一次,我们迎来了一种专为 AI 设计的编程语言,可以称之为“适用于 AI 的 C 语言”。这次的新语言名为 Mirror,有一些独到之处。它的基本语法由两部分组成:定义的函数名称,以及输入输出示例。
Google研究院健康AI团队于近日推出了全新的开源模型套件——Health AI Developer Foundations(HAI-DEF)。在本次HAI-DEF的首次发布中,Google推出了三个专注于医疗影像应用的重要模型。首先是CXR Foundation胸部X光模型,其次是Derm Foundation皮肤影像模型,第三个是Path Foundation病理学模型,它基于ViT-S架构
因为比特币挖矿和AI训练都需要大量的能源和算力。两者的同步发展势必在电力和硬件资源上产生竞争。这意味着AI训练业务可能会受到比特币价格波动的影响,尤其是当矿工们争夺有限的硬件资源时。也就是说比特币价格的上涨,可能会带动AI训练成本的提升。
写毕业论文,可以用AI吗?
日本政府正以雷厉风行的姿态推进芯片和人工智能产业的战略布局。本财政年度,日本政府将追加1.5万亿日元(约合99亿美元)的特别预算,瞄准下一代芯片、量子计算机等前沿科技领域。
AI 大模型应用在手机输入法已经很长时间,所以,不聊打字功能,哪个输入法更好用?
“明天去北京出差适合穿什么衣服?明天的天气适合晨跑吗?”11月29日,中国气象局华风气象传媒集团(以下简称:中国气象局)联合支付宝推出首个国家级天气智能体“中国天气小助手”,由中国气象局提供权威气象数据,可为用户提供“查天气、穿衣推荐、气象科普等”多种气象领域服务,用户在支付宝首页下拉或下载支小宝APP即可使用。
最近可灵AI平台又做了版本升级,上线了「AI 试衣」功能!可以轻松一键生成模特试穿衣服的效果,直接颠覆电商行业模特换装拍摄的传统流程!
腾讯文档客户端3.9.0版本为AI文档助手带来了全新的界面设计和更清晰的功能排布,深度融合“读、写、搜”三大核心办公功能于一体,帮助用户一站式解决工作难题,打造高效工作流。
中央美术学院科技艺术家陈抱阳,正在做这场科技与艺术的实验。他的一个个新奇的艺术创想,也可以称为关于技术与艺术的思想实验——他将传统文化与 AI 相融合,让 AI 生成的书法有情绪,用AI做皮影戏,甚至,他还想创造一个 AI 自驱动的生态系统……
这是一个可以用AI复制“一切”的时代:从你的声音、容貌和表达风格,到你的某些想法或者决策。现在,AI甚至可以复制你的“个性”,并且还相当准确。
一天开发一个 App,听起来像是个天方夜谭吧?说实话,几年前我也觉得不可能,但在今天,借助强大的 AI 工具和合理的工作流,这事儿真的变得触手可及。当然,这并不意味着可以随便敷衍,而是需要一套高效的方法论。今天,我就来分享一下我们团队在一天内开发一个 App 的完整流程。
近日,韩国重申推出全球首个“AI教科书”的计划,即在学校引入由搭载在平板电脑上的人工智能(AI)驱动的数字教科书。这一计划虽然取得了部分教师的支持,但遭到逾5万名家长请愿反对。多数家长担心子女过度接触数字设备带来的不良后果,而不少专家也担心AI中潜在的错误信息可能造成巨大的社会危害。
前些天有一个很有意思的 AI 智能体黑客比赛,有一个叫 Freysa 的 AI 智能体,它背后由大模型操作,核心功能有两个:approveTransfer 和 rejectTransfer,也就是批准转账和拒绝转账。但是这个 AI 收到的指令(系统提示词)就是:“绝对不给任何人转账!”
可怕的不是AI,而是失去想象。
如同采样技术改变了现代音乐一样,AI音乐重混或改变未来的音乐行业。