让企业为大模型买单,目前有四大难
让企业为大模型买单,目前有四大难要让更多的行业和企业为大模型买单,不是一蹴而就的事情
搜索
要让更多的行业和企业为大模型买单,不是一蹴而就的事情
或许只有用大模型来监督大模型,才能出现超越人类的人工智能。
以发展的眼光看待价值对齐问题。
Character AI 也要走上 Stability AI 的老路了?
AI和自动驾驶相辅相成
Agentic AI是比下一代基础模型更具潜力的AI发展方向
只要仍使用英语训练 LLM 模型,美国就还有优势。
苍蝇再小也是肉,聚沙成塔。
扎克伯格讨论MetaAI开源策略及其未来展望。
大厂拴不住的高级打工人,正涌向AIGC风口创业。
融资正在不断向头部集中
WWDC 2024上,苹果推出了Apple Intelligence,向大家展示了如何开发、训练出功能强大、快速且节能的模型,如何根据特定用户需求进行微调,以及如何评估模型的性能。
当前大语言模型(LLM)的评估方法受到数据污染问题的影响,导致评估结果被高估,无法准确反映模型的真实能力。北京大学等提出的KIEval框架,通过知识基础的交互式评估,克服了数据污染的影响,更全面地评估了模型在知识理解和应用方面的能力。
国产多模态大模型的头号交椅,再次易主
姚班大神陈立杰最新去向现已明朗:2025年秋季起,任加州大学伯克利分校EECS助理教授。
10亿名“员工”生产数据合成,数量占到了世界人口的13%。
文生图也有自己的prompt优化工具了。
只要把推理和感知能力拆分,2B大模型就能战胜20B?!
因为 AI 为自己的工作焦虑,这件事不是一天两天了。
AI 考古,追溯到了祖师爷头上。
不仅能恢复行走能力,还能感受到空间位置。
神经网络通常由三部分组成:线性层、非线性层(激活函数)和标准化层。线性层是网络参数的主要存在位置,非线性层提升神经网络的表达能力,而标准化层(Normalization)主要用于稳定和加速神经网络训练,很少有工作研究它们的表达能力,例如,以Batch Normalization为例
多模态命名实体识别,作为构建多模态知识图谱的一项基础而关键任务,要求研究者整合多种模态信息以精准地从文本中提取命名实体。尽管以往的研究已经在不同层次上探索了多模态表示的整合方法,但在将这些多模态表示融合以提供丰富上下文信息、进而提升多模态命名实体识别的性能方面,它们仍显不足。
「微调你的模型,获得比GPT-4更好的性能」不只是说说而已,而是真的可操作。最近,一位愿意动手的ML工程师就把几个开源LLM调教成了自己想要的样子。
两年一届的ECCV录用结果终于揭晓了!刚刚,ECCV组委会公布了录用论文名单,共有2395篇论文被录用。
最近,在美国00后中爆火的Character AI,竟然把聊天机器人对话模型给「阉割」了?愤怒的年轻人们冲进社区,抱怨的声浪快要掀翻天了!而这背后,似乎还有谷歌或Meta的授意。
10万张H100卡构成的超级AI算力集群就像是现代人类文明的奇观,是人类通向AGI的钥匙。AI时代的军备竞赛已经拉开帷幕,赌注是天量的Capex支出,胜者则有机会成为AI时代的造物主。
在盖茨眼里,AI对于计算机交互的革命还没来到,但是Scaling Law似乎已经看到尽头了。
走到风口,就必须要跟风吗?
中国的大模型已经在春天了。