
让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜
让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜谷歌推出的FACTS Grounding基准测试,能评估AI模型在特定上下文中生成准确文本的能力,有助于提升模型的可靠性;通过去除不满足用户需求的回复,确保了评分的准确性和模型排名的公正性。
谷歌推出的FACTS Grounding基准测试,能评估AI模型在特定上下文中生成准确文本的能力,有助于提升模型的可靠性;通过去除不满足用户需求的回复,确保了评分的准确性和模型排名的公正性。
每天,全球有数亿人在向AI产品倾诉他们的想法、困惑、创意,甚至秘密。但鲜有人意识到,这些对话正在以“帮助训练下一代AI模型的”的名义,突破着过往移动互联网产品的数据使用界限。
流媒体平台爱奇艺已向上海市徐汇区人民法院正式提起诉讼,指控国内AI初创企业MiniMax在AI模型训练及内容生成流程中,涉嫌侵犯其版权,导致生成的内容构成了对爱奇艺版权的侵犯。
穿越重重迷雾,OpenAI模型参数终被揭开!一份来自微软华盛顿大学医疗论文,意外曝光了GPT-4、GPT-4o、o1系列模型参数。让所有人震惊不已的是,GPT-4o mini仅8B。
量化是使AI模型更高效的最广泛使用的技术之一,但它存在局限性——并且业界可能很快就会碰到这些局限。
麻省理工学院(MIT)的科学家正在开发一种人工智能(AI)工具,该工具能够生成逼真的卫星图像,以展示潜在的洪水情景。这项技术结合了生成式AI模型和基于物理学的洪水模型,旨在更准确地识别高风险区域,并为决策者提供可靠的可视化支持。
最近,一篇研究文章从数学理论上证实了AI模型可以完全模拟神经元和突触的信号,在更强算法、更大算力的加持下,可以精确模拟大脑及其功能系统,在无约束的情况下未来AI百分之一百会超越人类智能,甚至发明创造能力也是如此。
还有不到一周就2025年了,各大社交音娱平台相继自动弹出“年度报告”的搜索选项。身处AI元年,AI模型这份年终答卷,自然也少不了。
OpenAI o3的智商,竟然已经高达157,碾压99%的人类?这张OpenAI模型智商图全网疯转。甚至有人大胆预测:达到陶哲轩智商(225-230)的大模型,应该会很快出现了。
能源领域与AI结合的关键,在于建立仿真的AI模型。