抵挡AI的最后一个基准!CAIS发布50万美元悬赏令:汇集人类顶尖专家,专攻高难度问题
抵挡AI的最后一个基准!CAIS发布50万美元悬赏令:汇集人类顶尖专家,专攻高难度问题随着AI模型的水平不断提高,现有的基准测试也被逐一攻破。CAIS和Scale AI共同发起了属于人类的最后一搏,悬赏50万美元,把最高难度、只有最顶尖的人才能回答出的问题收集起来作为基准,是否能挡住AI模型的攻势?
搜索
随着AI模型的水平不断提高,现有的基准测试也被逐一攻破。CAIS和Scale AI共同发起了属于人类的最后一搏,悬赏50万美元,把最高难度、只有最顶尖的人才能回答出的问题收集起来作为基准,是否能挡住AI模型的攻势?
近期,浙大和 Salesforce 学者进一步发现:语言模型或许帮助有限,但是图像模型能够有效地迁移到时序预测领域。
近段时间,AI 编程工具 Cursor 的风头可说是一时无两,其表现卓越、性能强大。近日,Cursor 一位重要研究者参与的一篇相关论文发布了,其中提出了一种方法,可通过搜索自然语言的规划来提升 Claude 3.5 Sonnet 等 LLM 的代码生成能力。
近日 Aleph Alpha 开始将其商业重点从开发大型语言模型转向生成式 AI 操作系统和咨询服务。
继OpenAI在5月发布会上展示「期货」GPT-4o的语音功能后,「AI语音助手」类的产品又成为了硅谷科技巨头的必争之地。
智东西8月29日消息,据Constellation Research今日报道,美国SaaS龙头Salesforce公布了截至2024年7月31日的2025财年第二季度业绩,第二财季Salesforce营收为93.2亿美元,同比增长8%。该公司将第三财季营收指引上调至93.1亿美元至93.6亿美元,同比增长7%;并维持2025财年全年营收指引为377亿美元至380亿美元,同比增长8%-9%。
在2024年AI Infra @Scale会议上发表开幕主旨演讲
性能不输Mistral与Llama,优化多语言支持,强化合规性。
a16z 合伙人 Alex Rampell 上周发布了一篇我觉得很有价值的文章《Input Coffee, Output Code: How AI Will Turn Capital into Labor》,认为在人工智能的帮助下,我们正在见证历史上最伟大的变革:软件正在变成劳动力,这是新的一种 E=MC^2 。
近日,HCM领域的SaaS巨头Workday和全球排名第一的CRM企业Salesforce达成AI战略合作,意在结合Salesforce在客户关系管理领域方面的专业知识以及Workday在人力资源、财务管理方面的优势,试图通过当下先进的人工智能功能和统一的数据集成技术重新构想全新的企业软件。