
DeepSeek用户慎入!体验完这款百万Tokens新"源神",我怕你回不去了【附5个神仙用法】
DeepSeek用户慎入!体验完这款百万Tokens新"源神",我怕你回不去了【附5个神仙用法】最近,我的AI交流群和别的一些AI群都炸锅了,话题的焦点是MiniMax-M1
最近,我的AI交流群和别的一些AI群都炸锅了,话题的焦点是MiniMax-M1
昨天深夜,月之暗面发布了开源代码模型Kimi-Dev-72B。这个模型在软件工程任务基准测试SWE-bench Verified上取得了60.4%的成绩,创下开源模型新纪录,超越了包括DeepSeek在内的多个竞争对手。
虚假的商战, 不断发布新的模型保持技术优势; 真实的商战,Anthropic 单方面禁止AI编程编辑器 Windsurf 使用 Claude 模型,订阅用户都跑去隔壁 Cursor 了。
在开源模型领域,DeepSeek 又带来了惊喜。
国产推理大模型又有重磅选手。MiniMax开源MiniMax-M1,迅速引起热议。
“蔚公子,DeepSeek核对两个Excel表格怎么做啊?”小伙伴上周问我。
最近,来自约翰・霍普金斯大学与中国人民大学的团队设计了三套实验,专门把关键线索藏在上下文之外,逼模型「凭记忆」作答,从而检验它们是否真的在脑海里保留了信息。
Era of Experience 这篇文章中提到:如果要实现 AGI, 构建能完成复杂任务的通用 agent,必须借助“经验”这一媒介,这里的“经验”就是指强化学习过程中模型和 agent 积累的、人类数据集中不存在的高质量数据。
仅用不到1200行代码,实现最小化且完全可读的vLLM!DeepSeek研究员俞星凯搞了个开源项目引得大伙拍手叫绝。项目名为Nano-vLLM(纳米级-vLLM),有三大特点:快速离线推理:推理速度可与vLLM相媲美
昨天,谷歌DeepMind与谷歌研究团队正式推出交互式气象平台Weather Lab,用于共享人工智能天气模型。在热带气旋路径预测方面,谷歌这次的新模型刷新SOTA,是首个在性能上明确超越主流物理模型的AI预测模型。