Step-3 发布:包括发布会上没说的,都在这了
Step-3 发布:包括发布会上没说的,都在这了今天下午,阶跃星辰在 WAIC 2025 开幕前夕发布新一代基础大模型 Step 3,并宣布将在 7 月 31 日面向全球企业和开发者开源。MoE 架构,321B 总参,38B 激活
今天下午,阶跃星辰在 WAIC 2025 开幕前夕发布新一代基础大模型 Step 3,并宣布将在 7 月 31 日面向全球企业和开发者开源。MoE 架构,321B 总参,38B 激活
就在刚刚,阿里正式发布全球最强开源推理模型——Qwen3-235B-A22B-Thinking-2507。就在刚刚,阿里正式发布全球最强开源推理模型——Qwen3-235B-A22B-Thinking-2507。
今天带来 Myshell ShellAgent 2.0 的测试和介绍。 发现 Myshell 上了一个 ShellAgent 2.0 的能力,只需要提示词就能生成一个 Agent 应用。他们这个有意思的点是,没有复杂的前端页面都会在一个 Chatbot 里构建类似的交互,这就摆脱了构建前端的复杂流程降低了错误率,Agent 只需要管理工具之间的交互就可以。
故意为之 当地时间周三(7月23日),美国总统特朗普在华盛顿特区举行的人工智能峰会上发言。
告别Next-token,现在模型微调阶段就能直接多token预测!
复合LLM应用 (compound LLM applications) 是一种结合大语言模型(LLM)与外部工具、API、或其他LLM的高效多阶段工作流应用。
一位从业20年设计师的自白。7月的杭州,潮湿的空气似乎随时都在酝酿一场暴雨。
大模型的能力再一次被行业验证!7月23日,夸克健康大模型在业界引起广泛关注:其成功通过了中国12门核心学科的主任医师笔试评测,成为国内首个完成此项专业考核的AI大模型。为深入解读其技术路径,我们分享一份关于夸克健康大模型的深度调研报告。
2025年7月21日,斯坦福大学学习加速器(Stanford Accelerator for Learning)发布名为《AI+学习差异:设计无边界的未来》(AI+ Learning Differences: Designing a Future with No Boundaries)白皮书,强调AI可以成为支持有学习差异的学生的有力工具,但前提是其开发要以他们的需求和意见为核心。
当AI创业进入高潮,连硅谷人们都重新开始拥抱“996”了。 早九晚九,一周六天,每周72个小时,直接干翻标准工时的两倍!