
DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成
DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成在多模态AI领域,基于预训练视觉编码器与MLLM的方法(如LLaVA系列)在视觉理解任务上展现出卓越性能。
在多模态AI领域,基于预训练视觉编码器与MLLM的方法(如LLaVA系列)在视觉理解任务上展现出卓越性能。
在当前AI写作工具迅速发展的背景下,华盛顿大学的这项研究选择了一个独特的切入点。研究团队没有去探讨AI是否应该用于创意写作这个争议性话题,而是直接走进了那些已经在使用AI的作家的创作现场。这18位作家来自不同背景:
现在 workflow 也有了自己的智能助手啦! MetaGPT 开源的 AFLOW 可以完全自动地构建和优化 workflow 了!
对于 LLM 从业者来说,让 LLM 落地应用并发挥作用需要手动构建并反复调试 Agentic Workflow,这无疑是个繁琐过程,一遍遍修改相似的代码,调试 prompt,手动执行测试并观察效果,并且换个 LLM 可能就会失效,有高昂的人力成本。许多公司甚至专职招聘 Prompt Engineer 来完成这一工作。
强化学习(RL)对大模型复杂推理能力提升有关键作用,然而,RL 复杂的计算流程以及现有系统局限性,也给训练和部署带来了挑战。
日前,MLCommons协会发布最新MLPerf™ Storage v1.0 AI存储基准测试成绩。浪潮信息分布式存储平台AS13000G7表现出众,在3D-UNet和CosmoFlow两个模型共计8项测试中,斩获5项性能全球第一。
RAGFlow自2024年4月1日正式开源,时至今日,不到7个月时间已经站在了Github 2万星标的台阶之上。
前些日子,特工宇宙关注到了一款名为「ResearchFlow」的产品。
在现代社会中,Wealthsimple、SUPER、webflow、duolingo、CONFLUENT、upside、CONTINO等多家企业都曾面临信息过载和知识孤岛的挑战。
论文共同第一作者郑淼,来自于周泽南领导的百川对齐团队,毕业于北京大学,研究方向包括大语言模型、多模态学习以及计算机视觉等,曾主导MMFlow等开源项目。