“浙大系”杀入多模态
“浙大系”杀入多模态开发和应用大语言模型的杭州波形智能,正式杀入多模态领域。
开发和应用大语言模型的杭州波形智能,正式杀入多模态领域。
7月26日,智谱AI 推出视频生成产品「清影」,已上线可免费使用。这无疑给上半年越演越烈的AI视频生成产品的竞争又加了一把火。
前苹果设计师 Jason Yuan 打造的一款 AI 聊天应用——Dot,近期在App store 中上线。
随着大型语言模型(LLMs)的进步,多模态大型语言模型(MLLMs)迅速发展。它们使用预训练的视觉编码器处理图像,并将图像与文本信息一同作为 Token 嵌入输入至 LLMs,从而扩展了模型处理图像输入的对话能力。这种能力的提升为自动驾驶和医疗助手等多种潜在应用领域带来了可能性。
寻隐(英文名 Queryable)是一款 iOS 上的 AI 照片搜索软件,支持用户使用自然语言搜索本地照片。软件诞生的契机是 OpenAI 发布的 CLIP 模型。
Ellie是一条金毛犬,狗主人对着手机上一款APP应用发了一段语音:“HI Ellie,你能给我拿下遥控器吗?”
商业化愿景下,AI应用元年已经到来。
许多人都非常关心的问题是,究竟在什么场景下,当下 AI 技术容易落地?
知识图谱作为结构化知识的重要载体,广泛应用于信息检索、电商、决策推理等众多领域。然而,由于不同机构或方法构建的知识图谱存在表示方式、覆盖范围等方面的差异,如何有效地将不同的知识图谱进行融合,以获得更加全面、丰富的知识体系,成为提高知识图谱覆盖度和准确率的重要问题,这就是知识图谱对齐(Knowledge Graph Alignment)任务所要解决的核心挑战。
LLM 很强,而为了实现 LLM 的可持续扩展,有必要找到并实现能提升其效率的方法,混合专家(MoE)就是这类方法的一大重要成员。