AI资讯新闻榜单内容搜索-开发

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 开发
国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类

国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类

国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类

近期,港中大(深圳)联手趣丸科技联合推出了新一代大规模声音克隆 TTS 模型 ——MaskGCT。该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。MaskGCT 已在香港中文大学(深圳)与上海人工智能实验室联合开发的开源系统 Amphion 发布。

来自主题: AI技术研报
5485 点击    2024-10-30 13:57
Janus:DeepSeek 打造的多模态理解与生成的解耦视觉编码框架

Janus:DeepSeek 打造的多模态理解与生成的解耦视觉编码框架

Janus:DeepSeek 打造的多模态理解与生成的解耦视觉编码框架

Janus 是 DeepSeek AI 开发的一个先进的多模态理解和生成框架,它通过创新性地解耦视觉编码路径来应对多模态理解和生成任务之间的需求冲突。

来自主题: AI技术研报
8551 点击    2024-10-29 14:46
PUMA:商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA:商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA:商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA(emPowering Unified MLLM with Multi-grAnular visual generation)是一项创新的多模态大型语言模型(MLLM),由商汤科技联合来自香港中文大学、港大和清华大学的研究人员共同开发。它通过统一的框架处理和生成多粒度的视觉表示,巧妙地平衡了视觉生成任务中的多样性与可控性。

来自主题: AI技术研报
5512 点击    2024-10-29 14:32
2mm²芯片点亮盲人黑暗世界!马斯克前搭档出手,失明81%也能阅读了

2mm²芯片点亮盲人黑暗世界!马斯克前搭档出手,失明81%也能阅读了

2mm²芯片点亮盲人黑暗世界!马斯克前搭档出手,失明81%也能阅读了

前Neuralink总裁创立的脑机接口公司Science Corporation,正在开发一种名为「Prima」的芯片技术。初步试验结果表明,38名患者中,有81%的患者视力得到了大幅度的改善。几位知名眼科医生都直称:「这是第一个有可能成功恢复AMD患者视力的重大进展!」

来自主题: AI技术研报
10030 点击    2024-10-29 12:19
AI实现人猪沟通,让猪快乐成长

AI实现人猪沟通,让猪快乐成长

AI实现人猪沟通,让猪快乐成长

欧洲科研团队近日开发出一套解析生猪叫声的人工智能系统。该研究共同负责人、哥本哈根大学行为生物学家埃洛迪·曼德尔-布里弗(Elodie Mandel-Briefer)表示,这一系统可帮助养殖户及时发现生猪的不良情绪状态,从而改善养殖质量。

来自主题: AI资讯
9569 点击    2024-10-28 20:59
惊雷又来了,用含义类型化提示MTP:更高效地提示LLM结构化输出,支持图片视频

惊雷又来了,用含义类型化提示MTP:更高效地提示LLM结构化输出,支持图片视频

惊雷又来了,用含义类型化提示MTP:更高效地提示LLM结构化输出,支持图片视频

在人工智能技术快速发展的今天,大语言模型(LLM)已经展现出惊人的能力。然而,让这些模型生成规范的结构化输出仍然是一个难以攻克的技术难题。不论是在开发自动化工具、构建特定领域的解决方案,还是在进行开发工具集成时,都迫切需要LLM能够产生格式严格、内容可靠的输出。

来自主题: AI技术研报
8669 点击    2024-10-28 11:55
手搓迪士尼同款机器人,总花费不到1500美元

手搓迪士尼同款机器人,总花费不到1500美元

手搓迪士尼同款机器人,总花费不到1500美元

还记得迪士尼开发的 BDX 双足机器人吗?这款机器人专为娱乐表演而设计,拥有多项技能,可以跳舞,还可以表演。

来自主题: AI资讯
11051 点击    2024-10-26 20:40