AI资讯新闻榜单内容搜索-GPT-4

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPT-4
首个支持普通话和方言混说的TTS大模型:河南话、上海话、粤语说得溜

首个支持普通话和方言混说的TTS大模型:河南话、上海话、粤语说得溜

首个支持普通话和方言混说的TTS大模型:河南话、上海话、粤语说得溜

自 2024 年 GPT-4o 出现以来,业内各公司纷纷投入巨大的资源进行 TTS 大模型的研发。近几个月内,中文语音合成大模型如雨后春笋般涌现,如 chattts、seedtts、cosyvoice 等。

来自主题: AI资讯
5812 点击    2024-08-13 18:34
再见,Devin!基于GPT-4o,最强「AI工程师」Genie诞生

再见,Devin!基于GPT-4o,最强「AI工程师」Genie诞生

再见,Devin!基于GPT-4o,最强「AI工程师」Genie诞生

AI编码的桂冠又易主了,Genie超越Devin,成为了地表最强的「AI软件工程师」,Genie不是一个编程助手,而是一个能够自主思考的「同事」,与你并肩作战。

来自主题: AI资讯
6633 点击    2024-08-13 17:01
我用AI鉴宝,在潘家园被店主围攻了!

我用AI鉴宝,在潘家园被店主围攻了!

我用AI鉴宝,在潘家园被店主围攻了!

事情是这样的,前两天面壁刚刚推出了“小钢炮” MiniCPM-V 2.6 模型,据说视频理解能力直接对标GPT-4V,最重要的是能直接部署在iPad 上。

来自主题: AI资讯
6381 点击    2024-08-10 12:15
GPT-4o模仿人类声音,诡异尖叫引OpenAI研究员恐慌!32页技术报告出炉

GPT-4o模仿人类声音,诡异尖叫引OpenAI研究员恐慌!32页技术报告出炉

GPT-4o模仿人类声音,诡异尖叫引OpenAI研究员恐慌!32页技术报告出炉

【新智元导读】五颗草莓到底指什么?盼了一天一夜,OpenAI只发来一份32页安全报告。报告揭露:在少数情况下,GPT-4o会模仿你的声音说话,或者忽然大叫起来……事情变得有趣了。

来自主题: AI资讯
6288 点击    2024-08-09 16:31
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准

多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准

多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准

LLM的数学推理能力缺陷得到了很多研究的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。

来自主题: AI技术研报
8712 点击    2024-08-08 14:41