AI资讯新闻榜单内容搜索-实时语音

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 实时语音
深度|OpenAI实时API技术细节揭秘,实时API支持函数调用和上下文管理,简化了多轮对话中的对话历史管理

深度|OpenAI实时API技术细节揭秘,实时API支持函数调用和上下文管理,简化了多轮对话中的对话历史管理

深度|OpenAI实时API技术细节揭秘,实时API支持函数调用和上下文管理,简化了多轮对话中的对话历史管理

OpenAI的实时API支持低延迟、双向音频流,使得多模态AI应用(如语音对话Agent)得以实现。它通过WebSocket连接管理对话状态,并提供短语结束检测和语音活动检测(VAD)功能,大大简化了实时语音应用的开发。

来自主题: AI资讯
9175 点击    2024-12-13 17:05
实测昆仑万维对话AI「Skyo」,会读诗、知晓雷军摆拍

实测昆仑万维对话AI「Skyo」,会读诗、知晓雷军摆拍

实测昆仑万维对话AI「Skyo」,会读诗、知晓雷军摆拍

算起来,距离 5 月 14 日 OpenAI 发布 GPT-4o 高级语音模式已经过去了半年时间。在这期间,AI 实时语音对话已经成为了有能力大厂秀肌肉、拼实力的新战场。

来自主题: AI资讯
6856 点击    2024-11-20 15:01
1.6K+ Star!Ichigo:一个开源的实时语音AI项目

1.6K+ Star!Ichigo:一个开源的实时语音AI项目

1.6K+ Star!Ichigo:一个开源的实时语音AI项目

Ichigo[1] 是一个开放的、持续进行的研究项目,目标是将基于文本的大型语言模型(LLM)扩展,使其具备原生的“听力”能力。

来自主题: AI资讯
6263 点击    2024-11-06 10:00
OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线

OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线

OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线

十一假期第1天, OpenAI一年一度的开发者大会又来了惹!今年的开发者大会分成三部分分别在美国、英国、新加坡三个地点举办,刚刚结束的是第一场。

来自主题: AI资讯
3733 点击    2024-10-03 13:07
遭GPT-4o碾压,豆包们直面语音AI生死战

遭GPT-4o碾压,豆包们直面语音AI生死战

遭GPT-4o碾压,豆包们直面语音AI生死战

在算力资源的匮乏下,中国的实时语音AI正面临着一场艰难的较量,试图在技术舞台上与GPT-4o一决高下,这无疑是当前中国AI版图中的尴尬局面。

来自主题: AI资讯
4378 点击    2024-10-01 11:25
开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开

开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开

开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开

两个多月前那个对标GPT-4o的端到端语音模型,终于开源了。大神Karpathy体验之后表示:nice!

来自主题: AI技术研报
6424 点击    2024-09-24 12:07