AI资讯新闻榜单内容搜索-

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 
我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!

我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!

我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!

OpenAI 放出了 o1 Pro、GPT-4o 高级语音、GPTCanavas,就跟孔雀开屏一样 ~ 谷歌最近的大动作是发布了 Gemini 2.0 嘛!2.0 比 1.5 版本快一倍,而且是原生的多模态大模型,能输入和生成语言、声音、图片、视频等。

来自主题: AI资讯
8884 点击    2024-12-13 17:12
深度|OpenAI实时API技术细节揭秘,实时API支持函数调用和上下文管理,简化了多轮对话中的对话历史管理

深度|OpenAI实时API技术细节揭秘,实时API支持函数调用和上下文管理,简化了多轮对话中的对话历史管理

深度|OpenAI实时API技术细节揭秘,实时API支持函数调用和上下文管理,简化了多轮对话中的对话历史管理

OpenAI的实时API支持低延迟、双向音频流,使得多模态AI应用(如语音对话Agent)得以实现。它通过WebSocket连接管理对话状态,并提供短语结束检测和语音活动检测(VAD)功能,大大简化了实时语音应用的开发。

来自主题: AI资讯
10464 点击    2024-12-13 17:05
OpenAI发布49页长文,讲述o1的安全机制

OpenAI发布49页长文,讲述o1的安全机制

OpenAI发布49页长文,讲述o1的安全机制

嘿!最近 AI 圈都在关注 OpenAI 的连续 12 场直播。就在直播开播同一天,OpenAI 也出炉了 o1 系统卡(o1 System Card),今天咱们就来啃啃这块硬骨头。

来自主题: AI技术研报
8266 点击    2024-12-13 16:53
国产全AI游戏来了?!大模型直出开放世界游戏,有声可交互

国产全AI游戏来了?!大模型直出开放世界游戏,有声可交互

国产全AI游戏来了?!大模型直出开放世界游戏,有声可交互

距离普通人凭想法就能做出游戏的时代,又近了一步。 AI游戏生成天花板今年以来不断突破,就在昨天,国产游戏AI团队也加入卷出了新高度。

来自主题: AI资讯
9155 点击    2024-12-13 15:25
李飞飞:World Labs这样实现「空间智能」

李飞飞:World Labs这样实现「空间智能」

李飞飞:World Labs这样实现「空间智能」

遵循世界的 3D 特性,很多事就会变得自然而然。 说到斯坦福大学教授李飞飞(Fei-Fei Li),她提倡的「空间智能」最近正在引领 AI 发展方向。

来自主题: AI资讯
8386 点击    2024-12-13 15:05
扩散模型=流匹配?谷歌DeepMind博客深度详解这种惊人的等价性

扩散模型=流匹配?谷歌DeepMind博客深度详解这种惊人的等价性

扩散模型=流匹配?谷歌DeepMind博客深度详解这种惊人的等价性

因为流匹配的公式很简单,并且生成样本的路径很直接,最近越来越受研究者们的欢迎,于是很多人都在问: 「到底是扩散模型好呢?还是流匹配好?」

来自主题: AI技术研报
7275 点击    2024-12-13 15:00