AI资讯新闻榜单内容搜索-

我扒出了Gemini 2.0超实时多模态幕后的黑科技，第六代TPU芯片Trillium！

OpenAI 放出了 o1 Pro、GPT-4o 高级语音、GPTCanavas，就跟孔雀开屏一样～谷歌最近的大动作是发布了 Gemini 2.0 嘛！2.0 比 1.5 版本快一倍，而且是原生的多模态大模型，能输入和生成语言、声音、图片、视频等。

来自主题: AI资讯

8884 点击 2024-12-13 17:12

深度｜OpenAI实时API技术细节揭秘，实时API支持函数调用和上下文管理，简化了多轮对话中的对话历史管理

OpenAI的实时API支持低延迟、双向音频流，使得多模态AI应用（如语音对话Agent）得以实现。它通过WebSocket连接管理对话状态，并提供短语结束检测和语音活动检测（VAD）功能，大大简化了实时语音应用的开发。

来自主题: AI资讯

10464 点击 2024-12-13 17:05

银河通用王鹤通向通用机器人：合成数据驱动的具身多模态大模型

在探索迈向AGI（通用人工智能）物理世界的路径中，通用机器人被视作关键载体。

来自主题: AI资讯

10249 点击 2024-12-13 16:57

OpenAI发布49页长文，讲述o1的安全机制

嘿！最近 AI 圈都在关注 OpenAI 的连续 12 场直播。就在直播开播同一天，OpenAI 也出炉了 o1 系统卡（o1 System Card），今天咱们就来啃啃这块硬骨头。

来自主题: AI技术研报

8266 点击 2024-12-13 16:53

国产全AI游戏来了？！大模型直出开放世界游戏，有声可交互

距离普通人凭想法就能做出游戏的时代，又近了一步。 AI游戏生成天花板今年以来不断突破，就在昨天，国产游戏AI团队也加入卷出了新高度。

来自主题: AI资讯

9155 点击 2024-12-13 15:25

微软出招！新模型数学超GPT-4o编程胜Llama3.3，训练新范式引热议：midtraining

OpenAI谷歌天天刷流量，微软也坐不住了，推出最新小模型Phi-4。参数量仅14B，MMLU性能就和Llama 3.3/ Qwen2.5等70B级别大模型坐一桌。

来自主题: AI技术研报

8734 点击 2024-12-13 15:14

「AI定义汽车」新拐点已至！小米孟二利：我们有三个工作需要做好 | MEET 2025

大模型的出现，让汽车行业来到了「AI定义汽车」的新拐点。

来自主题: AI资讯

8584 点击 2024-12-13 15:10

李飞飞：World Labs这样实现「空间智能」

遵循世界的 3D 特性，很多事就会变得自然而然。说到斯坦福大学教授李飞飞（Fei-Fei Li），她提倡的「空间智能」最近正在引领 AI 发展方向。

来自主题: AI资讯

8386 点击 2024-12-13 15:05

OpenAI前资深算法负责人江旭创建「亮源新创」，打造具身智能陪伴机器人

江旭是OpenAI GPT 4的重要贡献者，于2023年离开OpenAI。

来自主题: AI资讯

7269 点击 2024-12-13 15:02

扩散模型=流匹配？谷歌DeepMind博客深度详解这种惊人的等价性

因为流匹配的公式很简单，并且生成样本的路径很直接，最近越来越受研究者们的欢迎，于是很多人都在问：「到底是扩散模型好呢？还是流匹配好？」

来自主题: AI技术研报

7275 点击 2024-12-13 15:00

AI资讯新闻榜单内容搜索-

我扒出了Gemini 2.0超实时多模态幕后的黑科技，第六代TPU芯片Trillium！

深度｜OpenAI实时API技术细节揭秘，实时API支持函数调用和上下文管理，简化了多轮对话中的对话历史管理

银河通用王鹤 通向通用机器人：合成数据驱动的具身多模态大模型

OpenAI发布49页长文，讲述o1的安全机制

国产全AI游戏来了？！大模型直出开放世界游戏，有声可交互

微软出招！新模型数学超GPT-4o编程胜Llama3.3，训练新范式引热议：midtraining

「AI定义汽车」新拐点已至！小米孟二利：我们有三个工作需要做好 | MEET 2025

李飞飞：World Labs这样实现「空间智能」

OpenAI前资深算法负责人江旭创建「亮源新创」，打造具身智能陪伴机器人

扩散模型=流匹配？谷歌DeepMind博客深度详解这种惊人的等价性

银河通用王鹤通向通用机器人：合成数据驱动的具身多模态大模型