AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
微信正式发布多模态大模型POINTS1.5

微信正式发布多模态大模型POINTS1.5

微信正式发布多模态大模型POINTS1.5

距离 POINT1.0 的发布已经过去两个月时间来,在这段时间业界不断涌现出一系列优秀的模型。我们通过不断紧跟前沿技术,并结合过去开发多模态模型沉淀下来的经验,对 POINTS1.0 进行了一系列更新,推出了 POINTS1.5。

来自主题: AI技术研报
8635 点击    2024-12-17 10:52
ChatGPT搜索与Her打通了!搜索免费开放,居然还剧透明日直播主题

ChatGPT搜索与Her打通了!搜索免费开放,居然还剧透明日直播主题

ChatGPT搜索与Her打通了!搜索免费开放,居然还剧透明日直播主题

ChatGPT今天带来的是搜索功能方面的一些迭代升级(更像谷歌了)。根据用户反馈,优化搜索体验,移动端搜索更快,并能搜索出多模态信息;结合前几日发布的Her功能,可以在实时通话的时候进行语音搜索;

来自主题: AI资讯
9414 点击    2024-12-17 09:00
我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!

我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!

我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!

OpenAI 放出了 o1 Pro、GPT-4o 高级语音、GPTCanavas,就跟孔雀开屏一样 ~ 谷歌最近的大动作是发布了 Gemini 2.0 嘛!2.0 比 1.5 版本快一倍,而且是原生的多模态大模型,能输入和生成语言、声音、图片、视频等。

来自主题: AI资讯
7038 点击    2024-12-13 17:12
深度|OpenAI实时API技术细节揭秘,实时API支持函数调用和上下文管理,简化了多轮对话中的对话历史管理

深度|OpenAI实时API技术细节揭秘,实时API支持函数调用和上下文管理,简化了多轮对话中的对话历史管理

深度|OpenAI实时API技术细节揭秘,实时API支持函数调用和上下文管理,简化了多轮对话中的对话历史管理

OpenAI的实时API支持低延迟、双向音频流,使得多模态AI应用(如语音对话Agent)得以实现。它通过WebSocket连接管理对话状态,并提供短语结束检测和语音活动检测(VAD)功能,大大简化了实时语音应用的开发。

来自主题: AI资讯
7901 点击    2024-12-13 17:05
Sora之后,苹果发布视频生成大模型STIV,87亿参数一统T2V、TI2V任务

Sora之后,苹果发布视频生成大模型STIV,87亿参数一统T2V、TI2V任务

Sora之后,苹果发布视频生成大模型STIV,87亿参数一统T2V、TI2V任务

Apple MM1Team 再发新作,这次是苹果视频生成大模型,关于模型架构、训练和数据的全面报告,87 亿参数、支持多模态条件、VBench 超 PIKA,KLING,GEN-3。

来自主题: AI技术研报
4123 点击    2024-12-12 21:57