AI资讯新闻榜单内容搜索-语言模型

用童话训练AI模型：微小语言模型进入成熟期

微软找到了探索语言生成模型参数的新切入点！

来自主题: AI资讯

5950 点击 2024-03-10 16:28

Inflection-2.5发布：情商最高大模型、性能媲美GPT-4计算量仅为40%，App日活已破百万

本周四，美国 AI 创业公司 Inflection AI 正式发布新一代大语言模型 Inflection-2.5。仅用 40% 计算量，实现与 GPT-4 相媲美性能。

来自主题: AI技术研报

7620 点击 2024-03-09 10:20

挑战OpenAI的新模型免费上线，40%计算量性能逼近GPT-4

本周四，美国 AI 创业公司 Inflection AI 正式发布新一代大语言模型 Inflection-2.5。

来自主题: AI技术研报

4275 点击 2024-03-08 15:11

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

模型量化是模型压缩与加速中的一项关键技术，其将模型权重与激活值量化至低 bit，以允许模型占用更少的内存开销并加快推理速度。对于具有海量参数的大语言模型而言，模型量化显得更加重要。

来自主题: AI技术研报

8541 点击 2024-03-07 13:53

谷歌发布最新「读屏」AI！PaLM 2-S自动生成数据，多项理解任务刷新SOTA

谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型，能够完成各种屏幕QA问答、总结摘要等任务。

来自主题: AI技术研报

9518 点击 2024-03-05 10:35

北大具身智能成果入选CVPR'24：只需一张图一个指令，就能让大模型玩转机械臂

只靠一张物体图片，大语言模型就能控制机械臂完成各种日常物体操作吗？

来自主题: AI技术研报

7750 点击 2024-03-03 17:50

大视频模型是世界模型？DeepMind/UC伯克利华人一作：预测下一帧就能改变世界

谷歌DeepMind、UC伯克利和MIT的研究人员认为，如果用大语言模型的思路来做大视频模型，能解决很多语言模型不擅长的问题，可能能更进一步接近世界模型。

来自主题: AI技术研报

6575 点击 2024-03-03 17:31

能力与可信度可以兼得？GPT-4、Gemini等多模态大模型评测报告来了

2023 年我们正见证着多模态大模型的跨越式发展，多模态大语言模型（MLLM）已经在文本、代码、图像、视频等多模态内容处理方面表现出了空前的能力，成为技术新浪潮。以 Llama 2，Mixtral 为代表的大语言模型（LLM），以 GPT-4、Gemini、LLaVA 为代表的多模态大语言模型跨越式发展。

来自主题: AI资讯

8534 点击 2024-03-01 13:47

微软6页论文爆火：三进制LLM，真香！

现在，大语言模型（LLM）迎来了“1-bit时代”。

来自主题: AI技术研报

3109 点击 2024-02-29 13:31

英伟达发了个有点弱的端侧模型，却想喊话大家举手投降

英伟达在2024年2月14号的时候推出了这么一个产品，叫做Chat with RTX。顾名思义，就是和英伟达的显卡聊天。简单来说Chat with RTX是一个本地部署的大语言模型工具，可以实现和大语言模型对话，还支持处理多种文件类型，用户可以与其进行文本、PDF、Word文档等多种格式内容的交互。

来自主题: AI资讯

7518 点击 2024-02-27 14:14