AI资讯新闻榜单内容搜索-模型

月之暗面杨植麟专访：AI不是接下来一两年找到PMF，而是接下来十到二十年如何改变世界

就在一年以前，AI 科学家杨植麟在硅谷做了一笔精确的计算。他意识到，如果决定启动一场以 AGI 为目标的大模型创业，要在未来几个月立马筹措超 1 亿美金资本。

来自主题: AI资讯

8016 点击 2024-03-03 18:13

RNN效率媲美Transformer，谷歌新架构两连发：同等规模强于Mamba

去年 12 月，新架构 Mamba 引爆了 AI 圈，向屹立不倒的 Transformer 发起了挑战。如今，谷歌 DeepMind「Hawk 」和「Griffin 」的推出为 AI 圈提供了新的选择。

来自主题: AI技术研报

6712 点击 2024-03-03 18:10

清华、哈工大把大模型压缩到了1bit，把大模型放在手机里跑的愿望就快要实现了！

近期，清华大学和哈尔滨工业大学联合发布了一篇论文：把大模型压缩到 1.0073 个比特时，仍然能使其保持约 83% 的性能！

来自主题: AI技术研报

9246 点击 2024-03-03 18:06

北大具身智能成果入选CVPR'24：只需一张图一个指令，就能让大模型玩转机械臂

只靠一张物体图片，大语言模型就能控制机械臂完成各种日常物体操作吗？

来自主题: AI技术研报

9297 点击 2024-03-03 17:50

大视频模型是世界模型？DeepMind/UC伯克利华人一作：预测下一帧就能改变世界

谷歌DeepMind、UC伯克利和MIT的研究人员认为，如果用大语言模型的思路来做大视频模型，能解决很多语言模型不擅长的问题，可能能更进一步接近世界模型。

来自主题: AI技术研报

7138 点击 2024-03-03 17:31

最强端侧模型，面壁MiniCPM位列SuperClue榜单表现前列

随着终端侧 AI 变革席卷全球，「小而强」的端侧大模型，成为行业主流玩家的必争之地。

来自主题: AI资讯

6379 点击 2024-03-03 09:43

Llama 3性能炸裂，Meta要用“开源”争夺大模型王座

如果说 OpenAI 已经占据了今天闭源大模型生态的一极，那 Meta 无疑是代表开源大模型的另一极。

来自主题: AI资讯

8824 点击 2024-03-03 09:25

模型偏好只与大小有关？上交大全面解析人类与32种大模型偏好的定量组分

在目前的模型训练范式中，偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中，偏好数据通常被用作对齐（alignment）时的训练优化目标，如基于人类或 AI 反馈的强化学习（RLHF/RLAIF）或者直接偏好优化（DPO），而在模型评估中，由于任务的复杂性且通常没有标准答案，则通常直接以人类标注者或高性能大模型（LLM-as-a-Judge）的偏好标注作为评判标准。

来自主题: AI技术研报

12041 点击 2024-03-02 14:58

ControlNet作者又出新作：百万数据训练，AI图像生成迎来图层设计

有人表示：「等待已久的 AI 图像创建功能终于迎来了图层！」

来自主题: AI技术研报

5840 点击 2024-03-02 14:54

DeepMind CEO Demis Hassabis 专访：2030年有望达到AGI、AI会带来革命性的全民普惠

Google 最近在大模型上动作不断，先是发布了性能更强大的多模态 Gemini 1.5 Pro，然后是开源的小模型 Gemma，评测结果超过了 7b 量级的 Llama 2。

来自主题: AI资讯

8688 点击 2024-03-02 10:53