AI资讯新闻榜单内容搜索-模型

如何从零开始训练大模型（minicpm分享&讨论）

根据scaling law，模型越大，高质量数据越多，效果越好。但还有一个很直观的情况，随着预训练样本的质量不断提升，训练手段的优化。新的模型，往往效果能轻松反超参数量两倍于它的模型。

来自主题: AI技术研报

3701 点击 2024-03-19 15:55

科技新纪元，大模型成为教育智能硬件「标配」？

AI 大模型能否成为教育智能硬件的突破点？

来自主题: AI资讯

5106 点击 2024-03-19 15:30

想玩AI？先问问这家电力巨头

人工智能大模型的高耗电，会让很多国家玩不起。

来自主题: AI技术研报

3366 点击 2024-03-19 13:14

连地产中介都去学AI了

“不学点AI找不到工作了？”AI带来的焦虑正在不断蔓延。一位坐标北京的资深卖房中介林阳，已经开始自学AI大模型了。

来自主题: AI资讯

7727 点击 2024-03-19 12:56

奥特曼专访自曝全新GPT-5细节：性能跃升超想象，算力足可达AGI

【新智元导读】性能就是模型的一切！Altman首次公开曝料：GPT-5将会有史诗级提升，小看它的公司都会被碾压。而未来，AI将成为推动文明发展的核心动力。

来自主题: AI资讯

5113 点击 2024-03-19 12:31

可控图像生成最新综述！北邮开源20页249篇文献，包揽Text-to-Image Diffusion领域各种「条件」

【新智元导读】利用文本生成图片（Text-to-Image, T2I）已经满足不了人们的需要了，近期研究在T2I模型的基础上引入了更多类型的条件来生成图像，本文对这些方法进行了总结综述。

来自主题: AI技术研报

3458 点击 2024-03-19 11:44

一口气读完甄嬛传剧本、大部头医书：月之暗面200万字上下文Kimi开启内测

半年时间，月之暗面把 AI 模型支持的上下文长度提升了一个数量级，实现了 200 万字上下文的「无损压缩」。

来自主题: AI资讯

10446 点击 2024-03-19 11:12

支持百亿参数大模型、卢伟冰现场官宣小米首发，高通骁龙8s Gen3发布

高通又往中高端手机市场扔下一颗「重磅炸弹」。

来自主题: AI资讯

4263 点击 2024-03-19 10:51

ICLR 2024 | 连续学习不怕丢西瓜捡芝麻，神经形态方法保护旧知识

以脉冲神经网络（SNN）为代表的脑启发神经形态计算（neuromorphic computing）由于计算上的节能性质在最近几年受到了越来越多的关注 [1]。受启发于人脑中的生物神经元，神经形态计算通过模拟并行的存内计算、基于脉冲信号的事件驱动计算等生物特性，能够在不同于冯诺依曼架构的神经形态芯片上以低功耗实现神经网络计算。

来自主题: AI技术研报

4782 点击 2024-03-19 10:27

全球首个类Sora开源复现方案来了！全面公开所有训练细节和模型权重

全球首个开源的类Sora架构视频生成模型，来了！

来自主题: AI技术研报

8081 点击 2024-03-18 21:25