AI资讯新闻榜单内容搜索-框架

引爆整个AI圈的神经网络架构KAN，究竟是啥？

最近一周KAN的热度逐渐褪去，正好静下心来仔细学习KAN的原理，收获颇多。

来自主题: AI技术研报

9587 点击 2024-05-17 12:57

只需百行代码，让H100提速30%，斯坦福开源全新AI加速框架

提高 GPU 利用率，就是这么简单。

来自主题: AI技术研报

9966 点击 2024-05-13 17:15

GPT-4 提示词冠军如何写 prompt：CO-STAR 框架、文本分段、系统提示

当下，如果我们希望通过 ChatGPT 得到有用的信息，就必须知道如何向它发出清晰的指令。为了指导用户写一个好的 prompt，OpenAI 官方曾上线了 Prompt engineering，谷歌和微软也有类似的动作。

来自主题: AI资讯

8219 点击 2024-05-13 09:31

DiT架构大一统：一个框架集成图像、视频、音频和3D生成，可编辑、能试玩

基于 Diffusion Transformer（DiT）又迎来一大力作「Flag-DiT」，这次要将图像、视频、音频和 3D「一网打尽」。

来自主题: AI技术研报

7435 点击 2024-05-12 15:29

AI生成3D主题乐园，角色建筑批量生成，风格保持一致 | SIGGRAPH 2024

最少只需1个3D样例，即可生成3D主题乐园。

来自主题: AI技术研报

10035 点击 2024-05-12 12:56

微软打破Decoder-Only架构！大幅降低GPU内存需求，网友：把Llama3 70B弄20GB GPU上运行

微软&清华最新研究，打破GPT系列开创的Decoder-Only架构——

来自主题: AI技术研报

5433 点击 2024-05-12 12:51

与AI共舞，RISC-V芯片加速落地生根

自计算机诞生以来，指令集架构一直是计算机体系结构中的核心概念之一。目前市场上主流的指令集架构两大巨头是x86和ARM，前者基本垄断了PC、笔记本电脑和服务器领域，后者则在智能手机和移动终端市场占据主导地位。

来自主题: AI技术研报

5025 点击 2024-05-11 11:08

3倍生成速度还降内存成本，超越Medusa2的高效解码框架终于来了

传统上，大型语言模型（LLMs）被认为是顺序解码器，逐个解码每个token。

来自主题: AI技术研报

4124 点击 2024-05-10 23:29

Unsloth x Qwen2，提速47.32%，节省39.13%显存，最少仅需8.43GB显存

在上一篇文章「Unsloth微调Llama3-8B，提速44.35%，节省42.58%显存，最少仅需7.75GB显存」中，我们介绍了Unsloth，这是一个大模型训练加速和显存高效的训练框架，我们已将其整合到Firefly训练框架中，并且对Llama3-8B的训练进行了测试，Unsloth可大幅提升训练速度和减少显存占用。

来自主题: AI技术研报

3335 点击 2024-05-08 12:21

爆火后反转？「一夜干掉MLP」的KAN：其实我也是MLP

多层感知器（MLP），也被称为全连接前馈神经网络，是当今深度学习模型的基础构建块。MLP 的重要性无论怎样强调都不为过，因为它们是机器学习中用于逼近非线性函数的默认方法。

来自主题: AI技术研报

9246 点击 2024-05-07 18:21