AI资讯新闻榜单内容搜索-LLama

推理超越 Llama3！面壁Ultra对齐助推开源大模型「理科状元」

两周前，OpenBMB开源社区联合面壁智能发布领先的开源大模型「Eurux-8x22B 」。相比口碑之作 Llama3-70B，Eurux-8x22B 发布时间更早，综合性能相当，尤其是拥有更强的推理性能——刷新开源大模型推理性能 SOTA，堪称开源大模型中「理科状元」。

来自主题: AI技术研报

10709 点击 2024-05-07 22:38

大模型又又又被曝出安全问题！

来自主题: AI技术研报

10943 点击 2024-05-07 22:26

堂堂开源之王Llama 3，原版上下文窗口居然只有……8k，让到嘴边的一句“真香”又咽回去了。

来自主题: AI资讯

11179 点击 2024-05-06 20:51

我们知道，Meta 推出的 Llama 3、Mistral AI 推出的 Mistral 和 Mixtral 模型以及 AI21 实验室推出的 Jamba 等开源大语言模型已经成为 OpenAI 的竞争对手。

来自主题: AI技术研报

11935 点击 2024-05-06 17:49

Meta最近开源的Llama 3模型再次证明了「数据」是提升性能的关键，但现状是，开源的大模型有一堆，可开源的大规模数据却没多少，而收集、清洗数据又是一项极其费时费力的工作，也导致了大模型预训练技术仍然掌握在少数高端机构的手中。

来自主题: AI技术研报

7159 点击 2024-05-05 19:51

随着 Llama 3 发布，未来大模型的参数量已飙升至惊人的 4000 亿。尽管每周几乎都有一个声称性能超强的大模型出来炸场，但 AI 应用还在等待属于它们的「ChatGPT 时刻」。其中，AI 智能体无疑是最被看好的赛道。

来自主题: AI技术研报

4889 点击 2024-05-05 19:40

AI做数学题，真正的思考居然是暗中“心算”的？

来自主题: AI技术研报

7554 点击 2024-05-05 19:25

2024 年 4 月 20 日，即 Meta 开源 Llama 3 的隔天，初创公司 Groq 宣布其 LPU 推理引擎已部署 Llama 3 的 8B 和 70B 版本，每秒可输出token输提升至800。

来自主题: AI技术研报

7458 点击 2024-05-02 18:03

Llama 3的开源，再次掀起了一场大模型的热战，各家争相测评、对比模型的能力，也有团队在进行微调，开发衍生模型。

来自主题: AI技术研报

6135 点击 2024-05-01 20:59

FP8和更低的浮点数量化精度，不再是H100的“专利”了！

来自主题: AI技术研报

9086 点击 2024-04-29 20:17