AI资讯新闻榜单内容搜索-Nano

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Nano
DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版

DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版

DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版

仅用不到1200行代码,实现最小化且完全可读的vLLM!DeepSeek研究员俞星凯搞了个开源项目引得大伙拍手叫绝。项目名为Nano-vLLM(纳米级-vLLM),有三大特点:快速离线推理:推理速度可与vLLM相媲美

来自主题: AI技术研报
7083 点击    2025-06-13 15:41
GPT-4.1深夜登场,中科大校友领队!百万上下文编程惊人,GPT-4.5三个月后淘汰

GPT-4.1深夜登场,中科大校友领队!百万上下文编程惊人,GPT-4.5三个月后淘汰

GPT-4.1深夜登场,中科大校友领队!百万上下文编程惊人,GPT-4.5三个月后淘汰

OpenAI重磅发布的GPT-4.1系列模型,带来了编程、指令跟随和长上下文处理能力的全面飞跃!由中科大校友Jiahui Yu领衔的团队打造。与此同时,备受争议的GPT-4.5将在三个月后停用,GPT-4.1 nano则以最小、最快、最便宜的姿态强势登场。

来自主题: AI资讯
9368 点击    2025-04-15 08:53
神级项目训练GPT-2仅需5分钟,Andrej Karpathy都点赞

神级项目训练GPT-2仅需5分钟,Andrej Karpathy都点赞

神级项目训练GPT-2仅需5分钟,Andrej Karpathy都点赞

今年 4 月,AI 领域大牛 Karpathy 一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」曾经引发机器学习社区的热烈讨论。

来自主题: AI资讯
5416 点击    2024-11-22 10:18
深度|Perplexity 华裔联合创始人:AI 产品成功的两个要素 —— 专注 “颠覆” 应用场景以及良好的留存

深度|Perplexity 华裔联合创始人:AI 产品成功的两个要素 —— 专注 “颠覆” 应用场景以及良好的留存

深度|Perplexity 华裔联合创始人:AI 产品成功的两个要素 —— 专注 “颠覆” 应用场景以及良好的留存

Perplexity 联合创始人&首席战略官 Johnny Ho 在不久前与 Lightspeed 合伙人 Michael Mignano 的一场对话中提到,Perplexity 的产品发布秉持“完全准备好才推出”的原则,通过小而持续的功能改进,让产品逐步融入用户的日常生活。

来自主题: AI资讯
3555 点击    2024-11-13 10:36
为了保护Gemini的秘密,谷歌也开始打压刷机

为了保护Gemini的秘密,谷歌也开始打压刷机

为了保护Gemini的秘密,谷歌也开始打压刷机

为了将危险扼杀在襁褓中,谷歌就只能进行无差别打击。

来自主题: AI资讯
4636 点击    2024-09-05 09:59
不是大模型用不起,而是小模型更有性价比

不是大模型用不起,而是小模型更有性价比

不是大模型用不起,而是小模型更有性价比

无法控制成本的大模型终将被“快好省”的小模型取代今年最热的AI赛道中,机构们自然也得下一些判断,比如说——2024年大模型的一个趋势,是将变得“越来越小”。

来自主题: AI资讯
5229 点击    2023-12-28 14:07
微软小模型击败大模型:27亿参数,手机就能跑

微软小模型击败大模型:27亿参数,手机就能跑

微软小模型击败大模型:27亿参数,手机就能跑

上个月,微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源,在常识推理、语言理解和逻辑推理方面的性能显著改进。

来自主题: AI资讯
6826 点击    2023-12-13 16:21
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano

2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano

2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano

都快到年底了,大模型领域还在卷,今天,Microsoft发布了参数量为2.7B的Phi-2——不仅13B参数以内没有对手,甚至还能和Llama 70B掰手腕!

来自主题: AI资讯
7989 点击    2023-12-13 15:41
矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见

矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见

矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见

Transformer大模型工作原理究竟是什么样的?一位软件工程师打开了大模型的矩阵世界。黑客帝国中,「矩阵模拟」的世界或许真的存在。

来自主题: AI资讯
7522 点击    2023-12-04 18:48