CPU反超NPU,llama.cpp生成速度翻5倍!LLM端侧部署新范式T-MAC开源
CPU反超NPU,llama.cpp生成速度翻5倍!LLM端侧部署新范式T-MAC开源T-MAC是一种创新的基于查找表(LUT)的方法,专为在CPU上高效执行低比特大型语言模型(LLMs)推理而设计,无需权重反量化,支持混合精度矩阵乘法(mpGEMM),显著降低了推理开销并提升了计算速度。
T-MAC是一种创新的基于查找表(LUT)的方法,专为在CPU上高效执行低比特大型语言模型(LLMs)推理而设计,无需权重反量化,支持混合精度矩阵乘法(mpGEMM),显著降低了推理开销并提升了计算速度。
人工智能系统依靠充足、高质量的训练数据来获得高性能,但MIT等机构最近的一项研究发现,曾经免费提供的数据在多个方面变得越来越难获取。
TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B,性能与Transformer架构模型相媲美,在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。
AI编码的桂冠又易主了,Genie超越Devin,成为了地表最强的「AI软件工程师」,Genie不是一个编程助手,而是一个能够自主思考的「同事」,与你并肩作战。
ChatGPT有新模型了!
只是换掉Transformer架构,立马性能全方位提升,问鼎同规模开源模型!
继Devin之后,又一个AI软件工程师被刷屏了—— 它叫Genie,号称目前地表最强,已经可以像人一样思考和行动了!
史上首位“AI科学家”,横空出世! 一登场就一口气生成了十篇完整学术论文。
做to B,向钱看。
新一轮的竞争开始了
在这一波AI浪潮之中,日本一方面承担着亚洲据点作用,另一方面本土企业的表现并不突出。
开源还是闭源,这是个问题。
拿了巨额融资的月之暗面在变现上还不用那么急迫,但大模型应用落地跑通商业化是投资方检验未来投资成果的关键。
社交娱乐、教育学习、商务办公是AI用户高频使用场景
在这样一个阶段,找到了AI的新商业模式,并且给AI赋予新的概念和内涵的玩家,或许才是最后的胜利者。
机器人多模态模型(RRMM)+双臂协作系统(RTACS)
智能新物种
AI制药企业面临挑战,抱团取暖寻出路。
验证成药能力、适应“创新药圈”的资本和商业化规则,才是AI制药企业获得重金押注的关键。
迄今为止,AIGC 主要应用于像 ChatGPT 这样的聊天机器人。初创公司如 Character.AI 和Replika,通过赋予聊天机器人更接近人类伴侣的性格,已经取得了初步的成果。 然而,设想一下,如果我们将这些人工智能角色置于一个类似于 Instagram 的社交平台,并让它们进行互动,那将会带来什么样的全新体验呢?
关于长文本和 RAG 到底如何选择,一直有争论,从基模公司到应用开发者。 今天这篇文章,是来自基模公司月之暗面和中间层 Zilliz 的技术对话,值得一看。
除了手机之外,AI 硬件最大的机会是什么? Meta 雷朋眼镜销量破百万之后,AI 眼镜越来越成为共识。
《纽约时报》近期的一篇报道显示,人们发现,电影剪辑和动画制作,正成为最担心被AI颠覆的好莱坞工种之一。
人类模仿机器人,是倒反天罡版“恐怖谷”吗?
全方位“模仿”OpenAI
硬件+多模态,AI儿童陪伴的主流路径
高质量数据对于提升AI模型的准确性和泛化能力至关重要。
OpenAI面临治理结构、领导力和竞争压力三大风险。
你有没有想过,或许未来某天,AI大军完全能够承担公司重任,人类是否会沦为配角? 小扎坚信,「未来世界上AI智能体,将比人类还要多」。
AI生图工具Flux,俨然已经掀起了全网的风暴。这张情侣写真逼真、细腻,打光、纹理、毛发,都是挑不出破绽的程度。视频、声音、口型,AI的进化越来越完美了! 最近Flux的爆火,简直把所有人的三观都撼动了。 不懂就问:现在网上的东西,还有什么是真的?