AI资讯新闻榜单内容搜索-部署

7B超越百亿级，北大开源aiXcoder-7B最强代码大模型，企业部署最佳选择

对代码大模型而言，比能做编程题更重要的，是看是能不能适用于企业级项目开发，是看在实际软件开发场景中用得顺不顺手、成本高不高、能否精准契合业务需求，后者才是开发者关心的硬实力。

来自主题: AI资讯

6910 点击 2024-04-10 17:50

神州数码生成式AI战略升级，聚焦算力和AI应用工程平台研发

过去一年，AI大模型技术飞速发展，如何用好大模型实现降本增效、推动业务增长，成为了企业真正关心的问题。据Gartner预测，2026年，将有超过80%企业会使用生成式AI的API或模型，或在生产环境中部署支持生成式AI的应用，产业发展迎来巨大的机遇与挑战。

来自主题: AI资讯

3453 点击 2024-03-31 11:15

ChatGPT和Sora其实限制了我们对大模型的想象？

最近一份美国市场研究机构发布的报告火了。报告详细分析了OpenAI部署Sora所需的硬件资源，计算得出，在峰值时期Sora需要高达72万张英伟达H100 来支持，对应成本是1561亿人民币。

来自主题: AI资讯

7922 点击 2024-03-30 14:19

估值40亿的Pi大更新：性能接近 GPT-4，日均使用时长已经超过 Instagram

当OepnAI和马斯克连日互杠、Google因文化偏见麻烦缠身、号称抢走GPT-4王位的Claude 3全力瞄准企业级部署的时候，在另一个角落，致力于「为每个人开发服务型AI」的人工智能初创公司Inflection AI，悄悄更新了他们的聊天机器人Pi，以及为之提供支持的新一代大模型Inflection-2.5。

来自主题: AI资讯

9879 点击 2024-03-11 10:38

让大模型“瘦身”90%！清华&哈工大提出极限压缩方案：1bit量化，能力同时保留83%

对大模型进行量化、剪枝等压缩操作，是部署时最常见不过的一环了。

来自主题: AI技术研报

6998 点击 2024-03-09 14:51

Mac专属大模型框架来了！两行代码部署，能聊本地数据，还支持中文

Mac用户，终于不用羡慕N卡玩家有专属大模型Chat with RTX了！

来自主题: AI资讯

8926 点击 2024-03-04 15:32

英伟达发了个有点弱的端侧模型，却想喊话大家举手投降

英伟达在2024年2月14号的时候推出了这么一个产品，叫做Chat with RTX。顾名思义，就是和英伟达的显卡聊天。简单来说Chat with RTX是一个本地部署的大语言模型工具，可以实现和大语言模型对话，还支持处理多种文件类型，用户可以与其进行文本、PDF、Word文档等多种格式内容的交互。

来自主题: AI资讯

8119 点击 2024-02-27 14:14