
字节多模态大模型PixelLM:高效像素级推理,无需依赖SAM
字节多模态大模型PixelLM:高效像素级推理,无需依赖SAM目前大多数模型的能力还是局限于生成对整体图像或特定区域的文本描述,在像素级理解方面的能力(例如物体分割)相对有限。
目前大多数模型的能力还是局限于生成对整体图像或特定区域的文本描述,在像素级理解方面的能力(例如物体分割)相对有限。
最近 AngelList 举办了 2023 年会,现任 CEO Avlok Kohli 和 Naval 进行了一场 45 分钟的高密度圆桌对谈,谈到了给如今 AI 创业者和投资人的建议,以及自己最新创业打造的语音社交产品 Airchat。
科技巨头微软CEO萨提亚·纳德拉(Satya Nadella)宣布,刚被OpenAI公司解雇的两位人工智能领域的重磅人物,将率团队加入微软公司。
大模型代码生成能力如何,还得看你的「需求表达」好不好。从通过HumEval中67%测试的GPT-4,到近来各种开源大模型,比如CodeLlama,有望成为码农编码利器。
OpenAI在11月7日举行的一场发布会,再一次使得全球科技圈沸腾。但作为全球科技领域最知名的观察者,凯文·凯利(Kevin Kelly)却对于AI改变世界的“进度条”持不一样的态度。
11月6日发表在科学顶刊《细胞》物理子刊《Cell Reports Physical Science》上的一项研究,科学家已研究出一种机器学习工具,可以很容易地识别出使用聊天机器人ChatGPT撰写的化学论文。
近日,微软首席执行官萨蒂亚・纳德拉(Satya Nadella)在媒体专访中表示,其经历过四次重大转变,目前正在经历第五次重大转变,即人工智能。
继CodeLlama开源之后,北大等机构正式开源了性能更强的代码基座大模型CodeShell-7B和代码助手CodeShell-Chat。不仅如此,团队还把方便易用的IDE插件也开源了!
这两天,FlashAttention团队推出了新作: 一种给Transformer架构大模型推理加速的新方法,最高可提速8倍。 该方法尤其造福于长上下文LLM,在64k长度的CodeLlama-34B上通过了验证
Ello 是一家利用人工智能和儿童语音识别技术来帮助儿童学习的公司。这家初创公司今天宣布获得了1500万美元的A轮融资,这笔资金将用于产品开发和市场投放。