
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现出了越来越接近闭源的性能。
随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现出了越来越接近闭源的性能。
Llama3.1系列模型的开源,真让大模型格局大震,指标上堪比最好的闭源模型比如GPT 4o和Claude3.5,让开源追赶闭源成为现实。
OpenAI重金投资的代码工具Cursor,叛变了:
Claude深夜上新重磅功能——API长文本缓存。
xAI 今天宣布推出 Grok-2 和 Grok-2 mini 测试版,官方说,它的表现比 Claude 3.5 Sonnet 和 GPT-4-Turbo 更好。
GPT遭遇退订潮,Claude成新宠,Anthropic做对了什么?
ChatGPT,就是新的Excel! 红杉资本分析师、Every联合创始人兼CEO Dan Shipper,最近给出了这样的论断。 并且,他在长篇博客中做出了详实的分析,为什么ChatGPT和Claude将催生下一波初创公司,催生出三千多亿美元的市场。
把Llama 3.1 405B和Claude 3超大杯Opus双双送进小黑屋,你猜怎么着——
国产大模型,多模态能力都开始超越GPT-4-Turbo了??
一次意外右手骨折,Claude工程师的工作竟被AI挽救了。近两个月的时间,他们一起结对编程,甚至在一周内肝出3000行代码。他疯狂暗示,未来1-3年,就是「AI工程师」的天下。