
大模型究竟是怎么思考的?这可能是近期最有趣的高质量AI访谈
大模型究竟是怎么思考的?这可能是近期最有趣的高质量AI访谈智东西8月20日报道,8月16日,Anthropic最新一期官方油管视频上线,三位AI研究员抽丝剥茧,深入探讨AI研究不应避开的一个关键“谜团”——大模型究竟是怎么思考的?
智东西8月20日报道,8月16日,Anthropic最新一期官方油管视频上线,三位AI研究员抽丝剥茧,深入探讨AI研究不应避开的一个关键“谜团”——大模型究竟是怎么思考的?
DeepSeek V3.1和V3相比,到底有什么不同?官方说的模模糊糊,就提到了上下文长度拓展至128K和支持多种张量格式,但别急,我们已经上手实测,为你奉上更多新鲜信息。
8 月 20 日,在新加坡的 Stripe Tour 上与 Stripe CEO 对谈的时候,Manus 首席科学家季逸超(Peak)表示,Manus 从三月份推出至今已实现 9000 万美元的年化营收规模(revenue run rate),1 亿美元大关近在咫尺。
虎牙Q2营收15.7亿,AI战略驱动平台实现创新转型。 8月12日,虎牙发布2025年第二季度财报。经过两年战略转型后,虎牙交出一份超越市场预期的亮眼业绩。
2011 年 8 月,雷军穿着标志性的黑 T 恤和牛仔裤,在北京 798 艺术中心发布了初代小米手机。在这款产品搅动整个智能手机行业之前,他首先用一个极具冲击力的数字定义了它——1999 元。
DeepSeek V3.1新版正式上线,上下文128k,编程实力碾压Claude 4 Opus,成本低至1美元。在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。
没等到Deepseek R2,DeepSeek悄悄更新了V 3.1。官方群放出的消息就提了一点,上下文长度拓展至128K。128K也是GPT-4o这一代模型的处理Token的长度。因此一开始,鲸哥以为从V3升级到V 3.1,以为是不大的升级,鲸哥体验下来还有惊喜。
国产开源版 Genie 3 问世,昆仑万维用 1.8B 模型跑出了神级效果。如果你上传一个神庙逃亡游戏的截图,就可以在这个世界模型里面开一局,AI 脑补出来的画面会无限地向前延伸。
英伟达发布全新架构9B模型,以Mamba-Transformer混合架构实现推理吞吐量最高提升6倍,对标Qwen3-8B并在数学、代码、推理与长上下文任务中表现持平或更优。
8月18日,医疗AI企业惠每科技宣布完成近2亿元人民币融资。本轮融资由上海国资上海科创基金及钟鼎资本共同领投,启明创投继续加持、长宁资本以虹桥睿智投资平台进行跟投。