热闻

清华和上交的最新论文中，上演了一场“学术打假”的戏码。文中研究者们对当前“纯 RL 有利于提升模型推理能力”的主流观点提出了相反的意见。通过一系列实验，他们证明引入强化学习的模型在某些任务中的表现，竟

大模型时代的三道鸿沟：数据、成本与想象力

2025-09-03 10:04阅读(1269)赞(4)

跨入2023年，大模型兴起、诸多公司「跑步进场」的头几个月，大模型一边倒向 C 端类 ChatGPT 的研发，对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月，情况发生了变化。基于医疗、金融

2025-09-03 09:38阅读(2408)赞(1)

编译 | 郭思编辑丨陈彩娴在实际应用大模型的过程中，尤其是处理长文本的上下文信息时，如何高效灵活地调度计算资源成为一个学术界与工业界共同关注的问题。大语言模型所能容纳的上下文长度直接影响了诸如 Ch

2025-09-03 08:21阅读(2085)赞(15381)

「打造中国OpenAI」，「西湖心辰」这家创立时间不到两年的小公司怎么敢夸下海口？相比于国内的其他创业团队，心辰具有以下几大优势：1.在大模型的研究和商业化落地要早一年。积累了超过百万的用户，并训练出

2025-09-03 07:50阅读(169)赞(3791)

2013年9月底，吴韧受百度邀请，以杰出科学家的身份加入百度深度学习研究院IDL），此时正值他五十知天命的年纪。吴韧在人工智能领域耕耘多年，当时已是一名顶尖的AI计算科学家。2012年深度学习崛起前后

2025-09-03 07:49阅读(242)赞(8929)

1993年的拉斯维加斯，18岁的 Jeff Moss 正准备面临一场悲伤的别离。他的一位黑客朋友由于爸爸工作调动即将离开美国，为了给这份友谊再留下些纪念，Jeff 决定给朋友办一个盛大的告别 Part

2025-09-03 07:48阅读(508)赞(61)

【雷峰网(公众号：雷峰网)】近日，千呼万唤之下，Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本，再次震动 AI 圈。Meta 表示，Llama 3 已经在多种行业基准测试上展现了

2025-09-03 07:44阅读(1665)赞(48)

【雷峰网(公众号：雷峰网)消息】上周五，全球最大的开源大模型社区Hugging Face公布了最新的开源大模型排行榜，阿里云通义千问Qwen-72B表现抢眼，以73.6的综合得分在所有预训练模型中排名

2025-09-03 07:38阅读(1320)赞(3674)

大约 1 个月前，马斯克所创办的 xAI 团队宣布开源 Grok-1——一个参数量为 3140 亿的 MoE 大模型。从参数量来看，Grok-1 超越了 70B 的 LLaMA 2，是当前开源模型中最

2025-09-03 07:27阅读(955)赞(5338)

8月14日，新加坡，大厦起伏如丘，树木葱茏，云卷云舒，风也是清新的。建立在大模型技术爆炸时代语境下的第七届GAIR全球人工智能与机器人大会，正式在新加坡乌节大酒店举办。大会共开设10个主题论坛，聚焦大

2025-09-03 07:25阅读(1054)赞(3442)

【雷峰网(公众号：雷峰网)消息】12月19日，百川智能宣布开放基于搜索增强的Baichuan2-Turbo系列API，包含Baichuan2-Turbo-192K 及Baichuan2-Turbo。在