你知道吗?Plan9操作系统,这个40年前由“C语言之父”开发的系统,如今正在重新崛起,甚至影响了Linux和Windows的设计!令人兴奋的是,美国贝尔实验室刚刚宣布将Plan9的版权开放给开发者社区。这意味着,这个在幕后影响行业40年的分布式操作系统,即将正式“复活”。Plan9到底是什么?它是...
陈丹琦新作:大模型强化学习的第三条路,8B 小模型超越 GPT-4o
结合RLHF与RLVR的优势,仅需8B参数的小模型便能超越GPT-4o,并媲美Claude-3.7-Sonnet。陈丹琦团队最新研究引发广泛关注。他们提出了一种名为RLMT(ReinforcementLearningwithModel-rewardedThinking,基于模型奖励思维的强化学习)的...
OpenAI 连丢 4 位大将!Ilya 合作者 /o1 核心贡献者加入 Meta,苏黎世三人组回应跳槽:集体做出的选择
扎克伯格似乎确实对奥特曼格外关注!又有OpenAI的核心研究员被Meta挖走,而这次涉及的正是最前沿的推理大模型领域。最新一位加入Meta的是TrapitBansal,他在2022年进入OpenAI,并与Ilya展开了合作,在大模型强化学习研究的启动阶段发挥了重要作用,同时也是o1的核心贡献者之一。...
“大语言模型与多智能体系统读书会”本周六开始啦!
导语"大语言模型与多智能体系统读书会"将于本周六晚20点开始第一次分享。这次将由圣母大学计算机科学在读博士生——郭泰成,以及目前火爆的多智能体框架CAMEL的创始人,牛津大学博士后——李国豪主讲!更多来自清华、北大、浙大、MIT、UIUC等高校的论文作者将轮番登场...
