文章编号:13555时间:2025-02-07人气:
近年来,人工智能(AI)领域的发展日新月异,大模型的性能不断提升,但随之而来的是巨大的计算资源和训练成本。
在这一背景下,以低成本实现高性能的推理模型成为了众多研究者的追求。
最新由AI教母李飞飞及其团队推出的s1模型,便是一个令人瞩目的成果。
近期,DeepSeek-R1模型以极低成本实现了与o1模型相近的性能,引发了广泛关注。
这一成果背后的故事展示了模型推理技术的巨大潜力。
在此基础上,李飞飞团队运用蒸馏技术,以惊人的低成本训练出了s1模型,其性能在数学和编程能力的评测集上比肩DeepSeek-R1和o1。
s1模型的诞生离不开团队对Test-timeScaling的深入研究。
在OpenAI的o1模型展现出Test-timeScaling的能力后,复现这一成果成为了s1团队的目标。
过程中,团队构建了精心挑选的1000个样本数据集s1K,每个问题都附有答案以及gemini2.0FlashThinking实验版的思考过程。
研究团队以阿里通义团队的Qwen2.5-32B-Instruct作为基础模型,通过蒸馏谷歌DeepMind的推理模型Gemini2.0FlashThinking实验版,最终得到了s1模型。
训练过程中,团队采用了简单的蒸馏技术——budgetforcing法,通过设定思考token数量上限和下限来引导模型提供最佳答案。
整个训练过程仅用了不到半个小时,训练成本之低令人咋舌。
在对比多个推理模型后,s1模型表现出了卓越的性能。
在MATH500评测中,s1-32B的成绩超过了o1-mini,与o1和DeepSeek-R1相媲美。
s1模型在样本效率上表现出色,仅使用1000个样本训练便在AIME24上取得了接近Gemini2.0Thinking的成绩。
s1模型的诞生为我们提供了许多启示。
顺序Scaling相较于并行Scaling在Test-timeScaling中更为有效。
budgetforcing法在控制、缩放和性能指标上表现最佳。
蒸馏技术在大模型推理中具有重要意义。
展望未来,我们有理由相信,随着技术的不断进步,更多的创新方法将涌现出来,推动AI领域的发展。
s1模型的诞生是AI领域的一大突破。
通过运用简单的蒸馏技术和创新的Test-timeScaling方法,研究团队以极低成本训练出了高性能的推理模型。
这一成果为我们提供了许多启示,也让我们看到了AI领域的更多可能性。
期待未来大模型技术的精彩发展。
1. TechCrunch(2025):Researchers Created anOpen Rival to OpenAIs o1 Reasoning Model for Under50.
2. 本文:s1: Simplest-Timescaling (可在arXiv上找到)
3. GitHub项目:s1 (链接:)
上一篇:DeepSeek的助力与不完整之处揭秘ChatGPT的o
下一篇:缅怀黄旭华同志的一生
内容声明:
1、本站收录的内容来源于大数据收集,版权归原网站所有!
2、本站收录的内容若侵害到您的利益,请联系我们进行删除处理!
3、本站不接受违法信息,如您发现违法内容,请联系我们进行举报处理!
4、本文地址:https://www.gosl.cn/hlwzxwz/1a9970334dac0b3f58da.html,复制请保留版权链接!
原创刘博团队——乙巳蛇年的奇迹与变革乙巳蛇年注定不平凡,科技界和影视行业频频传来喜讯,DeepSeek引领科技潮流,宇树科技机器人在春晚大放异彩,而春节档电影,哪吒之魔童闹海,更是打破多项影史纪录,成为全民热议的焦点,在这波热潮中,,哪吒之魔童闹海,的续作,哪吒Ⅱ,更是以惊人的速度冲顶中国票房榜首,电影的成功不仅提升了出品方的市值,也...。
互联网资讯 2025-02-07 02:19:24
青岛文明旅游盛事,新时代文明实践志愿者在萝卜·元宵·糖球会中的行动与担当在浓厚的节日氛围中,青岛迎来了喜庆热闹的2025年萝卜·元宵·糖球会,这不仅是一场文化盛宴,更是城市文明程度的展示舞台,在这个特殊的日子里,市北区文明办与即墨路街道联手,发动新时代文明实践志愿者走进节会,开展了一场别开生面的,鸥遇青岛文明相伴,文明旅游宣传倡导活动...。
互联网资讯 2025-02-07 01:52:45
三款超值之选,MGES5、银河E5与深蓝S05——10万级入门纯电SUV的理性选择随着新能源汽车市场的蓬勃发展,纯电动汽车,EV,已经成为越来越多家庭的选择,特别是在紧凑级家用SUV市场,各大品牌纷纷推出自家的EV产品,今天,我们将聚焦三款近期上市的热门车型,MGES5、银河E5和深蓝S05,它们都以极具竞争力的价格进入市场,成为消费...。
互联网资讯 2025-02-05 20:21:15
标题,马竞新星朱利亚诺,西蒙尼闪耀国王杯,三场贡献三球两助直播吧2月5日讯,一场引人注目的国王杯比赛在马德里竞技俱乐部的主场展开,对阵双方是马竞与赫塔费,比赛结果令人震撼,马竞以5,0的大比分血洗对手,更引人关注的是比赛中一位年轻人的出色表现,这是西蒙尼的三儿子朱利亚诺,西蒙尼绽放光芒的一夜,他一人独中两元,成为球队胜利的重要功臣,朱...。
互联网资讯 2025-02-05 07:39:32
文章标题,春节出游的文艺范之选,福清石竹山与黄檗山的探索之旅正文,福清市,这个拥有深厚文化底蕴和自然景观的城市,是福建省文旅的一大亮点,春节即将来临,想要出游却希望带点文艺范的朋友们,一定不能错过福清的这两个景点——石竹山景区和黄檗山万福寺,一、石竹山景区——雅胜鼓山,文旅活动丰富多彩福清石竹山风景区是国家4A级景区,以石奇竹秀而得名...。
互联网资讯 2025-01-31 10:43:42
微软误将,魔兽世界,列入XGP订阅服务引发争议及澄清始末近日,微软在发给用户的促销邮件中误将动视暴雪的经典游戏,魔兽世界,列为XboxGamePass,简称XGP,订阅服务中的一款游戏,引发了一系列误会和关注,此事经过媒体的报道后,微软迅速作出回应,对此次失误进行了澄清和道歉,一、邮件中的误会此次引发争议的邮件中,微软提到用户使用XG...。
互联网资讯 2025-01-30 22:53:48
美国的新移民政策动向,特郎普签署,莱肯·莱利法案,聚焦非法移民拘留措施近日,美国总统特朗普再度成为焦点,据报道,当地时间XX月XX日,特朗普在白宫正式签署了备受瞩目的,莱肯·莱利法案,这一举措标志着特朗普在第二任期开始后取得了首个立法胜利,引起了国内外的广泛关注,该法案的正式实施,不仅关乎非法移民的拘留措施,更体现了特朗普政府对非法...。
互联网资讯 2025-01-30 11:59:19
标题,破除身边统计学,社会科学基础知识的力量在这个移动互联网时代,信息以前所未有的速度在我们周围泛滥,我们总是容易通过个例来理解社会,这种现象被称之为,身边统计学,没有受过良好教育的一个典型表现就是,只会通过这种有限的方式来观察和理解社会,这不仅可能导致认知的偏差,更可能阻碍我们理解复杂的社会现象,一、身边统计学的局限身边统计学,顾...。
互联网资讯 2025-01-29 20:15:24
新加坡政要纷纷送上新年祝福,蛇舞新春,福气满门在农历乙巳蛇年的第一天,即1月29日,新加坡的政要们纷纷通过社交平台为人们献上了新年的祝福,他们以个人名义发出的温馨祝愿,为新加坡的华人社区带来了浓浓的节日气氛,一、国务资政李显龙的新春祝福1月29日,新加坡国务资政李显龙在个人社交平台上发文,为大家送上蛇年的祝福,他表示,在华人文化中,蛇...。
互联网资讯 2025-01-29 17:49:38
奔驰S级轿车是一款豪华的轿车系列,其中奔驰S500L作为其中的一款车型,因其高端配置和出色的性能而备受关注,一、奔驰S500L的价格奔驰S500L的价格在1700万到2280万元之间,这一价格区间主要取决于车型配置、地区差异以及经销商的定价策略,作为一款高端豪华轿车,奔驰S500L配备了氙气大灯、电动天窗、铝合金轮圈、真皮座椅、桃木内...。
互联网资讯 2025-01-29 06:21:23
封面新闻武汉天价洪山菜薹引发关注,高价背后的历史底蕴与市场策略随着春节的脚步日益临近,武汉某蔬菜基地推出的一款洪山菜薹礼盒引起了广泛关注,这款礼盒中的两根菜薹售价高达18888元,被网友戏称为,吃了能成仙,在这个价格背后,隐藏着洪山菜薹深厚的历史底蕴以及复杂的市场策略,一、天价菜薹背后的历史与文化洪山菜薹,这一武汉地区的特色蔬菜,有...。
互联网资讯 2025-01-28 16:57:23