搜 索

期刊

21世纪商业评论2025年6月第6期

好未来攻坚大模型


  清晨的斯坦福大学校园,很安静,好未来创始人张邦鑫,约上CTO田密,一起散步。

  二人心事重重,气氛有点严肃。张邦鑫一开口,直入主题:“能不能请你放下别的所有工作,只做大模型?”

  那时,ChatGPT发布已有几个月,张邦鑫等人第一时间关注,做了些非正式预研,没拿定主意要不要跟进。他带着团队专程赴美,考察大模型的进展。

  一周多的时间里,团队连轴转,英伟达、谷歌等科技巨头以及当时还没爆火的Figure等初创公司,一口气走了个遍。白天出门,夜里复盘讨论。

  地陪司机忍不住嘀咕:“别人都是去哪儿玩,去哪儿看show,你们公司一天安排六七个访问行程,也太拼了。”

  “走完一圈,挺受震撼的,我们很快意识到,AI将给教育带来巨大颠覆。”田密接受《21CBR》记者专访时表示。

  那场清晨对话的最后,田密立下军令状:“如果大模型做失败了,我就离开公司。”

  他带着几十人的队伍,埋头攻坚,半年时间,自研发布数学大模型MathGPT,后取名为“九章”。

  现在,九章大模型已深度应用到学习机等核心产品,也推出了独立APP和小程序“九章爱学”。能力方面,以数学最为突出,在去年MathEval网站的数学能力测评中,位列国内外几十个大模型榜首。

  今年,田密团队,积极推动大模型走进公立学校,三个月就做出了第一版产品“九章爱学大小屏”,已在全国四个省市试点。

  “AI老师,是好未来坚定要做的方向。真人老师能干的事情,要让AI老师都能干,而且干得更好。”田密说。

押注“九章”

  2022年11月底,ChatGPT问世,我们第一时间开通账号。用完以后,大家很惊叹,过完春节就发现,身边讨论的人越来越多,这款产品破圈了。

  邦鑫和我们几个人,一直在讨论,要不要跟进。当时还没买卡,就用手头一批老的英伟达V100卡,试着做了些预研测试。

  大家觉得,还是得去发源地看看,了解AI行业当前的发展状况。我们在美国考察时,感受很深刻,新的技术革命来了,好未来必须all in,全力投入大模型。

  带着几十人的团队,我重新回到一线攻坚状态。

  大模型要顺利起步,三要素的投入不能少,算力、算法人员、数据,都是以亿为单位的,很烧钱,成本投入是摆在面前的首要问题。

  幸运的是,老板的决心很大。

  算力方面,起初我想过,要不要租一批大厂的卡来训练。邦鑫建议,自己买卡比较可控。好未来在教育公司里,算力投入可能是最大的。

  算法的关键在于人。当时集团的算法人员大约有100多个,几乎全部抽调来做大模型。我们意识到,大模型颠覆传统AI的路径,如果执着于过去的技术路线,就是“屎上雕花”。

  数据方面,公司多年下来,积累了大量教育数据,但做模型的强化和微调,光有教育垂类数据还不够。我们专门建了一个基地,雇人做数据标注。

  最初,我们希望从零开始,训练一个自己的大模型。过了一段时间,越来越多优秀的开源模型涌现出来,我们发现,自己做预训练,并不划算。

  因此,我们果断切换方向,在DeepSeek、LLaMA等全球顶尖的开源模型基础上,结合学而思独有的教育行业专有数据,进行二次训练,再把多个模型进行交叉验证和投票,最终得到专业的教育大模型。

  跟之前相比,步骤其实没省多少,但站在巨人肩膀上,模型能力得到提升。

  做大模型的厂商很多,从数学切入的,只有好未来。

  数学是公认的大语言模型最弱的地方,如何提升其逻辑推理能力,是业界共同面对的难题。

  好未来做数学培训起家,在这个领域的积累,是我们做数学大模型的优势。

  加上公司在2017年就成立了AI Lab,多年布局之下,有传统AI时代打下的地基,过渡到新的大模型时代,过程很顺。

  花了半年时间,我们做出了MathGPT的第一版,2023年11月,MathGPT成为首批通过备案的教育大模型。

  “九章”这个名字,源自《九章算术》,是世界上最早的印刷本数学书。大家基本没有纠结,觉得“九章”好听好记且有故事,一致通过。

  回过头看,在传统AI时代,需要针对多个应用场景,用到上百个小模型。公司做了大量AI助手,协助老师备课、批改作业等,功能较为零散、简单。

  现在,一个大模型就能搞定很多事情,更重要的变化在于,随着AI能力逐步强大,能实现教、学、练的闭环,真正从过去以老师为中心,转向以学生为中心。

软硬结合

  九章大模型以数学起家,并把能力继续延伸,覆盖全学段、全学科。

  比如,语文学科,可以提供作文辅导写作、作文批改等功能;英语学科,提供英语作文批改、口语对话练习等功能。

  最早,团队从AI解题这项能力做起。很快,我们意识到,AI解题,技术水平再牛,也不是家长和学生的实际痛点。

  家长要的是AI能给孩子批改作业,把错题讲明白,减少他们辅导作业的工作量和请家教的成本。

  做大模型不是炫技,帮用户解决现实问题才是第一位。

  九章选择聚焦三个方向——批改、讲题、精准练。

  先看批改。传统AI时期,能做的是选择题、判断题等简单的批改。现在有了大模型,不光能支持所有题型,而且能呈现批改过程,指出答题错在哪一步,这个步骤关联哪个知识点。

  至于讲题,好未来实打实训练出来一个AI老师,能划分六个维度的指标,让真人老师打分,评价其讲题的逻辑性、过程的连贯性等。

  最后的精准练,基于知识图谱,从孩子做对或做错一道题,来判断其是否掌握某个知识点,精准推送孩子需要的题目。

  这些技术能力,以多种应用方式落地,既嵌入好未来现有的APP、智能硬件和学习服务,也有独立的APP和小程序“九章爱学”,并提供API和智能体接口。

  随着落地探索的深入,我们逐渐认清了现实:纯AI软件很难单独落地,软硬结合可能是现在的唯一出路。

  在教育硬件赛道,学习机的复杂程度是最高的。好未来在2023年2月推出第一代学而思学习机,锚定“好内容”,当时有人估算过,4000多元的学习机,仅内置的课程资源,价值至少等于30万元的培训费。

  到了第二代产品,大模型能力全面接入,升级为“好内容+好AI”,“好AI”即九章与DeepSeek形成的双核大模型,进一步强化学习机的智能交互与精准分析能力。

  从具体功能来看,今年5月发布的旗舰产品T系列,搭载了小思智慧岛Pro,这是个软硬一体化的摄像头体系。学生伏在桌上写作业,摄像头能直接拍到纸上的题目,方便、智能地提供作业辅导。

  我们正在努力,往多模态AI老师的方向进化,省去每次主动唤醒AI的动作,让交互体验变得丝滑。

  桌面放上教科书或试卷,学生手写时,摄像头实时录入查看,实时按步骤讲解,如同真人老师面对面辅导。

提速进化

  九章大模型的AI能力,保持以月为单位的迭代节奏,配合学习机等前端产品的更新。

  好未来坚定往AI老师的方向走,仿照无人驾驶等级的L0到L5,我认为,教育行业的AI老师,大体上也是如此进阶。

  L1级别,AI只能给老师打辅助,做些简单重复的工作。

  当前所处的L2,AI能在某个模块上,胜任老师的工作,比如批改,属于“辅助驾驶”阶段,驾驶员可以“脱手”“脱脚”,不能“脱眼”。

  L3,进入“有条件的无人驾驶”,可部分“脱眼”,不能“脱脑”。一些特定场景下,交给AI老师明确的任务和目标,它能基本跑完一个闭环,但需要随时准备接管。

  我们希望,未来两三年,能实现L3级别。比如在家场景下,学习平板里的AI老师,可以自主帮你完成学业规划,也能实现做题—批改—讲题—练题的完整闭环。

  未来,到了L4,AI老师可以跨场景切换,家长能放心地把孩子的学习交给AI老师,除非出现个别极端情况,基本不用接管。

  那时候,教育行业将迎来彻底变革。

  为了将大模型能力推向更多应用场景,我们开启AI产品进校业务,去年底立项,今年3月推出第一版To G的学习机产品。

  第一批试点,至今两三个月时间,据学校反馈,两个班级对比,有AI工具赋能的班级,数学成绩的均分较另一个班高出7分,预测学期末将拉开十几分的差距。

  AI进校,有个逐渐接受的过程,关键在于信任和效果,我们有耐心,也有信心。

  技术和业务紧锣密鼓的同时,我们也在锻造AI化组织。

  一是转变思路,业务遇到问题,先问大模型,能不能做、怎么做。

  二是工作内容的“AI率”提升。明确要求所有岗位,未来几个月,至少有某项工作由AI替代。比如,公司法务、财务的合同审核,现在基本交给大模型,大幅提效。

  我做大模型这两年,感到压力最大的,是刚接下任务的时候,一切未知,不知从何着手。

  现在心里踏实多了,怎么应对挑战也很明确:从用户使用过程和经验中发现不足,思考技术改进的路径,探讨更丰富的交互形态。

  就我个人而言,之前十几年,待在腾讯、阿里,花名一直是“老师”。或许,冥冥之中就确定了我的角色。

期刊简介

       依托21世纪报系资源优势,汇聚中国工商精英,共同营造分享商业智慧和企业方法的话语平台,为他们的决策提供强大的智力支持和丰沛的思想营养,推动中国商业精神的成长和成熟。   《21世纪商业评论》关注本土实践,传播国际理念;提供关于全球商业的洞见、创见和远见;以独树一帜的工作哲学,深入关注商业领袖和企业管理者的真实焦虑。   《21世纪商业评论》面向企业中高层管理人员。设有议程、封面故事、特别报道、领导者、现场、价值、远见、态度等栏目,是一份具有高附加值的商业资讯。

过往期刊更多过刊..

21世纪商业评论21世纪商业评论
2025年5月第5期
21世纪商业评论21世纪商业评论
2025年4月第4期
21世纪商业评论21世纪商业评论
2025年3月第3期
21世纪商业评论21世纪商业评论
2025年2月第2期
21世纪商业评论21世纪商业评论
2024年12月第12期
21世纪商业评论21世纪商业评论
2024年11月第11期
21世纪商业评论21世纪商业评论
2024年10月第10期

阅读排行TOP10