第一段实习!智谱AI-大模型算法岗

1. 前言
2024.12.17 ~ 2025.4.14
实习应该是我考完雅思之后最焦虑的事情了,毕竟将来已经打算读水硕了,只能靠多刷实习来弥补一下paper少的缺憾。而我大三暑期又在全力冲刺考研数学,错过了一段实习的黄金期。所以24年下半年真的是很难熬,这里要特别鸣谢杨哥,直接把我内推进了智谱,省去了我各处投简历的麻烦,直接从gre无痛衔接到了人生第一段实习,杨宝我爱你。
关于面试,我的经历其实不太具有参考价值。感谢杨宝,我的面试也比较简单。
两面:
- 一面是mentor面,自我介绍+介绍一下项目经历,问了一个RAG项目过程遇到了什么难点,还有问了有没有cv相关经历、时间会不会和毕设冲突。反问问了工作内容。全程二十分钟左右。
- 二面是部门领导面,更是水中水,自我介绍说太多了被打断了,同样问了毕设会不会时间冲突,问了有没有看过时序大模型的论文(因为我说了我毕设也贴近这个方向),我说没有,他说好的。当场直接说了会尽快把资料给到hr。十分钟左右,牢大很忙的啦。
虽说过程没啥难度,但拿到第一封offer的时候还是很激动的~
这篇文章主要记录下智谱实习的工作内容、工作氛围,可能还夹杂有一些微小的个人对于AI的看法。
2. 工作内容
我在智谱的工作内容可以大体分为以下几个方面,我觉得可以代表大部分算法岗实习生了,除了少数的背景极为优秀的可以参与到核心业务或者基模的研发中,大部分普通人应该都是干这些。以下内容按照工作时长所占比例进行排序:
- 模型评测:入职前瞧不起测试岗,入职后我竟是测试岗。模型评测大概就是用现成的评测脚本去跑Benchmark,来来回回就是那经典的四个数据集:ceval、gsm8k、mmlu、bbh。这个工作内容全程只需要如下几步:启动模型的tgi部署脚本、启动评测脚本、记录结果。真的很简单,但可惜破公司前期给我了一个破烂脚本,花了很大功夫为评测脚本debug。后期换了一个产研的脚本,同一套模型能提高十个点,当时我真的很生气,感觉自己的时间被狠狠浪费。
我从中学到的唯一一个知识就是LLM-as-a-Judge真的很重要!如果你的工作主要内容就是模型评测,赶紧跑。 - Research:幸好除了测试岗之外还有一个工作,就是承担了一些部门里的前沿方向调研的工作。当然这个工作,只能说是把双刃剑,下面分几点简单讲讲:
- 内容:我一共接触过三段Research形式的工作。两段是刚入职时做的,一段是结束前做的,并且前两段以失败告终,好在最后一段有成效,为我苍白的简历添了一些色彩。
- 第一段:刚入职时接过了杨哥在做的工作,是组里想用一些少量的带有时间戳的数据,通过sft来激发模型的时间理解能力。然而时间理解应该来说即使是对当前的顶会工作都是个难以逾越的鸿沟,完全无法落地。我的评价是ai院的人来了也没办法,终于知道为啥杨哥最后那么着急让我去了,原来是去当接盘侠,烂尾。
- 第二段:mt给我的新任务,阅读一篇预训练文本检测的工作(emnlp的best paper),目的是探究基座模型的预训练语料库里都包含哪些内容,然后找一些模型没见过的数据进行增训。同样,学术界都没整明白,也烂尾了。
- 第三段:模型融合。最后一个月的主要工作,背景是训出来的行业大模型通用能力下降太多,希望能通过该手段弥补一下。找到了一个模型融合的开源工具包,救我狗命。融合完以后通用能力有显著恢复,并且领域能力甚至比增训+sft完的模型还高。具体的方法我还会再写一篇博客。
- 优点:这种前沿探索性质的工作是有一定优点的,那就是一旦能work,这就是一个与众不同的产出,可以写在简历里,虽然也不知道求职好不好用,但最起码这种探索然后有好结果的快乐是独一无二的。此外就是可以看很多文献,最起码锻炼了自己的文献阅读能力。
- 缺点:当然,这种工作的缺点就是不成功的话血本无归,甚至一个月的心血完全浪费。而且最关键的是组里基本没有人能指导,mt人很好但学术水平确实有限,基本没有学术眼光。只能说能否有产出还得看自身命运。
- 内容:我一共接触过三段Research形式的工作。两段是刚入职时做的,一段是结束前做的,并且前两段以失败告终,好在最后一段有成效,为我苍白的简历添了一些色彩。
- 模型部署:大模型算法岗实习生的基本操作。下载模型、启动模型、开接口,看似十分简单,实则一点也不难。这个过程可以熟悉一下tgi、vllm等模型部署框架,也可以学习到nginx端口转发的知识,但同样的,学会了就是熟练工种了,干多了就没啥意思了。
- 模型微调:很重要的一项工作,但没啥技术含量,使用的都是现成的框架,命令行一行搞定。并且也没有让我接触一些真正涉及到业务的模型微调,都是调一些baseline模型。
- 数据爬取:同样很重要,其实还是挺有技术含量的,毕竟爬虫技术亦有高低,好在我爬的都是一些政府网站,基本没有反爬措施,但是前端写的太狗屎了导致我还是花了很大功夫。爬取完还涉及到数据清洗工作,这步还挺有意义的,对于小白来说,可以了解一下什么数据是高质量的。我mt曾经说过,爬下来的数据留一半他都不嫌少。
主要就是这些,大部分时间都花在前两项工作上,确实稍显dirty,但平心而论,我作为零实习基础的小白,这里的大部分工作我一开始也是难以胜任的,我确实不应该嫌弃工作内容,而且也实打实的让我学到很多。但同样,作为一段实习工作来说,我是感觉做到这就可以了,再多的重复性工作也没啥意思。
以上只是我个人的工作内容,组里的工作内容还挺多样的,也有专门负责论文、专利产出的(与我无关),业务上行业大模型占主导,但也有一些其他方向,包括但不限于:Text2CAD、Text2SQL、时序大模型、多模态大模型、Agent等等。感觉啥跟大模型相关的业务都接。
3. 工作氛围
作为实习生来说,我觉得工作氛围还是很不错的,组里的几个正职对实习生都挺nice的,周末或者请假几乎不打扰你,如果实在要打扰的话态度也很好,还会道歉。由于这是我的第一段实习,刚来的时候有一段很难顶的过渡期,但mt也不会骂你,挺温柔的。组里还有一个产品转算法的姐姐,她的mt更是手把手得在她电脑上给她debug。部门领导,也就是+2,对实习生也比较客气。请假也很自由,我几乎每周都要请假一天或半天,从来没有不批过。
但对于正式员工,体验似乎就不太一样了,在我来的几个月里,部门加班是常态,而且动辄十点、十一点。我的mt还带了一个想转正的实习生,似乎对她就没有那么客气了。感觉在这里工作不是一个很好的选择。
4. 实习感受
以下本人要开始发表一些个人看法了,可能会有一些暴论。
好评:
- 熟悉企业工程环境:指的就是docker、服务器啥的,这肯定没得黑,非常宝贵的经验。我曾经安慰自己,别的都没学,光是这一点这段实习就值了。
- 简历背书:虽然我骂了无数次智谱,但不可否认的是智谱在大模型里肯定是有分量的,背书不亚于大厂。
- 基本的大模型知识:虽然是应用岗,但还是能接触到不少关于大模型的原理、部署方面的知识,比较有用。
- 看了很多文献:显著的锻炼了我的英文阅读能力,也涉猎了不少方向。
- 伙食还行,零食、冰棍挺多,但我爱吃的不多。
差评:
- 大模型算法岗自身的局限性:来之前杨哥跟我说大模型算法岗是最水的算法岗,当时我不懂什么意思,现在我觉得这可能是最水的技术岗,都不局限于算法岗。因为我们部门的一个真实案例就是一个实习生面试的时候是产品岗,结果因为算法岗缺人结果调到了算法岗,也开始sft模型了,可见是真的没啥技术含量。
- 部门的调研工作全部由实习生承担,但缺乏指导,基本就是无头苍蝇,能不能有结果很大概率看命。
- 薪资微薄:出去跟同学说都惊讶怎么这么少。
- 学术与业务之间的差距是一道鸿沟
虽然我在工作过程中骂了n次智谱,骂了n+1次glm,但总的来说我还是很感激这段经历的。不过个人认为,这段经历仅仅作为一个垫脚石比较合适,干个三四个月就差不多可以跑路了。这段经历也让我对行业产生了一些新的认识,我觉得如果单纯的做这种模型的增训和sft工作真的没有什么技术壁垒,可能甚至还不如前后端。所以下一段实习可能会尝试一些别的方向,比如搜广推、agent、或者llm推理这种。不过那也是在新加坡的事了,期待下一段实习!
5. 致谢
首先还是得感谢杨哥,没有杨哥就没有这段实习,杨宝我们爱你❤️
其次感谢一下我的mt和我的实习生搭子姐,mt之前夸过了,搭子姐在工位上天天和我聊天,让我枯燥的实习生活,增添了一些乐趣,并且lastday还送了我霸王茶姬,祝她能找到心仪的工作!
最后感谢一下我们可爱的杀器群,在我实习期间经常指点ai行业的发展,让我学习到了很多。三流科研看arxiv,二流科研看三大会,一流科研看群友!
还记得在我刚开始实习,我在智谱的楼梯间里给楷哥打电话求助。希望大伙将来都有好的发展然后带带我。
- 标题: 第一段实习!智谱AI-大模型算法岗
- 作者: jkm
- 创建于 : 2025-04-13 23:54:54
- 更新于 : 2025-04-15 16:13:49
- 链接: https://goldenkm.github.io/2025/04/13/ZhipuAI-Intern/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。