作者: SWYX. 编译:Cointime.com QDD
我们正在目睹应用人工智能的一次“右移”现象,这得益于基础模型的新兴能力和开源/API的可用性。
在2013年,完成一系列人工智能任务通常需要5年时间和一个研究团队,而在2023年,只需要API文档和一个闲暇的下午就可以完成。
正如我们在Spaces聊天中讨论的那样,API界线是渗透性的 - AI工程师可以向左调整/托管模型,研究工程师也可以向右构建API。但是,他们的相对优势和“归属基地”是明确的。
然而,魔鬼在细节中 - 成功评估、应用和产品化人工智能存在无数挑战:
- 模型:从评估最大的GPT-4和Claude模型,到最小的开源Huggingface、LLaMA和其他模型。
- 工具:从最受欢迎的链式、检索和向量搜索工具,如LangChain、LlamaIndex和Pinecone,到新兴的自主代理领域,如Auto-GPT和BabyAGI(Lilian Weng在这里提供了一个必读的回顾)。
- 新闻:除此之外,每天发布的论文、模型和技术的数量随着兴趣和资金的增加呈指数级增长,以至于跟上这一切几乎成了一项全职工作。
我对此持认真和字面的态度。我认为这是一项全职工作。我认为软件工程将催生一个新的子学科,专门研究人工智能的应用,并有效地使用新兴的技术堆栈,就像“可靠型站点工程师”、“DevOps工程师”、“数据工程师”和“分析工程师”一样。
这一角色新兴的(并且最不尴尬的)版本似乎是:AI工程师。
我所知道的每个初创公司都有一个名为#discuss-ai的Slack频道。这些频道将从非正式的小组变成正式的团队,就像Amplitude、Replit和Notion一样。成千上万的软件工程师正在为公司的API和开源模型进行生产工作,无论是在公司的工作时间还是在晚上和周末,在公司的Slack或独立的Discord中,他们将专业化并汇聚到一个称号下 - AI工程师。这很可能是本十年最需求量最大的工程职位。
AI工程师无处不在,从微软和谷歌这样的大公司,到领先的初创公司,如Figma(通过收购Diagram)、Vercel(例如Hassan El Mghari的RoomGPT)和Notion(例如Ivan Zhao和Simon Last的Notion AI),再到像Simon Willison、Pieter Levels(Photo/InteriorAI)和Riley Goodside(现在在Scale AI工作)这样的独立黑客。他们在Anthropic公司以prompt engineering的方式赚取30万美元/年,在OpenAI建立软件赚取90万美元。他们在AGI House上度过空闲的周末,分享/r/LocalLLaMA上的技巧。他们所有人的共同之处是将人工智能的进步塑造成数以百万计的真实产品,几乎是一夜之间。
一个博士学位都看不到。在推出人工智能产品时,你需要工程师,而不是研究人员。
AI与ML工程师的翻转
我提醒大家注意这一趋势,而不是开启它。Indeed上有10倍于AI工程师职位的ML工程师职位,但“AI”增长率更高,因此我预测这个比例将在5年内颠倒。
所有职位头衔都有缺陷,但有些是有用的。我们对于AI和ML之间的区别进行无休止的语义争论感到警惕和疲倦,我们也很清楚,普通的“软件工程师”角色完全能够构建人工智能软件。然而,最近有一个关于如何进入AI工程领域的问答贴子,说明了市场上仍然存在的基本观念:
大多数人仍然认为AI工程是机器学习或数据工程的一种形式,因此他们推荐的先决条件是相同的。但我向你保证,我提到的那些高效的AI工程师中没有一个人完成过等同于Andrew Ng的Coursera课程的工作,他们也不懂PyTorch,也不知道数据湖(Data Lake)和数据仓库(Data Warehouse)之间的区别。
在不久的将来,没有人会推荐通过阅读《Attention is All You Need》来开始学习AI工程,就像你不会通过阅读福特T型车的图纸来开始学开车一样。当然,理解基本原理和历史总是有帮助的,并且可以帮助您找到尚未为人所知的想法和效率/能力增益。但有时你只需使用产品并通过实际体验来了解它们的特性。
我不指望这种课程的“翻转”会一夜之间发生。人类天性就是想要填写简历,填写市场地图,并通过引用更权威的深层次话题来突出自己。换句话说,Prompt Engineering和AI Engineering在相当长的一段时间内都会比拥有良好数据科学/机器学习背景的人感到逊色。然而,我认为需求和供应的经济学规律将占上风。
为什么现在出现了AI工程师
- 基础模型是“少样本学习器”,具有上下文学习甚至零样本迁移的能力,可以推广到模型训练者最初意图之外的领域。换句话说,创建模型的人并不完全了解它们的能力。那些不是LLM研究人员的人可以通过更多地与模型交互,并将其应用于研究未充分重视的领域(例如Jasper的文案写作),从而发现并利用这些能力。
- 微软、谷歌、Meta和大型基础模型实验室占据了稀缺的研究人才,实际上提供了“AI研究即服务”的API。你不能雇佣他们,但如果你有软件工程师知道如何与他们合作,你可以租用他们。世界上大约有5000名LLM研究人员,但有约5000万名软件工程师。供应约束决定了将会涌现出一类介于两者之间的AI工程师,以满足需求。
- GPU囤积。当然,OpenAI/微软是第一家,但Stability AI通过强调他们的4000个GPU集群掀起了初创公司GPU竞赛的热潮。
自那时以来,新的初创公司(如Inflection,13亿美元;Mistral,1.13亿美元;Reka,5800万美元;Poolside,2600万美元;Contextual,2000万美元)已经成为拥有自己硬件的巨大种子轮融资的常见现象。甚至丹·格罗斯(Dan Gross)和纳特·弗里德曼(Nat Friedman)宣布了他们的1000万美元、10亿亿次浮点运算GPU集群Andromeda,专门为他们投资的初创公司。全球芯片短缺反过来又创造了更多的短缺。在API线的另一边,AI工程师将有更多的容量来使用模型,而不是训练模型。
- 先火再瞄准。不再要求数据科学家/机器学习工程师在训练一个特定领域的模型之前进行费力的数据收集工作,然后将其投入生产。现在,产品经理/软件工程师可以提示LLM,构建/验证产品想法,然后获取特定数据进行优化。
假设后者的数量比前者多100到1000倍,而提示LLM原型的“先火再瞄准”工作流使您能够比传统机器学习更快地进行10到100倍的工作。因此,AI工程师能够以更便宜的方式验证AI产品。这就是瀑布与敏捷的区别。AI是敏捷的。
- 从Python到JavaScript。数据/人工智能传统上非常依赖Python,最初的AI工程工具,如LangChain、LlamaIndex和Guardrails,也出自同一个社区。然而,JavaScript开发者与Python开发者的数量至少相当,因此现在的工具越来越多地面向这个广泛扩展的受众,从LangChain.js和Transformers.js到Vercel的新AI SDK。市场的扩大和机会是巨大的。
- 生成式AI vs分类器机器学习。术语“生成式AI”已经不再流行,为其他类比诸如“推理引擎”让路,但它仍然有助于简明地阐明现有的MLOps工具和ML从业者与新兴的、截然不同的人物类型之间的差异。新一代机器学习可能更加关注欺诈风险、推荐系统、异常检测和特征存储,而AI工程师正在构建写作应用程序、个性化学习工具、自然语言电子表格和类似Factorio的可视化编程语言。
每当一个子群体出现,他们具有完全不同的背景、说着不同的语言,生产出完全不同的产品,并使用完全不同的工具集,他们最终会分裂成为自己的群体。
1+2=3:从Software 2.0到Software 3.0的演进中代码的作用
6年前,Andrej Karpathy撰写了一篇非常有影响力的文章,描述了Software 2.0,对比了精确建模逻辑的“经典堆栈”手写编程语言与近似逻辑的“机器学习”神经网络堆栈,使软件能够解决比人类模拟更多的问题。今年,他在接下来的文章中指出,最热门的新编程语言是英语,最终填补了他在原始文章中未标注的灰色区域。
去年,Prompt Engineering是关于工作将如何改变的流行观点,因为人们开始使用GPT-3和稳定扩散进行工作。人们嘲笑AI初创公司为“OpenAI包装商”,并担心LLM应用程序容易受到提示注入和反向提示工程的影响。没有moat可言?
但是,2023年最重要的主题之一实际上是重新确立人类编写代码的作用,以编排和替代LLM的力量,从超过2亿美元的巨头Langchain,到受Nvidia支持的Voyager展示了代码生成和重用的重要性(最近我参加了与Harrison的Chain 和 Agents的在线研讨会)。Prompt Engineering既被过度炒作又被保留下来,但软件3.0应用中软件1.0范式的再次出现既是机遇和困惑的领域,也为一大批初创公司创造了白色空间。
当然,这不仅仅是人类编写的代码。我最近使用的smol-developer、更大范围的gpt-engineer以及其他代码生成代理,如Codium AI、Codegen.ai和Morph/Rift,将越来越成为AI工程师工具包的一部分。随着人类工程师学会利用人工智能,人工智能也将越来越多地进行工程工作,直到有一天,我们抬头望去,再也分不清楚区别了。
是时候汇聚在一起了 - AI工程师峰会
建造者们需要一个交流的地方。因此,在组织了几个小型聚会几个月后,我们现在宣布第一个独立举办的面向建造者的AI会议:AI工程师峰会!
如果您对本文中的一切感兴趣,我们计划召集所有顶级的AI工程师、创始人和投资者,共同了解最前沿的技术,参加/教授工作坊,并找到从在工作中使用的新工具到下一位新雇员/联合创始人/融资的一切。
这是我们过去一年在本通讯和播客中讨论的一切的终极会议,以及更多内容:
- AI用户体验
- AI开发工具
- AI基础设施
- AI代理
- 新的LLM工具,包括Langchain、Vector DB等等
- 开源模型(训练、微调、推理、评估)
我有相当多的社区管理经验,但从未组织过一个500人的会议,所以我与Reactathon的Ben Dunphy合作,举办旧金山(以及在线)最好的AI工程师会议(他最近举办的一场会议有20,000多人远程参与)。
我们是建造者
敏锐的观察者会注意到,我们逐渐将Latent Space播客和通讯调整以迎合AI工程师的角色。为我最兴奋的是为这个受众提供技术乐观主义和实用主义的结合。Marc Andreesen最近写道,绝大多数公众关于人工智能的讨论都是“歇斯底里的恐惧和偏执狂”。在谱系中的另一端,有很多不认真的加速主义者和令人无法忍受的foomer threadbois整天在推特上谈论遥远的乌托邦未来,但他们正在采取什么行动来实现它还不清楚。
AI工程师将驯服并驾驭Shoggoth。
让我们把它变成现实。
所有评论