Cointime

扫码下载App
iOS & Android

人工智能时代,谁将引领应用创新?AI工程师的崛起如何改变游戏规则?

作者: SWYX. 编译:Cointime.com QDD

我们正在目睹应用人工智能的一次“右移”现象,这得益于基础模型的新兴能力和开源/API的可用性。

在2013年,完成一系列人工智能任务通常需要5年时间和一个研究团队,而在2023年,只需要API文档和一个闲暇的下午就可以完成。

正如我们在Spaces聊天中讨论的那样,API界线是渗透性的 - AI工程师可以向左调整/托管模型,研究工程师也可以向右构建API。但是,他们的相对优势和“归属基地”是明确的。

然而,魔鬼在细节中 - 成功评估、应用和产品化人工智能存在无数挑战:

  • 模型:从评估最大的GPT-4和Claude模型,到最小的开源Huggingface、LLaMA和其他模型。
  • 工具:从最受欢迎的链式、检索和向量搜索工具,如LangChain、LlamaIndex和Pinecone,到新兴的自主代理领域,如Auto-GPT和BabyAGI(Lilian Weng在这里提供了一个必读的回顾)。
  • 新闻:除此之外,每天发布的论文、模型和技术的数量随着兴趣和资金的增加呈指数级增长,以至于跟上这一切几乎成了一项全职工作。

我对此持认真和字面的态度。我认为这是一项全职工作。我认为软件工程将催生一个新的子学科,专门研究人工智能的应用,并有效地使用新兴的技术堆栈,就像“可靠型站点工程师”、“DevOps工程师”、“数据工程师”和“分析工程师”一样。

这一角色新兴的(并且最不尴尬的)版本似乎是:AI工程师。

我所知道的每个初创公司都有一个名为#discuss-ai的Slack频道。这些频道将从非正式的小组变成正式的团队,就像AmplitudeReplitNotion一样。成千上万的软件工程师正在为公司的API和开源模型进行生产工作,无论是在公司的工作时间还是在晚上和周末,在公司的Slack或独立的Discord中,他们将专业化并汇聚到一个称号下 - AI工程师。这很可能是本十年最需求量最大的工程职位。

AI工程师无处不在,从微软和谷歌这样的大公司,到领先的初创公司,如Figma(通过收购Diagram)、Vercel(例如Hassan El Mghari的RoomGPT)和Notion(例如Ivan Zhao和Simon Last的Notion AI),再到像Simon WillisonPieter LevelsPhoto/InteriorAI)和Riley Goodside(现在在Scale AI工作)这样的独立黑客。他们在Anthropic公司以prompt engineering的方式赚取30万美元/年,在OpenAI建立软件赚取90万美元。他们在AGI House上度过空闲的周末,分享/r/LocalLLaMA上的技巧。他们所有人的共同之处是将人工智能的进步塑造成数以百万计的真实产品,几乎是一夜之间。

一个博士学位都看不到。在推出人工智能产品时,你需要工程师,而不是研究人员。

AI与ML工程师的翻转

我提醒大家注意这一趋势,而不是开启它。Indeed上有10倍于AI工程师职位ML工程师职位,但“AI”增长率更高,因此我预测这个比例将在5年内颠倒。

每月工作趋势(根据HN招聘数据)

所有职位头衔都有缺陷,但有些是有用的。我们对于AI和ML之间的区别进行无休止的语义争论感到警惕和疲倦,我们也很清楚,普通的“软件工程师”角色完全能够构建人工智能软件。然而,最近有一个关于如何进入AI工程领域的问答贴子,说明了市场上仍然存在的基本观念:

2023年6月截图:“如何进入AI工程”的最受赞同的答案

大多数人仍然认为AI工程是机器学习或数据工程的一种形式,因此他们推荐的先决条件是相同的。但我向你保证,我提到的那些高效的AI工程师中没有一个人完成过等同于Andrew Ng的Coursera课程的工作,他们也不懂PyTorch,也不知道数据湖(Data Lake)和数据仓库(Data Warehouse)之间的区别。

在不久的将来,没有人会推荐通过阅读《Attention is All You Need》来开始学习AI工程,就像你不会通过阅读福特T型车的图纸来开始学开车一样。当然,理解基本原理和历史总是有帮助的,并且可以帮助您找到尚未为人所知的想法和效率/能力增益。但有时你只需使用产品并通过实际体验来了解它们的特性。

我不指望这种课程的“翻转”会一夜之间发生。人类天性就是想要填写简历,填写市场地图,并通过引用更权威的深层次话题来突出自己。换句话说,Prompt Engineering和AI Engineering在相当长的一段时间内都会比拥有良好数据科学/机器学习背景的人感到逊色。然而,我认为需求和供应的经济学规律将占上风。

为什么现在出现了AI工程师

  • 基础模型是“少样本学习器”,具有上下文学习甚至零样本迁移的能力,可以推广到模型训练者最初意图之外的领域。换句话说,创建模型的人并不完全了解它们的能力。那些不是LLM研究人员的人可以通过更多地与模型交互,并将其应用于研究未充分重视的领域(例如Jasper的文案写作),从而发现并利用这些能力。
  • 微软、谷歌、Meta和大型基础模型实验室占据了稀缺的研究人才,实际上提供了“AI研究即服务”的API。你不能雇佣他们,但如果你有软件工程师知道如何与他们合作,你可以租用他们。世界上大约有5000名LLM研究人员,但有约5000万名软件工程师。供应约束决定了将会涌现出一类介于两者之间的AI工程师,以满足需求。
  • GPU囤积。当然,OpenAI/微软是第一家,但Stability AI通过强调他们的4000个GPU集群掀起了初创公司GPU竞赛的热潮。
还记得2022年10月吗?

自那时以来,新的初创公司(如Inflection,13亿美元;Mistral,1.13亿美元;Reka,5800万美元;Poolside,2600万美元;Contextual,2000万美元)已经成为拥有自己硬件的巨大种子轮融资的常见现象。甚至丹·格罗斯(Dan Gross)和纳特·弗里德曼(Nat Friedman)宣布了他们的1000万美元、10亿亿次浮点运算GPU集群Andromeda,专门为他们投资的初创公司。全球芯片短缺反过来又创造了更多的短缺。在API线的另一边,AI工程师将有更多的容量来使用模型,而不是训练模型。

  • 先火再瞄准。不再要求数据科学家/机器学习工程师在训练一个特定领域的模型之前进行费力的数据收集工作,然后将其投入生产。现在,产品经理/软件工程师可以提示LLM,构建/验证产品想法,然后获取特定数据进行优化。

假设后者的数量比前者多100到1000倍,而提示LLM原型的“先火再瞄准”工作流使您能够比传统机器学习更快地进行10到100倍的工作。因此,AI工程师能够以更便宜的方式验证AI产品。这就是瀑布与敏捷的区别。AI是敏捷的。

  • 从Python到JavaScript。数据/人工智能传统上非常依赖Python,最初的AI工程工具,如LangChain、LlamaIndex和Guardrails,也出自同一个社区。然而,JavaScript开发者与Python开发者的数量至少相当,因此现在的工具越来越多地面向这个广泛扩展的受众,从LangChain.js和Transformers.js到Vercel的新AI SDK。市场的扩大和机会是巨大的。
  • 生成式AI vs分类器机器学习。术语“生成式AI”已经不再流行,为其他类比诸如“推理引擎”让路,但它仍然有助于简明地阐明现有的MLOps工具和ML从业者与新兴的、截然不同的人物类型之间的差异。新一代机器学习可能更加关注欺诈风险、推荐系统、异常检测和特征存储,而AI工程师正在构建写作应用程序、个性化学习工具、自然语言电子表格和类似Factorio的可视化编程语言。

每当一个子群体出现,他们具有完全不同的背景、说着不同的语言,生产出完全不同的产品,并使用完全不同的工具集,他们最终会分裂成为自己的群体。

1+2=3:从Software 2.0到Software 3.0的演进中代码的作用

6年前,Andrej Karpathy撰写了一篇非常有影响力的文章,描述了Software 2.0,对比了精确建模逻辑的“经典堆栈”手写编程语言与近似逻辑的“机器学习”神经网络堆栈,使软件能够解决比人类模拟更多的问题。今年,他在接下来的文章中指出,最热门的新编程语言是英语,最终填补了他在原始文章中未标注的灰色区域。

更新:Karpathy的回应——意见不合

去年,Prompt Engineering是关于工作将如何改变的流行观点,因为人们开始使用GPT-3和稳定扩散进行工作。人们嘲笑AI初创公司为“OpenAI包装商”,并担心LLM应用程序容易受到提示注入和反向提示工程的影响。没有moat可言?

但是,2023年最重要的主题之一实际上是重新确立人类编写代码的作用,以编排和替代LLM的力量,从超过2亿美元的巨头Langchain,到受Nvidia支持的Voyager展示了代码生成和重用的重要性(最近我参加了与Harrison的Chain 和 Agents的在线研讨会)。Prompt Engineering既被过度炒作又被保留下来,但软件3.0应用中软件1.0范式的再次出现既是机遇和困惑的领域,也为一大批初创公司创造了白色空间。

如果你没有市场地图,那你真的算得上一名风险投资人吗?

当然,这不仅仅是人类编写的代码。我最近使用的smol-developer、更大范围的gpt-engineer以及其他代码生成代理,如Codium AI、Codegen.ai和Morph/Rift,将越来越成为AI工程师工具包的一部分。随着人类工程师学会利用人工智能,人工智能也将越来越多地进行工程工作,直到有一天,我们抬头望去,再也分不清楚区别了。

是时候汇聚在一起了 - AI工程师峰会

建造者们需要一个交流的地方。因此,在组织了几个小型聚会几个月后,我们现在宣布第一个独立举办的面向建造者的AI会议:AI工程师峰会

看看我们漂亮的域名 - ai.engineer!

如果您对本文中的一切感兴趣,我们计划召集所有顶级的AI工程师、创始人和投资者,共同了解最前沿的技术,参加/教授工作坊,并找到从在工作中使用的新工具到下一位新雇员/联合创始人/融资的一切。

这是我们过去一年在本通讯和播客中讨论的一切的终极会议,以及更多内容:

  • AI用户体验
  • AI开发工具
  • AI基础设施
  • AI代理
  • 新的LLM工具,包括Langchain、Vector DB等等
  • 开源模型(训练、微调、推理、评估)

我有相当多的社区管理经验,但从未组织过一个500人的会议,所以我与Reactathon的Ben Dunphy合作,举办旧金山(以及在线)最好的AI工程师会议(他最近举办的一场会议有20,000多人远程参与)。

我们是建造者

敏锐的观察者会注意到,我们逐渐将Latent Space播客和通讯调整以迎合AI工程师的角色。为我最兴奋的是为这个受众提供技术乐观主义和实用主义的结合。Marc Andreesen最近写道,绝大多数公众关于人工智能的讨论都是“歇斯底里的恐惧和偏执狂”。在谱系中的另一端,有很多不认真的加速主义者和令人无法忍受的foomer threadbois整天在推特上谈论遥远的乌托邦未来,但他们正在采取什么行动来实现它还不清楚。

AI工程师将驯服并驾驭Shoggoth。

让我们把它变成现实。

评论

所有评论

推荐阅读

  • 香港比特币ETF昨日总赎回量519.5枚,连续3日呈现净赎回

    根据 SoSo Value 数据,香港比特币现货 ETF 昨日(5 月 13 日)单日净赎回比特币 519.5 枚,比特币持有总量为 3560 枚,单日成交额为 425 万美元,总净资产为 2.19 亿美元。目前香港比特币现货 ETF 连续 3 日呈现净赎回。资产规模方面,华夏 ETF 持有 1690 枚 BTC 排名第一,博时 Hashkey 以及嘉实分别持有 989.93 枚以及 881.18 枚 BTC。另外,香港以太坊现货 ETF 昨日(5 月 13 日)单日净赎回以太坊 2270 枚,以太坊持有总量为 13350 枚,单日总成交额为 72.6 万美元,总净资产约为 3912 万美元。资产规模方面,目前博时 Hashkey ETF 持有 6300 枚 ETH 排名第一,华夏以及嘉实分别持有 4670 枚以及 2390 枚 ETH。注:香港加密 ETF 支持现货申赎机制,净申购是指一定时间段内申购金额和赎回金额之差为正,即买入比卖出多,反之则为净赎回。

  • 荷兰法官将于5月14日就Tornado Cash开发者Alexey Pertsev案作出裁决

    5月14日消息,荷兰法官将于今日就 Tornado Cash 开发者 Alexey Pertsev 的案件做出裁决。31 岁的 Pertsev 被控参与通过加密货币混币器 Tornado Cash 洗钱 12 亿美元。如果 Pertsev 被判有罪,专家预计这将对全球开源社区产生「寒蝉效应」。开发人员可能会担心代码被滥用而不敢编写,投资也可能会减少。如果 Pertsev 被宣判无罪,那么法官将接受他的解释,即 Tornado Cash 核心技术——智能合约——是独立于人为干预而合法运行的。更重要的是,此类平台的管理者不对使用该技术的人负责。此案的裁决结果将改变加密隐私的发展方向。

  • 全同态加密芯片提供商Niobium完成550万美元种子轮融资,Fusion Fund领投

    专注于零信任计算的定制加密芯片提供商Niobium宣布完成550万美元种子轮融资,Fusion Fund领投,Morgan Creek Capital、Rev1 Ventures、Ohio Innovation Fund和Hale Capital参投。据悉Niobium正在构建全同态加密 (FHE) 加速器芯片并将其商业化,新资金将用于其探索FHE在医疗保健、金融、区块链等行业的商业应用,同时还计划在今年第四季度展示该解决方案并启动试点项目。

  • RunPod完成2000万美元种子轮融资,英特尔资本等领投

    分布式GPU云计算AI训练模型项目RunPod宣布完成2000万美元种子轮融资,英特尔资本和戴尔旗下Dell Technologies Capital联合领投,Julien Chaummond、Nat Friedman和Adam Lewis等参投。RunPod利用全球分布式 GPU 云计算服务来训练、部署和扩展 AI 模型,从而减轻开发人员的工作量,根据其官网信息显示,RunPad接受加密货币付款,但提醒用户强烈建议作为风险管理过程,需要设置一个crypto.com帐户并提前进行可能需要的任何KYC检查。

  • 5月14日早间要闻速递

    1.拜登禁止中国投资人支持的加密矿企在美国导弹基地附近拥有土地

  • 全网 BTC 期权未平仓头寸为 184.6 亿美元,ETH 期权未平仓头寸为 90.8 亿美元

    据 Coinglass 数据显示,目前全网 BTC 期权未平仓头寸的名义价值为 184.6 亿美元,ETH 期权未平仓头寸的名义价值为 90.8 亿美元。

  • CFTC与Falcon Labs就注册违规问题达成和解

    美国商品期货交易委员会(CFTC)与加密主要经纪公司Falcon Labs, Ltd.达成和解,解决了Falcon Labs应该注册但未注册的问题。这是CFTC首次针对未注册期货佣金商进行的行动,Falcon Labs被指责不当地促进客户在数字资产交易所的交易。Falcon Labs未承认也未否认CFTC的发现,被罚款超过170万美元。此前,CFTC曾指控Binance及其前CEO,Falcon Labs随后改变了其收集客户信息的方式,并更新了其了解客户政策。CFTC表示,希望通过对Falcon Labs的合作和整改,鼓励其他非法数字资产中介机构向其报告活动。

  • 巴西4个月交易量达到60亿美元

    Kaiko Research表示,比特币 (BTC) 与股票的相关性正在上升,90 天相关性在 3 月份触及 0.01 的多年低点后,上周升至 0.17。根据该公司5 月 13 日的研究报告,比特币与股票的 90 天相关性在 5 月 5 日当周升至 0.17,高于 3 月份的多年低点 0.01。BTC 与风险资产的相关性低于牛市期间的 0.6 高位。 该研究报告还强调了巴西加密货币市场的高交易量。巴西的交易量大幅增加,并超过了美元。2024 年 1月至 5 月初,巴西雷亚尔 (BRL) 交易量达到 60 亿美元,使其成为拉丁美洲最大的加密货币市场和全球第七大法定货币市场。 Kaiko还报告了其他数据。该公司指出,自 3 月份以来,ETH 看跌期权和看涨期权的价格出现了分歧。 Kaiko 表示,随着美国 SEC 于 5 月 23 日拒绝或批准现货以太坊 ETF,这一趋势“可能是波动即将来临的迹象”。

  • 以太坊基金会宣布第五期Ethereum Protocol Fellowship计划正式开放申请

    5月14日消息,以太坊基金会宣布第五期 Ethereum Protocol Fellowship(EPF)计划正式开放申请,申请截止日期为5月26日。 EPF 是一个无需许可的项目,旨在为有抱负的协议贡献者提供一个为以太坊做出有意义贡献的通道。第五期项目为期五个月,从2024年6月持续到11月,期间将在布鲁塞尔的 EthCC 和东南亚的 Devcon 举行两次线下活动。 5月21日UTC时间16:00,EPF 团队将举行一次线上交流会,介绍项目详情并回答问题。有兴趣的开发者可以在 GitHub 仓库中查看完整的项目细则,并及时提交申请。