Cointime

扫码下载App
iOS & Android

人工智能时代,谁将引领应用创新?AI工程师的崛起如何改变游戏规则?

作者: SWYX. 编译:Cointime.com QDD

我们正在目睹应用人工智能的一次“右移”现象,这得益于基础模型的新兴能力和开源/API的可用性。

在2013年,完成一系列人工智能任务通常需要5年时间和一个研究团队,而在2023年,只需要API文档和一个闲暇的下午就可以完成。

正如我们在Spaces聊天中讨论的那样,API界线是渗透性的 - AI工程师可以向左调整/托管模型,研究工程师也可以向右构建API。但是,他们的相对优势和“归属基地”是明确的。

然而,魔鬼在细节中 - 成功评估、应用和产品化人工智能存在无数挑战:

  • 模型:从评估最大的GPT-4和Claude模型,到最小的开源Huggingface、LLaMA和其他模型。
  • 工具:从最受欢迎的链式、检索和向量搜索工具,如LangChain、LlamaIndex和Pinecone,到新兴的自主代理领域,如Auto-GPT和BabyAGI(Lilian Weng在这里提供了一个必读的回顾)。
  • 新闻:除此之外,每天发布的论文、模型和技术的数量随着兴趣和资金的增加呈指数级增长,以至于跟上这一切几乎成了一项全职工作。

我对此持认真和字面的态度。我认为这是一项全职工作。我认为软件工程将催生一个新的子学科,专门研究人工智能的应用,并有效地使用新兴的技术堆栈,就像“可靠型站点工程师”、“DevOps工程师”、“数据工程师”和“分析工程师”一样。

这一角色新兴的(并且最不尴尬的)版本似乎是:AI工程师。

我所知道的每个初创公司都有一个名为#discuss-ai的Slack频道。这些频道将从非正式的小组变成正式的团队,就像AmplitudeReplitNotion一样。成千上万的软件工程师正在为公司的API和开源模型进行生产工作,无论是在公司的工作时间还是在晚上和周末,在公司的Slack或独立的Discord中,他们将专业化并汇聚到一个称号下 - AI工程师。这很可能是本十年最需求量最大的工程职位。

AI工程师无处不在,从微软和谷歌这样的大公司,到领先的初创公司,如Figma(通过收购Diagram)、Vercel(例如Hassan El Mghari的RoomGPT)和Notion(例如Ivan Zhao和Simon Last的Notion AI),再到像Simon WillisonPieter LevelsPhoto/InteriorAI)和Riley Goodside(现在在Scale AI工作)这样的独立黑客。他们在Anthropic公司以prompt engineering的方式赚取30万美元/年,在OpenAI建立软件赚取90万美元。他们在AGI House上度过空闲的周末,分享/r/LocalLLaMA上的技巧。他们所有人的共同之处是将人工智能的进步塑造成数以百万计的真实产品,几乎是一夜之间。

一个博士学位都看不到。在推出人工智能产品时,你需要工程师,而不是研究人员。

AI与ML工程师的翻转

我提醒大家注意这一趋势,而不是开启它。Indeed上有10倍于AI工程师职位ML工程师职位,但“AI”增长率更高,因此我预测这个比例将在5年内颠倒。

每月工作趋势(根据HN招聘数据)

所有职位头衔都有缺陷,但有些是有用的。我们对于AI和ML之间的区别进行无休止的语义争论感到警惕和疲倦,我们也很清楚,普通的“软件工程师”角色完全能够构建人工智能软件。然而,最近有一个关于如何进入AI工程领域的问答贴子,说明了市场上仍然存在的基本观念:

2023年6月截图:“如何进入AI工程”的最受赞同的答案

大多数人仍然认为AI工程是机器学习或数据工程的一种形式,因此他们推荐的先决条件是相同的。但我向你保证,我提到的那些高效的AI工程师中没有一个人完成过等同于Andrew Ng的Coursera课程的工作,他们也不懂PyTorch,也不知道数据湖(Data Lake)和数据仓库(Data Warehouse)之间的区别。

在不久的将来,没有人会推荐通过阅读《Attention is All You Need》来开始学习AI工程,就像你不会通过阅读福特T型车的图纸来开始学开车一样。当然,理解基本原理和历史总是有帮助的,并且可以帮助您找到尚未为人所知的想法和效率/能力增益。但有时你只需使用产品并通过实际体验来了解它们的特性。

我不指望这种课程的“翻转”会一夜之间发生。人类天性就是想要填写简历,填写市场地图,并通过引用更权威的深层次话题来突出自己。换句话说,Prompt Engineering和AI Engineering在相当长的一段时间内都会比拥有良好数据科学/机器学习背景的人感到逊色。然而,我认为需求和供应的经济学规律将占上风。

为什么现在出现了AI工程师

  • 基础模型是“少样本学习器”,具有上下文学习甚至零样本迁移的能力,可以推广到模型训练者最初意图之外的领域。换句话说,创建模型的人并不完全了解它们的能力。那些不是LLM研究人员的人可以通过更多地与模型交互,并将其应用于研究未充分重视的领域(例如Jasper的文案写作),从而发现并利用这些能力。
  • 微软、谷歌、Meta和大型基础模型实验室占据了稀缺的研究人才,实际上提供了“AI研究即服务”的API。你不能雇佣他们,但如果你有软件工程师知道如何与他们合作,你可以租用他们。世界上大约有5000名LLM研究人员,但有约5000万名软件工程师。供应约束决定了将会涌现出一类介于两者之间的AI工程师,以满足需求。
  • GPU囤积。当然,OpenAI/微软是第一家,但Stability AI通过强调他们的4000个GPU集群掀起了初创公司GPU竞赛的热潮。
还记得2022年10月吗?

自那时以来,新的初创公司(如Inflection,13亿美元;Mistral,1.13亿美元;Reka,5800万美元;Poolside,2600万美元;Contextual,2000万美元)已经成为拥有自己硬件的巨大种子轮融资的常见现象。甚至丹·格罗斯(Dan Gross)和纳特·弗里德曼(Nat Friedman)宣布了他们的1000万美元、10亿亿次浮点运算GPU集群Andromeda,专门为他们投资的初创公司。全球芯片短缺反过来又创造了更多的短缺。在API线的另一边,AI工程师将有更多的容量来使用模型,而不是训练模型。

  • 先火再瞄准。不再要求数据科学家/机器学习工程师在训练一个特定领域的模型之前进行费力的数据收集工作,然后将其投入生产。现在,产品经理/软件工程师可以提示LLM,构建/验证产品想法,然后获取特定数据进行优化。

假设后者的数量比前者多100到1000倍,而提示LLM原型的“先火再瞄准”工作流使您能够比传统机器学习更快地进行10到100倍的工作。因此,AI工程师能够以更便宜的方式验证AI产品。这就是瀑布与敏捷的区别。AI是敏捷的。

  • 从Python到JavaScript。数据/人工智能传统上非常依赖Python,最初的AI工程工具,如LangChain、LlamaIndex和Guardrails,也出自同一个社区。然而,JavaScript开发者与Python开发者的数量至少相当,因此现在的工具越来越多地面向这个广泛扩展的受众,从LangChain.js和Transformers.js到Vercel的新AI SDK。市场的扩大和机会是巨大的。
  • 生成式AI vs分类器机器学习。术语“生成式AI”已经不再流行,为其他类比诸如“推理引擎”让路,但它仍然有助于简明地阐明现有的MLOps工具和ML从业者与新兴的、截然不同的人物类型之间的差异。新一代机器学习可能更加关注欺诈风险、推荐系统、异常检测和特征存储,而AI工程师正在构建写作应用程序、个性化学习工具、自然语言电子表格和类似Factorio的可视化编程语言。

每当一个子群体出现,他们具有完全不同的背景、说着不同的语言,生产出完全不同的产品,并使用完全不同的工具集,他们最终会分裂成为自己的群体。

1+2=3:从Software 2.0到Software 3.0的演进中代码的作用

6年前,Andrej Karpathy撰写了一篇非常有影响力的文章,描述了Software 2.0,对比了精确建模逻辑的“经典堆栈”手写编程语言与近似逻辑的“机器学习”神经网络堆栈,使软件能够解决比人类模拟更多的问题。今年,他在接下来的文章中指出,最热门的新编程语言是英语,最终填补了他在原始文章中未标注的灰色区域。

更新:Karpathy的回应——意见不合

去年,Prompt Engineering是关于工作将如何改变的流行观点,因为人们开始使用GPT-3和稳定扩散进行工作。人们嘲笑AI初创公司为“OpenAI包装商”,并担心LLM应用程序容易受到提示注入和反向提示工程的影响。没有moat可言?

但是,2023年最重要的主题之一实际上是重新确立人类编写代码的作用,以编排和替代LLM的力量,从超过2亿美元的巨头Langchain,到受Nvidia支持的Voyager展示了代码生成和重用的重要性(最近我参加了与Harrison的Chain 和 Agents的在线研讨会)。Prompt Engineering既被过度炒作又被保留下来,但软件3.0应用中软件1.0范式的再次出现既是机遇和困惑的领域,也为一大批初创公司创造了白色空间。

如果你没有市场地图,那你真的算得上一名风险投资人吗?

当然,这不仅仅是人类编写的代码。我最近使用的smol-developer、更大范围的gpt-engineer以及其他代码生成代理,如Codium AI、Codegen.ai和Morph/Rift,将越来越成为AI工程师工具包的一部分。随着人类工程师学会利用人工智能,人工智能也将越来越多地进行工程工作,直到有一天,我们抬头望去,再也分不清楚区别了。

是时候汇聚在一起了 - AI工程师峰会

建造者们需要一个交流的地方。因此,在组织了几个小型聚会几个月后,我们现在宣布第一个独立举办的面向建造者的AI会议:AI工程师峰会

看看我们漂亮的域名 - ai.engineer!

如果您对本文中的一切感兴趣,我们计划召集所有顶级的AI工程师、创始人和投资者,共同了解最前沿的技术,参加/教授工作坊,并找到从在工作中使用的新工具到下一位新雇员/联合创始人/融资的一切。

这是我们过去一年在本通讯和播客中讨论的一切的终极会议,以及更多内容:

  • AI用户体验
  • AI开发工具
  • AI基础设施
  • AI代理
  • 新的LLM工具,包括Langchain、Vector DB等等
  • 开源模型(训练、微调、推理、评估)

我有相当多的社区管理经验,但从未组织过一个500人的会议,所以我与Reactathon的Ben Dunphy合作,举办旧金山(以及在线)最好的AI工程师会议(他最近举办的一场会议有20,000多人远程参与)。

我们是建造者

敏锐的观察者会注意到,我们逐渐将Latent Space播客和通讯调整以迎合AI工程师的角色。为我最兴奋的是为这个受众提供技术乐观主义和实用主义的结合。Marc Andreesen最近写道,绝大多数公众关于人工智能的讨论都是“歇斯底里的恐惧和偏执狂”。在谱系中的另一端,有很多不认真的加速主义者和令人无法忍受的foomer threadbois整天在推特上谈论遥远的乌托邦未来,但他们正在采取什么行动来实现它还不清楚。

AI工程师将驯服并驾驭Shoggoth。

让我们把它变成现实。

评论

所有评论

推荐阅读

  • Tether投资2亿美元收购医疗设备公司Blackrock Neurotech的多数股权

    稳定币USDT的发行方Tether周一表示,通过其风险投资部门Tether Evo,投资2亿美元收购了脑机接口公司Blackrock Neurotech的大部分股权。Blackrock Neurotech开发的医疗设备由脑信号驱动,旨在帮助受到瘫痪和神经系统疾病影响的人。该科技公司与资产管理巨头BlackRock无关。投资将用于推出和商业化医疗设备,并进行研究和开发。Tether是USDT的发行公司,是市值达1100亿美元的最大稳定币。最近,Tether成立了四个部门,以扩大稳定币发行之外的业务。

  • 欧盟至少有10个国家正在敲定或已经敲定地方立法,以促进将MiCA法规转换为当地法律

    针对稳定币发行商的《加密资产市场 (MiCA) 法规》专项规则将率先生效,随后将在12月针对整个加密货币行业的公司实施许可和其他要求。 MiCA法规于2023 年获得通过,此前欧盟各国政府花了三年时间制定监管框架。一旦生效,每个司法管辖区都必须将欧盟范围内的MiCA法规转换为当地法律,选择其监管机构中的哪一个来监管加密货币,并准备授权代币发行商和其他服务提供商。目前20个国家正处于不同的准备阶段,至少有10个国家正在敲定或已经敲定了地方立法

  • 纽约公司Turnkey获得1500万美元A轮融资,将用于扩大业务和开发工作。

    纽约市的加密开发人员钱包基础设施提供商Turnkey获得了1500万美元的A轮融资,由Lightspeed Faction和Galaxy Ventures领投,Sequoia、Coinbase Ventures、Alchemy、Figment Capital和Mirana Ventures参与。该公司打算利用这笔资金扩大业务和开发工作。Turnkey由Bryce Ferguson和Jack Kearney共同创立,提供钱包基础设施,为构建链上体验的团队提供低级原语。Turnkey的产品套件使开发人员能够构建任何涉及钱包或加密交易的东西,并已为Alchemy、Dynamic、Goldfinch、Halliday、Thunder Terminal和Kinto等行业中最好的开发人员工具和应用程序提供支持。

  • 加拿大总理提议对股票和加密货币征收资本利得税

    加拿大总理Justin Trudeau提出了一项新的资本利得税,该税率将从50%到67%不等。根据加拿大税务局网站,常见的资本财产包括别墅、证券(如股票、债券、加密货币和共同基金信托单位)、土地和建筑物。在加拿大纳税人购买或持有加密货币无需纳税,对来自加密货币销售、挖矿活动或其他加密货币相关交易的资本收益或商业收入征税,个人加密货币持有者需为其总资本收益的 50%纳税,而专业(日间)交易者则需为其利润的100%纳税。

  • 泰国监管机构将打击欺骗性加密货币广告

    据《曼谷邮报》报道,包含虚假、夸大、扭曲、隐瞒或误导性信息的加密货币广告违反了泰国法规。主要加密市场的监管机构也采取了类似措施,以尽量减少加密投资的损失。例如,英国金融行为监管局 (FCA)仅在 2023 年就发布了 450 条非法加密货币广告警报。此外,2023 年 11 月,西班牙主要证券市场监管机构国家股票市场委员会谴责了 X 上的欺诈性加密资产促销活动,并重申公司有遵守当地法律的义务。 泰国证券交易委员会提醒加密货币交易所纳入有关投资风险的适当警告,并避免通过特别促销来吸引新用户。他警告说,违反上述指导方针将招致“依法惩处”。

  • 俄罗斯将实施加密货币限制,豁免矿工和央行项目

    俄罗斯将实施加密货币限制,豁免矿工和央行项目。自9月1日起,俄罗斯将对比特币等加密资产的流通实施严格限制。仅允许在其管辖范围内发行数字金融资产。 国家杜马金融市场委员会主席Anatoly Aksakov领导了这一举措。这是在地缘政治紧张局势加剧的情况下政府控制加密生态系统的更广泛努力的一部分。Aksakov表示,即将出台的立法旨在限制非俄罗斯加密货币业务,以加强卢布的主导地位。 与此同时,最近的报告表明,俄罗斯实体已使用加密货币,特别是 Tether 的 USDT来采购军事技术的关键组件。

  • 4月迄今以太坊链上稳定币交易量超1万亿美元,创历史新高

    4月29日消息,The Block数据显示,截至4月28日,4月以太坊链上稳定币交易量达1.08万亿美元,创历史新高,其中DAI交易量为5780.7亿美元,排名第一;USDC以2681.5亿美元交易量位居第二,USDT以1986.2亿美元交易量排名第三。

  • 许正宇:香港政府今年稍后将发表金融市场应用AI政策立场和方针

    香港财经事务及库务局局长许正宇在北京2024中关村论坛金融科技平行论坛时指出,随着人工智能科技不断演进,香港政府会保持开放态度,密切监察市场发展,以及参考海内外的经验,以推动金融业负责任地使用人工智能。今年稍后,香港政府会发表政策宣言,阐述香港政府对于在金融市场应用人工智能的政策立场和方针。 许正宇还表示,推动人工智能技术生态圈方面,香港数码港正全速设立人工智能超算中心,协助研究机构和业界应付算力需求,首阶段设施最快于今年内投入服务。此外,香港政府会拨款30 亿港元推行为期3年的人工智能资助计划,资助大学、研发机构及企业等运用算力,推动科研突破;加强算力中心的网络安全和数据保护;以及进行推广和教育活动等,从而吸引海内外人工智能专家、企业及研发项目落户香港。

  • 孙宇晨:以太坊现货ETF不会在5月获准

    波场 TRON 创始人孙宇晨在 X 平台发文表示,自己认为以太坊现货 ETF 在 5 月不会获批,加密行业仍需为监管机构的长期教育做准备,重点是帮助他们理解加密。

  • 欧盟成员国准备执行MiCA法案,加密货币公司应密切关注

    欧盟成员国即将实施MiCA法律,要求国家监管机构对加密货币服务提供商进行许可和监督。各国可以实施略有不同的技术标准,加密货币公司应密切关注政策观察者的建议。MiCA规定的稳定币发行者的专门规则将在几个月后生效,随后是针对加密货币公司的许可和其他要求。一些国家的加密货币监管将由中央银行承担,许多监管机构正在加强团队或培训人员以应对MiCA带来的挑战。