Cointime

扫码下载App
iOS & Android

开源人工智能模型何时才能取代闭源人工智能模型?

个人专家

作者:Janelle Teng. 编译:Cointime:QDD.

尽管一些基础的闭源公司已经捕捉了大部分风险投资机构对 GenAI 类别的投资,但越来越多的开源声音进入了这个系统,可能会动摇当前的范式。

几周前,我写了一篇关于 AI 模型层如何成为现代软件技术堆栈中最具战略和竞争性的层之一的文章。目前,最有价值的三家 GenAI 创业公司都是由深口袋的金融投资者和强大的战略合作伙伴支持的闭源公司。

1. Cohere 正式宣布其 2.7 亿美元 C 轮融资昨天由 Inovia 基金领导,估值约为 21 亿至 22 亿美元。该公司现在的支持者包括 NVIDIA 和 Oracle。

2. Anthropic 在几周前宣布了一笔 4.5 亿美元的 C 轮融资,由 Spark Capital 领导,估值约为 50 亿美元。Google 已经向该公司投资 3 亿美元

3. OpenAI 宣布从 Microsoft 获得了 100 亿美元的融资。这家公司据报道在今年 4 月份的一次认购中估值约为 290 亿美元,多家风险投资公司参与其中

这些知名基础模型公司的筹款活动非常引人注目,尤其是在 VC 活动放缓的背景下,这些大规模的融资规模更加令人印象深刻,因为市场下行后 1 亿美元以上的轮次变得越来越少。

来源:Carta,https://carta.com/blog/vc-megadeals-2022/

这些闭源投资所支撑的无限信心并不普遍在 VC 行业中被感受到。本周早些时候,Benchmark 的 Miles Grimshaw 被 TechCrunch 问及为什么他的公司在有机会投资基础模型公司时为什么没有投资,以及这些公司筹集的大量资金是否是一个因素。对此,Grimshaw 回答说:

“我们没有想象其中任何一家公司可能拥有的持久的过大的市场份额的信心。我认为你现在可以看到开源正在涌现并迅速追赶。随着时间的推移,你可以想象这些大型语言模型的输入会减少成本,无论是芯片上可用的计算量还是任何芯片的成本。这方面的知识显然是在扩散,越来越多的人知道如何做而不需要花很多钱去尝试找出如何做。你甚至可以看到像 OpenAI 模型这样的公司的折旧速度。想想看它们如何迅速地使 GPT-2 或 GPT-3 上的所有支出过时了。”

模型层的竞争动态正在发生变化。Grimshaw 的回应促使我深入了解当前的 GenAI 融资范式以及在“AI 的 Linux 时刻”期间开源势头可能如何影响当前状态。

GenAI 淘金热中,资金流向何方?

我们目前处于 AI 炒作周期(上图),因此风险投资正涌入这个领域应该并不意外。事实上,摩根士丹利发现截至2023年4月全球已经有超过120亿美元的融资流入了GenAI类别,这是2022年的增长函数:

正如阿马拉定律所述:“我们往往高估技术在短期内的影响,而低估它在长期内的影响”。即使已经有如此巨额的资金流入这个类别,作为技术范式的人工智能仍然处于 S 字形曲线的早期阶段,仍有很多方面尚未得到证实。那么资金流向了哪里呢?根据摩根士丹利的发现,约有80%的GenAI投资流向了模型层公司。我根据NFX的GenAI市场地图电子表格中的原始数据进行了类似的分析,并发现在过滤掉2013年之前的公司后,约70%的投资流向了模型平台或MLOps公司。

对此轻重缓急的关注在这个技术堆栈的这一部分是合乎情理的,因为我们处在早期的GenAI采用阶段,而模型层仍在不断发展,出现了一些新兴的领导者,但还没有确定的赢家。模型层与云基础架构提供商类似,在技术堆栈的其他层上形成了基础,我们可以预期随着模型层的成熟,将会产生更多的下游应用。此外,训练和开发LLMs往往比构建应用程序更昂贵,因此模型层公司具有更高的资本需求,往往需要筹集更大的融资。

来源:《经济学人》,https://www.linkedin.com/feed/update/urn:li:activity:7036730584655695872/

但重要的是要注意,即使在模型层这个“最热门”的资金流向中,也似乎出现了帕累托模式。这一层的绝大部分投资资金都被一些精选的闭源模型公司所获得。特别是如之前所述,OpenAI以惊人的100亿美元融资宣布,超过了2023年平均的风投融资轮次大小基准(其中约70%的所有风投轮次在2023年第一季度筹集的资金为1000万美元或以下),以及其他模型层大额融资。如上图所示,OpenAI的融资占GenAI初创企业累计融资总额的近50%。

在开放模型和闭源模型之间进行大卫与歌利亚之战

考虑到大量的投资流向模型层,支配这一技术堆栈的竞争是否仅限于这些资金充裕的闭源模型供应商?并非如此。

正如我之前所指出的,许多其他参与者,包括大型科技公司、非AI本土初创公司和学术机构,在该生态系统中引起了动荡,导致许多开源模型进入竞争。当我说长,我的意思真的是很长…只需查看这个开源LLM数据库(感谢Sung Kim的维护)。其中许多模型仅在六个月前不存在,但现在,由于引发了连锁反应,每天都会发布多达三个开源模型!

来源:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

斯坦福大学的Chris Ré将这种开源势头比拟为AI的Linux时刻(指朝向开源操作系统作为Microsoft封闭平台Windows的替代方案的运动):“自深度学习时代开始以来,AI就有着强大的开源传统。我所说的Linux时刻是指:我们可能正处于开源模型和建立重要、持久、广泛使用的重要开源努力的时代的开端。许多最重要的数据集(例如LAION-5B)和模型努力(例如来自稳定性和Runway 的 Stable Diffusion、来自EleutherAI 的GPT-J)都是由较小的独立玩家以开源方式完成的。今年我们看到这些努力激发了大量的进一步发展和社区激动。”

生态系统中的每个人都在关注,重新评估他们的防御能力,因为开源LLMs证明了它们作为可靠的竞争对手,与那些拥有更充足资金支持的闭源竞争对手相比,并非处于劣势地位。

在病毒式传播的“我们没有Moat,OpenAI也没有”泄露备忘录中,一位谷歌研究员声称,开源参与者正在缩小质量上的差距,并最终在各方面(如训练速度和成本)上击败专有的闭源模型:   “虽然我们的模型在质量上仍然有一定优势,但差距正在惊人地快速缩小。开源模型更快,更可定制,更私密,而且在每一方面都更能干。他们用100美元和13B params做出我们在10美元和540B时努力做出的事情。而且他们是在几周内,而不是几个月内做到的。这对我们有深刻的影响。”

该备忘录引用了Vicuna-13B作为例子,Vicuna-13B是一个开源聊天机器人,通过对用户共享的从ShareGPT收集的对话进行微调LLaMA进行训练。Vicuna-13B能够在很短的时间内轻松超过其前身LLaMA和斯坦福阿尔帕卡,实现了超过90% OpenAI的ChatGPT和Google的Bard的质量(下图)。特别值得注意的是,相对于将某些估计需要数百万美元的特定闭源LLMs进行训练的成本而言,Vicuna-13B的培训成本约为300美元

来源:SemiAnalysis,https://www.semianalysis.com/p/google-we-have-no-moat-and-neither

但未来远非确定。有些人认为,“Linux时刻”并不足以使开源模型赢得闭源竞争对手,可能需要“Apache时刻”才能倾向于他们。

AILinux时刻为火上加油

资金最充足的玩家会获胜吗?会有几个赢家吗?市场结构会长期保持分散吗?GenAI的日子从未变得无聊,因为这个领域的变化速度是前所未有的快。近期出现的开源参与者的蓬勃发展增加了模型层上已经非常竞争的压力,但我认为这种活力很重要,因为它可以促进创新,推动更多的AI资源民主化,让下游公司在此基础上构建更多的产品和应用。

来源:Morgan Stanley

正如Marc Andreesen最近写道:“AI可能是我们文明创造的最重要和最好的事物,至少和电和微芯片不相上下,可能更加重要。” 因此,我以上图作为背景,来结束本文,以突显我们目前正在经历的深刻时刻,以及从众多投入到这个领域的燃料中催生出的前所未有的采用速度!

本篇文章及所提供的信息仅供参考。所表达的观点仅是作者个人观点,并不构成出售的要约或推荐购买,也不构成要求购买的要约,也不构成任何投资产品或服务的推荐。虽然本文中包含的某些信息源自被认为可靠的来源,但作者及其雇主或附属机构没有对此信息进行独立验证,其准确性和完整性不能得到保证。因此,不应根据此信息的公正性、准确性、及时性或完整性进行任何形式的陈述或保证,也不应依赖此信息。作者及其所有雇主及其附属人员对此信息不承担任何责任,并且不保证将来会更新此处所包含的信息或分析。

评论

所有评论

推荐阅读

  • 慢雾安全提醒:警惕恶意攻击者利用 WordPress 插件漏洞发起的水坑攻击

    近期有攻击者利用 WordPress 插件漏洞攻击正常的站点,然后在站点中注入恶意的 js 代码,发起水坑攻击,在用户访问站点时弹出恶意弹窗,骗取用户执行恶意的代码或进行 Web3 钱包签名,从而盗取用户的资产。建议有使用 WordPress 插件的站点注意排查是否存在漏洞,及时更新插件,避免被攻击;用户在访问任何站点的时候,要仔细识别下载的程序以及 Web3 签名的内容,避免下载到恶意程序或因授权了恶意的签名导致资产被盗。

  • 4月28日午间要闻速递

    1. BTC突破64000美元

  • 未经验证的Ember Sword NFT拍卖合约漏洞已造成近20万美元损失

    据Certik监测,其发现未经验证的Ember Sword NFT拍卖合约漏洞,已从159名批准该合约的受害者那里获利60 WETH(约19.5万美元)。Certik提醒用户撤销对Polygon上相关合约的批准。

  • BSC链上的某未知合约和Polygon链上Ember Sword项目合约存在可疑交易

    BlockSec Phalcon在X平台表示,位于BSC链上的未知合约和位于Polygon链上Ember Sword项目合约存在可疑交易,请立即撤销对BSC链上0x389开头合约地址和Polygon链上的0x6f7开头合约地址。

  • 4月28日早间要闻速递

    1. BTC:63,597美元、ETH:3,257美元、BNB:599美元

  • 诈骗者利用伪造的USDT余额来欺骗加密货币用户

    慢雾与Imtoken合作,揭露了一种利用离线交易并使用USDT的新加密货币骗局,诈骗者操纵以太坊RPC来伪造受害者钱包中的USDT余额。骗子诱骗受害者将他们的以太坊RPC URL更改为他们控制的URL,让受害者看起来像是存入了USDT资金,结果却让受害者在尝试交易时空手而归。此外,该骗局还通过小额转账欺骗用户以获得信任,然后操纵账户余额和合约信息,给毫无戒心的用户带来严重风险,并与更广泛的生猪屠宰骗局活动有关。

  • Cointime 4月27日要闻速递

    1. 港交所:将博时 HashKey、华夏、嘉实比特币及以太币ETF收纳为中央结算系统多柜台合资格证券

  • 港交所:将博时 HashKey、华夏、嘉实比特币及以太币ETF收纳为中央结算系统多柜台合资格证券

    香港交易所发布三份通告,宣布收纳博时 HashKey 比特币 ETF 股份及博时 HashKey 以太币 ETF 股份、华夏比特币 ETF 股份及华夏以太币 ETF 股份、嘉实比特币现货 ETF 股份及嘉实以太币现货 ETF 股份为中央结算系统多柜台合资格证券。据悉:

  • 俄罗斯央行和Rosfinmonitoring披露法币-加密货币跟踪系统试点

    Odaily星球日报讯 自 2023 年以来,俄罗斯一直试图追踪加密货币交易及其来源。俄罗斯银行和俄罗斯联邦金融监测局(Rosfinmonitoring)透露,目前存在一个系统,允许私人银行跟踪基于法币的交易与加密货币业务之间的联系。该公告是在 Rosfinmonitoring 组织的“当前反洗钱/反恐融资问题”论坛上发布的,该论坛还披露,该试点于 2023 年开始,五家大型信贷机构正在与 Rosfinmonitoring 合作,预计将持续到明年4月,但也可以延长。Rosfinmonitoring 合作伙伴 Innotech 的项目投资组合管理总监 Ilya Bushmelev 表示,该试点可能会帮助银行建立“了解您的加密客户”和“了解您的加密交易”程序,并指出该系统可能对合规和监管目的有用。(Bitcoin.com)

  • PolkaWorld:Kusama上的Coretime交易已开始

    4月27日消息,PolkaWorld 发文表示,Kusama 上的 Coretime 交易已开始,平行链时代谢幕。随着 Kusama 373 号公投的通过和执行,该提案将 Kusama 中继链运行时升级至 v1.2.0,并带来了 Coretime 的功能。紧接着,在上周五社区又通过了 Kusmaa 375 号公投,允许 Coretime 链开始 Coretime 的销售。当前,Kusama 正在进行续订期(Renew Period),即正在进行批量核心的售卖。