开源人工智能模型何时才能取代闭源人工智能模型？

作者：Janelle Teng. 编译：Cointime：QDD.

尽管一些基础的闭源公司已经捕捉了大部分风险投资机构对 GenAI 类别的投资，但越来越多的开源声音进入了这个系统，可能会动摇当前的范式。

几周前，我写了一篇关于 AI 模型层如何成为现代软件技术堆栈中最具战略和竞争性的层之一的文章。目前，最有价值的三家 GenAI 创业公司都是由深口袋的金融投资者和强大的战略合作伙伴支持的闭源公司。

1. Cohere 正式宣布其 2.7 亿美元 C 轮融资昨天由 Inovia 基金领导，估值约为 21 亿至 22 亿美元。该公司现在的支持者包括 NVIDIA 和 Oracle。

2. Anthropic 在几周前宣布了一笔 4.5 亿美元的 C 轮融资，由 Spark Capital 领导，估值约为 50 亿美元。Google 已经向该公司投资 3 亿美元。

3. OpenAI 宣布从 Microsoft 获得了 100 亿美元的融资。这家公司据报道在今年 4 月份的一次认购中估值约为 290 亿美元，多家风险投资公司参与其中。

这些知名基础模型公司的筹款活动非常引人注目，尤其是在 VC 活动放缓的背景下，这些大规模的融资规模更加令人印象深刻，因为市场下行后 1 亿美元以上的轮次变得越来越少。

来源：Carta，https://carta.com/blog/vc-megadeals-2022/

这些闭源投资所支撑的无限信心并不普遍在 VC 行业中被感受到。本周早些时候，Benchmark 的 Miles Grimshaw 被 TechCrunch 问及为什么他的公司在有机会投资基础模型公司时为什么没有投资，以及这些公司筹集的大量资金是否是一个因素。对此，Grimshaw 回答说：

“我们没有想象其中任何一家公司可能拥有的持久的过大的市场份额的信心。我认为你现在可以看到开源正在涌现并迅速追赶。随着时间的推移，你可以想象这些大型语言模型的输入会减少成本，无论是芯片上可用的计算量还是任何芯片的成本。这方面的知识显然是在扩散，越来越多的人知道如何做而不需要花很多钱去尝试找出如何做。你甚至可以看到像 OpenAI 模型这样的公司的折旧速度。想想看它们如何迅速地使 GPT-2 或 GPT-3 上的所有支出过时了。”

模型层的竞争动态正在发生变化。Grimshaw 的回应促使我深入了解当前的 GenAI 融资范式以及在“AI 的 Linux 时刻”期间开源势头可能如何影响当前状态。

在 GenAI 淘金热中，资金流向何方？

我们目前处于 AI 炒作周期（上图），因此风险投资正涌入这个领域应该并不意外。事实上，摩根士丹利发现截至2023年4月全球已经有超过120亿美元的融资流入了GenAI类别，这是2022年的增长函数：

正如阿马拉定律所述：“我们往往高估技术在短期内的影响，而低估它在长期内的影响”。即使已经有如此巨额的资金流入这个类别，作为技术范式的人工智能仍然处于 S 字形曲线的早期阶段，仍有很多方面尚未得到证实。那么资金流向了哪里呢？根据摩根士丹利的发现，约有80％的GenAI投资流向了模型层公司。我根据NFX的GenAI市场地图电子表格中的原始数据进行了类似的分析，并发现在过滤掉2013年之前的公司后，约70％的投资流向了模型平台或MLOps公司。

对此轻重缓急的关注在这个技术堆栈的这一部分是合乎情理的，因为我们处在早期的GenAI采用阶段，而模型层仍在不断发展，出现了一些新兴的领导者，但还没有确定的赢家。模型层与云基础架构提供商类似，在技术堆栈的其他层上形成了基础，我们可以预期随着模型层的成熟，将会产生更多的下游应用。此外，训练和开发LLMs往往比构建应用程序更昂贵，因此模型层公司具有更高的资本需求，往往需要筹集更大的融资。

来源：《经济学人》，https://www.linkedin.com/feed/update/urn:li:activity:7036730584655695872/

但重要的是要注意，即使在模型层这个“最热门”的资金流向中，也似乎出现了帕累托模式。这一层的绝大部分投资资金都被一些精选的闭源模型公司所获得。特别是如之前所述，OpenAI以惊人的100亿美元融资宣布，超过了2023年平均的风投融资轮次大小基准（其中约70％的所有风投轮次在2023年第一季度筹集的资金为1000万美元或以下），以及其他模型层大额融资。如上图所示，OpenAI的融资占GenAI初创企业累计融资总额的近50％。

在开放模型和闭源模型之间进行大卫与歌利亚之战

考虑到大量的投资流向模型层，支配这一技术堆栈的竞争是否仅限于这些资金充裕的闭源模型供应商？并非如此。

正如我之前所指出的，许多其他参与者，包括大型科技公司、非AI本土初创公司和学术机构，在该生态系统中引起了动荡，导致许多开源模型进入竞争。当我说长，我的意思真的是很长…只需查看这个开源LLM数据库（感谢Sung Kim的维护）。其中许多模型仅在六个月前不存在，但现在，由于引发了连锁反应，每天都会发布多达三个开源模型！

来源：https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

斯坦福大学的Chris Ré将这种开源势头比拟为AI的Linux时刻（指朝向开源操作系统作为Microsoft封闭平台Windows的替代方案的运动）：“自深度学习时代开始以来，AI就有着强大的开源传统。我所说的Linux时刻是指：我们可能正处于开源模型和建立重要、持久、广泛使用的重要开源努力的时代的开端。许多最重要的数据集（例如LAION-5B）和模型努力（例如来自稳定性和Runway 的 Stable Diffusion、来自EleutherAI 的GPT-J）都是由较小的独立玩家以开源方式完成的。今年我们看到这些努力激发了大量的进一步发展和社区激动。”

生态系统中的每个人都在关注，重新评估他们的防御能力，因为开源LLMs证明了它们作为可靠的竞争对手，与那些拥有更充足资金支持的闭源竞争对手相比，并非处于劣势地位。

在病毒式传播的“我们没有Moat，OpenAI也没有”泄露备忘录中，一位谷歌研究员声称，开源参与者正在缩小质量上的差距，并最终在各方面（如训练速度和成本）上击败专有的闭源模型： “虽然我们的模型在质量上仍然有一定优势，但差距正在惊人地快速缩小。开源模型更快，更可定制，更私密，而且在每一方面都更能干。他们用100美元和13B params做出我们在10美元和540B时努力做出的事情。而且他们是在几周内，而不是几个月内做到的。这对我们有深刻的影响。”

该备忘录引用了Vicuna-13B作为例子，Vicuna-13B是一个开源聊天机器人，通过对用户共享的从ShareGPT收集的对话进行微调LLaMA进行训练。Vicuna-13B能够在很短的时间内轻松超过其前身LLaMA和斯坦福阿尔帕卡，实现了超过90% OpenAI的ChatGPT和Google的Bard的质量（下图）。特别值得注意的是，相对于将某些估计需要数百万美元的特定闭源LLMs进行训练的成本而言，Vicuna-13B的培训成本约为300美元。

来源：SemiAnalysis，https://www.semianalysis.com/p/google-we-have-no-moat-and-neither

但未来远非确定。有些人认为，“Linux时刻”并不足以使开源模型赢得闭源竞争对手，可能需要“Apache时刻”才能倾向于他们。

AI的Linux时刻为火上加油

资金最充足的玩家会获胜吗？会有几个赢家吗？市场结构会长期保持分散吗？GenAI的日子从未变得无聊，因为这个领域的变化速度是前所未有的快。近期出现的开源参与者的蓬勃发展增加了模型层上已经非常竞争的压力，但我认为这种活力很重要，因为它可以促进创新，推动更多的AI资源民主化，让下游公司在此基础上构建更多的产品和应用。

来源：Morgan Stanley

正如Marc Andreesen最近写道：“AI可能是我们文明创造的最重要和最好的事物，至少和电和微芯片不相上下，可能更加重要。” 因此，我以上图作为背景，来结束本文，以突显我们目前正在经历的深刻时刻，以及从众多投入到这个领域的燃料中催生出的前所未有的采用速度！

本篇文章及所提供的信息仅供参考。所表达的观点仅是作者个人观点，并不构成出售的要约或推荐购买，也不构成要求购买的要约，也不构成任何投资产品或服务的推荐。虽然本文中包含的某些信息源自被认为可靠的来源，但作者及其雇主或附属机构没有对此信息进行独立验证，其准确性和完整性不能得到保证。因此，不应根据此信息的公正性、准确性、及时性或完整性进行任何形式的陈述或保证，也不应依赖此信息。作者及其所有雇主及其附属人员对此信息不承担任何责任，并且不保证将来会更新此处所包含的信息或分析。

最近浏览

热门币种

每日趋势

每日必读

欢迎回来

注册账号

使用 email 登录

使用 email 注册

检查您的收件箱

所有评论

推荐阅读

慢雾安全提醒：警惕恶意攻击者利用 WordPress 插件漏洞发起的水坑攻击

4月28日午间要闻速递

未经验证的Ember Sword NFT拍卖合约漏洞已造成近20万美元损失

BSC链上的某未知合约和Polygon链上Ember Sword项目合约存在可疑交易

4月28日早间要闻速递

诈骗者利用伪造的USDT余额来欺骗加密货币用户

Cointime 4月27日要闻速递

港交所：将博时 HashKey、华夏、嘉实比特币及以太币ETF收纳为中央结算系统多柜台合资格证券

俄罗斯央行和Rosfinmonitoring披露法币-加密货币跟踪系统试点

PolkaWorld：Kusama上的Coretime交易已开始

每日必读

深度解读：USDT+TON+Telegram将变异出什么新物种？

美国司法部“变卦”或将赵长鹏监禁升至3年？辩护文件披露温情一面

重磅！港交所开始准备上线现货虚拟资产ETF

新政重大利好！个人投资者允许买卖香港现货比特币ETF

又减半了，北京还有人在吗？

比特币玩家还在等符文上线，土狗玩家已经在以太坊上赚麻了

热门标签

分享