Cointime

扫码下载App
iOS & Android

AI 掀起 GPU 短缺潮:区块链如何缓解机器学习瓶颈?

区块链通过允许分布式访问模型,并创建具有加密激励的更便宜模型市场,为访问较低计算成本的 GPU 提供一座桥梁。

原文标题:《The Rise of AI and GPU Shortages: How Blockchain Alleviates Machine Learning Bottlenecks》

撰文:Tommy Eastman

编译:Frank,Foresight News

随着人工智能的发展和对 GPU 需求的增加,机器学习行业面临着 GPU 成本和可访问性的问题,让我们看看区块链技术是如何提供解决方案的。

GPU 产业

在过去的一年里,基于人工智能的应用程序和集成有了巨大的增长。OpenAI 的 ChatGPT 成为有史以来增长最快的应用程序,在发布仅仅两个月后就达到了 1 亿月活跃用户。相比之下,TikTok 花了 9 个月,Instagram 花了 18 个月才达到同样的里程碑。

对人工智能的需求极大地影响了图形处理器(GPU)的价值和可用性。GPU 是为执行并行计算而优化的处理单元,同时处理许多数据,这使得它们对机器学习、视频编辑和游戏应用程序很有用。由于 GPU 在人工智能赛道具有多用途,因此市场对 GPU 的需求有所增加。

GPU 是由少数几家公司开发和分售的,这在制造业供应链的延迟中很明显。自 2017 年牛市以来,它们一直与区块链行业密切相关,2018 年以太坊工作量证明矿工购买了几乎所有可用的 GPU。以太坊区块链已经转向了权益证明,但随着人工智能的爆炸式增长,区块链技术仍然为获得 GPU、训练成本、分布式推理等常见问题提供了有用的解决方案。

机器学习过程和瓶颈

机器学习是一个庞大而迅速发展的行业。模型的训练通常分为几个步骤,每个步骤都有一定的瓶颈。

1. 基础模型训练

基础模型训练包括获取大型数据集(例如维基百科)并训练初始基础模型,以用作通用智能模型或最终进行微调,它使用学习到的模式和关系来预测序列中的下一个项目。

例如,图像生成模型被训练将图像模式与相应的文本关联起来,因此当给定文本输入时,它们根据这些学习到的模式生成图像。类似地,对于文本,模型根据前面的单词和上下文预测文本字符串中的下一个单词。

基础模型的训练在劳动力、基础设施、时间和精力方面是昂贵的,目前的供应链很难获得最先进的 NVIDIA GPU,即使对拥有充裕资金的公司来说也是如此。

例如 OpenAI 的 GPT-3 的迭代训练持续了几个月,仅能源成本就消耗了数百万美元。因此基础模型的训练仍然是一项昂贵得令人望而却步的努力,只有少数私人企业才能做到。

2. 微调

值得注意的是,与基础模型训练相比,更少的资源密集,微调优化了特定任务的模型(例如学习新方言的语言模型)。基础模型在特定任务上的性能可以通过微调大幅提高。

虽然 GPU 稀缺会影响这三个领域,但微调受到的影响最小。然而,微调完全依赖于开源的基础模型。如果私人公司决定停止开源他们的模型,社区模型将以惊人的速度落后于最先进的(SOTA)模型。

3.推理

访问模型代表了该步骤的最后一步——例如从 ChatGPT 接收问题的答案,这是基于稳定扩散的用户提示生成的图像——需要 GPU 资源用于模型查询。推理在计算需求方面正在迅速升级,特别是在 GPU 支出方面。

推理既包括最终用户,也包括将模型合并到其应用程序中的开发人员,这是确保该模式经济可行性的途径。这一概念对于将人工智能系统整合到社会中至关重要,其重要性体现在终端用户积极使用 ChatGPT 等工具的快速采用率上。

GPU 的稀缺性使得推理成本迅速上升。虽然与基础模型训练相比,推理的基准线要求较低,但公司部署应用程序的规模要求查询模型的 GPU 负载惊人。随着 GPU 模型多样性的增加(通过微调和新的基础模型开发),应用程序的多样性将会增加,而来自推理的 GPU 需求将急剧增加。

区链为机器学习瓶颈提供解决方案

在过去,GPU 被用于挖掘以太坊和其他 PoW 代币。现在,区块链被视为一个独特的机会,可以提供访问和增加 GPU 空间瓶颈之间的协调——特别是在机器学习方面。

加密激励

大规模 GPU 部署需要大量的前期资金,这阻碍了除了大型公司之外的所有公司在这一领域的发展进程。区块链激励为 GPU 所有者创造了从备用计算中获利的潜力,为用户创造了一个更便宜、更容易进入的市场。

分布式访问

任何人都可以提供 / 使用计算、托管模型和查询模型——这与需要处于测试版或在传统空间中具有有限的访问权限有明显的不同。

区块链可以为机器学习空间提供的一个重要特性是分布式访问。传统上机器学习需要大型数据中心,因为 FMT 还没有在非集群 GPU 上大规模完成,而分布式协议正试图解决这个问题,如果成功,将打开 FMT 的闸门。

市场协调

区块链市场帮助协调 GPU 采购,允许拥有 GPU 的个人和公司找到想要租用它们的人,而不是让它们闲置,在 GPU 闲置的时候产生收入可以帮助抵消购买 GPU 的前期成本,允许更多的实体参与 GPU 托管。

Foundry 对负责任 AI 的承诺

区块链机器学习领域是一个刚刚起步的行业,在主网上只有很少的项目。目前 Foundry 正在支持 Bittensor AI 项目以及 Akash,这被证明是推进分布式 AI 的一种有意义的方式。

Bittensor

Bittensor 是一个去中心化的、无需许可的计算网络,可以更容易地访问模型,并通过加密激励创建一个更便宜的模型市场,任何人都可以托管模型,并且用户提示与给定模态的排名最高的模型相匹配。

Bittensor 已经发展成为加密领域最大的人工智能项目之一,利用区块链创建了一个大规模的计算推理网络,该网络最近发布了激励不同模式的子网,包括图像生成、预测市场等。

Foundry 在网络上进行验证和挖掘,并运行权威证明节点以确保共识。

Akash

Akash 是一个通用的计算市场,它允许更容易地大规模访问 GPU,训练更多的基础模型,并降低 GPU 的成本。

Akash 最近推出了他们的 GPU 市场,其目标与减少入门资金门槛、降低 GPU 计算成本和增加可访问性类似,基础模型培训计划在 Akash 发展。Foundry 正在为网络提供 GPU 计算,并与团队合作开发功能。

接下来是什么?

随着机器学习继续融入企业,对 GPU 的需求将继续飙升,这在机器学习领域引发了持续的供应链问题,区块链技术通过允许分布式访问模型并创建具有加密激励的更便宜的模型市场,为访问较低计算成本的 GPU 提供了一座桥梁。

评论

所有评论

推荐阅读

  • 能继承以太坊活性的 Based Rollup 是什么?

    Based Rollup 将交易排序外包给 L1 以减轻自身验证复杂度,同时享有与 L1 相同的活性保证。

  • Starknet桥接存储总价值突破90万枚ETH

    Dune 数据显示,以太坊二层解决方案 Starknet 桥接存储总价值(TVB)已突破 90 万枚 ETH,达到 901,512 枚 ETH,按照当前价格计算约合 28.4 亿美元,桥接用户地址总数为 1,225,098 个。其他 L2 方面,zkSync 桥接存储总价值为 3,642,170 枚 ETH,Arbitrum 为 3,713,183 枚 ETH、Optimism 为 761,313 枚 ETH、Base 为 558,434 枚 ETH。

  • 5月06日早间要闻速递

    1.过去24小时符文铸币占比特币所有交易的70.2%

  • 过去24小时符文铸币占比特币所有交易的70.2%

    Ord.io 在 X 平台发文表示,过去 24 小时内,符文(Runes)铸币占比特币所有交易的 70.2%。 1. DOPE•ASS•TICKER:267,955 枚; 2. EPIC•EPIC•EPIC•EPIC:100,000 枚; 3. THE•DONALD•TRUMP:9,076 枚。

  • 下周MAVIA等代币将迎来解锁,总价值约3616万美元

    据Token Unlocks数据显示,下周MAVIA等代币将迎来一次性大额解锁,总计释放价值约3616万美元。其中:

  • USDe发行量近23亿枚

    据Etherscan数据,由Ethena Labs发行的稳定币USDe发行量已达2,292,060,769枚。 据悉,USDe是一种基于以太坊的稳定币,由衍生品提供担保,其通过在中心化和去中心化场所进行delta中性对冲来实现价格稳定。为了创建USDe,Ethena允许用户使用美元、ETH或流动性质押代币作为抵押品。

  • 慢雾:上周(2024年4月28日-5月4日)安全事件损失总额超7140万美元

    据慢雾发布的每周安全报告(2024年4月28日-5月4日),本周总损失:超过71,399,000美元,本周,一个事件导致损失从九位数上升到惊人的十位数。令人惊讶的是,这并不是由于复杂的技术缺陷或复杂的网络钓鱼诈骗,而是一个简单的错误,只需实施白名单就可以轻松避免。多起安全事件包括: 1.Bitfinex数据泄露争议:5月4日,有报道称Bitfinex发生数据泄露,据称泄露的数据包含40万名客户的信息。然而,Bitfinex CTO Paolo Ardoino驳斥了这一说法,称泄露的数据与Bitfinex的数据库不符,经过彻底分析后未发现任何泄露。 2.鲸鱼地址投毒攻击:5月3日,一名鲸鱼遭遇地址投毒攻击,造成1155个WBTC的巨额损失,价值约7000万美元。 3.NOVAMIND_(NMD)疑似存在“地毯式攻击”:5月2日,以太坊网络上的NOVAMIND_(NMD)被指控存在“地毯式攻击”,约41ETH(约12.3万美元)被转移到多重签名,代币价格暴跌约97%。 4.Pike Finance漏洞不断:4月30日,Pike Finance再次遭遇安全漏洞,损失99,970.48枚ARB、64,126枚OP、479.39枚ETH。Pike合约功能安全措施薄弱,导致漏洞被利用。 5.Dune的Twitter帐户被盗:区块链数据分析平台Dune于4月30日遭遇安全事件,其Twitter帐户被盗。一则关于Dune空投的虚假帖子流传了大约15分钟,之后该团队重新控制了该帐户。 6.Yield Protocol的Arbitrum合约被利用:一名黑客利用了Yield Protocol在Arbitrum区块链上的战略合约中的漏洞,导致价值约181,000美元的加密资产被盗。该漏洞涉及池代币余额与总供应量之间的差异,从而导致提取额外的池代币。 7.Ember Sword NFT拍卖再次被利用:未经验证的Ember Sword NFT拍卖中的漏洞再次浮出水面,允许从159名批准合同的受害者那里提取60枚WETH,相当于约195,000美元。

  • Tether于5月4日发行价值2.4亿美元的USDT,赎回价值860万美元的USDT

    据ChainArgos监测,Tether于5月4日进行了大规模的发行与赎回活动。当天共发行2.4亿美元的USDT,同时赎回了860万美元的USDT。

  • 以太坊稳定币交易量在4月份打破月度记录

    上个月以太坊上稳定币的交易总量明显高于之前任何一个月,但大部分交易量是由单一稳定币DAI贡献的。 据The Block此前报道,DAI越来越多地用于复杂的MEV交易,通常涉及闪贷,其中很大一部分DAI在单笔交易中铸造和返还。仅其中一项交易就增加了近10亿美元的DAI交易量。

  • 马斯克的人工智能公司xAI或融资30亿美元

    知情人士称,与马斯克关系密切的投资者正洽谈帮助其AI初创公司xAI融资30亿美元,本轮融资将使该公司估值达到180亿美元。据悉,考虑投资此轮融资的支持者包括风险投资公司Gigafund和美国风投家Steve Jurvetson。xAI的融资条款尚未最终确定,计划可能会发生变化。