Cointime

扫码下载App
iOS & Android

深入了解 flood:针对 EVM 节点进行基准测试的负载测试工具

个人专家

作者:Storm Slivkoff  编译:Cointime Lu Tian

简介

负载测试(Load testing)是开发高弹性、高性能数据系统的关键环节。尽管如此,负载测试在加密货币基础设施的开发中尚未得到广泛应用。为弥补这一空缺,我们推出了 flood,一款专为 RPC 端点性能分析设计的基准测试工具。

flood 最初是作为优化 Reth 工具而构建的,以便更深入地了解在不同负载下延迟和吞吐量的权衡。然而,我们相信 flood 远不止于应用在 Reth上,它在优化众多类型加密基础设施性能方面具有重要价值。

我们很荣幸以 Apache/MIT 许可证将 Flood 作为免费的开源软件发布。您可以在 Github repo 中找到其源代码和安装说明。flood 可以从命令行使用,也可以作为 Python 库使用。此外,Flood 还提供了一个 Docker 镜像,便于集成到 CI/CD 和其他类型的流程中。

什么是负载测试

负载测试是衡量系统性能特性如何受到不同类型工作负载影响的方法。关键的见解在于,随着系统承受的负载逐渐增加,吞吐量、延迟和错误率等性能指标往往会下降。因此,在受控负载条件下观察系统,有助于揭示系统瓶颈、故障模式以及性能潜力。

负载测试获取的信息可在多种场景中发挥作用。当系统处于积极开发阶段时,负载测试能够明确突出最需改进的系统瓶颈。在比较两个系统时,负载测试有助于识别哪个系统性能更优或更可靠。作为这种情况的特例,负载测试还可以比较单个系统在不同硬件或软件配置下的表现。在各种情况下,负载测试都有助于开发高度优化的系统。

如何进行区块链节点的负载测试

我们关注的焦点是 RPC,它通常用于从区块链节点获取数据的通信协议。

目前,衡量 RPC 性能的最常用方法并不是负载测试,而是延迟测试(latency testing):您向 RPC 节点发送请求,并测量获得响应所需的时间。各种 RPC 提供商的延迟测试可以在众多网站上找到。然而,这类测试提供的节点性能视角有限,因为它几乎无法展示系统在负载下的表现(更多详情,请参阅我们关于测量延迟和吞吐量的文章)。

在区块链背景下,工作负载可以在两个关键方面发生变化。一个变量是大小(size),每秒 10,000 个请求的负载对系统的压力将大于每秒 100 个请求的负载。另一个负载变量是 RPC 方法。对于从区块链节点中提取的每种类型的数据,都有不同的 RPC 方法。例如,区块与交易、日志以及追踪。每种 RPC 方法都会给系统带来不同类型的负载。部分 RPC 方法受存储 IO 限制,而其他方法受 CPU 限制。

flood 是什么

基于这些原则,我们开发了一款名为 flood 的负载测试工具。flood 通过 1) 使用负载测试替代延迟测试;以及 2) 将测试范围扩展至所有相关的 RPC 方法,为 RPC 端点的性能特征提供了前所未有的视角。

flood 主要由以下三个基本组件组成:

  1. 调用生成引擎:flood 生成大量参数化的 RPC 调用集,随机抽样分布类似于不同类型的区块链工作负载。flood 利用 Paradigm Data Portal 数据集确保全面覆盖区块链历史。
  2. 负载测试引擎:flood 接着编排 Vegeta(由 @tsenart 用 Go 编写的高性能负载测试工具)使用这些调用对 RPC 端点进行负载测试。
  3. 报告引擎:在执行测试后,flood 以各种图表、表格和报告的形式汇总结果。这些摘要便于集成到脚本和数据管道中。

每个组件都具有高度可配置性,使 Flood 能够覆盖广泛的测试场景和环境。

flood 能用来做什么

在 使用 flood 时,用户可以指定他们想要测试的 RPC 方法以及 RPC 端点列表。例如,您可能希望测试两个不同 Reth 版本中的 eth_getLogs 性能。接下来,flood 将针对这些 RPC 端点执行不同的受控负载。例如,它可能以每秒 1,000、2,000、4,000 和 8,000 个请求的速度运行 eth_getLogs。然后,flood 将展示表格和图表,概括性能指标如何随负载变化。

输出结果类似于下面的形式:

你可以点击 这里 查看更多 flood 报告。

性能指标在负载下降的特定方式能为系统瓶颈和最终性能容量提供丰富的洞察。关于解释和利用负载测试数据的详细信息,我们推荐阅读 Cesarini 的《Designing for Scalability with Erlang/OTP》第 15 章。

除了这种简单的操作模式之外,flood 还提供高级功能以适应各种类型的高级用户需求:

  • flood 可以使用不同的负载测试计划,包括:压力测试(随着时间的推移逐渐增加负载)、尖峰测试(突然出现大负载,然后是小负载)和浸泡测试(长时间运行负载)。
  • flood 可以编排负载测试在每个 RPC 节点上以本地模式运行,以消除网络瓶颈引起的干扰。
  • flood 提供一个“一致性”测试模式,用于检查每个 RPC 端点是否返回相同的响应。

为什么要创建 flood 

 Paradigm 目前正在进行 Reth 的开发,性能是我们的主要关注点之一。为了深入了解 Reth 的性能特征,我们开发了 flood 工具。通过 flood 工具,我们已经发现了在不同工作负载和系统配置下出现的多个 Reth 性能瓶颈,并对其进行了修复。此外,flood 工具还为 Reth 开发人员提供了一个紧密的反馈循环,使他们能够深入了解任何代码库更改如何影响节点的端到端系统性能。

除了 Reth,我们相信 Flood 工具还可以帮助解决与 RPC 节点相关的许多未解决问题,例如:

  • 哪些硬件规格对节点性能最为重要?存储 IO 和 RAM 速度、RAM 容量和 CPU 速度之间的相对重要性是什么?RAID 是否值得使用?
  • 每个第三方 RPC 提供商的每个 RPC 方法的有效速率限制是多少?
  • 哪个节点客户端为不同类型的工作负载提供最佳性能?

在本文中,我们介绍了 flood 工具作为一种负载测试工具,它提供了前所未有的区块链节点性能特征视图。尽管我们最初构建 flood 工具是为了优化 Reth 的开发,但我们相信它将对其他类型的高性能加密基础设施的开发产生巨大的推动作用。我们期待看到更多人使用 flood 工具来构建他们自己的高性能和可靠的系统。

EVM
评论

所有评论

推荐阅读