跳转至

吞吐量与性能故障排查

本主题解释如何对已订阅带宽与实际传输速率不一致、以及网络性能不稳定进行故障排查并定位原因。

Megaport 无法查看或访问 Megaport 网络之外的环境。要判断问题是否源自 Megaport 网络,Megaport Support 要求您先验证您设备的性能。

开始技术故障排查之前

在开始排查前,请确认您的服务未受到云服务提供商 (CSP) 或 Megaport 的计划维护或已知中断的影响。

  • 关于 CSP 更新 – 检查您的电子邮件通知或访问该提供商的官方状态页面。

  • 关于 Megaport 更新 – 直接在 Megaport Portal 中查看实时服务状态。 详细信息,参见 监控维护与中断事件

另外,请在 Megaport Portal 中查看监控数据。以下项目是需要重点监控的关键字段。

  • Service Logs(服务日志) – 在 Portal 的 Logs 选项卡中检查上下线事件和开通历史。详细信息,参见 查看服务日志

  • Usage Graphs(使用情况图表) – 查看 Usage 选项卡以分析流量模式、光功率水平和错误。 详细信息,参见 查看使用情况详细信息

排查 Port 与交叉连接

如果问题与您的 Port 有关,请在联系 Megaport Support 之前先查看以下项目。

类别 排查步骤 操作 说明与分析
物理层 接口错误检查 检查设备上的接口或 CRC 错误以及丢包。 接口统计信息和日志有助于确定交叉连接的哪一端导致故障,并指明潜在的解决方案。

例如,某网络接口上的入方向错误数量不断增加,通常可以排除该 SFP 本身的问题,并指示交叉连接中其他部件可能存在故障。
硬件 SFP 小型可插拔(SFP)是一种可热插拔的收发器,应用于数据通信和电信网络,实现两个设备之间的数据传输。
兼容性
检查您的 SFP。

确认您的 Port 容量。

检查您的交换机、路由器和防火墙型号。

检查固件版本。
确认光模块 SFP 的类型、速率、波长和光纤类型。

确保 SFP 符合 Megaport 规范(例如,1 Gbps 使用 1000BASE-LX,10 Gbps 使用 10GBASE-LR)。

详细信息,参见 技术规格
光功率 光功率检查 验证设备上的 Tx/Rx 光功率。

检查发射(Tx)和接收(Rx)的光功率。
此健康检查可用于验证物理连通性。

如果未接收到 Rx 光,则服务处于中断状态。

如果观察到 Tx 和 Rx 光功率劣化,服务可能会被中断。建议检查物理连接。

如果与 Megaport 之间未发出(Tx)或未接收(Rx)光,可能由以下原因导致:

• 光纤极性问题 – 在您侧对调双芯光纤以验证。

• 您的环境或交叉连接内的连通性问题 – 在您侧执行物理回环测试进行验证。

• Megaport 环境内的连通性问题 – 从您侧朝向 Megaport 执行物理回环测试进行验证。
硬件 网络 检查您的网络中的以下内容:

• Port 利用率
• CPU 利用率
• 配置
• 整体网络设计
如果发现任何异常,请收集日志、图表细节或任何相关错误信息。
硬件 运营商电路 验证运营商电路状态(如有)。 某些交叉连接在到达 Megaport 网络之前,会经过一个或多个运营商网络设备。

请验证交叉连接路径上的设备接口无错误,且光功率读数正常。
环境 数据中心核查 向数据中心提交工单。 如果错误仍然存在,请寻求数据中心的协助以核查以下事项:

• 检查交叉连接是否损坏,必要时进行清洁。

• 确保数据中心在其端的分界点外部发出的光功率充足。数据中心应使用光功率计在分界点进行检测。

• 您可以要求复位并更换 SFP、清洁并更换线缆、执行回环测试。
您的设备配置要求 自动协商 检查您的路由器配置。 根据您 LOA 中指定的 Megaport 设备,可能需要启用自动协商。

对于某些 1 Gbps 服务,这一点尤为重要,必须在路由器上启用自动协商。

查看 LOA 中 Customer Demarcation/Z Side 部分的底部。
如果自动协商设置为 On,则必须在路由器上启用它。

在接口上使用 negotiate auto 命令。
您的 Port 设置 LACP 设置 在 Portal 中检查您的 Port 设置。 如果 Port 属于 LAG,请启用 LACP;否则请确保将其禁用。 详细信息,参见 创建链路聚合组

排查 VXC

如果问题与您的 VXC 有关,请在联系 Megaport Support 之前先查看以下项目。

测试方法 步骤与操作 说明与分析
通过 Traceroute(或其他测试)定位症状 Traceroute 测试可帮助确定目标是否可达。

Traceroute:
• 在两点之间发送一串 UDP 数据包,并显示数据包经过的路径。

• 测量数据包在 IP 网络中的传输时延。

执行端到端 Traceroute 测试:
• 在发起流量的主机(A 端)上,对目标主机(B 端)发起 traceroute。

• 然后在目标主机上对源主机运行 traceroute。各设备上的命令与参数可能不同。
分析结果:

• 查找 traceroute 中响应时间显著增加的跳点;如有,判断这些时延是否发生在您自己的网络内。

• 核实是否有防火墙或访问控制列表(ACLs)阻止流量到达目标。
iPerf(吞吐量测试) iPerf 是一款跨平台工具,用于生成标准化性能测量并调优您的网络。

iPerf 同时具备客户端和服务器端功能,可创建数据流以测量两端之间的吞吐量,支持单向或双向。

推荐测试流程
我们建议进行 30 分钟的双向测试:先以 A 端为客户端、B 端为服务器进行测试,然后交换角色,以 B 端为客户端、A 端为服务器。每次测试之间预留约 10–15 分钟。该测试必须使用 UDP 运行。以下是在 A 端或 B 端运行的命令示例:

iperf3 -c -b1000m -t 900 -u

注意: 必须使用 UDP 流来测量连接两端之间的吞吐量,以避免 TCP 握手协商、拥塞避免和窗口机制等开销。
分析结果:

• 查找可能的非对称路由。通过 traceroute 可定位结果是否走了不同路径,这可能表明网络某处存在非对称路由。

• traceroute 中是否存在响应时间显著增加的跳点?如果有,这些时延是否发生在您的网络内?

测试完成后,请提供接口统计信息并截取以下内容的屏幕截图:

• 流量图表(如可用)

• 您网络中距离 Megaport 最近的入/出方向节点

• B 端入/出方向的流量图表(如可用)。

请在网络拓扑图上注明这些图表对应的设备、Port 和 VLAN。

下一步

如果上述故障排查步骤仍未解决问题,请联系 Megaport Support。提交请求时,请将下表中的信息整理为一个 .txt 文件,并同时提供以下四项必填信息。

  • Service ID(服务 ID) – 唯一的 8 位字母数字代码(这是 Megaport Support 团队最关键的信息)。 详细信息,参见 服务详细信息
  • Source/destination details(源/目的详细信息) – 每次执行的测试所对应的服务信息。
  • iPerf parameters(iPerf 参数) – 每次测试使用的具体设置。
  • Timestamp(时间戳) – 测试执行的准确时间和时区。
类别 详细信息
排查结果 详细提供您已执行的所有排查步骤。例如,如果放置了回环,请注明其位置以及朝向。
源 IP 地址与目的 IP 地址 源 IP 地址是发送数据包的主机的 IP 地址。目的 IP 地址是应接收数据包的主机的 IP 地址。
高层网络拓扑图 了解您的网络设计如何实现以及如何连接到 Megaport 网络,有助于在排查过程中确定需要重点关注的额外区域。

请提供包含路径上所有设备的网络拓扑图,并注明各设备涉及的 IP 地址和 VLAN。
Ping 测试结果 提供在该服务上执行的每次 ping 测试的输出。 如果您拥有与不同产品相关的多个服务(例如 Port 或 VXC),请提供所有测试输出。
Traceroute 结果 提供 traceroute 结果,并注明由连接的哪一侧发起测试、哪一侧为目标。建议使用来自 VXC 的 A 端和 B 端信息。
iPerf(吞吐量)测试结果 根据上述步骤提供所有数据,并补充与以下问题相关的任何信息:

您是否在网络中使用了流量整形?
如果在流量到达 Megaport 之前进行了整形、限速或过滤,我们在 Megaport 网络中可能只能看到已整形的入方向流量。客户和经销商必须确保 Megaport 网络之外使用的设备能够支持所需速率。

您是否已联系该连接的 B 端,以确认该侧路径不存在问题?
如适用,请提供工单编号。流量从 Megaport 的网络接口发往对端提供商接口后,我们不再对该流量具有控制权。

是否涉及其他提供商,例如电信运营商?如果网络中涉及运营商,是否已向其提交工单以调查潜在的路由问题?
如适用,请提供工单编号。请务必核实您是否使用电信运营商将流量在您的网络与 Megaport 之间转送,因为我们只能对经由我们设备的流量进行排查。例如,在流量到达我们的网络之前发生的任何丢包或其他问题,我们无法核查。

如果这是 Azure 连接,您是否按照“配置 Q-in-Q”中的说明,在 Megaport Portal 中使用了 Q-in-Q 选项?
使用 Q-in-Q 的 Azure 连接可能较为复杂,必须正确配置,才能确保流量正确送达 Megaport 并继续前往 Azure。有关详细信息,参见 配置 Q-in-Q
数据包捕获日志(可选) 数据包捕获(PCAP)日志有助于采集网络流量、监控带宽、检测恶意软件,并支持事件响应。若与问题相关,提供 PCAP 日志有助于更清晰地了解您的网络流量与行为。

注意

有关何时需要在数据中心安排现场工程师的更多信息,参见 客户现场服务

参考资料