吞吐量与性能故障排查
本主题解释如何对已订阅带宽与实际传输速率不一致、以及网络性能不稳定进行故障排查并定位原因。
Megaport 无法查看或访问 Megaport 网络之外的环境。要判断问题是否源自 Megaport 网络,Megaport Support 要求您先验证您设备的性能。
开始技术故障排查之前
在开始排查前,请确认您的服务未受到云服务提供商 (CSP) 或 Megaport 的计划维护或已知中断的影响。
-
关于 CSP 更新 – 检查您的电子邮件通知或访问该提供商的官方状态页面。
-
关于 Megaport 更新 – 直接在 Megaport Portal 中查看实时服务状态。 详细信息,参见 监控维护与中断事件。
另外,请在 Megaport Portal 中查看监控数据。以下项目是需要重点监控的关键字段。
-
Service Logs(服务日志) – 在 Portal 的 Logs 选项卡中检查上下线事件和开通历史。详细信息,参见 查看服务日志。
-
Usage Graphs(使用情况图表) – 查看 Usage 选项卡以分析流量模式、光功率水平和错误。 详细信息,参见 查看使用情况详细信息。
排查 Port 与交叉连接
如果问题与您的 Port 有关,请在联系 Megaport Support 之前先查看以下项目。
| 类别 | 排查步骤 | 操作 | 说明与分析 |
|---|---|---|---|
| 物理层 | 接口错误检查 | 检查设备上的接口或 CRC 错误以及丢包。 | 接口统计信息和日志有助于确定交叉连接的哪一端导致故障,并指明潜在的解决方案。 例如,某网络接口上的入方向错误数量不断增加,通常可以排除该 SFP 本身的问题,并指示交叉连接中其他部件可能存在故障。 |
| 硬件 | SFP 小型可插拔(SFP)是一种可热插拔的收发器,应用于数据通信和电信网络,实现两个设备之间的数据传输。 兼容性 |
检查您的 SFP。 确认您的 Port 容量。 检查您的交换机、路由器和防火墙型号。 检查固件版本。 |
确认光模块 SFP 的类型、速率、波长和光纤类型。 确保 SFP 符合 Megaport 规范(例如,1 Gbps 使用 1000BASE-LX,10 Gbps 使用 10GBASE-LR)。 详细信息,参见 技术规格。 |
| 光功率 | 光功率检查 | 验证设备上的 Tx/Rx 光功率。 检查发射(Tx)和接收(Rx)的光功率。 |
此健康检查可用于验证物理连通性。 如果未接收到 Rx 光,则服务处于中断状态。 如果观察到 Tx 和 Rx 光功率劣化,服务可能会被中断。建议检查物理连接。 如果与 Megaport 之间未发出(Tx)或未接收(Rx)光,可能由以下原因导致: • 光纤极性问题 – 在您侧对调双芯光纤以验证。 • 您的环境或交叉连接内的连通性问题 – 在您侧执行物理回环测试进行验证。 • Megaport 环境内的连通性问题 – 从您侧朝向 Megaport 执行物理回环测试进行验证。 |
| 硬件 | 网络 | 检查您的网络中的以下内容: • Port 利用率 • CPU 利用率 • 配置 • 整体网络设计 |
如果发现任何异常,请收集日志、图表细节或任何相关错误信息。 |
| 硬件 | 运营商电路 | 验证运营商电路状态(如有)。 | 某些交叉连接在到达 Megaport 网络之前,会经过一个或多个运营商网络设备。 请验证交叉连接路径上的设备接口无错误,且光功率读数正常。 |
| 环境 | 数据中心核查 | 向数据中心提交工单。 | 如果错误仍然存在,请寻求数据中心的协助以核查以下事项: • 检查交叉连接是否损坏,必要时进行清洁。 • 确保数据中心在其端的分界点外部发出的光功率充足。数据中心应使用光功率计在分界点进行检测。 • 您可以要求复位并更换 SFP、清洁并更换线缆、执行回环测试。 |
| 您的设备配置要求 | 自动协商 | 检查您的路由器配置。 | 根据您 LOA 中指定的 Megaport 设备,可能需要启用自动协商。 对于某些 1 Gbps 服务,这一点尤为重要,必须在路由器上启用自动协商。 查看 LOA 中 Customer Demarcation/Z Side 部分的底部。 如果自动协商设置为 On,则必须在路由器上启用它。 在接口上使用 negotiate auto 命令。 |
| 您的 Port 设置 | LACP 设置 | 在 Portal 中检查您的 Port 设置。 | 如果 Port 属于 LAG,请启用 LACP;否则请确保将其禁用。 详细信息,参见 创建链路聚合组。 |
排查 VXC
如果问题与您的 VXC 有关,请在联系 Megaport Support 之前先查看以下项目。
| 测试方法 | 步骤与操作 | 说明与分析 |
|---|---|---|
| 通过 Traceroute(或其他测试)定位症状 | Traceroute 测试可帮助确定目标是否可达。 Traceroute: • 在两点之间发送一串 UDP 数据包,并显示数据包经过的路径。 • 测量数据包在 IP 网络中的传输时延。 执行端到端 Traceroute 测试: • 在发起流量的主机(A 端)上,对目标主机(B 端)发起 traceroute。 • 然后在目标主机上对源主机运行 traceroute。各设备上的命令与参数可能不同。 |
分析结果: • 查找 traceroute 中响应时间显著增加的跳点;如有,判断这些时延是否发生在您自己的网络内。 • 核实是否有防火墙或访问控制列表(ACLs)阻止流量到达目标。 |
| iPerf(吞吐量测试) | iPerf 是一款跨平台工具,用于生成标准化性能测量并调优您的网络。 iPerf 同时具备客户端和服务器端功能,可创建数据流以测量两端之间的吞吐量,支持单向或双向。 推荐测试流程 我们建议进行 30 分钟的双向测试:先以 A 端为客户端、B 端为服务器进行测试,然后交换角色,以 B 端为客户端、A 端为服务器。每次测试之间预留约 10–15 分钟。该测试必须使用 UDP 运行。以下是在 A 端或 B 端运行的命令示例: iperf3 -c 注意: 必须使用 UDP 流来测量连接两端之间的吞吐量,以避免 TCP 握手协商、拥塞避免和窗口机制等开销。 |
分析结果: • 查找可能的非对称路由。通过 traceroute 可定位结果是否走了不同路径,这可能表明网络某处存在非对称路由。 • traceroute 中是否存在响应时间显著增加的跳点?如果有,这些时延是否发生在您的网络内? 测试完成后,请提供接口统计信息并截取以下内容的屏幕截图: • 流量图表(如可用) • 您网络中距离 Megaport 最近的入/出方向节点 • B 端入/出方向的流量图表(如可用)。 请在网络拓扑图上注明这些图表对应的设备、Port 和 VLAN。 |
下一步
如果上述故障排查步骤仍未解决问题,请联系 Megaport Support。提交请求时,请将下表中的信息整理为一个 .txt 文件,并同时提供以下四项必填信息。
- Service ID(服务 ID) – 唯一的 8 位字母数字代码(这是 Megaport Support 团队最关键的信息)。 详细信息,参见 服务详细信息。
- Source/destination details(源/目的详细信息) – 每次执行的测试所对应的服务信息。
- iPerf parameters(iPerf 参数) – 每次测试使用的具体设置。
- Timestamp(时间戳) – 测试执行的准确时间和时区。
| 类别 | 详细信息 |
|---|---|
| 排查结果 | 详细提供您已执行的所有排查步骤。例如,如果放置了回环,请注明其位置以及朝向。 |
| 源 IP 地址与目的 IP 地址 | 源 IP 地址是发送数据包的主机的 IP 地址。目的 IP 地址是应接收数据包的主机的 IP 地址。 |
| 高层网络拓扑图 | 了解您的网络设计如何实现以及如何连接到 Megaport 网络,有助于在排查过程中确定需要重点关注的额外区域。 请提供包含路径上所有设备的网络拓扑图,并注明各设备涉及的 IP 地址和 VLAN。 |
| Ping 测试结果 | 提供在该服务上执行的每次 ping 测试的输出。 如果您拥有与不同产品相关的多个服务(例如 Port 或 VXC),请提供所有测试输出。 |
| Traceroute 结果 | 提供 traceroute 结果,并注明由连接的哪一侧发起测试、哪一侧为目标。建议使用来自 VXC 的 A 端和 B 端信息。 |
| iPerf(吞吐量)测试结果 | 根据上述步骤提供所有数据,并补充与以下问题相关的任何信息: 您是否在网络中使用了流量整形? 如果在流量到达 Megaport 之前进行了整形、限速或过滤,我们在 Megaport 网络中可能只能看到已整形的入方向流量。客户和经销商必须确保 Megaport 网络之外使用的设备能够支持所需速率。 您是否已联系该连接的 B 端,以确认该侧路径不存在问题? 如适用,请提供工单编号。流量从 Megaport 的网络接口发往对端提供商接口后,我们不再对该流量具有控制权。 是否涉及其他提供商,例如电信运营商?如果网络中涉及运营商,是否已向其提交工单以调查潜在的路由问题? 如适用,请提供工单编号。请务必核实您是否使用电信运营商将流量在您的网络与 Megaport 之间转送,因为我们只能对经由我们设备的流量进行排查。例如,在流量到达我们的网络之前发生的任何丢包或其他问题,我们无法核查。 如果这是 Azure 连接,您是否按照“配置 Q-in-Q”中的说明,在 Megaport Portal 中使用了 Q-in-Q 选项? 使用 Q-in-Q 的 Azure 连接可能较为复杂,必须正确配置,才能确保流量正确送达 Megaport 并继续前往 Azure。有关详细信息,参见 配置 Q-in-Q。 |
| 数据包捕获日志(可选) | 数据包捕获(PCAP)日志有助于采集网络流量、监控带宽、检测恶意软件,并支持事件响应。若与问题相关,提供 PCAP 日志有助于更清晰地了解您的网络流量与行为。 |
注意
有关何时需要在数据中心安排现场工程师的更多信息,参见 客户现场服务。