Yiran Blog

New post every day (with probability 0.03).

SIMON NSDI 2019

Network Tomography技术在数据中心测量的应用

核心思想 用网卡收集到的信息重构网络中队列信息、链路利用率等(Network Tomography技术) Measurement 和 monitoring 的三大挑战 准确性、可扩展性、速度 已有工作分类 分为 switch-based 和 edge-based. switch-based: 可以收集到很细粒度的信息,但是代价高,需要把多个交换机信息拼接在一起、大量带宽去传递...

Pingmesh SIGCOMM 2015

Data Center Network Latency Measurement and Analysis

核心思想 构建一个大规模的数据中心latency测量和分析系统(微软) 网络运维面临的挑战 确定是否是网络的问题、定义和追踪SLA、network troubleshooting Design Pingmesh Controller: 负责产生pinglist.为了减少probe数目, 设计了多重complete gragh. 分为inter-dc和intra-dc. in...

Flux NSDI 2019

Flow size prediction

核心思想 机器学习算法预测流的size, 除此之外的亮点:探讨了对流大小是不是知道的越多越好? 获取流大小 方法总结 应用提供 局限:有的应用一开始不知道大小;需要改应用API,对public cloud不适用 Flow aging (LAS PIAS) 局限:不适用于需要知道流确切大小的调度场景(fastpass、sincron...

DETER NSDI 2019

Deterministic TCP Replay

核心思想 使得operator能够反复、确定地重放tcp的trace,从而使用各种工具,作出问题诊断。 Oh,,TCP能重放的话 就能量化不同bottleneck了!并且不需要改应用! 主要挑战 butterfly effect(蝴蝶效应)—a small timing variation causes a chain reaction between TCP and the netw...