Toggle navigation
Yiran Blog
Home
About
Tags
Yiran Blog
New post every day (with probability 0.03).
SIMON NSDI 2019
Network Tomography技术在数据中心测量的应用
核心思想 用网卡收集到的信息重构网络中队列信息、链路利用率等(Network Tomography技术) Measurement 和 monitoring 的三大挑战 准确性、可扩展性、速度 已有工作分类 分为 switch-based 和 edge-based. switch-based: 可以收集到很细粒度的信息,但是代价高,需要把多个交换机信息拼接在一起、大量带宽去传递...
Posted by Yiran on March 27, 2019
Pingmesh SIGCOMM 2015
Data Center Network Latency Measurement and Analysis
核心思想 构建一个大规模的数据中心latency测量和分析系统(微软) 网络运维面临的挑战 确定是否是网络的问题、定义和追踪SLA、network troubleshooting Design Pingmesh Controller: 负责产生pinglist.为了减少probe数目, 设计了多重complete gragh. 分为inter-dc和intra-dc. in...
Posted by Yiran on March 27, 2019
Flux NSDI 2019
Flow size prediction
核心思想 机器学习算法预测流的size, 除此之外的亮点:探讨了对流大小是不是知道的越多越好? 获取流大小 方法总结 应用提供 局限:有的应用一开始不知道大小;需要改应用API,对public cloud不适用 Flow aging (LAS PIAS) 局限:不适用于需要知道流确切大小的调度场景(fastpass、sincron...
Posted by Yiran on March 27, 2019
DETER NSDI 2019
Deterministic TCP Replay
核心思想 使得operator能够反复、确定地重放tcp的trace,从而使用各种工具,作出问题诊断。 Oh,,TCP能重放的话 就能量化不同bottleneck了!并且不需要改应用! 主要挑战 butterfly effect(蝴蝶效应)—a small timing variation causes a chain reaction between TCP and the netw...
Posted by Yiran on March 27, 2019
← Newer Posts
FEATURED TAGS
Measurement in Datacenter
TCP Performance Diagnosis
Flow Scheduling
Machine Learning
Network Troubleshooting
Programmable Switches
Congestion Control
Useful links
Deep Reinforcement Learning
Transport in Datacenter
Key-value Store
Load Balancing
Distributed Systems
OS Scheduling
microsecond-scale
ABOUT ME
✉️ yiran914@gmail.com