Yiran Blog

New post every day (with probability 0.03).

PTPmesh 2017

DC Network Latency Measurements Using PTP

核心思想 使用已有的PTP(IEEE 1588 Precision Time Protocol)进行数据中心网络latency和丢包率测量 PTP one-way delay: \(1/2 * (master\_to\_slave\_delay + slave\_to\_master\_delay)\) master-to-slave-delay: $ T1-T1^{’}$ ...

LossRadar CoNEXT 2016

Fast Detection of Lost Packets in DC

核心思想 专门用于快速检测丢包以及获取丢包详细信息的monitor system. 可以说是第一篇专门做数据中心丢包troubleshooting的文章,007在此文章之后. Packet Loss Background 丢包很常见并且对数据中心应用影响大:on average in a production data center for one year, up t...

Parameter Sever OSDI 2014

Scaling Distributed Machine Learning with PS

核心思想 分布式机器学习架构:Parameter Server. 首次将分布式参数服务器架构扩展到支持1000台服务器规模. A third generation open source implementation of a parameter server that focuses on the systems aspects of distributed inference. Ba...

HiPS SIGCOMM workshop 2018

Hierarchical Parameter Synchronization for DML

核心思想 设计了一种新的分布式机器学习(DML)参数同步算法。最大意义在于说明了拓扑对参数同步算法提供了优化空间。 Background and Motivation 已有的参数同步算法: PS-based synchronization (PS). 集中式, 较为常用(Tensorflow, Caffe, MXNet等). 两种角色: 参数服务器(Paremeter serv...

DPTP SOSR 2019

Time-synchronization in the Programmable Data Plane

核心思想 在可编程交换机数据平面实现时间同步协议. 亮点:非常详尽的可编程交换机各部分delay的测量 Motivation NTP (Network time protocol) 精度不够(软件timestamp) PTP标准 (IEEE 1588 Precise Time Protocol)精度高,能够实现纳秒级别的同步(硬件timestamp),但是由于通常由端主机软件...

QDPAS ICNP 2018

Queueing Delay Aware Packet Spraying

核心思想 根据队列排队延时进行端口选择,从而解决packet spraying的乱序问题。 Motivation 这篇论文是对paclet-level load balancing的工作的重要改进,解决其最明显的乱序问题。亮点:在motivation部分通过实验对已有packet-level,flow-level,flowlet-level的缺点进行了直观展示。 Ou...

Sincronia SIGCOMM 2018

Near-Optimal Network Design for Coflows

核心思想 设计一个能够基于任何支持优先级调度的传输协议的coflow调度机制。最大的贡献是理论证明了:只要给定一个合适的coflow的ordering, 任何per-flow的rate allocation按照这个ordering优先级调度, 都能够达到平均coflow完成时间是最优调度的4$\times$以内。 Motivation: 以前的coflow调度机制(Varys, Aalo...

Rate-Aware Flow Scheduling Infocom 2017

Rate-Aware Flow Scheduling for Commodity Data Center Networks

核心思想 已有流调度工作(pFabric, PASE, and PIAS)根据 Shortest Remaining Time First (SRTF)进行调度,认为剩余完成时间仅由流的size决定,没有考虑到应用产生数据的速率。论文设计了RAX,通过获取应用产生数据的速率以及size计算更加准确的剩余完成时间。 为什么要考虑data generation rate ...

DCQCN+ ICNP 2018

Taming Large-scale Incast Congestion in RDMA

解决问题 DCQCN是目前RDMA over Ethernet Networks的拥塞控制算法,但是大规模的incast导致其性能下降。 核心思想 动态参数控制:发送端需要知悉incast的规模, using a long period and a small increase step for large-scale incast, and a short period and a ...

Size-aware Sharding NSDI 2019

Size-aware Sharding For Improving Tail Latencies in In-memory Key-value Stores

解决问题 现有key-value store 99th percentile latency 大, 因为小的 request(请求的item size小)阻塞在大 request(请求的item size大)后面. 论文在background里通过实验说明了request的处理时间与item的size几乎成正比. 这是这篇论文基于size的方法的一个重要observation和前提. 核...