Skip to content

Latest commit

 

History

History
53 lines (31 loc) · 3.05 KB

ovs-dpdk.md

File metadata and controls

53 lines (31 loc) · 3.05 KB

OVS DPDK

OVS在实现中分为用户空间和内核空间两个部分。用户空间拥有多个组件,它们主要负责实现数据交换和OpenFlow流表功能,还有一些工具用于虚拟交换机管理、数据库搭建以及和内核组件的交互。内核组件主要负责流表查找的快速通道。OVS的核心组件及其关联关系如图

ovs internal

下图显示了OVS数据通路的内部模块图

ovs software architecture

  • ovs-vswitchd主要包含ofprotodpifnetdev模块
    • ofproto模块实现openflow的交换机
    • dpif模块抽象一个单转发路径
    • netdev模块抽象网络接口(无论物理的还是虚拟的)
  • openvswitch.ko主要由数据通路模块组成,里面包含着流表。流表中的每个表项由一些匹配字段和要做的动作组成。

DPDK加速的思想就是专注在这个数据通路上

ovs with dpdk

ovs with dpdk

ovs with dpdk architecture

ovs architecture process

  • dpif-netdev:用户态的快速通路,实现了基于netdev设备的dpif API
  • Ofproto-dpif:实现了基于dpif层的ofproto API
  • netdev-dpdk:实现了基于DPDKnetdev API,其定义的几种网络接口如下:
  • dpdk物理网口:其实现是采用高性能向量化DPDK PMD的驱动。
  • dpdkvhostuserdpdkvhostcuse接口:支持两种DPDK实现的vhost优化接口:vhost-uservhost-cusevhost-uservhost-cuse可以挂接到用户态的数据通道上,与虚拟机的virtio网口快速通信。如第12章所说,vhost-cuse是一个过渡性技术,vhost-user是建议使用的接口。为了性能,在vhost burst收发包个数上,需要和dpdk物理网口设置的burst收发包个数相同。
  • dpdkr:其实现是基于DPDK librte_ring机制创建的DPDK ring接口。dpdkr接口挂接到用户态的数据通道上,与使用了IVSHMEM的虚拟机合作可以通过零拷贝技术实现高速通信。

DPDK加速的OVS数据流转发的大致流程如下:

  1. OVSovs-vswitchd接收到从OVS连接的某个网络端口发来的数据包,从数据包中提取源/目的IP、源/目的MAC、端口等信息。
  2. OVS在用户态查看精确流表和模糊流表,如果命中,则直接转发。
  3. 如果还不命中,在SDN控制器接入的情况下,经过OpenFlow协议,通告给控制器,由控制器处理。
  4. 控制器下发新的流表,该数据包重新发起选路,匹配;报文转发,结束。

DPDK加速的OVS与原始OVS的区别在于,从OVS连接的某个网络端口接收到的报文不需要openvswitch.ko内核态的处理,报文通过DPDK PMD驱动直接到达用户态ovs-vswitchd里。

Packet Flow

ovs packet flow

网络存储优化

network-storage-optimization