05 BGP(2020.0518)

BGP概述

动态路由协议可以按照工作范围分为IGP(rip\ospf\eigrp\isis)以及EGP(bgp)。IGP工作在同一个AS内,主要用来发现和计算路由,为AS内提供路由信息的交换;而EGP工作在AS与AS之间,在AS间提供无环路的路由信息交换,BGP则是EGP的一种。

自治系统AS

由同一个技术管理机构管理、使用统一选路策略的一些路由器的集合。自治系统内部的路由协议IGP,自治系统之间的路由协议EGP。

  • EGP,运行于AS之间的路由协议,现通常都是指BGP。BGP着重于控制路由的传播和选择最优的路由。
  • IGP,运行于AS内部的路由协议,主要有: RIP, OSPF及ISIS。IGP着重于发现和计算路由。

BGP特征

  • BGP是外部路由协议,用来在AS之间传递路由信息
  • 是一种增强的距离矢量路由协议
    • 可靠的路由更新机制(TCP端口号179
    • 丰富的Metric度量方法
    • 从设计上避免了环路的发生
  • 为路由附带属性信息
  • 支持CIDR(无类别域间选路)
  • 丰富的路由过滤和路由策略
    BGP重启进程之前要考虑好,因为路由信息庞大,更新极其缓慢

BGP版本:rfc1105-bgpv1;rfc1163-bgpv2;rfc1267-bgpv3;rfc4271/1771-bgpv4

BGP基本工作机制

BGP路由传递

BGP对等体的建立、更新和删除等交互过程主要有5种报文、6种状态机和5个原则

BGP可靠的路由更新

  • 传输协议:TCP,端口号179
  • 无需周期性更新
  • 路由更新:只发送增量路由
  • 周期性发送keepAlive报文检测TCP的连通性

使用场景

  • 适应
    • 让IP报文通过本路由器到达其他AS
    • 有多条到达其他AS的链路,可以不同路由分别进行选路由
    • 需要进行流量控制或控制选路
  • 不适应
    • 网络简单,只有单个出口
    • 设备性能够不够(CPU,内存等)
    • 能力够不够(对BGP要有足够的理解,足够的熟练度)

术语

  1. Peer(对等体,邻居),BGP的邻居称为BGP的peer
  2. Speaker,运行了BGP的设备叫BGP Speaker
  3. AS
  4. IBGP和EBGP
  5. NLRI(网络可达信息)是BGP更新报文的一部分,携带BGP的属性和路由
  6. 同步:是IBGP与IGP的同步,从IBGP收到一条路由,是否要通告给EBGP邻居,要看同步情况
  7. BGP的水平分割:从IBGP收到的路由,不会再通告给他的IBGP邻居,是为了防环

BGP消息类型

BGP报文有五种类型,其中Open、KeepAlive、Notification报文用于邻居关系的建立和维护
BGP报文由BGP报文头和具体报文内容两部分组成,消息最长为4096字节,最短为19字节(只包含报文头)。
报文头帧格式
报文头帧格式

  • Marker:占16字节,用于检查BGP对等体的同步信息是否完整,以及用于BGP验证的计算。不使用验证时所有比特均为1(十六进制则全“FF”)。
  • Length:占2个字节(无符号位),BGP消息总长度(包括报文头在内),以字节为单位。长度范围是19~4096
  • Type:占1个字节(无符号位),BGP消息的类型。Type有5个可选值,表示BGP报文头后面所接的5类报文: 1 OPEN ;2 UPDATE ;3 NOTIFICATION ;4 KEEPALIVE ;5 REFRESH。

Open

负责和对等体建立邻居关系。主要包括BGP版本、AS号等信息,试图建立BGP邻居关系的两个路由器在建立了TCP会话之后开始叫唤Open信息已确认能否形成邻居关系。

报文格式

OPEN报文格式
OPEN报文参数
AFI及SAFI编码说明

KeepAlive

该消息在对等体之间周期性地发送,用以维护连接。

报文格式

如果BGP报文头中的TYPE为4,则该报文为KEEPALIVE报文。KEEPALIVE报文用于保持BGP连接。KEEPALIVE报文只有BGP报文头,没有具体内容,故其报文长度应固定为19个字节。

Update

该消息被用来在BGP对等体之间传递路由信息。包含撤销、撤销路由和可达路由信息及其各种路由属性,是BGP报文中最重要的报文。

报文格式

UPDATE报文格式
UPDATE报文参数
路由属性的类型号列表

Notification

当BGP Speaker检测到错误的时候,就发送该消息给对等体。BGP的差错检测机制,一旦检测到任何形式的差错,BGP Speaker会发送一个Notification报文,随后与之相关的邻居关系将被关闭。

报文格式

NOTIFICATION报文格式
  • Error code:占1个字节(无符号位),定义错误的类型,非特定的错误类型用零表示。
  • Error subcode:占1个字节(无符号位),指定错误细节编号,非特定的错误细节编号用零表示。
  • Data:指定错误数据内容。
    错误码

Route-refresh

用来通知对等体自己支持路由刷新能力。

报文格式

REFRESH报文格式

BGP状态机

BGP状态机
BGP状态机2

  1. Idle状态是BGP初始状态。在Idle状态下,BGP拒绝邻居发送的连接请求。只有在收到本设备的Start事件后,BGP才开始尝试和其它BGP对等体进行TCP连接,并转至Connect状态。

说明:

Start事件是由一个操作者配置一个BGP过程,或者重置一个已经存在的过程或者路由器软件重置BGP过程引起的
任何状态中收到Notification报文或TCP拆链通知等Error事件后,BGP都会转至Idle状态。

  1. 在Connect状态下,BGP启动连接重传定时器(Connect Retry),等待TCP完成连接。
    • 如果TCP连接成功,那么BGP向对等体发送Open报文,并转至OpenSent状态。
    • 如果TCP连接失败,那么BGP转至Active状态。
    • 如果连接重传定时器超时,BGP仍没有收到BGP对等体的响应,那么BGP继续尝试和其它BGP对等体进行TCP连接,停留在Connect状态。
  2. 在Active状态下,BGP总是在试图建立TCP连接。
    • 如果TCP连接成功,那么BGP向对等体发送Open报文,关闭连接重传定时器,并转至OpenSent状态。
    • 如果TCP连接失败,那么BGP停留在Active状态。
    • 如果连接重传定时器超时,BGP仍没有收到BGP对等体的响应,那么BGP转至Connect状态。
  3. 在OpenSent状态下,BGP等待对等体的Open报文,并对收到的Open报文中的AS号、版本号、认证码等进行检查。
    • 如果收到的Open报文正确,那么BGP发送Keepalive报文,并转至OpenConfirm状态。
    • 如果发现收到的Open报文有错误,那么BGP发送Notification报文给对等体,并转至Idle状态。
  4. 在OpenConfirm状态下,BGP等待Keepalive或Notification报文。如果收到Keepalive报文,则转至Established状态,如果收到Notification报文,则转至Idle状态。
  5. 在Established状态下,BGP可以和对等体交换Update、Keepalive、Route-refresh报文和Notification报文。
    • 如果收到正确的Update或Keepalive报文,那么BGP就认为对端处于正常运行状态,将保持BGP连接。
    • 如果收到错误的Update或Keepalive报文,那么BGP发送Notification报文通知对端,并转至Idle状态。
    • Route-refresh报文不会改变BGP状态。
    • 如果收到Notification报文,那么BGP转至Idle状态。
    • 如果收到TCP拆链通知,那么BGP断开连接,转至Idle状态。

BGP路由通告原则

  1. 连接建立时,BGP Speaker只把本身用的最优路由通告给对等体;多条路径时,BGP Speaker只选最优的路由放入路由表
  2. BGP Speaker从EBGP获得的路由会向它所有BGP对等体通告(包括EBGP和IBGP)。
    EBGP收到的路由通告给IBGP不会修改下一跳EBGP通告给EBGP会自动修改)。如果需要修改下一跳为自身,则需要进行配置。
    IBGP是为EBGP服务的,用于承载EBGP路由,传递给其他AS。
  3. BGP Speaker从IBGP获得的路由不会通告给它的IBGP邻居。
    IBGP逻辑全互连,导致AS内部路由器需要维护更多的IBGP会话,解决方案:路由反射器和联盟
  4. BGP Speaker从IBGP获得的路由是否通告给它的EBGP对等体要依IGP和BGP同步的情况来决定。
    BGP与IGP同步(华为设备无法同步)的概念:BGP Speaker不将从IBGP对等体获得的路由信息通告给它的EBGP对等体,除非该路由信息也能通过IGP获得

总结

  1. 从IBGP对等体获得的BGP路由,BGP设备只发布给它的EBGP对等体
  2. 从EBGP对等体获得的BGP路由,BGP设备发布给它所有EBGP和IBGP对等体
  3. 当存在多条到达同一目的地址的有效路由时,BGP设备只将最优路由发布给对等体
  4. 路由更新时,BGP设备只发送更新的BGP路由
  5. 所有对等体发送的路由,BGP设备都会接收。

BGP的路由黑洞

简单的说,它会默默的将数据包丢弃,使所有数据包有去无回,主要原因是没有相应的路由
BGP的路由黑洞
举例:AR6无法ping通AR1的11.11.11.11,主要是AR5的路由表中11.11.11.11的下一跳是2.2.2.2(AR5和AR2没有直连),在其转发表中2.2.2.2的下一跳是35.1.1.3(或者45.1.1.4),但是AR3(或者AR4)中没有关于11.11.11.11的路由,导致所有涉及11.11.11.11的数据包被丢弃。

解决路由黑洞方法

  1. 开启同步(思科支持),华为不支持。开启同步后,从IBGP收到的路由,如果IGP中不存在,就不会通告EBGP邻居。【即AR5中不存在11.11.11.11/32,所以AR5不会讲此路由通告给AR6】
  2. 物理线路直连(不可取),但是可以使用GRE隧道。【即在AR2和AR5之间建立GRE通道】
  3. 全互联可以解决 ,管理成本增加。
  4. RR(配置路由反射器)。路由反射器不是解决路由黑洞的,是解决水平分割的问题。【在R3上配置RR,R2和R5不再需要配置BGP邻居】
  5. 联邦是用来解决水平分割的问题,但也可以解决路由黑洞。
  6. 将EBGP路由引入IGP可以解决路由黑洞 (不可取),会造成IGP负担过重。
  7. MPLS网络。
  8. 可以在黑洞设备上配置静态也可以解决(不可取)。

BGP路由的来源

成为BGP路由的3个来源:

  1. network命令
    BGP的network命令为通告路由,把IGP(比如OSPF)发现的路由信息通过network命令注入到BGP设备的BGP路由表中需要严格匹配掩码。network宣告的路由的起源属性为i 。本地该路由的下一跳是0.0.0.0。
  2. import-route命令
    通过import-route命令把IGP路由或静态路由注入到BGP设备的BGP路由表中,import-route引入的路由的起源属性为?。
  3. aggregate命令
    聚合路由,本地该路由的下一跳是127.0.0.1

BGP路径属性

BGP路径属性是一组描述BGP前缀特性的参数,公认属性是所有BGP路由器都必须识别的属性,可选属性不需要都被BGP路由器所识别,可以分为四大类:

公认必遵

所有BGP路由器都可以识别,且必须存在于Update消息中。如果缺少这种属性,路由信息就会出错。例如:

  1. Origin:起源属性
    一般的,具体的实现按如下方式决定一条路由的Origin属性:
    • 某条路由是直接而具体的注入到BGP路由表中的,则origin属性为IGP
      • 通过network命令注入BGP的路由
    • 通过EGP学到的路由,则origin属性为EGP
    • 其他情形下,Origin属性都为 Incomplete
      • 通过import命令注入BGP的路由
        Origin属性值默认情况下不被任何路由器修改
        路由优先级:i(network宣告) 优于 e(EGP) 优于 ?(import-route引入的路由)
  2. AS_Path
    用于防环和选路,在默认情况下,BGP是通过AS号来检测路由环路的。
  3. Next_Hop
    BGP设备在向EBGP对等体发布某一条路由时,会把该路由信息的下一跳属性 设置为 本地与对端建立BGP邻居关系的接口地址
    BGP设备将本地始发路由发布给IBGP对等体时,会把该路由信息的下一跳属性 设置为 本地与对端建立BGP邻居关系的接口地址
    BGP设备在向IBGP对等体发布从EBGP对等体学来的路由时,并不改变该路由信息的下一跳属性

公认任意

所有BGP路由器都可以识别,但不要求必须存在于Update消息中,可以根据具体情况来决定是否添加到Update消息中。例如:

  1. Local_Pref
    在某些情况下,一个ISP可能通过两条高速链路连接两个大的ISP作为自己到INTERNET的出口(越大越优)
    Local_Pref属性可以针对 IBGP的出\入 方向和 EBGP的入 方向调用,但是不能针对 EBGP的出 方向调用。
    # 使用路由策略修改Local_Pref值,使得访问44.44.44.44和55.55.55.55的走不通的链路,从而实现选路功能
    acl number 2001  
    rule 5 permit source 44.44.44.44 0 
    acl number 2002  
    rule 5 permit source 55.55.55.55 0 
    
    route-policy Local-pre permit node 10 
    if-match acl 2001 
    apply local-preference 150 
    route-policy Local-pre permit node 20 
    if-match acl 2002 
    apply local-preference 200 
    route-policy Local-pre permit node 30 
    
    bgp 100
    peer 14.1.1.4 route-policy Local-pre import
    
  2. Atomic_Aggregate

可选过渡

BGP路由器可以选择是否在Update消息中携带这种属性。接收的路由器如果不识别这种属性,可以转发给邻居路由器,邻居路由器可能会识别并使用到这种属性。例如:

  1. Aggregator
  2. Community
    团体属性是由一系列4字节(0x00000000-0xFFFFFFFF)数值所组成
    • 保留团体属性
      • 0x00000000-0x0000FFFF
      • 0xFFFF0000-0xFFFFFFFF
    • 公认团体属性
      • NO_EXPORT(0xFFFFFF01):路由器收到带有这一团体值的路由后,不应把该路由通告给一个联盟之外的对等体

      • NO_ADVERTISE(0xFFFFFF02):路由器收到带有这一团体值的路由后,不应该把该路由通告给任何的BGP对等体

      • NO_EXPORT_SUBCONFED(0xFFFFFF03):路由器收到带有这一团体值的路由后,可以把该路由通告给它的IBGP对等体,但不能通告给任何EBGP对等体(包括联盟内的EBGP对等体)

    • 私有团体属性
      • AS(2B):Number(2B)
       # 通过路由策略和团体属性的结合,达到路由传递范围的限制
       # AR4:as200,AR1:as100
       # AR4:添加no-export属性
       route-policy Comm permit node 10 
       apply community no-export 
       bgp 200
       peer 14.1.1.1 route-policy Comm export
       peer 14.1.1.1 advertise-community
       # AR1:去掉no-export属性,从而可以使得该条路由继续通告
       ip community-filter 10 permit no-export
       route-policy Comm permit node 10 
       apply community none
       # AR1:在现有团体属性基础上添加新的团体属性100:100
       route-policy COMM_NO_noexport permit node 10
       if-match community-filter 10
       apply community 100:100 additive
      

可选非过渡

BGP路由器可以选择是否在Update消息中携带这种属性。在整个路由发布的路径上,如果部分路由器不能识别这种属性,可能会导致该属性无法发挥效用。因此接收的路由器如果不识别这种属性,将丢弃这种属性,不必再转发给邻居路由器。例如:

  1. Multi_Exit_Disc
    MED(和cost值类似)用来区别达到同一邻居AS的多条入口链路(MED值越小越优),通过EBGP发送MED值给对等体。
    MED属性可以针对 EBGP\IBGP 的 出\入 方向调用。
    从不同AS过来的路由是不会比较med的,可以通过compare-different-as-med忽略AS。
    # 使用路由策略修改MED值,使得20.20.20.20和21.21.21.21的优先级不相同,从而实现选路功能
    acl number 2020  
    rule 5 permit source 20.20.20.20 0 
    acl number 2021  
    rule 5 permit source 21.21.21.21 0 
    
    route-policy Med permit node 10
    if-match acl 2020
    apply cost 50   # 华为没有med,此处修改的是cost值
    route-policy Med permit node 20 
    if-match acl 2021 
    apply cost 100 
    
    peer 35.1.1.5 route-policy Med export  # 在邻居上使用路由规则(出方向)
    
  2. Originator ID
  3. Cluster List

BGP路径选择过程(选路规则:按照数字顺序依次进行选路)

  1. 如果此路由的下一跳不可达,忽略此路由
  2. Preferred-Value值数值高的优先(只在本地有效)
    route-policy Prefer permit node 10
    apply preferred-value 200
    bgp 100
    peer 3.3.3.3 route-policy Pref import
    
  3. Local-Preference值最高的路由优先
  4. 聚合路由优先于非聚合路由
  5. 本地手动聚合路由的优先级高于本地自动聚合的路由
  6. 本地通过network命令引入的路由的优先级高于本地通过import-route命令引入的路由
  7. AS路径的长度最短的路径优先
  8. 比较Origin属性,IGP优于EGP,EGP优于Incomplete(即i优e优于?)
  9. 选择MED较小的路由
  10. EBGP路由优于IBGP路由
  11. BGP优先选择到BGP下一跳的IGP度量最低的路径
    当以上全部相同,则为等价路由,可以负载分担
    【注】:A S-Path必须一致
    当负载分担时,以下3条原则无效
    1. 比较Cluster List长度,短者优先
    2. 比较Originator_ID(如果没有Originator_ID,则用Router ID比较),选择数值较小的路径
    3. 比较对等体的IP地址,选择IP地址数值最小的路径

当到达同一目的地存在多条路由时,BGP依次对比下列属性来选择路由:

  1. 优选协议首选值(Pref_Val)最高的路由。【对比思科的权重weight】协议首选值(Pref_Val)是华为设备的特有属性,该属性仅在本地有效
  2. 优选本地优先级(Local_Pref)最高的路由。如果路由没有本地优先级,BGP选路时将该路由按缺省的本地优先级100来处理
  3. 依次优选手动聚合路由、自动聚合路由、network命令引入的路由、import-route命令引入的路由、从对等体学习的路由。【对比思科,本地起源即本地通告产生的路由】
  4. 优选AS路径(AS_Path)最短的路由。【与思科相同,此为公认必遵属性】
  5. 依次优选Origin类型为IGP、EGP、Incomplete的路由。【与思科相同,此为公认必遵属性】
    -.-.-.-.-.-.-.--.-.-.-.-.-.-.--.-.-.-.-.-.-.-.-.-.-.-.-.-.-
  6. 对于来自同一AS的路由,优选MED值最低的路由
  7. 依次优选EBGP路由、IBGP路由、LocalCross路由、RemoteCross路由
  8. 优选到BGP下一跳IGP度量值(metric)最小的路由。【6、7、8选路原则也相同,此处思科如果在前8条选路原则选择不出最优路由,则使能负载均衡,华为也有相同的属性,命令为maximum load-balancing [ebgp|ibgp] number,配置BGP负载分担的最大等价路由条数。缺省情况下,BGP负载分担的最大等价路由条数为1,即不进行负载分担】
    -.-.-.-.-.-.-.--.-.-.-.-.-.-.--.-.-.-.-.-.-.-.-.-.-.-.-.-.-
    华为并未说明优选更“老”(建立时间更久)的BGP
  9. 优选Cluster_List最短的路由。【对比思科,华为在此处第9条和第10条颠倒】
  10. 优选Router_ID最小的设备发布的路由(可以由路由反射器的Oringinator_ID代替)
  11. 优选从具有最小IP地址的对等体学来的路由
    记忆华为选路原则:世界恋爱组织亚洲办公室,纪念碑下的半兽人
```shell
世界恋爱组织亚洲办公室;纪念碑;半兽人
分别对应的英文单词为:
1、W(world) Weight
2、L(love)local preference,本地优先级
3、O(organization)Sourced,本地起源
4、A(asia)AS-PATH
5、O(Office)Origin,起源代码
---
6、M,MED,多出口分离器
7、E,EBGP优于IBGP
8、M,到达更新源的metric小的下一跳
9、L,负载均衡
---
10、O,建立时间更久的EBGP邻居
11、R,更小的RID
12、C,更短的Cluster-list
13、优选来自用最低地址建立BGP 连接的邻居的路由条目
最重要的,下一跳可达是选路的前提条件
```

BGP的防环机制

  • EBGP:通过as-path属性,丢弃从EBGP对等体接收到的在as-path属性里包含自身as号的任何更新信息
  • IBGP:BGP路由器不会将任何从IBGP对等体接收到的更新信息传给其他IBGP对等体
    • IBGP防环机带来的问题
      • 为确保更新信息可以到达所有的IBGP对等体
        • 解决方案:IBGP Speaker与IBGP Speaker之间要保证会话的全互连【从而又带来了IBGP会话数n(n1)/2n(n-1)/2的问题,即IBGP设备过多之后导致维护成本增加】
      • 路由反射(Route Reflector,RR):适合现有网络的改造
      • 联盟(Confederation):适合新网络的搭建

BGP路由反射器

角色

BGP路由反射器
  • 路由反射器RR(Route Reflector):允许把从IBGP对等体学到的路由反射到其他IBGP对等体的BGP设备,类似OSPF网络中的DR。
  • 客户机(Client):与RR形成反射邻居关系的IBGP设备。在AS内部客户机只需要与RR直连
  • 非客户机(Non-Client):既不是RR也不是客户机的IBGP设备。在AS内部非客户机与RR之间,以及所有的非客户机之间仍然必须建立全连接关系
  • 始发者(Originator):在AS内部始发路由的设备。Originator_ID属性用于防止集群内产生路由环路
  • 集群(Cluster):路由反射器及其客户机的集合。Cluster_List属性用于防止集群间产生路由环路。

路由反射宣告原则

  1. 从非客户机IBGP学到的路由,发布给此RR的所有客户机和EBGP对等体
  2. 从客户机学到的路由,发布给此RR所有非客户机和客户机(发起此路由的客户机除外)
  3. 从EBGP对等体学到的路由,发布给所有的非客户机和客户机

路由反射簇(即路由反射集群,Cluster)

当一个AS内存在多台RR为Client提供冗余时,RR间的路由更新很有可能会形成环路,为防止该现象,需要使用Cluster。

  • 通过4字节的Cluster_ID来标识Cluster,通常会使用LoopBack地址作为Cluster_ID
  • 一个Cluster里可以包括一个或者多个RR;一个Client可以同时属于多个Cluster

Originator_ID属性

Originator ID由RR产生,使用的Router ID的值标识路由的始发者,用于防止集群内产生路由环路。

  • 当一条路由第一次被RR反射的时候,RR将Originator_ID属性加入这条路由,标识这条路由的发起设备。如果一条路由中已经存在了Originator_ID属性,则RR将不会创建新的Originator_ID属性。
  • 当设备接收到这条路由的时候,将比较收到的Originator ID和本地的Router ID,如果两个ID相同,则不接收此路由。

Cluster_List属性

路由反射器和它的客户机组成一个集群(Cluster),使用AS内唯一的Cluster ID作为标识。为了防止集群间产生路由环路,路由反射器使用Cluster_List属性,记录路由经过的所有集群的Cluster ID。

  • 当一条路由第一次被RR反射的时候,RR会把本地Cluster ID添加到Cluster List的前面。如果没有Cluster_List属性,RR就创建一个。
  • 当RR接收到一条更新路由时,RR会检查Cluster List。如果Cluster List中已经有本地Cluster ID,丢弃该路由;如果没有本地Cluster ID,将其加入Cluster List,然后反射该更新路由。

备份路由反射器

为增加网络的可靠性,防止单点故障对网络造成影响,有时需要在一个集群中配置一个以上的RR。由于RR打破了从IBGP对等体收到的路由不能传递给其他IBGP对等体的限制,所以同一集群内的RR之间中可能存在环路。这时,该集群中的所有RR必须使用相同的Cluster ID,以避免RR之间的路由环路。
备份路由反射器
路由反射器RR1和RR2在同一个集群内,配置了相同的Cluster ID

  1. 当客户机Client1从EBGP对等体接收到一条更新路由,它将通过IBGP向RR1和RR2通告这条路由。
  2. RR1和RR2在接收到该更新路由后,将本地Cluster ID添加到Cluster List前面,然后向其他的客户机(Client2、Client3)反射,同时相互反射。
  3. RR1和RR2在接收到该反射路由后,检查Cluster List,发现自己的Cluster ID已经包含在Cluster List中。于是RR1和RR2丢弃该更新路由,从而避免了路由环路。

多集群路由反射器

一个AS中可以存在多个集群,各个集群的RR之间建立IBGP对等体。当RR所处的网络层不同时,可以将较低网络层次的RR配成客户机,形成分级RR。当RR所处的网络层相同时,可以将不同集群的RR全连接,形成同级RR。

分级路由反射器

在实际的RR部署中,常用的是分级RR的场景。ISP为AS100提供Internet路由。AS100内部分为两个集群,其中Cluster1内的四台设备是核心路由器,采用备份RR的形式保证可靠性。
分级路由反射器

同级路由反射器

同级路由反射器
一个骨干网被分成多个集群。各集群的RR互为非客户机关系,并建立全连接。此时虽然每个客户机只与所在集群的RR建立IBGP连接,但所有RR和客户机都能收到全部路由信息。

BGP联盟

解决AS内部的IBGP网络连接激增问题,除了使用路由反射器之外,还可以使用联盟(Confederation)。联盟将一个AS划分为若干个子AS每个子AS内部建立IBGP全连接关系,子AS之间建立联盟EBGP连接关系,但联盟外部AS仍认为联盟是一个AS。配置联盟后,原AS号将作为每个路由器的联盟ID。这样有两个好处

  • 可以保留原有的IBGP属性,包括Local Preference属性、MED属性和NEXT_HOP属性等;
  • 联盟相关的属性在传出联盟时会自动被删除,即管理员无需在联盟的出口处配置过滤子AS号等信息的操作。
    BGP联盟
    AS100使用联盟后被划分为3个子AS:AS65001、AS65002和AS65003,使用AS100作为联盟ID。此时IBGP的连接数量从10条减少到4条,不仅简化了设备的配置,也减轻了网络和CPU的负担。而AS100外的BGP设备因为仅知道AS100的存在,并不知道AS100内部的联盟关系,所以不会增加CPU的负担。

路由反射器和联盟的比较

路由反射器 联盟
不需要更改现有的网络拓扑,兼容性好 需要改变逻辑拓扑
配置方便,只需要对作为反射器的设备进行配置,客户机并不需要知道自己是客户机 所有设备需要重新进行配置
集群与集群之间仍然需要全连接 联盟的子AS之间是特殊的EBGP连接,不需要全连接
适用于中、大规模网络(对现有网络进行改造) 适用于大规模网络(新建大型网络)

实验

实验一:简单配置BGP

简单配置BGP
  • 华为BGP如果用默认路由,邻居可以正常UP,但是路由不是有效的
  • 思科BGP如果用默认路由建立,邻居不会UP
  • IBGP通常用环回口建,EBGP通常能直连建立邻居,一台设备只能启用一个BGP进程
  • BGP设备将EBGP路由传递给IBGP时不会修改下一跳,需要手工配置修改
  • BGP的水平分割:从IBGP收到的路由,不会传递给IBGP邻居
# ...........................初始化配置
# AR1
sys 
sys AR1
int lo 0
ip addr 1.1.1.1 32
int lo 10
ip addr 11.11.11.11 32
int g0/0/0
ip addr 12.1.1.1 24
# AR2
sys 
sys AR2
int lo 0
ip addr 2.2.2.2 32
int g0/0/0
ip addr 12.1.1.2 24
int g0/0/1
ip addr 23.1.1.2 24
int g0/0/2
ip addr 24.1.1.2 24
# AR3
sys 
sys AR3
int lo 0
ip addr 3.3.3.3 32
int g0/0/0
ip addr 23.1.1.3 24
int g0/0/1
ip addr 35.1.1.3 24
# AR4
sys 
sys AR4
int lo 0
ip addr 4.4.4.4 32
int g0/0/0
ip addr 24.1.1.4 24
int g0/0/1
ip addr 45.1.1.4 24
# AR5
sys 
sys AR5
int lo 0
ip addr 5.5.5.5 32
int g0/0/0
ip addr 35.1.1.5 24
int g0/0/1
ip addr 45.1.1.5 24
int g0/0/2
ip addr 56.1.1.5 24
# AR6
sys 
sys AR6
int lo 0
ip addr 6.6.6.6 32
int lo 10
ip addr 66.6.6.66.66 32
int g0/0/0
ip addr 56.1.1.6 24
# ......................................配置OSPF,保证IBGP内网络连通
# AR2
ospf 10 router-id 2.2.2.2
area 0
net 23.1.1.2 0
net 24.1.1.2 0
net 2.2.2.2 0
int g0/0/1
ospf network-type p2p
int g0/0/2
ospf network-type p2p
# AR3
ospf 10 router-id 3.3.3.3
area 0
net 23.1.1.3 0
net 35.1.1.3 0
net 3.3.3.3 0
int g0/0/0
ospf network-type p2p
int g0/0/1
ospf network-type p2p
# AR4
ospf 10 router-id 4.4.4.4
area 0
net 24.1.1.4 0
net 45.1.1.4 0
net 4.4.4.4 0
int g0/0/0
ospf network-type p2p
int g0/0/1
ospf network-type p2p
# AR4
ospf 10 router-id 5.5.5.5
area 0
net 34.1.1.5 0
net 45.1.1.5 0
net 5.5.5.5 0
int g0/0/0
ospf network-type p2p
int g0/0/1
ospf network-type p2p
# .....................................配置BGP
# AR1
bgp 100
router-id 1.1.1.1
peer 12.1.1.2 as-number 200
peer 2.2.2.2 as-number 200
peer 2.2.2.2 connect-interface lo 0
peer 2.2.2.2 ebgp-max-hop 2
network 11.11.11.11 32
# AR2
bgp 200
router-id 2.2.2.2
peer 12.1.1.1 as-number 100
peer 1.1.1.1 as-number 100
peer 1.1.1.1 connect-interface lo 0
peer 1.1.1.1 ebgp-max-hop 2
peer 3.3.3.3 as-number 200
peer 3.3.3.3 connect-interface lo 0
peer 4.4.4.4 as-number 200
peer 4.4.4.4 connect-interface lo 0
# AR3
bgp 200
router-id 3.3.3.3
peer 2.2.2.2 as-number 200
peer 2.2.2.2 connect-interface lo 0
peer 5.5.5.5 as-number 200
peer 5.5.5.5 connect-interface lo 0
# AR4
bgp 200
router-id 4.4.4.4
peer 2.2.2.2 as-number 200
peer 2.2.2.2 connect-interface lo 0
peer 5.5.5.5 as-number 200
peer 5.5.5.5 connect-interface lo 0
# AR5
bgp 200
router-id 5.5.5.5
peer 3.3.3.3. as-number 200
peer 3.3.3.3 connect-interface lo 0
peer 4.4.4.4 as-number 200
peer 4.4.4.4 connect-interface lo 0
peer 56.1.1.6 as-number 300
peer 6.6.6.6 as-number 300
peer 6.6.6.6 connect-interface lo 0
peer 6.6.6.6 ebgp-max-hop 2
# AR6
bgp 300
router-id 6.6.6.6
peer 5.5.5.5 as-number 200
peer 5.5.5.5 connect-interface lo 0
peer 5.5.5.5 ebgp-max-hop 2
peer 56.1.1.5 as-number 200
net 66.66.66.66 32
# .............................配置静态
# AR5
ip route-static 6.6.6.6 32 56.1.1.6
# AR6
ip route-static 5.5.5.5 32 56.1.1.5
#................................手动配置下一条
# AR2
bgp 200
peer 3.3.3.3 next-hop-local
peer 4.4.4.4 next-hop-local
# AR5
bgp 200
peer 3.3.3.3 next-hop-local
peer 4.4.4.4 next-hop-local
# 手工刷新路由表
# AR2/5
refresh bgp all export 
# AR3/4
refresh bgp all import 
# .......................................使11.11.11.11和66.66.66.66通信
# AR2
bgp 200
peer 5.5.5.5 as-number 200
peer 5.5.5.5 connect-interface lo 0
peer 5.5.5.5 next-hop-local
# AR5
bgp 200
peer 2.2.2.2 as-number 200
peer 2.2.2.2 connect-interface lo 0
peer 2.2.2.2 next-hop-local

实验二:BGP优化次优路径

BGP优化次优路径
# ...............................配置
# AR1
sys
sys AR1
int lo 0 
ip addr 1.1.1.1 32
int g0/0/0
ip addr 123.1.1.1 24
bgp 100
router-id 1.1.1.1
peer 123.1.1.2 as 200
# AR2
sys
sys AR2
int lo 0 
ip addr 2.2.2.2 32
int g0/0/0
ip addr 123.1.1.2 24
bgp 200
router-id 2.2.2.2
peer 123.1.1.1 as 100
peer 123.1.1.3 as 300
# AR3
sys
sys AR2
int lo 0 
ip addr 3.3.3.3 32
int lo 100 
ip addr 100.100.100.100 32
int g0/0/0
ip addr 123.1.1.3 24
bgp 300
router-id 3.3.3.3
peer 123.1.1.2 as 200
net 100.100.100.100 32

# ...........................查看
# AR2/1
dis bgp ro # 100.100.100.100这条路由的下一跳为123.1.1.3,此时没有修改下一跳,重定向了

实验三:路由反射器(只写主要配置)

路由反射器
# AR1:路由反射器
bgp 100
router-id 1.1.1.1
group QYT internal     # 配置组为IBGP 
peer QYT connect-interface LoopBack0
peer 2.2.2.2 as-number 100 # 此命令可省略,IBGP默认as-number相同
peer 2.2.2.2 group QYT 
peer 2.2.2.2 reflect-client      # 指定2.2.2.2为反射客户端 
peer 3.3.3.3 as-number 100 # 此命令可省略,IBGP默认as-number相同
peer 3.3.3.3 group QYT 
peer 3.3.3.3 reflect-client      # 指定3.3.3.3为反射客户端 
peer 4.4.4.4 group QYT 
peer 5.5.5.5 group QYT 
group Ebgp externa     # 配置组为EBGP 
peer Ebgp as-number 200 
peer 16.1.1.6 group Ebgp 
reflector cluster-id 1.1.1.1    # 配置RR的簇ID 

# AR2:客户端
bgp 100
router-id 2.2.2.2
peer 1.1.1.1 as-number 100
peer 1.1.1.1 connect-interface LoopBack0
# AR3:客户端
bgp 100
router-id 3.3.3.3
peer 1.1.1.1 as-number 100
peer 1.1.1.1 connect-interface LoopBack0
# AR4:非客户端
bgp 100
router-id 4.4.4.4
peer 1.1.1.1 as-number 100
peer 1.1.1.1 connect-interface LoopBack0
# AR5:非客户端
bgp 100
router-id 5.5.5.5
peer 1.1.1.1 as-number 100
peer 1.1.1.1 connect-interface LoopBack0

# AR6:EBGP邻居
bgp 200
router-id 6.6.6.6
peer 16.1.1.1 as-number 100

# 查看AR1/3/4/5/6
dis bgp rou 22.22.22.22
dis bgp rou 44.44.44.44
dis bgp rou 66.66.66.66