基础知识

什么是分布式系统

“分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像单个相关系统”。

分布式系统(distributed system)是建立在网络之上的软件系统。

随着互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对,分布式服务架构以及流动计算架构势在必行,亟需一个治理系统确保架构有条不紊的演进。

发展演变

image-20200927135430669

单一应用架构

当网站流量很小时,只需一个应用,将所有功能都部署在一起,以减少部署节点和成本。此时,用 于简化增删改查工作量的数据访问框架(ORM)是关键。

适用于小型网站,小型管理系统,将所有功能都部署到一个功能里,简单易用。

缺点:

  • 性能扩展比较难
  • 协同开发问题
  • 不利于升级维护

image-20200927135454938

垂直应用架构

当访问量逐渐增大,单一应用增加机器带来的加速度越来越小,将应用拆成互不相干的几个应用, 以提升效率。此时,用于加速前端页面开发的 Web 框架(MVC)是关键。

通过切分业务来实现各个模块独立部署,降低了维护和部署的难度,团队各司其职更易管理, 性能扩展也更方便,更有针对性。

缺点: 公用模块无法重复利用,开发性的浪费

image-20200927135554521

分布式服务架构 RPC

当垂直应用越来越多,应用之间交互不可避免,将核心业务抽取出来,作为独立的服务,逐渐形成 稳定的服务中心,使前端应用能更快速的响应多变的市场需求。此时,用于提高业务复用及整合的 分布式服务框架(RPC)是关键。

image-20200927135616709

RPC 基本原理

RPC【Remote Procedure Call】是指远程过程调用,是一种进程间通信方式,他是一种技术的思想, 而不是规范。它允许程序调用另一个地址空间(通常是共享网络的另一台机器上)的过程或函数, 而不用程序员显式编码这个远程调用的细节。即程序员无论是调用本地的还是远程的函数,本质上 编写的调用代码基本相同。

RPC 两个核心模块:通讯,序列化。

image-20200927135845662

image-20200927135858790

流动计算架构 SOA

当服务越来越多,容量的评估,小服务资源的浪费等问题逐渐显现,此时需增加一个调度中心基于 访问压力实时管理集群容量,提高集群利用率。此时,用于提高机器利用率的资源调度和治理中心 的SOA[ Service Oriented Architecture]是关键。

image-20200927135705565

dubbo 核心概念

Apache Dubbo 是一款高性能、轻量级的开源 Java RPC 框架,它提供了三大核心能力:面向接口的远程方法调用,智能容错和负载均衡,以及服务自动注册和发现。

服务提供者(Provider):暴露服务的服务提供方,服务提供者在启动时,向注册中心注册自 己提供的服务。

服务消费者(Consumer): 调用远程服务的服务消费方,服务消费者在启动时,向注册中心订 阅自己所需的服务,服务消费者,从提供者地址列表中,基于软负载均衡算法,选一台提供者进行 调用,如果调用失败,再选另一台调用。

注册中心(Registry):注册中心返回服务提供者地址列表给消费者,如果有变更,注册中心 将基于长连接推送变更数据给消费者

监控中心(Monitor):服务消费者和提供者,在内存中累计调用次数和调用时间,定时每分 钟发送一次统计数据到监控中心

image-20200927140144890

调用关系说明:

  • 服务容器负责启动,加载,运行服务提供者。
  • 服务提供者在启动时,向注册中心注册自己提供的服务。
  • 服务消费者在启动时,向注册中心订阅自己所需的服务。
  • 注册中心返回服务提供者地址列表给消费者,如果有变更,注册中心将基于长连接推送变更数 据给消费者。
  • 服务消费者,从提供者地址列表中,基于软负载均衡算法,选一台提供者进行调用,如果调用失败,再选另一台调用。
  • 服务消费者和提供者,在内存中累计调用次数和调用时间,定时每分钟发送一次统计数据到监控中心。

dubbo 环境搭建

官方文档:http://dubbo.apache.org/zh-cn/docs/user/references/xml/dubbo-monitor.html

dubbo-helloword代码

1.安装 zookeeper

修改 zoo.cfg 配置文件,注意几个重要位置:

dataDir=./ # 临时数据存储的目录(可写相对路径) 
clientPort=2181 # zookeeper 的端口号 修改完成后再次启动 zookeeper

一些命令:

# 启动Zookeeper
bin/zkServer.sh start
# 查看进程是否启动
jps
# 查看状态
bin/zkServer.sh status
# 启动客户端
bin/zkCli.sh
# 退出客户端
quit
# 停止Zookeeper
bin/zkServer.sh stop

2.安装 dubbo-admin 管理控制台

图形化的服务管理页面;安装时需要指定注册中心地址,即可从注册中心中获取到所有的提供者/ 消费者进行配置管理。

下载dubbo-admin:https://github.com/apache/incubator-dubbo-ops

进入目录,修改 dubbo-admin 配置

# 修改 src\main\resources\application.properties 指定 zookeeper 地址
spring.guest.password = guest
dubbo.registry.address = zookeeper://127.0.0.1:2181

打包 dubbo-admin

cd ~/Applications/dubbo-monitor/incubator-dubbo-ops-master/dubbo-admin
mvn clean package -Dmaven.test.skip=true

运行 dubbo-admin

java -jar dubbo-admin-0.0.1-SNAPSHOT.jar # 默认使用 root/root 登陆

或者使用简易版本:dubbo-monitor-simple

  1. 修改dubbo-monitor-simple/src/main/resources/conf/dubbo.properties 文件

image-20200928131325463

  1. 打包 dubbo-monitor-simple
mvn clean package -Dmaven.test.skip=true
  1. 解压 tar.gz 文件,并运行 start.sh

image-20200928131442633

  1. 启动访问 localhost:8080

3. 监控中心配置

所有服务配置连接监控中心,进行监控统计

<!-- 监控中心协议,如果为protocol="registry",表示从注册中心发现监控中心地址,否则 直连监控中心 -->
<dubbo:monitor protocol="registry"></dubbo:monitor>

ps:

  • Simple Monitor 挂掉不会影响到 Consumer 和 Provider 之间的调用,所以用于生产环境不会有风险。
  • Simple Monitor 采用磁盘存储统计信息,请注意安装机器的磁盘限制,如果要集群,建议用 mount 共享磁盘。

整合 SpringBoot

code

1.引入 spring-boot-starter 以及 dubbo 和 curator 的依赖

<dependency>
<groupId>com.alibaba.boot</groupId> <artifactId>dubbo-spring-boot-starter</artifactId> <version>0.2.0</version>
</dependency>

注意 starter 版本适配:

image-20200928211032901

2.配置 application.properties

# 提供者配置:
# 1.制定当前服务/应用的名字(同样的服务名字相同,不要和别的服务同名)
dubbo.application.name=user-service-provider
# 2. 制定注册中心的位置
dubbo.registry.address=zookeeper://127.0.0.1:2181
# 3. 制定通信规则(通信协议 通信端口)
dubbo.protocol.name=dubbo
dubbo.protocol.port=20880
# 4. 暴露服务 ref指向真正的实现
# 服务太多,使用dubbo下的Service注解代替
#  连接监控中心,去注册中心自动发现
dubbo.monitor.protocol=registry

# 消费者配置:
# 1.制定当前服务/应用的名字(同样的服务名字相同,不要和别的服务同名)
dubbo.application.name=order-service-comsumer
# 2. 制定注册中心的位置
dubbo.registry.address=zookeeper://127.0.0.1:2181
# 3 声明需要调用的远程服务的接口,生成远程服务代理
# 服务太多不方便配置,使用@@Reference注解代替
#  监控中心
dubbo.monitor.protocol=register

3.dubbo 注解

@Service、@Reference;如果没有在配置中写 dubbo.scan.base-package,还需要使用@EnableDubbo 注解。

SpringBoot与dubbo整合的三种方式

  1. 导入dubbo-starter,在application.properties配置属性,使用@Service【暴露服务】使用@Reference【引用服务】
  2. 保留dubbo xml配置文件; 导入dubbo-starter,使用@ImportResource导入dubbo的配置文件即可
  3. 使用注解API的方式:将每一个组件手动创建到容器中,让dubbo来扫描其他的组件。文档链接
    • 可实现方法级的配置

dubbo配置

配置原则

  • JVM 启动 -D 参数优先,这样可以使用户在部署和启动时进行参数重写,比如在启动时需改变协议 的端口。
  • XML 次之,如果在 XML 中有配置,则 dubbo.properties 中的相应配置项无效。
  • Properties 最后,相当于缺省值,只有 XML 没有配置时,dubbo.properties 的相应配置项才会生效,通常用于共享公共配置,比如应用名。

image-20200929213635790

重试次数

失败自动切换,当出现失败,重试其它服务器,但重试会带来更长延迟。可通过 retries=”2” 来设 置重试次数(不含第一次)。

<dubbo:service retries="2" /><dubbo:reference retries="2" /><dubbo:reference>
<dubbo:method name="findFoo" retries="2" />
</dubbo:reference>

超时时间

由于网络或服务端不可靠,会导致调用出现一种不确定的中间状态(超时)。为了避免超时导致客户端资源(线程)挂起耗尽,必须设置超时时间。

1.Dubbo 消费端

全局超时配置
<dubbo:consumer timeout="5000" />
指定接口以及特定方法超时配置
<dubbo:reference interface="com.foo.BarService" timeout="2000"> <dubbo:method name="sayHello" timeout="3000" />
</dubbo:reference>

2.Dubbo 服务端

全局超时配置
<dubbo:provider timeout="5000" />
指定接口以及特定方法超时配置
<dubbo:provider interface="com.foo.BarService" timeout="2000"> <dubbo:method name="sayHello" timeout="3000" />
</dubbo:provider>

3.配置原则

dubbo 推荐在 Provider 上尽量多配置 Consumer 端属性:

  • 作为服务的提供者,比服务使用方更清楚服务性能参数,如调用的超时时间,合理的重试次数,等等
  • 在 Provider 配置后,Consumer 不配置则会使用 Provider 的配置值,即 Provider 配置可以作为 Consumer 的缺省值。否则,Consumer 会使用 Consumer 端的全局设置,这对于 Provider 不可控的,并且往往是不合理的

配置的覆盖规则

  1. 方法级配置别优于接口级别,即小 Scope 优先
  2. Consumer 端配置 优于 Provider 配置 优于 全局配置
  3. 最后是 Dubbo Hard Code 的配置值(见配置文档)

image-20200929214518145

版本号

当一个接口实现,出现不兼容升级时,可以用版本号过渡,版本号不同的服务相互间不引用。可以按照以下的步骤进行版本迁移:

  1. 在低压力时间段,先升级一半提供者为新版本
  2. 再将所有消费者升级为新版本
  3. 然后将剩下的一半提供者升级为新版本
老版本服务提供者配置:
<dubbo:service interface="com.foo.BarService" version="1.0.0" />
新版本服务提供者配置:
<dubbo:service interface="com.foo.BarService" version="2.0.0" />
老版本服务消费者配置:
<dubbo:reference id="barService" interface="com.foo.BarService" version="1.0.0" />
新版本服务消费者配置:
<dubbo:reference id="barService" interface="com.foo.BarService" version="2.0.0" />
如果不需要区分版本,可以按照以下的方式配置:
<dubbo:reference id="barService" interface="com.foo.BarService" version="*" />

高可用

高可用:通过设计,减少系统不能提供服务的时间;

zookeeper 宕机与 dubbo 直连

zookeeper 注册中心宕机,还可以消费 dubbo 暴露的服务。

健壮性:

  • 监控中心宕掉不影响使用,只是丢失部分采样数据
  • 数据库宕掉后,注册中心仍能通过缓存提供服务列表查询,但不能注册新服务
  • 注册中心对等集群,任意一台宕掉后,将自动切换到另一台
  • 注册中心全部宕掉后,服务提供者和服务消费者仍能通过本地缓存通讯
  • 服务提供者无状态,任意一台宕掉后,不影响使用
  • 服务提供者全部宕掉后,服务消费者应用将无法使用,并无限次重连等待服务提供者恢复

集群下 dubbo 负载均衡配置

在集群负载均衡时,Dubbo 提供了多种均衡策略,缺省为 random 随机调用。

负载均衡策略

  • Random LoadBalance

    随机,按权重设置随机概率。 在一个截面上碰撞的概率高,但调用量越大分布越均匀,而且按概率使用权重后也比较均匀,有 利于动态调整提供者权重。

  • RoundRobin LoadBalance

    轮循,按公约后的权重设置轮循比率。 存在慢的提供者累积请求的问题,比如:第二台机器很慢,但没挂,当请求调到第二台时就卡在 那,久而久之,所有请求都卡在调到第二台上。

  • LeastActive LoadBalance

    最少活跃调用数,相同活跃数的随机,活跃数指调用前后计数差。 使慢的提供者收到更少请求,因为越慢的提供者的调用前后计数差会越大。

  • ConsistentHash LoadBalance

    一致性 Hash,相同参数的请求总是发到同一提供者。 当某一台提供者挂时,原本发往该提供者的请求,基于虚拟节点,平摊到其它提供者,不会引起剧烈变动。

整合 hystrix,服务熔断与降级处理

服务降级

当服务器压力剧增的情况下,根据实际业务情况及流量,对一些服务和页面有策略的不处理或 换种简单的方式处理,从而释放服务器资源以保证核心交易正常运作或高效运作。

可以通过服务降级功能临时屏蔽某个出错的非关键服务,并定义降级后的返回策略。

向注册中心写入动态配置覆盖规则:

RegistryFactory registryFactory = ExtensionLoader.getExtensionLoader(RegistryFactory.class).getAdaptiveExtension();
Registry registry = registryFactory.getRegistry(URL.valueOf("zookeeper://10.20.153.10:2181")); registry.register(URL.valueOf("override://0.0.0.0/com.foo.BarService?category=configurators&dynamic =false&application=foo&mock=force:return+null"));

其中:

  • mock=force:return+null 表示消费方对该服务的方法调用都直接返回 null 值,不发起远程调 用。用来屏蔽不重要服务不可用时对调用方的影响。
  • 还可以改为 mock=fail:return+null 表示消费方对该服务的方法调用在失败后,再返回 null 值,不抛异常。用来容忍不重要服务不稳定时对调用方的影响。

集群容错

在集群调用失败时,Dubbo 提供了多种容错方案,缺省为 failover 重试。

  • Failover Cluster

    失败自动切换,当出现失败,重试其它服务器。通常用于读操作,但重试会带来更长延迟。可通 过 retries="2" 来设置重试次数(不含第一次)。
    重试次数配置如下:
    <dubbo:service retries="2" /><dubbo:reference retries="2" /><dubbo:reference>
    <dubbo:method name="findFoo" retries="2" />
    </dubbo:reference>
    
  • Failfast Cluster

    快速失败,只发起一次调用,失败立即报错。通常用于非幂等性的写操作,比如新增记录。

  • Failsafe Cluster

    失败安全,出现异常时,直接忽略。通常用于写入审计日志等操作。

  • Failback Cluster

    失败自动恢复,后台记录失败请求,定时重发。通常用于消息通知操作。

  • Forking Cluster

    并行调用多个服务器,只要一个成功即返回。通常用于实时性要求较高的读操作,但需要浪费更 多服务资源。可通过 forks=”2” 来设置最大并行数。

  • Broadcast Cluster

    广播调用所有提供者,逐个调用,任意一台报错则报错 [2]。通常用于通知所有提供者更新缓存 或日志等本地资源信息。

集群模式配置

按照以下示例在服务提供方和消费方配置集群模式
<dubbo:service cluster="failsafe" /><dubbo:reference cluster="failsafe" />

整合 hystrix

Hystrix 旨在通过控制那些访问远程系统、服务和第三方库的节点,从而对延迟和故障提供更强大 的容错能力。Hystrix 具备拥有回退机制和断路器功能的线程和信号隔离,请求缓存和请求打包,以 及监控和配置等功能

1.配置spring-cloud-starter-netflix-hystrix

<dependency>
	<groupId>org.springframework.cloud</groupId> 
	<artifactId>spring-cloud-starter-netflix-hystrix</artifactId> 		
	<version>1.4.4.RELEASE</version>
</dependency>

2.然后在 Application 类上增加@EnableHystrix 来启用 hystrix starter

@SpringBootApplication @EnableHystrix
public class ProviderApplication {...}

3.配置 Provider 端。在 Dubbo 的 Provider 上增加@HystrixCommand 配置,这样子调用就会经过 Hystrix 代理。

@Service(version = "1.0.0")
public class HelloServiceImpl implements HelloService {
@HystrixCommand(commandProperties = {
@HystrixProperty(name = "circuitBreaker.requestVolumeThreshold", value = "10"), @HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds", value = "2000") })
@Override
public String sayHello(String name) {
// System.out.println("async provider received: " + name);
// return "annotation: hello, " + name;
throw new RuntimeException("Exception to show hystrix enabled.");
} 
}

4.也可以配置在 Consumer 端。对于 Consumer 端,则可以增加一层 method 调用,并在 method 上配置@HystrixCommand。当调用 出错时,会走到 fallbackMethod = “reliable”的调用里。

@Reference(version = "1.0.0") 
private HelloService demoService;

@HystrixCommand(fallbackMethod = "reliable") 
public String doSayHello(String name) {
	return demoService.sayHello(name); }
public String reliable(String name) { 
  return "hystrix fallback value";
}

dubbo原理

RPC 原理

image-20201005214048307

一次完整的 RPC 调用流程(同步调用,异步另说)如下:

  1. 服务消费方(client)调用以本地调用方式调用服务;
  2. client stub 接收到调用后负责将方法、参数等组装成能够进行网络传输的消息体;
  3. client stub 找到服务地址,并将消息发送到服务端;
  4. server stub 收到消息后进行解码;
  5. server stub 根据解码结果调用本地的服务;
  6. 本地服务执行并将结果返回给 server stub;
  7. server stub 将返回结果打包成消息并发送至消费方;
  8. client stub 接收到消息,并进行解码;
  9. 服务消费方得到最终结果。

RPC 框架的目标就是要 2~8 这些步骤都封装起来,这些细节对用户来说是透明的,不可见的。

netty 通信原理

Netty 是一个异步事件驱动的网络应用程序框架, 用于快速开发可维护的高性能协议服务器和客户端。它极大地简化并简化了 TCP 和 UDP 套接字服务器等网络编程。

image-20201005214234976

Selector 一般称 为选择器 ,也可以翻译为 多路复用器。

Connect(连接就绪)、Accept(接受就绪)、Read(读就绪)、Write(写就绪) 。

Netty 基本原理:

image-20201005214328769

dubbo 原理

框架设计

image-20201005214342884

  • config 配置层:对外配置接口,以 ServiceConfig, ReferenceConfig 为中心,可以直接初始化配 置类,也可以通过 spring 解析配置生成配置类
  • proxy 服务代理层:服务接口透明代理,生成服务的客户端 Stub 和服务器端 Skeleton, 以 ServiceProxy 为中心,扩展接口为 ProxyFactory
  • registry 注册中心层:封装服务地址的注册与发现,以服务 URL 为中心,扩展接口为 RegistryFactory, Registry, RegistryService
  • cluster 路由层:封装多个提供者的路由及负载均衡,并桥接注册中心,以 Invoker 为中心, 扩展接口为 Cluster, Directory, Router, LoadBalance
  • monitor 监控层:RPC 调用次数和调用时间监控,以 Statistics 为中心,扩展接口为 MonitorFactory, Monitor, MonitorService
  • protocol 远程调用层:封装 RPC 调用,以 Invocation, Result 为中心,扩展接口为 Protocol, Invoker, Exporter
  • exchange 信息交换层:封装请求响应模式,同步转异步,以 Request, Response 为中心,扩展 接口为 Exchanger, ExchangeChannel, ExchangeClient, ExchangeServer
  • transport 网络传输层:抽象 mina 和 netty 为统一接口,以 Message 为中心,扩展接口为 Channel, Transporter, Client, Server, Codec
  • serialize 数据序列化层:可复用的一些工具,扩展接口为 Serialization, ObjectInput, ObjectOutput, ThreadPool

启动解析、加载配置信息

public class DubboNamespaceHandler extends NamespaceHandlerSupport {

    static {
        Version.checkDuplicate(DubboNamespaceHandler.class);
    }

    @Override
    public void init() {
        registerBeanDefinitionParser("application", new DubboBeanDefinitionParser(ApplicationConfig.class, true));
        registerBeanDefinitionParser("module", new DubboBeanDefinitionParser(ModuleConfig.class, true));
        registerBeanDefinitionParser("registry", new DubboBeanDefinitionParser(RegistryConfig.class, true));
        registerBeanDefinitionParser("monitor", new DubboBeanDefinitionParser(MonitorConfig.class, true));
        registerBeanDefinitionParser("provider", new DubboBeanDefinitionParser(ProviderConfig.class, true));
        registerBeanDefinitionParser("consumer", new DubboBeanDefinitionParser(ConsumerConfig.class, true));
        registerBeanDefinitionParser("protocol", new DubboBeanDefinitionParser(ProtocolConfig.class, true));
        registerBeanDefinitionParser("service", new DubboBeanDefinitionParser(ServiceBean.class, true));
        registerBeanDefinitionParser("reference", new DubboBeanDefinitionParser(ReferenceBean.class, false));
        registerBeanDefinitionParser("annotation", new AnnotationBeanDefinitionParser());
    }
}

服务暴露

image-20201005223341019

服务引用

image-20201005223402772

服务调用

image-20201005223422754