一、HTTP1.x存在的问题
Http1.0时Connection无法复用,同一时间一个Connection只能处理一个request。Http1.1引入了Request pipelining来解决这一问题,Request pipelining。
Requestpipeling在FIFO基础上支持同一Connection并发处理多个Request,这里的FIFO是指Http Response发送顺序必须与Request的发送顺序保持一致。
详情前往。然而它并不完美,仍然有 Blocking问题。
所谓的行首阻塞是因于FIFO的原因,导致后面的Reponse由于其之前的Response由于资源抢占等原因无法输出而Block。
由于这样的限制,HTTP/1.0及HTTP/1.1时代需要对Server端创建多个连接,通过提高并发度来降低Latency。
另外Http2支持Header压缩,而Header压缩在此前是不支持的,此前一般是对body进行gzip压缩。
二、HTTP2的解决方案
HTTP2在协议上真正要求不同的Request可以在同一个Connection上交错进行,真正做到多路复用。所带来的好处显而易见,更少的Connection,更好的并发,更高效的网络资源利用。
支持流量控制及请求优先级,使得重要的请求优先得到处理,这一点对于应用来说是个大的优化点,以体验为目标,对不同的请求划分优先级以及流量控制,比如异步加载的内容重要性低,可以设置较低优先级。但是个人觉得这一点要做好很难,要依赖于浏览器,应用服务器,应用程序三个地方都有非常好的实现,是否是合理的实现还需要好的度量平台,视效果而定。
Server Push机制支持Server端应用程序可以预先输出内容暂未需要的内容,从而降低潜在的延时。举例:可以把css内容与html内容同步输出,而不需要等待html完全输出后,浏览器再加载css。
支持对Http Header进行压缩。
高效的二进制格式(相对文本格式)传输。
三、原理分析
将通过Jetty源码来分析Jetty如何支持Http2的
Jetty源码地址:git://git.eclipse.org/gitroot/jetty/org.eclipse.jetty.project.gitA. Jetty.io&Jetty.server主要类结构图:
Jetty.io主要是对EndPoint及Connection的定义和基本实现,Jetty.server实现了络的交互过程,包装了Socket,Channel,多路复用等实现。这两个包一起对应用程序端或协议格式端提供了网络交互过程,从而实现网络交互过程对于协议及应用的透明。B. 与Http2协议的结合:
Jetty Basic如上图已经介绍,HTTP2的实现只扩展ServerConnection,ServerConnectionFactory即可,相当于Jetty内核上增加插件,扩展性好,另外也不需要关注网络细节C. 对重点类的重点解读:
类名 | 职责 | 详细介绍 |
---|---|---|
HTTP2Flusher | Frame输出控制类 | 重点说明:HTTP2Flusher类中保存了各种Entry队列,Entry中包含Frame数据,其对应的Stream引用,以及对应的CallBack。主要属性: Queue<WindowEntry> windows,WindowUpdateFrame类型的保存队列ArrayQueue<Entry> frames,Frame数据队列 主要方法:window(), prepend(), append(), remove()等都是针对如上Queue的操作process()真正执行Frame的输出。首先执行Window队列,将Window的窗口设置数据写入到对应的Stream或Session中;然后执行WindowsSize的限流逻辑,若对应的Session或Stream当前WindowSize不大于0,则不发送Frame,否则将WindowSize减去当前Frame的Size,应用于下次限流。最后调用Session中的EndPoint类的write方法将Frame输出 |
FlowControlStrategy | 流控接口定义 | 重点说明: 其实现类主要实现了依据发送或接收的Frame的数据length,依据固定策略改写Session及Stream的WindowSize,以及Stream另一端EndPoint对于WindowSize的要求,完成输科和输出限流的完整逻辑 |
Http2Session | ISession的实现类 | 主要属性:1. EndPoint endPoint, 表征了此Session的网络端点,对于网络的操作通过调用endPoint的方法实现2. Generator generator,用于按需生成各种格式的Frame,Frame被最终写入endPoint中 3. Listener listener,Session中被动接口的逻辑实现,面向接口编程,支持多种实现4. FlowControlStrategy flowControl前面已经讲述5. HTTP2Flusher flusher前面也已讲述主要方法:1.newStream(),创建新的流对象,以及HeaderFrame,将流写入Session的流缓存中,流缓存通过ConcurrentHashMap实现;并将流和HeaderFrame追加到Http2Flusher对象的ArrayQueue中;2. push(), settings(), ping(), reset()的实现雷同,最终都是将对应格式的Frame放入Http2Flusher的ArrayQueue中。Http2Flusher是真正输出Frame的控制类。3. onData(),接收DataFrame时的处理方法,首先更新当前FlowControl对象中的WindowSize,并执行Window限流逻辑,若未超出限流控制,则调用Stream的处理方法处理接收到的数据,否则直接丢弃当前Frame,最后将WindowSize恢复之前值4. onHeaders()接收HeaderFrame时的处理方法,抽象方法,交由子类实现5. onPriority(),Jetty默认未支持客户端发起的对优先级的支持6. onReset(), onSettings(),onPing(),onGoAway(),onWindowUpdate(),onConnectionFailure()执行对应逻辑,通过Listener接口,支持对于这些请求数据的自定义实现 |
HTTP2Stream | IStream的实现类 | 重点说明: 实现了IStream的主动接口及其被动接口Stream.Listener。其主动接口一般是通过调用对应的ISession接口实现 |
HTTP2ServerSession | 继承HTTP2Session,实现Server端Session特有的逻辑 | 重点说明:特有逻辑包括ServerSession在接收onPreface时,需回复一个Settings Frame;在接收Headers请求时需创建RemoteStream对象;当接收ServerPush时,报出异常,HTTP2中Client不能向Server发送Server Push。 |
DataFrame | HTTP2协议的各种数据格式的封闭 | 重点说明: 针对不同的数据格式,如ServerPush,Preface等,有对应的子类实现 |
DataGenerator | 构建如上的DataFrame | 重点说明:对于不同的数据格式有不同的子类实现 |
parser包 | 对接收的数据格式进行解析 | 重点说明:对接收的数据格式进行解析 |
四、如何实现HTTP2
HTTP2还未被所有浏览器所支持,因此在实施时要支持多种协议并存.
需要Http Server端支持HTTP2协议,据我所知Tengine尚未支持,已支持的Server列表。若要充分利用HTTP2的所有优点,需要在应用程序端(甚至是JAVA)的输出行为作智能处理,如通过大数据来分析哪些资源适合用Server Push并行输出,哪些资源优先级可以隐藏低,如何在性能与复杂度及维护成本之间做出平衡,需要业内更多的人努力和尝试,