张尧学,周悦芝
(清华大学计算机科学与技术系,清华信息科学与技术国家实验室,北京100084)
PDF版本下载:http://pan.baidu.com/s/1c03vKUO
1引言
云计算[1]正成为新的计算机研究和产业发展重要热点。这是一种由谷歌等公司于2008年首先提出的网络计算新模式。这种模式的主要特点在于通过网络,把原来在单台计算机中软件的运算和存储分开到用户终端机和网络服务器上完成。即,这种模式把主要软件(含系统程序、应用程序和数据)存储在网络上,而用户的终端机只负责和用户的交互以及获取服务,为用户提供服务的运算既可在网络上的某台计算服务器上完成,也可在用户终端机上完成。
至今为止,谷歌、IBM、亚马逊等公司都推出了自己的云计算模式和产品[2]。特别是谷歌的GFS[3]和MapReduce[4]分别给出了其大规模网络文件系统的存储结构和快速搜索算法。但是,在网络化的云计算操作系统方面,则还未见有相关研究成果报道。尽管谷歌公司于2009年推出了面向终端机的操作系统ChromeOS[5],但该系统只是为终端机提供相应的网络服务,并不管理网络软硬件资源。
本文从用户服务和以网络为基础管理系统软硬件资源的角度出发,提出一种把传统操作系统、应用程序与文件/数据也看做资源,通过网络对这些资源进行调度、分配、回收和控制,把资源的存储和运算分开管理的云计算操作系统(TransOS)。由于TransOS是在各种传统操作系统的底层分布式运行,因此,它使得用户可以自主选择自己需要的操作系统(例如Windows或Linux),以及其上的各种应用服务,使不同厂家和不同标准的操作系统可在同一用户终端上兼容运行;同时,这种模式减少用户终端的存储负载、管理难度以及增加用户使用的方便性和安全性。
2操作系统
操作系统是管理和控制计算机系统中软硬件资源的系统软件[6]。操作系统的发展主要有两条技术路线:
(1)单机操作系统。基于冯•诺依曼结构、以单机为单位的资源管理和程序运行平台。包括从最初的批处理系统,到后来的多道程序系统、分时系统和有网络功能的操作系统等。这类操作系统的典型代表有Windows,Linux,Symbian等。由于这类系统的资源管理以单机为单位,当应用需求增加时,其功能就会越来越复杂,系统程序就会越来越庞大,安全性降低。这导致用户操作复杂、管理维护困难。
(2)网络操作系统。这类操作系统以网络作为资源管理和程序运行的平台,大多是在单机操作系统基础上加上协议和管理软件构成。典型代表有Windows7[7]、Android[8]、ChromeOS[5]等。与单机操作系统相比,网络操作系统具有前端功能轻载化、虚拟化、移动化和管理集中化等特点,方便了用户的管理和维护、提高了易用性和安全性。
但是,无论是单机操作系统,还是网络操作系统,它们都存在着系统过于复杂和庞大、不支持跨硬件和软件平台等问题。例如,支持桌面软件的操作系统一般不支持移动软件;支持Windows的应用软件也不能在Linux上运行。这给用户从网络上获得服务和管理带来了很多不便和风险,也提高了成本和功耗;不适合云计算模式的大规模异构存储的管理和为用户提供所需要的主动服务。
ChromeOS试图解决上述问题。但它只提供了一个类似于浏览器的简单桌面环境。它的启动速度很快,也能很快访问后端存储的大规模数据库和获得计算服务。但是,ChromeOS不支持跨平台操作和访问,因而,还不能把ChromeOS看做云计算操作系统的解决方案。
3透明计算
透明计算是一种为用户提供服务的计算[9]。其目标是在系统为用户提供服务时,让用户不用知道计算过程和实现细节,只需关心系统能否提供所需服务和服务质量。为了实现这一目标,透明计算通过网络把运算和存储分离,服务器存储操作系统、应用程序以及用户数据等软件资源,终端接近裸机,只存储最底层的BIOS和极少部分协议和管理程序。用户服务需要的操作系统和应用程序则通过本文后续的分布式超级操作系统(MetaOS)从服务器中以分块或以流的方式调度到终端上运行。由于操作系统、应用程序以及用户数据都存储在服务器上,终端是一个近乎裸机的运行平台,因此,终端可以做到多样、轻载、安全、易管理和维护。另外,网络服务器可以存储多种不同操作系统以及无数的应用程序,形成巨大的“云”,从而使用户可以自由地从网上跨软件和硬件平台获得所需服务。
透明计算的核心思想包括:(1)计算和存储分离;(2)提供跨终端、跨操作系统平台的操作和用户可选择的服务;(3)服务器和终端之间通过数据流和块调度交换指令,云计算的超级操作系统对整个网络资源进行一体化管理;(4)程序以流的方式被动态调度到指定的终端或服务器上执行[10]。
基于透明计算理论,文献[11]提出了透明计算体系结构4VP+,并研制了相应的终端系统。Intel公司又进一步把新一代BIOS:EFI(ExtensibleFirmwareInterface)[12]和透明计算结合,开始进行BIOS层开放的研究[13]。
4一种云计算操作系统TransOS
4.1TransOS操作系统的概念
如前所述,单机操作系统只能管理单机的有限资源。现有的网络操作系统还只是在单机的基础上加上对网络的支持,因此它们不能为用户提供需要的主动服务。在云计算环境下,需要一种能够管理网络软硬件资源,并为用户提供服务的超级操作系统。为此,基于透明计算,我们设计了一种层次化、分布式内核的云计算操作系统TransOS。与单机和现有的网络操作系统相比,TransOS能够统一管理由各种异构终端、服务器、网络、以及传统操作系统等组成的网络化资源,并能主动为用户提供按需服务。TransOS具有如下几个特点:
(1)将传统操作系统也作为一种资源进行管理
TransOS管理的资源分为三类:第一类是指由终端(群)、服务器(群)和互联网络组成的硬件平台资源;第二类是指在上述硬件实体资源基础上,通过设备驱动和虚拟化,形成可供TransOS管理的虚拟化资源;第三类是软件/数据资源,包括传统操作系统、应用程序和数据等。因此,与传统操作系统只管理和调度应用程序和数据不同,在TransOS中,传统操作系统,如Linux,Windows等本身也是一个被管理和调度的对象。在用户进行选择后,相应的传统操作系统会被TransOS调度到用户终端上执行,完成用户所要求的计算任务。TransOS的任务就是统一管理和调度上述的三类资源,形成一个基于透明计算的云计算超级操作系统。为方便起见,作如下定义:
定义1网络化资源包括由TransOS管理的硬件资源,如终端(群)和服务器(群)等计算和存储设备,路由器、交换机、基站等网络设备;以及传统操作系统、开发和管理工具、应用软件、结构化和非结构化数据等软件或数据资源。
定义2自治网络系统由终端(群)、服务器(群)、以及网络交换机等硬件设备组成的能够在其上运行TransOS的网络系统。
定义3实例操作系统指由TransOS管理的传统操作系统,如Windows,Linux,Sybian,Android,WindowsMobile等。
(2)分布式内核,动态调度运行
TransOS的内核分布在用户终端和服务器上。如图1所示,TransOS内核的很小一部分,驻留在终端BIOS上,其它内核部分则驻留在服务器上。需要注意的是,图中只画出了一(终端)对一(服务器)的情形。在实际中,会存在多对多的情形。当终端启动后,驻留在BIOS中的TransOS内核部分负责获得终端控制权,并与服务器联系,获得系统运行所需要的更多内核代码,并动态以块流的方式加载到终端侧执行[10]。块流的含义是指每次只按需从网络服务器上获取一小部分代码或者数据块到终端上进行计算,如此循环反复,形成从网络服务器到终端的流。需要说明的是,TransOS上面支持的实例操作系统、应用程序以及数据等也都是以块流的方式被动态调度到终端侧执行的。
(3)运行在BIOS之上,实例操作系统之下
如图2所示,TransOS通过EFI(ExtensibleFirmwareInterface)等标准接口实现对不同终端硬件架构,如x86、ARM、MIPS等的支持。TransOS在由BIOS负责启动运行后,会与服务器联系,将网络服务器能够支持的实例操作系统显示给终端用户进行选择。在用户选择后,再由它从服务器上以块流方式调度用户所选择的实例操作系统到终端上执行。
(4)分布式网络化资源的统一管理和调度
如图3所示,TransOS管理的是一个跨网络、跨终端和服务器平台的自治网络系统。为了能够统一管理分布在不同地方的网络软硬件资源,TransOS将其功能按照运行的地点,分为TransOS客户端和TransOS服务器端。TransOS客户端和服务器端通过协议通信,共同维护和管理分布在不同地点的网络软硬件资源,包括终端硬件、服务器硬件、网络、实例操作系统、应用程序以及数据等,并按照用户需求,统一调度相关资源,以供用户使用。一般而言,TransOS客户端运行在用户终端设备上,而TransOS服务器端则运行在网络服务器上。
4.2TransOS操作系统的设计
为了实现对分布式网络软硬件资源,包括实例操作系统等的统一管理和调度,TransOS被设计成一种层次式的模块结构,如图4所示,共由7个模块组成。需要说明的是,每个模块都是按照需要分布在一台或者多台设备上,共同完成某项功能。
下面分别对每个模块的功能进行说明。网络化中断处理模块是对来自虚拟设备(在一台计算机的硬件设备基础上形成的可供其他计算机操作的设备)的中断进行处理的模块。该模块能够接受来自自治网络系统中任何一台计算机的网络中断并进行处理,完成该中断请求的相应功能。图5描述了TransOS与传统单机操作系统在中断处理上的区别。对于传统单机操作系统,出现诸如缺页中断、键盘中断等中断后,CPU保存当前的运行状态,开始运行相应的中断处理函数处理该中断事件,处理结束后恢复之前的运行状态,继续运行。对于TransOS,如果是由位于TransOS客户端计算机上的虚拟设备发出的中断,则该中断事件并不在TransOS客户端上进行处理,而是需要通过网络传输给服务器,交由TransOS服务器端进行处理,处理结束后,再通过网络将处理结果返回给TransOS客户端。此后,TransOS客户端CPU恢复中断前的运行过程。
实体/虚拟化资源驱动模块,是在网络化中断管理的基础上,完成对实体/虚拟化资源的驱动和管理。具体包括如下三个方面的功能:(1)对物理的硬件设备,如网卡、显卡等进行驱动,完成自治网络系统中所有硬件设备的驱动;(2)在实体硬件设备驱动基础上,进一步形成虚拟化资源,如对虚拟CPU、虚拟内存、虚拟存储等虚拟设备资源进行构建、驱动和管理;(3)实现对大规模软件/数据的存储支持,其功能类似于Google公司的GFS和Bigtable[14],实现对大规模数据的网络化存储和检索。软件/数据资源存储与管理模块是在虚拟化网络存储的基础上,进一步将例操作系统、应用程序以及数据进行组织、存储和管理,供用户进行高效访问。
TransOS的核心功能是对网络化资源进行管理和调度,也就是进行资源的调度、分配和回收等工作。这是由资源管理与调度模块来实现,该层功能类似于传统单机操作系统中的内核调度功能。为满足不同网络化资源的调度和管理要求,需要针对不同属性的资源,研究基于不同策略和方法的调度、分配和回收算法,实现资源的按需弹性流动。与单机操作系统类似,TransOS也具有接口与界面模块,用于实现与应用程序以及用户的交互,接收并完成来自上层应用和用户的请求。
与单机操作系统不同的是,TransOS具有两个特殊的模块,网络化启动与优化模块以及网络通信与服务协议模块。其中网络化启动与优化模块的客户端主要完成终端启动中断的截获,并将此信号传递到网络服务器,由服务器来进行处理。网络化启动与优化模块的服务器端会响应来自客户端的请求,首先是给客户端分配一个网络地址,便于后面的通信;其次,会对用户的身份进行认证并将网络自治系统支持的实例操作系统列表返回给用户进行选择;在用户选择自己想要运行的实例操作系统后,再调用相关的传输协议将部分的实例操作系统内核加载到终端内存中执行,完成实例操作系统的启动。网络通信与服务协议模块下,TransOS客户端和服务器端的功能均被划分为四个虚拟层和两个协议,如图6所示。两个协议分别是多操作系统远程启动协议管理(VNDM,VirtualNetworkDeviceManagement),虚拟网虚拟网络用户管理(VNUM,VirtualNetworkUserManage络文件管理(VNFM,VirtualNetworkFileManagement)以及ment)。下面分别介绍各个虚拟层的功能。主要完成实例操作系统启动以后,如何依照用户的使用,按需将其他实例操作系统模块以及应用程序代码和数据按需以块流的方式传送到终端内存中执行。与传统操作系统中通信协议模块只为应用程序间通讯服务所不同的是,TransOS中的通信协议传送的不仅是数据,还有代码;同时,TransOS中的通信协议在实例操作系统未启动的情况下就会工作。
5TransOS的实现示例
TransOS有多种实现方式。下面介绍一种基于4VP+
(4VirtualLayers,2Protocols)在普通PC计算机板上基于EFIBIOS的实现示例。在这种实现(MRBP,Multi-OSRemoteBootingProtocol)和网络服务访问协议(NSAP,NetworkServiceAccessProtocol)。MRBP的功能是捕获客户端启动初始化的中断信号,发现服务器存储的实例操作系统列表,下载部分操作系统内核以及NSAP协议客户端部分。因此,MRBP客户端代码必须提前驻留在终端主板BIOS上。由于MRBP工作在实例操作系统启动之前,因此MRBP客户端不能像传统协议一样利用操作系统的网络通信接口,而需要实现自己的网络设备驱动和网络协议栈。NSAP协议的主要功能是传输TransOS以及上层实例操作系统的指令、数据、中断和响应等。
4VP+中的四个虚拟层分别是:虚拟网络IO管理(VNIOM,VirtualNetworkI/OManagement),虚拟网络设备(1)VNIOM。其主要功能是接收终端上运行的实例操作系统的I/O中断请求,分析中断原因,并唤醒相应的处理程序进行处理。与单机环境下不同的是,VNIOM需要将终端的中断请求送到服务器进行处理,并将处理结果返回给终端。由于服务器需要同时处理来自不同终端的中断请求,因此VNIOM需要管理多级队列,以快速响应高优先级的中断请求。
(2)VNDM。其主要功能包括:完成虚拟设备的分配与回收;完成客户端虚拟设备到服务器虚拟镜像的映射及管理;完成客户端与服务器的虚拟交换与调度。
(3)VNFM。这一层首先是完成类似于GoogleGFS的大规模分布式文件系统的存储、访问与搜索;其次,还需要完成如下辅助功能:完成用户文件空间、文件
(4)VNUM。其主要功能包括:完成增加、减小、配置用户信息的工作;进行用户身份认证;对用户使用过程进行监管等。
我们已经在基于桌面终端和普通PC服务器集群上实现了局域网范围内的4VP+,并已经进行了产业化生产和实际部署。目前,正在研制基于平板电脑、手机等终端和移动互联网的TransOS。此外,透明计算模式和TransOS也可以在家电等其他设备上得到应用。