863软件专项
 
支持网格化的动态自组织系统结构的操作系统研究

课题负责人:陈明宇
起止时间:2003年7月—2005年7月

 网格化的动态自组织计算机体系结构(Dynamic Self-organized computer Architecture based on Grid-component ,DSAG)是由国家智能计算机研究开发中心提出的一种新型的计算机体系结构。其基本思想是利用具有自描述能力的独立的功能部件级服务(网格化部件服务),根据应用的计算模式和运行模式的需要,动态地组织成一个计算机系统,并有效运行应用程序。

  本项目主要研究对DSAG这种全新的计算机体系结构的操作系统支持技术。
主要内容包括:
  操作系统功能的分布化:对操作系统的功能进行分解,并分布到不同的服务节点上。各个操作系统模块本身构成一种服务。各种不同的操作系统服务之间通过一定的方式进行动态的关联。各种计算资源不再由操作系统完全控制,而是自身构成独立的具有自我描述能力的网络服务,操作系统模块通过网络协议与各种资源服务器进行交互协商。
  适合应用模式的按需组合的资源映射: DSAG不再是一个固定的计算机系统,而是可以根据需要进行资源重组的按需变化的结构。操作系统可以根据应用模式的需要,将来自不同服务设施的各种功能部件组合成用户需要的计算机模式。同时操作系统本身的各种功能模块也可以按需组合。从而实现一种按需定制系统的计算模式。
  资源的动态申请、分配和组合:网格计算环境下可用的计算资源将不再是固定的。随着应用运行模式的变化,资源随时可以动态的加入和退出。操作系统不仅是在一个任务开始前就完成资源的分配,而是要在任务执行过程中始终保持对资源的有效控制,保证任务能够根据资源的变动而进行规模和策略上调整,实现子任务动态的分解和组合。
  实现单一系统映像,隐藏系统结构差异:网格计算环境下资源的分布更为不均匀,每个独立的功能模块所提供的性能各不相同,例如因距离不同而带来的不同的响应延迟等。操作系统必须为应用程序提供统一的系统映像,包括采用全局统一的虚拟地址空间等技术,避免为应用程序设计带来额外的复杂性。同时,也需要提供必要的接口以便需要时应用程序可以进行特别的优化。
  自动故障屏蔽和恢复:网格化的计算机系统的规模远大于现有的计算机系统。随着系统规模的扩大,系统中发生局部故障的几率也增大。操作系统应该能自动屏蔽局部故障的影响,保证大型任务能够正常进行,包括故障监测、故障隔离、故障迁移、检查点恢复等技术。利用细粒度的部件级冗余和检查点等技术取代传统的基于整机冗余的高可用技术。从而有效提高整体系统的可用性。

拟解决的技术难点:

  • 网格化资源的自描述和分配协议
  • 操作系统功能分解和动态组合
  • 动态资源映射和重组技术
  • 基于动态虚拟共享的单一系统映象技术
  • 细粒度故障屏蔽和恢复技术等

主要创新点为:

  • 操作系统功能模块的分解和动态重组
  • 操作系统的动态资源映射和管理技术
  • 根据应用模式按需定制的操作系统 

 

 

   
     

Copyright for NCIC All Rights Reserved
本网站版权归国家智能计算机研究开发中心所有