数据网格项目OGSA-DAI新特性

OGSA-DAI是用于分布式异构数据源访问和集成的网格中间件。在新近发布的3.2.x版本中,DAI在功能和易用性方面得到不少改进。

在OGSA-DAI 3.2版本中,最重大的改进是将分布式查询组件DQP进行重写,作为一个组件包含在DAI安装包中,无需之前版本在配置DQP时的DQP EvaluatorDQP Coordinator部署包。通过配置文件加载后的DQP资源,也作为DAI资源和行为(Activities)以标准DAI服务的形式存在,并可通过DAI的SQLClient进行分布式查询,极大简化了DQP配置和使用。

值得关注的是,具备拓展数据类型和函数的关系型数据库,如PostGIS空间数据库,3.2之前版本的DQP分布式查询无法读出包含拓展字段类型如Geometry类型的Schema表结构,而新版本中DQP资源以DAI资源形式对外暴露接口,且DAI支持关系型数据库拓展的JDBC列类型到DAI元组类型的元数据抽取和映射,所以可以读出空间数据库的Schema表结构,并对多个空间数据源进行分布式查询。但在DQP查询过程中,需使用OQL对象查询语句针对异构数据源进行拆分组合,所以DQP查询还不支持直接在SQL语句中嵌入空间分析函数。可行的方法是,对DQP查询进行自定义Functions拓展,加入后端空间数据库支持的空间操作函数

此外,新的DQP索引页面dqp-index.jsp也可以在安装后查看已加载的DQP资源,其中包含DAI数据源信息、DQP数据字典、所有可以查询的表名和字段信息等。同时,DAI 3.2还更新了之前的dai-manager.jsp页面,新增了DAI资源列表dai-resources.jsp,DAI行为列表dai-activities.jsp,配置键值对dai-config.jsp,容器环境键值对dai-context.jsp,请求监视器dai-request-monitor.jsp等多项DAI服务信息页面。

DAI 3.2版本还启用了新的资源监控框架,用于跟踪工作流执行过程中每个Activities产生和消费的数据块的情况。同时,并优化了GridFTP行为的执行效率。在最新的OGSA-DAI 3.2.1版本中,还对已经发现并提交的一些Bug进行了修复。感兴趣的DAI使用者可以查看更新说明,以获取更多细节。

DAI 3.2提供了新的功能并在操作上做了简化,在Ubuntu 9.10下实际安装配置也很顺利,但在版本兼容性方面,测试了DQP提供的GUI组件ogsadqp-3.2.1-od30port,以及驱动程序OSGA-DAI:JDBC都已无法适用于新的DAI 3.2版本,需要等待组件升级或自己在原有基础上修改代码进行定制。