Skip to main content

开源仓储软件的研究应用进展及发展趋势

学校名称: 
清华大学图书馆
作者
姓名: 
曾婷,董丽,邹荣,姜爱蓉
研究方法: 
调查研究,应用实践
 
仓储软件主要被用于构建数字仓储,包括机构仓储及保存仓储。最近几年来,开源仓储软件在高校尤其是图书馆界得到越来越广泛的应用。结合文献调研和我们的工作实践,本文主要从技术的角度,对应用最为广泛的三种开源仓储软件(Fedora、DSpace、Eprints)的研究及应用进展进行分析,并探讨它们的未来发展趋势。
Fedora、DSpace、Eprints这三种开源仓储软件都具有悠久的历史,其中:英国南安普敦大学在2000年推出Eprints,美国MIT大学图书馆和惠普实验室在2002年推出DSpace,美国康奈尔大学和弗吉尼亚大学在2003年推出Fedora。Fedora更多的被用来构建保存仓储或者作为其它应用的底层平台,DSpace更多的用来构建机构仓储,Eprints在英国的应用比较广泛。DSpace和Fedora Commons于2008年7月宣布合作,DuraSpace(DSpace+Fedora Commons)组织现在统一对这两个仓储软件的开发进行管理,并促进两个平台的互操作。DuraCloud是DuraSpace的云计算管理层服务,提供云存储及计算服务,在2009年秋季启动试用,计划2011年正式提供服务。在今年召开的Open Repositories 2010会议上,DuraSpace推荐调研DSpace软件运行在Fedora平台上面的策略。
基于OAIS模型,每个仓储软件有三个基本功能:内容的摄入,管理和传播。但是它们的底层架构不同,包括对于文件和元数据的存储和组织方式有根本的不同。由于Fedora数字对象模型在版本2以后有较大的改变,所以将重点分析Fedora数字对象模型的改进之处,并介绍面向服务的Fedora仓储架构。之后,会对基于Fedora的一些典型研究和应用工作进行阐述。DSpace体系结构审核组在2007年发布了关于下一代DSpace体系结构的推荐说明,部分架构上的变化已经在现有版本中体现出来。我们将重点分析下一代DSpace体系结构的改进之处以及针对长期保存工作的研发进展。Eprints在数字仓储的长期保存方面也开展了相关的研发工作,值得借鉴。我们也将对这三种开源仓储软件之间的互操作模式和未来发展趋势进行探讨。
 

通过对开源仓储软件的研究及应用进展进行一次全面的梳理,试图理清思路,对它们在高校及图书馆的应用模式有清楚的了解,为以后各种应用的系统选择和本地化开发提供参考。

作者基本情况介绍: 
曾婷,董丽,邹荣,清华大学图书馆,主要从事机构库及长期保存相关的研究及实践工作。 姜爱蓉,清华大学图书馆,研究馆员,副馆长。
附件大小
-03.ppt2.26 MB