Skip to main content

Web环境下多源数据集成服务——清华大学新版期刊导航系统建设

学校名称: 
清华大学图书馆
联系方式
email: 
doutf@lib.tsinghua.edu.cn
电话: 
010-62784905转8005

        Web应用已深入人心,特别是在web2.0 技术环境下, Web服务以更开放的姿态和更协作的理念把互联网上各个节点关联起来。这给图书馆服务带来巨大的发展机遇。图书馆作为互联网上的一个节点,不再是用户获取信息资源的唯一入口。在新技术环境下,图书馆的数据作为优质的数据源应被更多节点集成应用。相反,图书馆也要有意识地把web环境中不同来源的数据组织起来,重构出符合本馆特色的优质服务。  
        清华大学图书馆在充分调研了电子期刊出版发布现状,分析了本馆期刊数据以及本馆系统优势的基础上提出:综合运用多种技术和多源数据建立以期刊数据为线索的多层次立体化的期刊导航系统。即:建立一个以期刊数据为线索,向下关联期刊的封面、目次、文章数据,向外关联期刊的评价信息,馆藏年限,向上关联期刊隶属的数据库(平台)和学科分类的电子期刊导航系统。
该系统实现5个具体功能。
1.        灵活有效的期刊浏览与检索;
2.        点击期刊名称链接到刊;
3.        提供期刊出版变更等扩展信息;
4.        体现期刊评价。
5.        实现期刊最新封面、目次和文章等内容的推送。
该系统从如下4个数据来源中抽取数据。
1.        从SFX知识库抽取期刊基本信息和用于扩展服务的扩展数据;
2.        建立RSS收割服务器,并从中抽取期刊的封面,文章级别的数据;
3.        从评价机构获取期刊收录列表;
4.        从Ulrich's Periodicals Directory 获取期刊扩展信息,补充SFX知识库扩展信息的不足。
目前RSS收割服务器已完成对15000种期刊的采集,累计采集的文章数据达50万篇。
该系统在展示层完成多源数据的关联应用。
系统综合运用了RSS,mashup, AJAX等web2.0技术,利用多源数据,围绕期刊导航这一核心服务延伸出更多服务内容,并改变了我馆原有期刊导航的数据维护机制。新版期刊导航服务一经推出即受到用户的一致好评,一些年轻的读者则直呼“太炫了”,“很实用”!开发新版期刊导航系统也是综合各厂商数据,协调多厂商技术规范的一个有益尝试,它充分体现了2.0时代开放协作的优势。项目探索过程中涉及的多源数据采集、重组、集成应用的思路也为我们未来在“云计算”环境下开展饶有特色的图书馆服务开辟了广阔的空间。

开发环境(编程环境,开源软件的利用): 
MYSQL+Perl+Jacascript
应用效果(访问量,访问频率等): 
截至2009/11/13,新版期刊导航用户访问人次为2499608
案例开发人员: 
窦天芳、李志强、韦晓全、陈代龙
合作单位: 
Exlibris公司北京办事处,同方知网(北京)技术有限公司
附件大小
11web环境下多源数据的集成服务.ppt764.5 KB
奖项: 
二等奖
排名: 
3