Skip to main content

数据资源的开放、关联:CADAL Open API信息检索系统构建与应用

Posted in
作者信息
姓名: 
张蓓、张成昱
学校名称: 
清华大学
研究课题来源: 
CADAL二期建设子项目

   数字化的信息环境促使人们处于数据的海洋。而面对内容丰富、分布广泛的数据网络,资源开放共享、关联聚合的需求日益强烈,Open API应运而生。

一、Open API简介
API并不是新概念,它的全称是应用编程接口(Application Programming Interface),在计算机操作系统出现的早期就已存在。随着互联网的繁荣发展,一种互联网业务新模式出现:把网站服务封装成计算机易识别的数据接口开放,供第三方开发者使用,这种模式叫做开放网站的API,所开放的API就是Open API
基于Open API实现互联网应用系统之间资源的互连和共享,不仅满足内部交互,而且可以对外开放给其他各类业务合作伙伴。随着轻量级服务交互规范REST得到更多互联网成员的支持,以及XMLJSON等数据格式被普遍使用,Open API拥有坚固的公共基础,为Open API的集成开发提供了最基本的保障;同时在GoogleYahoo、微软等国际技术型大公司的推动下,资源和服务的开放程度逐渐加深,Open API被广泛提供和应用。
二、CADAL Open API信息检索系统的具体实践
清华大学图书馆于20117月承担CADAL二期建设子项目——《基于Open API的信息检索系统》建设任务。本报告将以该项目为背景,具体介绍CADAL Open API信息检索系统的构建与应用情况。
大学数字图书馆国际合作计划(China Academic Digital Associative LibraryCADAL)作为国家教育部公共服务体系建设的重要组成部分,经过先后两期建设,发展成由2个数字图书馆技术中心和64个数字资源中心构成的组织体系,拥有100万册(件)数字资源(包括古籍、民国书刊、现代中英文图书、学位论文等)。为了使成员单位更好地共享、利用CADAL资源,清华大学图书馆完成CADAL Open API信息检索系统的构建,初期在清华大学图书馆、厦门大学图书馆和东北师范大学图书馆的OPAC系统和资源整合系统中推广应用。
1清华大学图书馆INNOPAC系统基于JavaScript语言调用Open API,在馆藏书目记录页面呈现Cadal记录。读者检索时程序首先匹配ISBN,如果命中则直接显示;若不能命中,则按照检索词(如“关键词”、“题名”)二次模糊匹配,最多显示相关度最高的10条“CADAL相关资源”。
2)东北师范大学图书馆ALEPH500系统基于JavaScript+Perl语言,调用Open API呈现Cadal记录。馆藏书目记录页面的“当前Tab”中使用ISBN匹配,如果能命中,则直接显示全文链接;“扩展资源显示Tab”使用题名模糊匹配方式,以表格形式显示命中记录。
3)厦门大学图书馆汇文OPAC系统基于PHP语言调用CADAL Open API,读者通过题名检索馆藏时,程序调用API查询CADAL相关结果,并将结果集成在汇文OPAC检索结果页面上。
4清华大学学术信息资源门户(Metalib)将CADAL资源作为独立的检索集合——CADAL百万册书。程序基于Perl语言调用CADAL Open API,并对检索结果进行处理,以Metalib系统的统一格式揭示。
CADAL Open API检索系统独立于CADAL资源和服务系统,通过内部数据交换批式获得百万级资源元数据,以一组API的形式开放服务。第三方应用不限开发语言,通过指定协议和符合API规范的函数获取XMLJSON 等格式的数据,对自身资源和CADAL资源有效重组后提供给用户混搭(Mashup)应用。系统充分利用开源搜索引擎Solr,实现对于CADAL资源在元数据层面上的检索和访问;并兼顾分布式服务的索引自动同步和负载平衡等应用要素,保障了数据一致性和系统稳定性;在数据安全认证机制方面,系统则提供基于IP控制和用户白名单认证的授权服务,只有授权用户才能使用。
三、CADAL Open API信息检索系统的实践意义
CADAL的建设一贯遵循分布建设、集成使用的理念。Open API信息检索系统基于开放技术框架,建立起异构资源的统一用户视图,不仅提供跨资源、跨平台和跨系统的CADAL数字资源共享环境,而且实现与其他资源的无缝整合,成为一种新的用户服务建设模式。
CADAL所独有的丰富资源以Open API的方式开放给成员单位乃至其他机构,可以有效提高资源利用率,更有针对性地为个性化用户群体服务,使资源更好发挥作用,成为服务于社会的公共财富。
Open API的研究和实现为各个成员单位提供灵活、有效的工具;相关标准规范和应用开发指南也将为同类应用的发展提供指导,具有广泛的借鉴意义。
未来,清华大学图书馆将逐步完善CADAL Open API信息检索系统,进行更多推广,协助相关单位实现基于Open API的资源整合和应用融合的多种尝试。
 
附件大小
2012-OPENAPI报告-张蓓.pdf2.34 MB