Skip to main content

WEB统一检索的本地整合技术研究

学校名称: 
中国农业大学图书馆
作者
姓名: 
康实
研究方法: 
探索性研究

        统一资源检索是数字图书馆的重要应用,传统的以Web Service 做代理的统一检索架构存在一大硬伤:屏蔽了最终用户信息。最终用户信息比如IP,对于某些资源提供者来说有着授权和统计的意义,这也是一些资源提供者不愿意“被”统一检索的主要原因。
        解决这个问题有两个思路,一是资源提供者与Web Service代理方有严格的协议,保障资源提供者能从代理方获取完整的最终用户信息,Web Service代理方获得API;但是,同每家资源提供者进行冗长的商务谈判和复杂的技术交流,对Web Service代理方来说是场噩梦。
       另一个彻底解决的办法是:让用户直接面向资源提供者,整合在用户桌面进行,不再通过代理。资源提供者看到的是最终用户正常的检索行为,能获取完整的最终用户信息,感觉不到整合的进行。
       WEB统一检索的本地整合可用以下几种方式:
       1. 编写客户端直接访问WEB资源,抓回数据再整合;这要求客户端包含DOM解析、JS引擎(当然也可以使用浏览器内核),这种C/S方式在复杂度、跨平台、维护、用户体验上满足不了要求;
       2. 直接使用浏览器在本地整合,这种方式原理简单,通过JS操作DOM就可以达到整合的目的。但这种方式必须解决“跨域”问题:限制跨域访问,是浏览器最基本的安全特性,目前JSONP、IFRAME等跨域方案也不能实现真正意义上的跨域访问。HTML5中提供了便利的跨域解决方案,只需要资源提供者在WEBSERVER做个简单的授权(Access-Control),目前主流浏览器都支持HTML5这一新特性。
       3. 使用第三方平台或扩展浏览器来实现。第2种方案仍需要资源提供者配合,虽然是简单的配置,但也有不确定性。真正不打搅资源提供者同时又能以标准WEB方式实现本地整合的是本方案。核心仍是一个标准的AJAX-RIA,只是通过第三方平台(如AIR)或扩展浏览器来突破“跨域”的安全沙箱。
       按照第三种方案,我馆成功实现“日文OPAC统一检索”从Web Service代理架构迁移到本地整合的测试:在chrome浏览器扩展中通过prototype框架实现AJAX跨域检索,JS操作DOM实现整合,服务端只提供配置参数,不再提供Web Service代理。
       这项研究的意义在于,通过RIA可以实现复杂的本地逻辑处理,数图系统(如统一检索)可以考虑跨平台(PC、智能手机、平板)的free-server桌面部署战略:用户终端(PC、智能手机、平板)等在硬件性能、软件环境上已经有部分重合的趋势,特别是对RIA的支持(包括对DOM、JS的渲染速度)已趋同一,一个HTML标准的RIA可以分担服务端的逻辑运算,并且可以跨平台部署。
 

作者基本情况介绍: 
中国农业大学自动化部 馆员
附件大小
-农大康实.ppt4.52 MB