Archive for 11月, 2005

谈谈我们的分类主题词表

星期四, 11月 24th, 2005

谈谈我们的分类主题词表


今天吃了豹子胆,想来炮轰一下我们这个专业的一个重要堡垒:分类主题词表。或者称不上堡垒,是一个Hardcore。炮轰不是目的,偶鼓吹图书情报向来不遗余力,实在因为到了这把年纪,转行已无可能,身家性命在此,哪有不维护的道理?然而要维护首先得让它立得住脚,特别是在这个风起云涌的数字网络时代,得拿得出让人服气的真东西,否则恐怕只能另起炉灶,那就困难多多啦。

看了今次”**分类主题词表”的一本培训教材,算是比较近距离了解了这个东西,补了俺离校快两个decade的课,应该说这还算个不错的东东,起码还在与时俱进:有电子版了。然而看了之后还是有一些话不吐不快,说的不对欢迎大家拍砖。也请我们专家不要生气,我是对事不对人,对于为这个东东做出贡献的所有专家,本人是由衷地敬仰和钦佩有加的。

首先不得不说的是,我们这个学科炼出的这样一套”知识”组织方法,实在是过时了。你可以说它曾经起到多大的作用,但是现在肯定没人会用这个东东了,特别是那些开发各类应用的计算机人士和各行各业的用户,你纵有一万条理由、一万种委屈,他们不会和你争论,不用你就是了。你就慢慢走向坟墓了。

实际上我们奉为圭臬的许多理论是否真是圭臬,还真有疑问呢。窃以为主要有以下问题:

1.编撰、修订的机制和方式已经不合需要了;一个标准规范的生命力在于给大家带来方便、带来价值,网络时代的技术一要简单、门槛低,二要民主、人人参与。什么叫权威?权威不是少数人关起门来说的,而是敞开门由大家在实践中评判的。由少数人把持的东西只有逼着大家说拜拜,如果你想做贡献而不得其门而入。这种东东是没有生命力的。

2.技术背景和应用环境变了,应用目的肯定有所不同,特别是对于Web环境下的信息系统,想要起到规范控制的作用,设计思路一定得跟着变。现在早已经不是靠索引”引得”文献的时代了,现在”基于内容的检索”遍地开花(全文检索实际上就是一种基于内容的文本检索),”微内容”时代已经到来,我们如果仅仅局限于用分类主题词表产生和规范索引,几十年如一日地把它当作标引辅助工具,而不能把它作为内容”导航”和自动链接的工具,毫不奇怪这么好的东东将不名一文。

3.与第一点相关的,开放开放还是开放问题。据说搞了个电子版,然而是个极其封闭的独立系统,甚至在Windows环境下只能通过”复制-粘贴”进行规范标引,这算什么?!据说如果我人工将其输入,建立XML格式(或RDF/OWL)的分类主题词表还算侵权?是不是有专家能够给我澄清一下,我如果用其中多少巴仙能够算”合理使用”?或者我修改其中多少巴仙的内容就算没有侵权?这个东东要给大家用,才能普及,不要管别人用得好不好、规范不规范,让大家随意使用、任意改造、评点,如果大家用你,你应该认为是看得起你,感到高兴才是。不要关起门来自我陶醉,门槛高高,死路一条。

4.我们的分类主题词表要适应网络时代的要求,在设计原则和技术方面可能也可以进行许多改进。传统中我们不满足于分类主题词表体系庞大难于应用,同时又难以对具体学科有专指度很高的应用,很难扩展,我们可以开发一定的工具在网上供人调用、辅助标引(就像现在的PiggyBank插件集成了本体的插件,简单点就像网摘软件支持Tag标注一样),并考虑建立一种开放的自行扩展、维护的机制,例如某些行业领域的自行扩展应该能够公示从而有利于词表的复用和重用((例如在网上公开应用模型和编码格式,开放讨论(例如可以通过在网上公开应用模型和编码格式,开放讨论等方法)。

5.包括分类法、主题法、知识本体等各类具有一定规范的知识组织体系是数字图书馆建设的重要依据和标准,特别在一些需要规范的信息系统/数字图书馆中,例如需要地名、历史纪年规范的家谱数字图书馆或地理信息应用系统、需要植物类属关系、物质命名、生物基因工程的数据库等等,甚至社会科学的研究和资料库、知识库的建立也很需要规范的主题、事件词表。而我国在这方面的成果并不是很多,应该考虑一方面利用现有成果,同时拓展领域,使我们的核心能力发扬光大。

6.现在不光要有电子版,更重要的是应该有网络版。网络版可以实现很多Web2.0的功能。应用工具也可以任由第三方开发。将有望形成一个图书馆方法复兴的局面。其实在国际上将图书馆学传统的规范控制方法应用于网络数字信息已经做得非常先进了,例如NKOS的许多努力,其中作为NKOS主力的曾蕾目前还Chair了FRSAR(主题规范记录的功能需求)(见 编目精灵博客文章 ),我们要学习的话还有现成的老师。我不知道我们是否能在这些方面作些什么。

我在”元数据方法”系列博文( 参考一参考二 , 以及更多 )中也谈到过类似观点。实际上今天想要说的话还有很多,晚上还有事,就此打住,余言就写文章用吧。






Trackback: http://tb.donews.net/TrackBack.aspx?PostId=638458



读”Do libraries matter? The rise of Library 2.0″

星期二, 11月 22nd, 2005

读”Do libraries matter? The rise of Library 2.0″

Filed under: Correspondence (同行交流) - keven @ 2:02 pm


在眼下席卷东西方图书馆界的Library2.0热潮中,Ken Chad和Paul Miller的 Do Libraries Matter? The rise ofLibrary2.0 可以算是一份纲领性的文件了(虽然很短小)。正是这个Paul Miller,最近在Ariadne发表了一篇影响颇大的文章:” Web 2.0: Building the New Library ” 。

在这篇报告摘要中,Ken和Paul似乎把Library2.0当作传统图书馆的一根救命稻草(即使不是最后一根),这也未免太有点危言耸听、夸大其词了吧?

我们先来欣赏一下这份简短的摘要:

The library’s information provider crown is slipping.Justifiably or not, today libraries are increasingly viewed asoutdated, with modern, Internet-based services, such as Amazon andGoogle,looking set to inherit the throne.

Even so, at Talis, we believe that there isplenty of life left in the library yet.

This survival demands change though. Inevitably, as the worldadvances, the library must also evolve and begin to deliver itsservices in the ways that its modern users expect. Library 2.0 isaconcept of a very different library service that operates according tothe expectations of today’s library users. In this vision, the librarymakes information available wherever and whenever the user requires it.

At times, realising this vision will be tough. But we believe it will also be exciting and fulfilling.

In the end, we hope it will be proof that the library really does continue to matter.

Library2.0从(Web2.0)技术的角度看来还只是一些与用户体验有关的功能和技术的七拼八凑,后台需要大量的东西还不是2.0技术所能涵 盖的。技术之源还是可以追溯到Semantic Web技术,看看为了推广SW技术而提出的(解决应用与技术”鸡与蛋”难题的) Piggy Bank /Semantic Bank项目就可以知道关于语义网的应用能够走多远( 参考文章 )。微内容(microcontent)可以有多种连接方式,RSS只是其中一种,数字图书馆的微观结构不就是解决微内容的包结构问题 吗?PiggyBank提供的技术架构还要解决如果网页出版时没有RSS怎么办?如何自动生成或添加RDF标注(RSS即为其中一种)等等。我感到目前的PiggyBank还没有发挥RSS的潜力,可能也是因为RSS应用过于混乱,而达不到SW应用最起码的规范要求,例如应用RDF,现在把RSS认作RDF Site Summary的恐怕不是大多数,虽然大多数也提供RSS1.0的描述。

当然,Ken和Paul主要是从图书馆网站给与读者的用户体验角度来谈Library2.0的,这个角度虽然我并不认为是图书馆的”核心竞争力”,然而也无不可,网络图书馆(或者干脆叫做数字图书馆)如果面目可憎,即便心灵再美,读者恐怕也会被隔壁叫古狗或亚马逊的小女人拐走。

如果对Library2.0感兴趣,我们可以好好看看Ken和Paul倾情打造的 Talis图书馆2.0门户软件/服务 ,虽然现在还有些幼稚,但是金屋藏娇,已经略懂风情,可以示人了。

Ken和Paul在报告中说,Web2.0首先反映了:1、因特网的生活方式;2、自由/免费的精神/理念。在图书馆界应该找到结合点。我一直很忧虑,信息免费的趋势愈演愈烈,而免费却优质的信息服务(例如Google的查询服务)却是由嗜利如命的企业来提供的,一方面把图书馆的服务逼到了死角,另一方面却不允许图书馆界采取类似的运行模式(例如拉广告),而要政府完全承担起来,这从根本上讲是合理的吗?是不是放开图书馆的经营,或者不说传统图书馆,而说数字图书馆,放开数字图书馆的经营,让Google、Amazon、eBay等都来经营数字图书馆的免费信息服务,数字图书馆是否能够呈现更大的发展呢?老百姓是否能够得到更大的实惠呢?图书馆事业是否能够得到更大的发展呢?这应该是给我们的理论家留下的一个很好的研究课题,不要总是拘泥于工业革命时代关于精神、 理念的空谈。

Ken和Paul也承认实现Library2.0需要一个全面的进化过程,特别是对于业务覆盖范围、后台流程、观念方面需要有一个全新的认识。Talis就是一个将Library2.0的需求进一步明确和具体化的试验。

报告的第二部分提出了Library2.0的几个基本原则,颇有启示意义:

  • The library is everywhere (即The pervasive library);
  • The library has no barriers;
  • The library invitesparticipation;
  • The library uses flexible,best-of-breed systems;

核心内容就是平台江先生所说的开放性。如果感兴趣大家自己看吧。

关于Library2.0进一步阅读:




Trackback: http://tb.donews.net/TrackBack.aspx?PostId=636000



数字图书馆理想

星期三, 11月 16th, 2005

数字图书馆理想


我一直在说,搞数字图书馆需要有一点理想,我们不要整天看着电脑屏幕,想着DC、MARC、代码、程序、资源,而更应该想一想数字图书馆为什么?这样我们才能不为图书馆面临挑战而手足无措,不为图书馆职业行将发生巨大的变化而恐惧。这次ICUDL2005会上Brewster Kahle的 Invited Talk ,再一次地揭示了人类赋予图书馆的这个理想:UNIVERSAL ACCESS TO ALL KNOWLEDGE(对所有知识的普遍访问)。

这个理想诞生于图书馆的肇始。古埃及亚历山大图书馆将收藏人类所有知识作为目标,皓首穷经,在2000多年之前就能集50万馆藏之巨。这个理想在20世纪末由于人类掌握了计算技术而被重新点燃, PITAC 有一篇报告: Digital Libraries: Universal Access to Human Knowledge (数字图书馆:对人类知识的普遍访问)就是一篇宣言。我们曾经《 向亚历山大告别 》(作者G.·丹尼尔)),亚历山大图书馆不是得以重建了吗?数字图书馆再次燃起了人类穷尽知识的熊熊烈火,人类历史的延续仿佛又一次将责任肩负到了图书馆身上–这次是数字图书馆。

Kahle告诉我们,当今世界存世之作大约一亿种(国会图书馆拥有2600万),已经比我们想象得数量好像要少得多,其中有版权的数量更是远比我们想象的要少。是啊,实际上法律”允许”人类利用个体智力劳动获得利益的期限,相对于人类历史长河实在是短短一瞬,版权规定的初衷在于激发创造,促进智力劳动,绝不应该限制了人类对于知识的利用和创造。眼下Google、Microsoft、Yahoo等与出版界、图书馆界联手打造一个庞大的”历史图书”馆,据估计平均100美元可以解决一本书的权利问题,10美元可以解决扫描制作问题,一亿种书的数字化,已不是不可能任务,甚至在我们的有生之年已经能够唾手而得了。历史上还有什么时期,能够赋予人这样一种能力,利用有限的金钱,做如此有意义的工作?

试想这个数字图书馆建成之后,在世界各地有众多10-15万美元一辆的面包车(BookMobile或RoamingLibrary),附在各种设备,穿行于贫困乡镇,架起卫星天 线,搭个凉棚,连接起设备,就可以把一亿本书Print onDemand了。平均一本书的制作成本是1美元,远小于图书馆”采分编典流”的管理成本,因而根本不用”读者”归还。这个项目据说已经开始实施,看看孩子们得到书之后的表情吧!我深深地为 这种数字图书馆的理想能够得以实现而激动和感动。

(说明:所附图片均取自ICUDL2005会议网站中Brewster Kahle的 Invited Talk 演示稿,如有违反版权,请版权所有人或代理人致函本人kevenlw@gmail.com,当即撤下。)


胡侃图书软件市场风云变幻群雄并起

星期三, 11月 16th, 2005

下午收到领导的一个妹儿,要了解一下图书馆软件市场的情况,于是拉拉杂杂写了许多,虽然孤陋寡闻,但也觉得光给领导看有点浪费,也害怕误导了 领导,所以也贴出来给同志们看看,群众的眼睛雪亮,如果有不同看法或意见正好可以纠正,让我有机会大家学习。各位产商代表如果看了不高兴,也欢迎留言批判。上周在杭州曾被储树青馆长问及类似问题,只是简单回答 了一下,很不全面,如果储馆长能够看到这个帖子甚好。


近几年图书馆自动化系统 (LAS, 又称图书馆集成管理系统LIS: Library IntegratedSystem)面临对数字图书馆需求的冲击。传统上以书目为中心的业务管理流程首先受到以读者为中心理念的冲击,书目的查询由专门的客户端程序向支持浏览器的方向转变,接着增加了许多基于Web的在线用户服务功能,比如在线续借、预约等,这就要求强化用户管理,支持更为广泛的用户身份认证(一卡通)。图书馆的内部业务流程也开始重视面向工作人员的”界面友好”,区域协作更加强化了对集中Z39.50支持、联合编目、馆际互借、多MARC格式以及多库的分布式管理功能,以及类似于中心图书馆的”LibraryConsortia”。这都是对传统图书馆自动化系统功能提出了更高的要求。在这些方面,国内的系统似乎没有”全能型”的,已经开始有点顾此失彼,难以应付了。

数字图书馆建设的要求首先是要将数字资源的采选订藏编目管理发布服务结合进来。虽然还没有形成固定的运行模式,但是国 外的相关研究开发已经不少,有一些系统已经考虑到相应的功能。利用MARC的856字段加入链接从而支持电子资源全文获取是一个基本应用,进而随着OpenURL开放链接标准的成型为图书馆的电子资源管理提供了一种基于”链接”的标准方法,国外的一些大型系统( Endeavor / Ex Libris / Sirsi + Dynix / Innovative )都有支持开放链接的产品,甚至与数字资源出版/发行商合作,提供”软件+资源”的服务模式。OAI也是正在兴起的一种电子资源整合检索标准,但属于相对独立的开放标准,还没有哪家图书馆软件系统提供商作为他们的软件产品或服务选件。现在国内许多公司把数字化管理系统、数字参考工作、电子阅览室管理、甚至办公自动化也作为图书馆集成系统的选件。但是应该说图书馆还没有一揽子交钥匙的、很好的”数字资源”的集成管理服务方案,因而也还没有传统与”数字资源”结合的、功能全面的”图书馆集成管理系统”产品获解决方案。数字资源基本上是独立系统,各自为政,图书馆基本上采取分门别类个案解决的办法,例如加州数字图书馆提出开放”裸”数据的购买要求,或者比较大的、有开发能力的图书馆自行开发特定中间件,国内外目前基于页面分析技术进行Web资源整合也是一种流行的通用方法。目前这些方法都有明显的缺点。

市场上可以购买到的产品方面,就我 所知,国外产品主要有ExLibris的ALEPH500及系列产品,SirsiDynix的Unicorn系列和Horizon系列产品,Innovative的Millennium产品在国内较活跃(由于Sirsi和Dynix的合并,现在变成3家公司4种产品),产品成熟度、功能性相差无几,而从媒体的报道和用户的口碑而言,ExLibris的系统可能由于起步晚而在设计上较为先进,而且由于是以色列产品而更为”国际化”一些,对多语种的支持可能更好一些,而且有较为完整的产品线,例如其SFX专利产品是最早支持数字资源的开放链接的产品,可能也是由于技术上稍稍领先一些,其价格也是最贵的,听说光是核心的ALEPH500(传统的图书馆自动化集成管理系统)就不低于***万人民币,如果是大馆,起码要**个许可,总价不会低于***万-***万。Dynix虽然几经转卖、易主或兼并,但其技术在市场上却一直是不甘落后,虽然承诺的新功能总是推迟推出,但给人留下了深刻印象。相信与Sirsi公司的兼并又有助于Sirsi提高技术,共同拓展市场。当然这些公司在技术方面的领先并不是难以超越,其它跟随公司往往不久也都掌握了类似的技术、开发出类似的产品(见表二,分数字图书馆解决方案、开放链接解决方案和元搜索方案三个方面的附加产品)。由于Dynix与Sirsi的合并(传言是被兼并),使Dynix的Horizon变得前景不甚明朗,给原本在新产品中承诺的许多新技术将如何发展,SirsiDynix的两条产品线如何向用户提供同等的技术支持等都成了疑问,因此有不少想买系统、换系统客户都在犹豫,老客户也在观望。但是不论如何Sirsi自己的Unicorn和Innovative的Millennium几乎不相上下,还是有得一拼。这两个产品的最终总价(包括几十个许可证)应该在**万美金左右可以拿下。国外尚有许多企业未进入国内市场,例如很有竞争力的Endeavor公司,特别是面向低端市场的海外中小图书馆软件企业几乎是空白。

国内的图书馆自动化系统现在也是水涨船高。大约十几万人民币到**万人民币应该可以拿下。现在恐怕已经没有几万元的系统了(除非应用于中小学市场的)。目前比较有市场竞争力的恐怕也就南京的汇文系统、深圳的ILAS-II、北邮的MELINET了,另外还有北京的丹诚Datatrans、博菲特、金盘系统等等(见表三),由于没有使用或”近距离考察”过这些系统,恐怕无法评论好坏。从211高校的使用情况(见下表一),汇文口碑是不错的,装机量也最大,ILAS其次,但是由于公司近年来的重点在dIlas系统的开发,该产品至今尚未投放市场,目前市场占有率下降也属无奈,dIlas还未定价,据称定价不会低,不知其具体的市场定位如何,其开发思路给人的感觉是比较传统,希望市场策略方面能够有所创新,如果这个老牌产品不打组合拳,结合资源或者服务,在市场营销方面拿出一些新的手段,很让人担心这个产品的前途(本人也实在衷心希望有一个凝聚众人力量的民族品牌能够在国内占领市场,起码是中低端市场,造福图书馆界,从而造福广大读者,啊啊)。北邮的系统近来也没有听说新的市场拓展。这些软件主要实现的是图书馆传统核心功能,还没有国外大型产品的技术思路(例如支持Web Services以及RSS等)和完整的产品线,如果加上定制开发数字图书馆部分,虽然国内目前没有很成熟的公司(最成熟的可能要数参加CALIS数字图书馆认证的一些公司了,当然不排除还有数家不屑于参加CALIS认证的公司),但对新的功能要价都不低,杂七杂八加起来最少也需要**万左右。国内图书馆界一直存在喜欢自行开发的现象,这个趋势可能还会维持下去,国际上现在有用开源软件的趋势,特别是DLI1和DLI2遗留下大量的成果,当然这需要图书馆有一定的软件人才,或者合作伙伴能够提供技术支持作为前提条件。在一些老牌软件厂商创新乏力、服务下滑的情况下。一些新开发的厂商极有可能成为新星,在国产软件不合用而国外软件价太高的夹缝中寻找生路。东莞图书馆采用的新系统就是一家新兴企业开发的产品,最近这个产品又在黑龙江省图书馆的招标中中标,就是一个值得注意的现象。

以上比较主观,仅供参考。欢迎批评指正。

表一

公司名称

产品名称

2001

2002

2003

2004

安装总数

Sirsi

Unicorn

117

207

124

134

1719

Dynix

Horizon

126

114

168

193

1481

Endeavor

Voyager

50

44

35

22

1304

Innovative

Millennium

157

136

144

119

1160

Ex Libris

ALEPH 500

80

58

51

53

923

见:杨思洛”美国图书馆自动化系统市场管窥”(《图书馆杂志》2005/?)引Marshall Breeding. Gradual Evolution-Automated System Marketplace 2005. http://www.libraryjournal.com/article/CA512267

表二

厂商名称

DIGITAL LIBRARY SYSTEM

卖出数量

LINK RESOLVER

卖出数量

METASEARCH INTERFACE

卖出数量

Dynix

Horizon Digital Library

3

Horizon Link Resolver

1

Webfeat

36

Endeavor

ENCompass for Digital Collections

489

LinkFinderPlus

302

ENCompass for Resource Access

17

Exlibris

DigiTool

11

SFX

220

MetaLib

153

Sirsi

Sirsi Hyperion Digital Media Archive

16

Sirsi Resolver

36

Sirsi SingleSearch

52

VTLS

VITAL

6

VSolver

0

VECTORS

2

Innovative*

Electronic Resource Management

不详

WebBridge

不详

MetaFind

不详

见:杨思洛”美国图书馆自动化系统市场管窥”(《图书馆杂志》2005/?)引自国外报道

*感谢编目精灵(http://catwizard.bokee.com/)提供Innovative的相关产品信息。


系统名称

用户数

所占百分比

百分比合并

国外

UNICORN

7

7.36%

23.16%

INNOPAC

6

6.31%

HORIZON

6

6.31%

ALEPH

2

2.10%

VINTAGE

1

1.05%

国内

汇文系统

31

32.63%

76.84%

ILAS

18

18.94%

MELINET

11

11.57%

DATATRANS

2

2.10%

博菲特系统

3

3.15%

MILINS

3

3.15%

金盘系统

2

2.10%

NLIS

1

1.05%

SULCMIS

1

1.05%

图腾系统

1

1.05%



原文注:数据来源:《现代图书情报技术》2004年第3期(原文统计数据略有误差,本数据为最新数据)



Trackback: http://tb.donews.net/TrackBack.aspx?PostId=629351




Technorati :

借鉴DCMI,谈谈怎样使“中图学会”更加现代化

星期一, 11月 14th, 2005

借鉴DCMI,谈谈怎样使”中图学会”更加现代化

Library Society of China

看了 编目精灵的帖子 ,很有感触。我们的学会在进步, 老槐已经总结得很多了 ,前不久我就被 李国新教授大兴调查研究之风 感动过, 林州百县馆长论坛 更 让我有一种”阿根廷,请别为我哭泣”般的感触,还有积极向外界声明我们图书馆界对于网络知识产权保护的立场,以及对图书馆立法的推动(虽然我有 种种担心 ,但 只是对结果的担心,绝非对这件事情本身的否认),种种举措实实在在,确实是我们这个行业和学会应该做的事情,这种新气象、新面貌着实让人振奋,用李国新教授自己的话说就是”空前但不绝后”,评价毫不过分!

但是我觉得我们还可以、还应该走得更远一些。学会的宗旨是促进事业的发展,不是一个木偶、皮影、象征、附庸或者工具,或有着蝇营狗苟见不得人的特殊利益,我们的主任、副主任们在学会不是官员,而是行业的引导者、领路人。在没有什么硬指标或权威机构来衡量、评价或制约学会的工作的时候,学会的好坏自在人心,在广大会员的人心,在每个委员、会员的责任感和事 业心、以及由图书馆理念和精神而生的事业良心,最终当然还是体现在对各种类型、各阶层读者服务上、以及对整个社会文明进步的贡献上。由此判断,我们的学会没有任何的一己私利,而应该是个开放的、民主的、全体图书馆员及相关职业人员组成的俱乐部。

基于这种认识,学会是应 该能够与时俱进,更加”现代化”的。学会的组织形式、活动方式,从头到脚,应该没有什么不能改变、创新的。国外的学术组织在互联网产生之后,组织形式活动方式等有了许多新的变化,产生了许多基于相同兴趣的、虚拟的组织实体,在IEEE等内部就有许多这样的组织,DCMI实际上也是其中非常突出的。基于本人参与DCMI活动的经验,提出以下意见供参考:

1.学会能否取消个人会员的会费和入会手续(我不太清楚目前的手续和会费情况。是否可以通过网络填一个极简单的表,甚至通过邮件订阅,自愿加入某个工作组(working group)),而成为一个图书馆 相关行业(包括专业、职业教育与研究,甚至包括博物馆、档案馆)从业及在学人员当然的俱乐部?这样可以模糊学会的边界,使学会具有最大的开放性。

2.能否提高团体会员以及各类”委员”(例如各类专委会、分委会)的收费?可以认为这些团体会员和委员是Share the ownership oftheentity的,可以使学会有一个坚强的核心,承担起适当的责任和义务,同时学会能够有更多的资源可以支配,进行各类活动。结合上述1可以形成一种既有核心,又围绕着外围逐渐稀薄的大气的无边界开放式学会形态。

3.各专门委员会、分委员会根据工作计划和任务设立工作组、项目组、课题组等作为基本组织单位进行活动,这些基本组织单位需按照一定的程序产生并进行活动,需要有书面的章程或任务书(Charter)。基本组织单位的活动主要通过邮件列表、Wiki、email等形式进行,年会是主要的聚会形式,文档是主要的成果形 式。

4.各专业委员会都应该有自己的Charter,根据Charter安排计划和活动。学会也依据Charter考核各专/分委会。专/分为会下设的工作组/项目组/课题组根据需要产生,根据程序中止。各类工作组项目组课题组可以接受会员单位、企业的赞助进行活动,或开展各种形式的合作研究等等,鼓励成果开放和创作共享。

5.任何人可以通过订阅邮件列表、参与虚拟组织和各类学术讨论或其它活动的方式加入有关工作组/项目组/课题组,进而加入相应的委员会,参与学习、讨论、研究等等,成为社区中的一员。虚拟社区的建设使网站成为联系大家的关键载体。因此必须有强有力的功能(支持Web2.0)和维护。

6.学会内部能否分享最大的民主和足够的自由?会员进出自由、来去自由、活动自由,以各类委员会根据工作任务下设的工作组/项目组为组织单元,会员以自愿为原则,加入或受招募指派参与工作组/项目组的各类活动(按上述虚拟组织方式进行活动)、享受工作成果和应有权利,同时接受相应的约束。

7. 学会提供入会和参与基本组织进行活动所需的基本技能的网络培训,必要时可以由老会员义务提供培训。

8.年会是最基本和主要的活动形式,年会的议程除理事会制定之外,可否向各类委员会及下属工作组提前招募会议主题和议题,安排Session或Slot,不要硬性安排或指定,避免使年会成为官员聚会,或自上而下的工作总结、指令安排等,而要能够体现上下互动、成为会员自己能够参与意见、乐于参加的会议。会议总的议程可以根据各个工作组议程汇总,再合理安排,分配时段和会场,会员和听众也可以自行选择会场分会场,一些不足人数的Session可以在现场取消,并淘优汰劣。

9. 图书情报专业的学生、研究生应该成为学会的有生力量,青年论坛应该可以在年会期间召开。

10. 学会应该寻求各种可能的方式赞助贫困地区的会员参与活动,在名额有限的情况下可以采取论文竞赛或评比的方式,但程序一定要实现公开。鼓励企业赞助但需保持赞助的公益性和中立性,不能影响学会的目的宗旨和公正性。

11.学会应支持进行特殊专题的长期、深入研究,必要时可以聘请学会之外的专家进行(类似于IFLA的许多跨委员任期的专题研究,如FRBR的研究)。开放存取、数图需求、RFID应用、资源/服务整合、开源软件的应用等等都可以成为专项研究课题,组织力量深入研究,然后完全开放免费地提供业界应用(符合creative commons(创作共用)原则或开源版权协议)(不要象我 们前些年国家对于行业的研发投入成果却成了一些公司赚钱的资本,未免不太合理)。

12. 学会应尽可能向行业协会的形式发展,或从事一些行业协会的职能。例如制定行业有关的标准规范,促进职业准入制度、认证制度的建立和实施,以及进行有关软件、资源的评测、许可等,可以从非强制性、推荐性做起,向强制性过渡。

13. 学会应尽可能秉承开放的原则,与其它学会、机构、组织(例如计算机学会、博物馆/档案馆相应组织、作家/电影家协会或其它版权组织等等)或国际性的学会、机构、组织联合开展活动。

14. 学会应积极参与、或组织和鼓励会员、委员加入或参与国际性的学会(例如ALA/ASIS/DCMI等)、机构和组织,开展国际合作。

这样学会组织工作会不会一盘散沙、失去了凝聚力?我却认为如果真正变成上下互动、全体会员都能参与意见的活动,结果只有相反–会更加有凝聚力。学会的凝聚力不是靠外力强加的,而是靠业界精英及其所从事的各类事业发展活动自然形成的,通过必要的学术交流活动来增强社区的凝聚力和成员的荣誉感。如果没有了这一点,这个事业肯定是个没落的事业,自然会被淘汰的,没有必要再维持下去。

以上都是闭着眼睛瞎说,淡吃萝卜咸操心,或者站着说话不嫌腰疼,许多内容只是一种可能性,提供大家开拓思路而已,不对之处请多多包涵,不要当真。



Trackback: http://tb.donews.net/TrackBack.aspx?PostId=626487


“学委会”归来有感

星期五, 11月 11th, 2005

感谢前辈和同侪厚爱,本人有幸参加了这次学委会并聆听了数图专委会的分组讨论。写这篇博的时候, 超平师老槐师 的博文都已出笼,对大大小小头头脑脑的报告和发言都有不少精彩而又”技巧娴熟”的”导读”,多处使我恍然大悟:噢,原来是如此之高!本人愚钝之外还加惭愧,除了开幕式开溜了一会儿小差,其它也都听得稀里糊涂,普通话虽然都听懂了,但由于惯常形象思维而缺乏抽象思维,也习惯了自由散漫,对提纲挈领、大而化之、上下涉及、左右兼顾、全面周到、话里有话的”政府工作报告”式的报告,不大能够全面把握,更难以理解报告背后可能具有的内涵的广度、深度和厚度。不过李国新教授的激情还是充分感受到了,或许我们的事业或学科真的已经到了单凭理性已无法挽救的地步了?想想也参加过一些国际组织的学术讨论,好像报告没有那么多的严肃、抽象、复杂、十足的荣誉感和天降大任般的责任感,有时倒有不少幽默、调侃、低调、平和、现实和好玩。本人无意评判好坏,而更愿意认为这是由于文化不同的缘故吧。

说实话参加这次学委会本人略感失落,为数字图书馆的没落而失落。李国新教授的工作报告充分贯彻了理念和精神,而没有让人看到更多的技术实践和学科更新内容,在我看来 这与吴慰慈教授代表的、上届学委会所强调的、为适应信息技术革命而改造传统图书馆事业和学科的技术实用主义路线(仅仅是我的理解而已)有了很大的不同。我并不是个技术万能论者,但我对中国图书馆界最薄弱的是什么,以及我们能够做些什么、应该做些什么有着技术主义和实用主义的理解。我崇敬甚至崇拜那些进步的理念和精神,但并不认为高喊这些理念和精神能够使我们的事业向前走多远。我甚至不认为我们现在应该制定图书馆法(纯粹个人愚见,仅供批判使用)。即使我们能够制定图书馆法,我们能保证所制定的图书馆法会真正有利于图书馆事业的发展而不是相反吗?我觉得我们倒是面临许多危险:

  • 我们制定的图书馆法不会约束、限制甚至窒息目前图书馆界的许多行之有效的”先进生产力”(主要指一些对事业发展有促进作用的运行方式)吗?能够给予图书馆界以更大的自主权利、发展空间、活动领地和创新机制吗?
  • 我们制定的图书馆法能够涵盖全面的图书馆事业(包括私人图书馆)吗?
  • 能够对政府应尽的义务(例如网点的按人口或地域分配,经费投入占GDP的比例、以及各类图书馆的合作及向公众开放的程度)成功地作出规定吗?
  • 我们在代表读者、弱势群体的利益方面能使图书馆事业得到进一步加强而不是受到损害吗?
  • 我们在尽可能争取更大的公平使用权利方面能够取得更多地话语权甚至裁决权而不是变得更加束手无策吗?
  • ……

如果不是这样,我们迎来的将不是能够被整个社会治理结构和制度所尊重和接纳的明媒正娶,而是更多的锁链和更大的桎梏。

我对数字图书馆没落的这种失落早已习以为常了,只是这种感觉常常被类似于学委会这样的事件唤醒。感到高兴的是其他老师并未没有这种失落感,朱强老师认为至少在高校数字图书馆正在向纵深发展,开发和建设取得了不小的成绩;国家图书馆的数图项目也十分让人期待;党校数图的建设也在如火如荼;来自方正研究院的陈晓鸥院长也谈了数字档案馆的蓬勃兴起,以及数字博物馆正在兴起的开发热潮。这或许是一种深化和进步吧。但是无论如何,我还是感到数字图书馆正在被迅速地边缘化,甚至在图书馆界也是这样。我们正在失去一个千载难逢的机遇,使我们能够具备足够的核心竞争力去抵御其它事业和学科的”侵略”,甚至为我们攻城略地,而目前这个核心竞争力正在花落邻家。



Trackback: http://tb.donews.net/TrackBack.aspx?PostId=623614



关于DC-2005

星期五, 11月 11th, 2005

2005都柏林核心元数据国际会议(DC-2005)于该年9月12日-15日在西班牙首都马德里召开,与会代表来自33个国家和地区共计214名。会议的主题是Vocabulary in Practice,显示了DC专注于语义以及推进应用的工作重心。绝大多数的会议资料(日程和演示文件)目前可以在 会议网址 上获得,会议入选论文34篇参见 DC论文库

DC-2006将于2006年10月初在墨西哥召开,由墨西哥Colima大学(http://www.ucol.mx/index-i.php)承办,在DC-2005会后的AB(Advisory Board)会议上还专门播放了 申办介绍。

除了上一贴介绍的对于DCCD AP的讨论,本次DC年会还取得了如下成果:

  • 去年提出的四个新的属性术语得到了认可,他们是:instructionalMethod (教育元数据工作组提出), accrualMethod, accrualPeriodicity和accrualPolicy (资源集合元数据工作组提出);
  • 作为dc:contributor的修饰词(子元素),MARC relator terms(MARC关系词)得到了认可,但是如何申明河使用还在商讨当中,DCMI, SKOS, FOAF 和LC将可能共同商议提出一个共同的解决办法;
  • 可获得性工作组(Accessibility WG)提出的新属性还在讨论当中,未获通过;
  • 许多现有术语的定义正在进行审核,即将重新修订公布。一项基本原则是新的版本尽可能不要与现有的应用发生冲突,即要保持向下兼容。
  • 应用委员会也要继续审查DCSV(Dublin CoreStructured Value)规范中术语的使用不符合抽象模型的问题。

DCMI每年两次的现状报告(Status report)继续在3月和9月提交,因此各工作组也必须与2月和8月提交报告。

回顾一年来的大事,归纳如下:

  • 2005年3月由Andy Powell, Mikael Nilsson, Ambjörn Naeve 和Pete Johnston四人提交的重要文献: DCMI 抽象模型》 成为DCMI 的推荐文档(Recommendation也就是DCMI的标准);.
  • 2005年6月由Ann Apps提交的 Guidelines for Encoding Bibliographic Citation Information in DublinCore Metadata 成为DCMI 的推荐文档;
  • 2005年6月由Pete Johnston提交的 《关于 DC 元素修饰词的说明(A note on Element Refinement in DublinCore Metadata )》 成为推荐资源(Recommended Resource);
  • 2005年7、8月间DianeHillmann, Mary Woodley 和Corey Harper精心修订了文件 Using Dublin Core, the DCMI Glossary, and the DCMI Bibliography ;
  • 资源集合、政府、教育和图书馆四个工作组的应用纲要开发继续获得进展;
  • Harry Wagner主持开发的新版注册登记软件Registry-Lite开始投入使用;
  • John Kunze向IETF提交了新版的RFC2413标准文档;
  • 新加坡国家图书馆局和新西兰加入了DCMI联盟计划(DCMIAffiliates);
  • 2005年5月Tom Baker成为规范与文档委员会主任(Director of Specifications and Documentation);
  • 关闭了两个工作组:Persistent Identifiersand User Documentation。



Trackback: http://tb.donews.net/TrackBack.aspx?PostId=623610



DC资源集合描述元数据应用纲要(DC CD AP)进展

星期五, 11月 11th, 2005


Pete Johnston 对于 DC-2005 的总结给我们带来了DC CD AP工作组的最新信息,这些情况都反映在 Pete的ppt报告 中了:

DC CD AP过往一年最显著的进展可能要算是DC CD AP草案的推出,在DC-2005应用委员会的全体会议上”非正式”地讨论了这个草案,除了形式上的修改建议之外,对于存在的几个问题中的一个比较大的问题提出了指导性意见。这个问题是:

在资源集合描述时,如果需要同时用到元素及其元素修饰词,例如dc:relation/dcterms:isReferencedBy;dc:description/dcterms:abstract(dc:rights也会碰到),这两类term修饰的内容会发生矛盾。例如一个资源集合的dc:relation的值是另一个资源集合,而这个资源集合isReferencedBy另一本书;dc:description的值是这个资源集合的一般性描述而dcterms:abstract是其某个单元的摘要。应用委员会建议在这种情况下不能够复用dc:relation或dc:description(或dc:rights)而必须专门为资源集合描述寻找新的元素。

另一些正在讨论、尚未定论的问题(虽然在草案中已经有推荐的规定)是:

1、属性值作为字串还是作为引用(use a (value) URI or a (value) string)?编码体系syntaxencoding scheme/富结构rich representation如何用?相关描述(relateddescriptions)应该允许,但是DC CD AP应该保持术语无关。

2、 资源集合媒体类型(格式)的描述。功能需求提出必须能够描述资源集合中是否有提问所需的媒体格式,于是问题就变得很复杂。

3、 开放的时间段。对于资源集合来说,其内容的时间跨度常常是不可确定的。W3CDTF不支持时间范围的表述,ISO8601支持时间范围,但是不支持一头开放的时间范围,例如1949-?。这个问题需要DC Date WG工作组解决。

4、 资源集合的位置location和服务services分离是否有必要?如何分离?是否isLocatedAt/ isAccessedVia两个修饰词都需要?

DC定义的相关概念如下:

• Collection

- An aggregation of one or more items

• Location

- Aplace where a collection is held (Michael Heaney, Analytical Model)

• Service

-Asystem that provides one or more functions of value to the end-user.Examplesinclude: a photocopying service, a banking service, anauthentication service,interlibrary loans, a Z39.50 or Web server (DCMIType Vocabulary)

- Provided physically or digitally

- User may be human, organisation orsoftware application.

• (DCCD AP) Service

- A system that provides access to theItems within the Collection

来年的工作计划就围绕这些问题进行讨论、提出解决方案,并修订DC CD AP。

序号

工作内容

开始日期

结束日期

1

Revise in light of Usage Board review

2005-09

2005-11

2

Resolve item media-type issue

2005-09

2005-11

3

Finalise isLocatedIn/isAccessedVia properties

2005-11

2006-02

4

Work with DC Date WG on date range format

2005-09

2006-03?

5

Update DCAP

2006-01

2006-04

6

Syntax (based on work by DC Arch WG)

2006-05?

2006-09

7

Crosswalks

2006-05

2006-09

8

Usage Guidelines

2006-05

2006-09

9

Usage Board Review

2006-10

2006-10

DC-2005上资源集合工作组还交流了三篇报告:

来自University of Illinois at Urbana-Champaign的Sarah Shreeves 和Muriel Foulonneau通过网络视频会议形式报告了他们在 几个项目中使用资源集合描述 的情况。

英国博物馆、图书馆、档案馆联合委员会的Kate Fernie介绍了他们承担的 文化遗产资源集合项目 的情况。

大英图书馆的Bill Oldroyd简短地介绍了TEL (The European Library:欧洲图书馆)项目中采用资源集合描述的情况。

DC CD AP草案精简版(2005-8-25)见:
http://www.ukoln.ac.uk/metadata/dcmi/collection-ap-summary/2005-08-25/

草案完整版(2005-8-25)见:
http://www.ukoln.ac.uk/metadata/dcmi/collection-application-profile/




Trackback: http://tb.donews.net/TrackBack.aspx?PostId=623606



数字图书馆相关国际会议(2005)

星期五, 11月 11th, 2005


本年度与数字图书馆和元数据相关的国际会议网址(来自 DC-2005网站




Trackback: http://tb.donews.net/TrackBack.aspx?PostId=623602




Technorati :

关于DC编码问题的回复

星期四, 11月 3rd, 2005

关于DC编码问题的回复


对于元数据进行XMLs/RDFs等编码是一件劳心费力的事情,偶一向认为只有聪明绝顶的人才能做,所以常常避而远之。别说国内 绝少探讨,在DC社区也常常只有Andy Powell、PeteJohnston人偶尔说说,而且只要他们一说话,旁人往往噤声–这两位是真专家(当然得除了Eric Miller和DanBrickley,这两人应算W3C的人。其他的人偶就不知了,抱歉)。我们这里只有Leon是专家,但他虽然聪明,还没有绝顶。记得n年前(n?>=5)我们写了篇论文就说用RDF来保存我们的元数据,在当时可算是国际数字图书馆界的先驱,Leon因此还去了趟汉城(即”首儿”)参加亚洲数字图书馆会议,第一次跻身于国际诸多DL大腕之间。当然我们是后来知道RDF怎么回事之后,才知道我们有多么先进的。

因此我认为平台江先生对DC编码有如此深入的实践,实在难得,在国内绝对算凤毛麟角,让我们顿生惺惺相惜之情。当然也许(99%的可能性)我们太过于孤陋寡闻,国人绝顶聪明者众(当然一般是到了米国才被发现),就我知道张晓林教授麾下的毛老弟肯定就是一位,清华还有一位邢博士,何其了得,但是好像人家兴趣都不在此。其他是否有人,欢迎检举揭发。

于是偶感到有责任不揣浅薄,捋起袖子,打起精神,挺身而出,花点时间,倾我所学,仔细看了江先生的大作,就DC元数据的编码问题作一番探讨。当然偶只是尽可能从我理解的DCMI的角度解释编码问题,绝不能说偶的理解一点偏差都没有,完全代表了DCMI,况且DCMI本来就非常开放,DCMI没有说的大家都可以说,DCMI说了的你也可以只取爱听的听、爱用的用。就像人们常说的:用户永远是对的;如果用户错了,请参照前一句。

1、首先需要探讨一个问题:为什么元数据编码问题那么容易被人忽视?而且被人忽视了那么久?元数据不是很重要吗?是很重要。那么数字图书馆已经喊了十多年了,元数据是数字图书馆的基础,如此重要的元数据编码问题为什么至今没有为众人所共知、共享、公用?难道是不需要吗?没错,可以说目前绝大多数项目的元数据方案还不需要用统一的、一致的、基于XML/S或RDF/S的编码,而只需要用任何数据库系统或软件包来开发就是了。元数据的语义约束/限定(如数据类型/取值范围/关联关系等)通过应用系统的软件开发来实现。统一的、一致的和开放的编码在当前看来是为了系统之间互操作使用的,从历史的角度来看是为了永久保存而使用的,而互操作和永久保存对于商用系统(或开发急功近利的政绩系统)来说永远是最后的/被迫的考虑,特别是实现这种互操作还需要花费额外的资源,特别是目前在应用系统中实现NativeXML数据的管理(XMLs/RDFs本质上都是XML或比XML更繁琐的数据)还存在效率问题、还没有很好的工具能够处理/操纵等等问题,其好处还不能充分体现出来的时候。然而这个问题一向为视数据为生命的图书馆界所重视,永久保存是任何时代图书馆员对于知识及其载体的最大诉求,服务器可以毁坏,系统可以升级,数据却要随时可以被迁移,不能依赖于任何硬件、软件、人件而做到永久保存。这也是我们作为图书馆员,一直关心元数据编码的原因,即便不可用、不会用,无需用,也要关心。

2、第二个问题:元数据编码主要解决的是什么问题?如果把元数据看成是关系数据库中的属性表(实际上目前各类数字图书馆应用的元数据方案更多地采用数据库方式进行实现,可以看成用关系表的形式进行编码),元数据的XML/RDF描述文档实际上是以一种外在的、显性的方式呈现属性的约束和属性联系,使”数据”在真正意义上不依赖于实现系统,而能为任何计算机所处理(实际上使计算机的处理单元从”字串”向”语义单元”进化)。并且如果采用标准的方式进行编码,更能够增强数据语义的表达和传递的独立性。我们知道关系数据库中数据离开了表结构就会变得毫无意义了,而用XML/RDF编码的元数据就不存在这个问题。

3、第三个问题:元数据描述的语法独立性真的那么重要吗?能够做到吗?语法独立性是指一个元数据方案所指代的一个应用系统信息模型在描述上是中立的,不依赖于编码的,可以由多种编码语言和技术来实现的。从这个表述中我们可以知道这种元数据描述的独立性有助于保证系统的互操作性、可扩展性、可迁移性和永久保存性,并且潜在的一个要求–语义的显性化(或称外在化)要求使得计算机操作数据变得非常准确、容易、不会在传输过程中轻易地改变。而隐含的语义或关系假设常常会威胁到语义和关系的匹配、运算和传递。能不能做到对于任一应用系统都能够建立一个独立的表达语义和关系的描述,使得应用系统的数据能够脱离系统软硬件而独立存在,这也是我近来研究的一个课题。即一个独立的”数字图书馆语义结构”。结果如何,尚不得而知。DCMI提出一个独立于编码的抽象模型(当然基本上还是基于RDF的,因为元数据应用模型与RDF的约定有着千丝万缕的联系,甚至很难说谁是鸡谁是蛋)就是一个独立的语义模型,但这还只是一个定义了一些基本原则的微观模型而已。

4、一个相关的、反过来的问题是,通过元数据编码能够解决元数据方案的语义限定/扩展问题吗?为什么不能尽可能地直接通过应用XML的语法所提供的功能(例如现成的元素或嵌套、递归等方法,或直接采用DC自身的元素)来进行扩展、限定呢?而偏要引入RDF,并认为它才是最好的描述元数据的模型?原因同上,不是说不行,而是影响了语法独立性以及语义的外显化原则,难以在不同系统之间达成一致。同样的道理,元数据元素的约束限定及其相互之间的关系定义推荐尽可能采用XMLSchema方式定义(例如元素是字串还是资源或复合结构、一个元素Date与另一个元素Created之间的关系是元素与元素修饰词的关系等等),而在带有实例的XML文件中采用平面的、直观的表达形式。这样看其来复杂,实际上增强了灵活性和独立性。采用属性嵌套等编码方式不仅会使数据变得很”难看”,而且不易于维护和迁移,更危险的是由于不可能完全遵循1:1原则而在作dumb-down时产生歧义(例如”作者”元素的值变成一个email地址或者职称性别等情 况)。这里需要说明的是XML同XML Schema的关系与 RDF和RDFSchema的关系完全是不同的,XMLS是XML文件的定义格式,而RDFSchema只不过是RDF词表的扩展而已。由于有XMLS作为XML文档的定义格式,任何结构化查询都需要先经过XMLS才能判断并列题名是题名的修饰词,在查题名时就不会漏掉查并列题名。

5、正确的DC扩展,DCMI推荐采用抽象模型+应用纲要形式,这在本帖子中恐怕难以尽述了,有兴趣可以看DCMI的相关文档。对于DC/DCTerms我的理解还是应该看成是一套词表,而不是一种方法体系,这不是说不可以将DC元素用作XML元素,而是说不可以以任意的编码结构或任意地扩展元素/修饰词。应用纲要对于 复用或自行扩展元素都有基本规定,诸如”著作方式”、”版本”"价格”等描述需求都可以复用已有元数据标准,例如MARC。

6、DC的语法独立原则是基于抽象模型的,其抽象模型是所有编码实现的基准。”某种通用的、稳定的、合理的编码表现形式”应该是一个抽象模型,而不是具体的编码规范。元数据抽象模型或许可以用一种中立的UML来表示(当然这里面有一个”语义描述”描述到何种程度的问题)。但不论怎么,我认为抽象模型最符合RDF,用RDFs表示就毫无问题,RDFs不仅仅是一个框架,而包含一套功能性的词表。RDF与xml表示的元素序列化语法格式可以相同,然而意义则可以完全不同。上面已经说了,XML的序列化需要XMLSchema的支持,而RDF也需要作为XML文件实现功能。值得注意的是DCMI的XML编码指南在制定xmlschema时并非进行了很详尽的、完全满足抽象模型的规定,不是说与抽象模型有冲突,而是说不能认为这个指南是”完备”的,毕竟”指南”产生于抽象模型完善之前。是否新版的”指南”有所改进我还没有来得及去核查,抱歉了。

不早了,今天就先说这些。

(此处关闭评论功能,评论请至 keven.wordpress.com




Trackback: http://tb.donews.net/TrackBack.aspx?PostId=613321




Technorati :

三种数字图书馆

星期四, 11月 3rd, 2005

美国数字图书馆先导研究计划第一期的成功和第二期的实施,对美国国内乃至世界各国的数字图书馆的建设起到了极大的推动作用。近几年各国数字图书馆的研究开发高潮迭起,通过因特网可以查到的有关项目、课题有数百个之多。数字图书馆领域的研究开发是体现数字图书馆理念最好实例:充分利用因特网的便利条件,信息公开,依靠技术提高信息的可获得性。该领域的绝大多数研究资料都可以通过因特网直接得到,包括许多会议论文(例如 IEEE 的早期数字图书馆会议录全文),部分可能要通过付费方式,例如 ACM ( Association for Computing Machinery ,实际上的美国计算机协会)的技术报告等。我们所浏览和调查过的项目不下 200 个,美国研究图书馆协会( ARL )资源网站中收录了 403 个 [1] ( 2000 年 9 月),通过我们整理的”核心资源”、”重要论文”"大事记” 等资料,您可以看到目前的繁荣局面。

如此纷繁复杂的局面有时很难让人看清楚目前数字图书馆领域到底在搞些什么,哪些与自己正在从事的工作有关,是否可资借鉴或参考。不加分析地罗列许多项目,或者对每个项目进行逐个介绍我们认为毫无意义,这些项目不仅对于初入道者,甚至资深的图书馆员和计算机网络专家也常常不得要领。作为”引论”,我们希望尽可能理清数字图书馆的发展脉络,尽可能从政策、机制、宏观管理、技术进展的意义等宏观方面对各个项目进行分析。通过对目前数字图书馆研究课题和开发项目进行一个大致分类,应该有助于认识目前数字图书馆领域所发生的事情。

根据我们分析,国外目前数字图书馆计划和项目大致可分为三种类型:技术主导型、资源主导型和服务主导型,基本区分见下表:


类型

内容

特征

举例

技术主导型

以涉及数字图书馆资源获取、存储、组织、检索、发布和版权管理等方面的技术创新和开发为目标,资源库通常作为测试环境或副产品。

求得某一方面的技术进展,成果为技术报告,资源库只作为测试环境( Testbed )

DLI1 、 DLI2 项目

资源主导型

以资源数字化为目标,借助一定的技术手段(不一定是最先进的),提供因特网浏览和检索

可以是资源网站,任何商业机构、个人都可以开发建设,很多项目属于传统图书馆资源的数字化。

” 美国记忆 ” 项目 , 纽约公共图书馆历史收藏项目 , UNCOVER 等

服务主导型

以各类型资源库的整合和系统服务为目标,结合各种先进的服务手段,如个性化服务、自动定制等,并常常用到各种电子商务手段,如用户认证、付费管理等。

深层次的情报服务,常常是传统图书馆向数字图书馆转型期的必然选择

加里福尼亚数字图书馆项目、大英图书馆项目


上述分类反映了目前数字图书馆研究的丰富性,所有这些相关努力带来了数字图书馆的繁荣,每一个具体的组织机构都站在它的角度、以它自己的理解进行研究或开发,涓涓细流汇成大海。数字化图书馆从一开始就不局限于一个行业或学科领域,它不仅仅是数字化资源的集合,而是数字化资源与服务,以及一系列工具的有机组成,数字图书馆的建设也不仅仅是技术问题,而是一系列目标与政策的合力。

有一点需要注意的是,上述三类区分并不是绝对的,他们之间有相互交叉、影响或难以区分的情况。例如一些 DLI1 的项目已经建立起初具规模的资源库,一直在对用户提供服务;美国国家数字图书馆计划也采用了许多新开发的技术(如统一资源命名技术);大英图书馆的数字化计划是我们见到的传统图书馆最富挑战性的数字化计划,这主要受益于英国图书馆界一贯的对数字图书馆技术的重视,当然它的立足点始终不移地放在更好地为读者服务上。近期 NSF 资助的一些项目非常强调强调要结合技术、资源库、服务的结合,例如2000年四月结束招标的 NSDL 项目( National Science, Mathematics, Engineering, and Technology Education Digital Library ) [3]

以此为分类标准,我们可以清楚具体地分析各类数字图书馆项目。



[1] http://www.arl.org/did/



[3] 见 http://www.nsf.gov/cgi-bin/getpub?nsf0044





Trackback: http://tb.donews.net/TrackBack.aspx?PostId=553005