Archive for 9月, 2007

在新加坡逛书店(下)

星期一, 9月 17th, 2007

国家图书馆东门(?)马路对过的一幢商务楼的三楼,有一间”草根书室”,是网友推荐的,果然不错。幸亏网友介绍得非常详细,否则真得找不到。楼下街 面有一 家”商务印书馆”虽然也不错,但是规模不大,陈列的大多是台版的文化或学术快餐类的著作,估计是台湾的商务过来开的。从这个商务印书馆边门进去,像是一个 写字楼,沿着自动扶梯上去,窄小的楼道就让人没有方向了。网友说你要沿着一部永远不开的自动扶梯走上去,就看到走廊尽头的草根书室了。如果不是事先知道, 在黑乎乎的走廊里逡巡,很有擅入民宅的担心。

走廊尽头相邻的两间店面,门口都写着”草根书室”,还没有走近,就听见作为背景音乐的交响曲在轻轻地放送着。两间屋子面积不大,加起来估计也就六、 七十平 方,沿墙一抹到顶的书架,还有不规则的几排在中间。进到空无一人的书店(主人在柜台后面舒服地坐着看书,并不在意我的存在),仿佛进了主人的私家书房,没 有任何哗众取宠喧嚣尘世的畅销作品或快餐读物,然而我几乎走不动了,沿着书架一本一本地翻阅,似乎是翻开了一本巨大的《读书》。我知道书店的主人英培安先 生是新加坡有名的作家,这个书店实际上反映了是他个人兴趣爱好和品位。

在草根书室我买到了北岛主编的十年前的刊物《今天》(英先生这里可以发现很多绝版书)、台湾的《读书》类丛刊(Mook)”《思想》”以及史景迁、 高行建、章怡合的著作、作品等,十几本书,折算人民币一千多元,不过心中还是非常高兴的。

草根书室让我的新加坡购物不至于毫无收获。

在新加坡逛书店(上)

星期日, 9月 16th, 2007

了解一个城市的文化,最好的方式莫过于逛书店。

这次来新加坡开会,是我第一次来新加坡,对这个城市国家我充满了好奇。会议之余,我大约花了两个半天的时间,逛了有10多家书店。

总的说来,可以感到新加坡的书店生存不易。大多数中文书店都蛰居在距离国家图书馆不远的几条马路上,尤其是百胜街的百胜楼,是一处文化用品的集市,主体是 中空的回廊式五层建筑,集中了大大小小七、八个书店,有些书店有两三个门面,分别经营音像制品、大陆或港台图书,抑或旧书、二手书,楼上经营纸张、文具以及杂 七杂八的”文化用品”居多,有”天津馆”是一家饭店,看起来还比较地道,郭德刚如果来新,一定别忘了来这里慰问一下老乡。

这里的大众书局是当然的龙头老大,占据了一翼的四个楼面,楼下两层主要是外文书,一个楼面是中文书,还有一个楼面兼营文具。大众书局似乎有大陆的股份,时下在国内的热销书在这里也都赫然在列。五楼的友联书局还算有一些港台、东南亚中文社科人文图书。如果不是后来在草根书室大开杀戒买了一批图书,我的新加坡购书之旅,可能只有在这里小有收获。

淘旧书据说是百胜楼的强项,只是我对此没有多少兴趣。而类似大众书局这样的书店到处都一样,后来在乌节路又逛了Border外文书店、义安城纪伊国屋书店等,都是一个格调,就像福州路上海书城或者徐家汇现代书局一样,书店虽然非常豪华,但内容都没什么特色。然而若论图书的丰富性和性价比,国内还真是读书人的天堂啊。

图书的价格这里自然是要高得很多了,据说是税收和转运成本的缘故。大陆图书的”定价”在这里都是没有用的,除了旧书,书后的人民币定价基本上与新币价格相当,有时还要高些,这就是说一般图书的价格至少是国内的5倍。

QOTD: 图书馆的专业书太过专业

星期四, 9月 13th, 2007

Karen Coyle不无讽刺地说:

I have discovered a key difference between information architects and librarians: information architects write books that you can find at a bookstore; librarians write books that you can only find (at best!) at the ALA store twice a year, assuming you attend ALA meetings. (我发现信息架构师与图书馆员最大的不同在于:前者所写的书你可以在任何一个书店找到,而图书馆员写的书在最好的情况下,你可以在两年一度的ALA大会上看到,如果你参加大会的话。)

看来全球同此凉热,国外也是一样,至少反映了我们这门科学(如果能称得上的话)太过于小众,大多数研究不过是自娱自乐罢了,很难对这个世界产生什么影响。

所以,正如老槐所说,研究的”品味”可以高一些,视野可以开阔一些,不要太把自己当回事,放轻松一些,后现代一些,学术成就或许还能再大一些。

Coyle接下去的话也很值得回味:

There is meaning behind this statement beyond book distribution. It has to do with the insularity of the library world and our tendency to only speak to each other. It also reveals an underlying assumption that what we know and what we think isn’t of interest to anyone outside of our profession. At least, I hope that’s the reason, because another possibility, which would be even worse, would be that we don’t think that anyone outside the library world is worth speaking to. That would be truly tragic.

《图书馆2.0》著作推介

星期三, 9月 12th, 2007

一本大32K崭新的专著放在你手中,散发着淡淡的油墨清香。翻开典雅大方的烫塑封面,80克亚光铜版纸显得厚重珍贵,纯黑的新宋体文字凸出纸面,别有一种特殊的质感,一摸、一看,这就是一本与众不同的书。

是的,这本书大大的与众不同。

这是本彻头彻尾2.0的书,来自2.0,关于2.0,为了2.0。以2.0的方式萌芽,以2.0的方式写作,以2.0的方式出版。你也可以试试以2.0的方式阅读,你必然有比平常阅读更大的收获。

一批来自五湖四海的年轻图书馆员,在一起描绘一个共同的理想,尤其希望更多的人认同这个理想,一起来实践这个理想。实践这个理想的基础是奉献,是不信权威、不揣浅陋、不避高下、不计得失的草根精神。在德先生和赛先生的指引下,2.0的旗帜高高飘扬。

行文、 体例与风格上很不统一,充分展示了个性化的文字魅力。阅读每一章,你都能感受到背后的激情、冲动,甚至呼吸和心跳。时而博学、亲切,时而冷峻、狡黠,时而睿智,深刻。每位作者都倾尽心力,把2.0的一个侧面,以自认为最美味的方式呈现出来。

人文烟鬼可以发现,这并不是一本关于2.0的说明书,这里有历史的理性和哲学的思辨,有对于职业的焦虑和学科的批判,以及以特有的方式,向大师和人文精神致敬。这里尽可能避免生涩的语汇和缩略词,但是却提供了足够的考据,由2.0所特有的草根性统筹一切价值判断,人人都能开卷有益是2.0写作追求的最高境界。

技术酒徒也能看到,这里并没有唾手可得的方案,或者直接引用的代码,但却非常全面地涉猎了图书馆未来应用的每一个方面,虽然可能还只是罗列,但却是以业务为经纬,以服务为纲目的有机的罗列,术语解释、图表、大量的参考资料以及各类索引,提供了系统深入的研发入口。

这本书绝不是2.0的一切,它只是一切2.0之梦开始的地方。

DC-2007论文学习(下)

星期二, 9月 4th, 2007

Application Profiles: Exposing and Enforcing Metadata Quality
by Diane Ileana Hillmann, Jon Phipps

Diane 的大作。作者选择了一个利用元数据应用纲要控制元数据质量的角度,元数据应用纲要的标准化问题还没有解决,已经开始深入应用了,有点意思。当然就目前看来 AP是一个可松可紧的东西,可以认为,AP规定得越是严格,数据符合AP越是具有高一致性,元数据质量越是高。有时受到现实的局限,许多内容无法用AP来 规定,或者规定了也无法执行,对元数据质量自然无法要求太高。

Using an Application Profile Based Service Registry
by Ann Apps
Ann 又来讲她的元数据注册登记系统了,当然这回是元数据应用纲要的注册登记系统,同样是以IESR的系统来说事。照Leon的话说,一招鲜吃遍天。这个登记注 册系统虽然与前两年介绍得并没有很大的进展,但毕竟是一个实用的系统在运行,而且每年也实实在在地有一些变化。虽然分布式Web服务、语义技术(如采用本 体)等提了好长时间了没有明显进展,还是非常值得借鉴的。
相比较而言,DCMI的元数据登记注册系统管理的对象只是标准规范中的TERMS,最多 涉及一些推荐的编码方式,供查询、翻译、借鉴。而IESR的注册登记是用于资源导航的,可以看成是一个”服务体系的登记注册系统”,其中有”From Application Profile to XML Serialization”的讨论,除了AP,系统还要管理具体的元数据记录库。当然应用纲要本身的规范用词、词间关系、编码模式(Schema)等也 是可以查阅的。这也是元数据注册登记系统与元数据应用纲要注册登记系统的一个比较大的不同吧。
这篇文章可以看成是国内元数据研究实践与国外的主要差距所在。

Identifying the Identifiers
by Douglas Campbell

这篇论文在整个DC会议上显得比较另类,专门研究标识体系的,Doug甚至在为数字资源的标识建立哲学基础,看不出直接的实用意义,但是是一篇颇有中国图林风格(例如对于定义、属性、范围等的偏好)的好论文。

Using Metadata Schema Registry as a Core Function to Enhance Usability and Reusability of Metadata Schemas
by Mitsuharu Nagamori, Shigeo Sugimoto
日 本筑波大学并入了前日本图书情报大学,这两位日本元数据的干将和元老依然在为DCMI做着重要贡献:开发和维护DCMI元数据登记注册系统,新版的系统将 于不久正式推出,主要升级在于支持编码模式(Metadata Schema)的注册,看起来还要支持符合DCAM的形式化的DCAP注册,这个进展不是一点点。粗粗看了一下论文,还不能确切知道是XML Schema还是RDF Schema,还是OWL,当然他们都可以认为是XML Schema。不过Metadata Schema还可以有不同的理解,不进行XML编码的元数据方案,也可以称为Schema。这篇论文是必须/值得一读的。

Virtual Archival Exhibition System: An Authoring Tool for Developing Web-based Virtual Exhibitions
by Ruan Yang, Chennupati K. Ramaiah, Schubert Foo
一个来自新加坡的实际应用案例,元数据方案在其中起到怎样的作用,似乎并没有看明白。


Education.au and Metadata for Events
by Pru Mitchell, Kim Edgar
探索用DC元数据来描述事件,在edna项目中。相信许多图书馆数字化项目中都有此类描述需求,但是是不是能够开发成一种微格式?或者与现有的事件微格式能够互相转换,是值得探讨的。

Integrating Dublin Core and Learning Object Metadata for Describing Learning Objects for Enhanced Reusability
by Abdul Halim Abdul, Abdus Sattar Chaudhry

论文集中的标题与会议演讲的标题有些出入,可能也说明了这篇文章的探索性。

Audience-Centric Taxonomy: Using Taxonomies to Support Heterogeneous User Communities
by Dave Clarke, Pei Jiun Tan
看来是建立一个统一的词表体系用以建立新加坡国家图书馆统一资源门户,以提高资源对于读者的可用性。

Integrating Dublin Core Metadata for Cultural Heritage Collections Using Ontologies
by Constantia Kakali, Irene Lourdi, Thomais Stasinopoulou, Lina Bountouri, Christos Papatheodorou, Martin Doerr, Manolis Gergatsoulis
利用本体映射解决由于采用不同元数据方案而带来的语义互操作问题。不知道效果如何,但是属于热门领域,值得借鉴参考。

Can a system make novice users experts? Important Factors for Automatic Metadata Generation Systems
by Sueyeon Syn, Michael B. Spring
本次会议中最像论文的一篇论文,探讨Web资源元数据自动生成的问题,通过调查发现,某些方面的资源描述如果给与一定推荐,将提高检索系统的查询效果。

DC-2007论文学习(上)

星期二, 9月 4th, 2007

本次会议的主题是”元数据应用纲要的理论和实践”,所有的论文基本上都与这个主题有直接关系,扣题很紧。
以下论文仅链接至会议网站论文摘要页面,会议论文全文即将上网。

Parallel Writing Tradition in East Asian Language Data and Metadata Representation: Under the Light of the DCMI Abstract Model
by Akira Miyazawa

介绍了东亚语言中常见的、同样的内容不同写法(例如汉字和拼音)的元数据编码问题,主要是如何符合DCAM的XML/RDF编码。

Annotation Profiles: Configuring Forms to Edit RDF
by Matthias Palmér, Fredrik Enoksson, Mikael Nilsson, Ambjörn Naeve

Mikael Nilsson是DCAM的起草人之一,是DCAP形式化方案的主要制订者,因此他作为参与者的论文应该具有一定的权威性,至少在DCAP的编码方面。
这篇论文介绍了一个对于网络资源进行元数据标注的工具的开发项目,这个工具与以往的工具所不同的是,支持多种”标准”的元数据应用纲要形式,甚至还可以支 持用户自定义的AP。具体功能还没有去仔细探究,但是好像能够支持自定义(包含所有约束)的XML/RDF/OWL Schema形式的元数据应用纲要,上载之后立刻能够产生元数据著录标引所需要的表单。不知道对于标注的元数据记录,这个工具提供怎样的管理和检索功能。 如果这个工具能够与个人知识管理工具,例如Zotero、BlueOrganizor等结合起来,就不得了了。
这是我们长期以来都想开发、并且试着做过一些开发的一个东西。

SCROL Application Profile
by Steven Wan Wu, Barbara Reed, Paul Loke

在新加坡国际图书馆数字化项目中采用元数据应用纲要的具体做法。与我们通常的做法大同小异,由于DCAP并不是严格意义上的标准规范,因此具体项目中都会有许多扩展和个性化考虑,特别是在Format/Medium方面有很多细化,值得借鉴或参考。

The DCMI Tools Application Profile
by Thomas Severiens, Jane Greenberg

两位作者是DCMI Tools Community的召集人。DCMI一直想为软件工具制定一个元数据规范,草案就在这里了。因为不涉及具体项目,很像我们专门元数据课题组所作的事情。 目前DCMI新的形式化的AP要求已经提出,这个AP应该可以改写成符合新规范的版本了吧?

The DRIADE Project: Phased Application Profile Development in Support of Open Science
by Jane Greenberg, Sarah Carrier, Jed Dube

Jane真是很能写,这是她参加的一个具体的机构库开发项目,为其设计和应用元数据方案所写的论文。与上一篇单纯提出一个应用纲要规范有所不同,涉及很多 具体开发的考虑,特别是对于开放存取的机构库建设,对于元数据方案的需求比一般的商用系统和交钥匙工程来得更为迫切,非常值得一看。论文中提出的三期应用 纲要:第一期以传统的元素集定义为主,第二期要定义各类实体/元素之间的关系,第三期要符合语义Web以及Web2.0的需求,很有意思。

Theory and Practice of Application Profile Development
by Jon Mason, Helen Galatis

澳大利亚教育界很早(1997)就开始将元数据标准应用到基于Web的数字资源系统中,近年来他们发现,对于如此丰富的资源和应用需求,一个标准、一个编 码模式或者一个元数据应用纲要肯定是不够的。作者回顾了十年以来澳大利亚教育界制定或采用的各类元数据标准的情况,项目不多,互有交叉,但碰到的问题却很 典型。一个很重要的”互操作问题”显现出来,必须要很好的考虑和解决。元数据应用纲要很好地反映了人们在刚性的标准和应用需求之间进行折衷,而必须考虑的 一种操作流程和方式上的标准化,应用纲要提出的历史就是从实践到理论的成熟过程。教育资源领域的数字资源和网络应用具有一定的特殊性,而且对元数据共建共 享的需求尤其迫切,已经有多套标准规范,因此作者回顾的ednaVetadataLFMAPARROWAPSRCarrick 等元数据方案都极具观赏价值和参考意义。从通篇的内容来看,作者对于互操作的考虑还停留于元素的重用和共享方面。

“新加坡框架(Singapore Framework)”

星期日, 9月 2nd, 2007

沃维克框架、堪培拉限定、芬兰终结……。DC元数据自诞生以来,留下许多里程碑式的成果,如今这些成果中又多了一个:新加坡框架(Singapore Framework)。 新加坡框架是指元数据应用纲要的一种规范形式。虽然应用纲要曾经是欧洲标准CWA14855,但那毕竟只是一个非常笼统、给人作参考的”指南”。DCMI认识到DC的应用一直无法大规模开展,与编码方面的规范一直不统一很有关系,编码的无标准可循造成元数据标准有等于无,各类应用的互操作还是无法进行。然而编码规范的统一是一件不可能的任务,在XML大行其道的今天,任何符合XML模式规范的DC编码,你都不能说它不规范,你也不可能让大家都采用一种XML的DC编码模式。同时专注于语义一致性描述的DCMI怎么可能推荐一种编码而排斥另一种呢?再说现在有RDF/OWL/N3等编码方式(甚至采用关系型数据库来描述和编码),将来还会出来种种新的方式,如何能预料得到呢?所以对于编码的标准化,必须依赖于一种编码模型的标准化。这就是近年来DCMI花大力气研究并反复讨论的”DC元数据抽象模型(DCAM)”。只有独立于语言的编码模型标准化了,才能建立一种标准的形式化编码规范,不论形式化语言用的是什么。 而领域应用中符合DC抽象模型的元数据的形式化方案的整体,就叫做DC元数据应用纲要(DC Metadata Application Profile)。 我们的”专门元数据方案“实际上都可以认为属于领域应用的”应用纲要”。 具体说来,新加坡框架指符合DC元数据抽象模型的元数据应用纲要,应该包含以下几个部分:

-

  • 功能需求说明(需要desirable)
  • 领域模型 (必需mandatory)
  • 元素集描述 (DSP: Description Set Prifile) (必需mandatory)
  • 应用指南 (可选)
  • 编码句法指南(可选)


对于每个部分是否必需Mandatory、需要Desirable还是可选Option,目前的意见还不统一,例如很多图书馆员认为功能需求说明应该是必需的,但是对于形式化的应用纲要,功能需求说明只是给人读的,不像领域模型(可用UML形式化)和元素集合描述等(DSP,用Schema等形式化),无法翻译成机器语言,对于机器来说并非必需。

为进一步说明应用纲要各个部分的关系,这里还有一个框架的图示(版权属于DCMI,本人拥有翻译版权,引用敬请声明),值得好好推敲和学习:

2004年本人在一篇论文中将数字图书馆的元数据描述方案定义为”语义结构(Semantic Architecture)”,并认为有如下几个部分组成:

  • Resource Analysis and Definition
  • Metadata Set Definition (Core and Extended)
  • Encoding and Mapping Rules
  • Guidelines and Best Practices
  • Metadata Registry, Ontologies and Authority Files

与这个”新加坡框架”颇有一些异曲同工呢!

DC2007总结

星期日, 9月 2nd, 2007

8月30日下午闭幕式上, Makx Dekkers进行了例行总结:

本次会议进行了4场培训,2场主题发言,3场大会论文发言(共计10篇论文),2场分会场论文发言(共计6篇论文),15场社区和工作组会议,3场特别会议,以及两场专题报告会。参加培训的共有113位代表,参加会议的正式注册代表约190位,分别来自33个国家和地区。

照例,Makx感谢了东道主十分专业的组织和接待工作,以及各方的赞助和参与,将这次会议办成又一次成功的大会,胜利的大会。最后Makx宣布明年的DC年会将移师德国柏林举行。

总体感觉,DC经过这许多年的发展,似乎仍然缺乏群众基础,参与者寡,也一直缺乏杀手级的成功应用。这应该与整个WEB标准规范(例如Semantic Web的RDF/OWL标准,以及Web Services标准等)近年来普及不利有关,与DCMI本身的组织形式也有关系。因此本届会议,虽然并不是参与人数最多的一次,但其成果应该足可以在DC历史上留下一笔。主要是两项成果:提出了”新加坡框架(Singapore Framework)”以及正式提出DCMI向实体化发展。由于8月30日我的出国期限已到,未能参加9月1号举行的内部会议(Advisory Board Meeting),其中的幕后细节和下一阶段的问题讨论我就不得而知,不能汇报给大家了,十分遗憾。