Archive for 3月, 2007

Mashup和Meshup

星期六, 3月 31st, 2007

照我看来,RSS从1.0到2.0,是一个不可饶恕的、极大的倒退。当然这两个东西不是一个东西,完全是不同团体(是不是利益团体不知道)开发的用于同一目的的不同标准。采用混淆视听的手法,满足于一时的简单,而贻患无穷。

Kingsley Idehen在最近的一个帖子里解释了Mashup与Meshup的不同:

Mashups - 粗暴地联结不同来源的数据(Brute force joining of disparate Web Data。我的理解:不考虑被联结方的属性/意愿。因为没有描述,也无从查考)
Meshups - 自然地联结不同来源的数据(Natural joining of disparate Web Data )

也就是说,前者是革命婚姻,后者是自由恋爱;前者也可能碰到好人,而后者才是和谐社会的基础。

根源就在于RSS2.0的数据只比HTML多了一个数型结构的描述,链接关系的描述并不是基于语义的(不支持RDF),数据类型不具有自说明性,因而不同应用的数据进行集成(互操作)就存在很大的不确定性,没有人工的参与很难判别数据是否一致,从原理上使得数据集成的自动化成为不可能。

目前有不少2.0开放应用已经事实上支持Meshup了。即:一部分采用了RDF进行数据描述的应用,在进行Mashup时,实际上是在进行Meshup(Meshup子集于Mashup)。例如Googlebase以及Yahoo的一些应用,它们也输出RSS2.0,但却是规范的、支持RDF的RSS2.0,因为他们内部数据是支持RDF的。

Kinsley说:

I can achieve this in minutes without writing a single line of code. I can do it because of the Data Model prowess of RDF (self-describing instance-data), the data interchange and transformation power of XML and XSLT respectively, the inherent power of XML based Web Services (REST or SOAP), and of course, having a Hybrid Server product like Virtuoso at my disposal that delivers a cross platform solution for exploiting all of these standards coherently.

他还举了两个例子:

  1. Googlebase Query URL as an RDF Data Source
  2. Perform a simple Data Mesh by adding (via link copy and paste) this Upcoming.org Query Services URL for Ajax Events to the RDF Browsers list of Data Sources (paste into the Data Source URI input field).

介绍这些对我们数字图书馆建设有什么意义呢?实际上意义特别重大。与这些襁褓中的语义技术相比,目前的资源整合技术,包括跨库检索、开放链接、门户整合、单点登录等等所采用的具体做法,从总体上而言都是权宜之计,说句不好听的:都是要被淘汰的。对于RDF数据的支持将最终使互联网发生天翻地覆的变化。

语义Web现在非正式地给自己贴了个标签叫Web3.0,也就是Data Web (作为语义Web的第一层:数据层,往上还有描述层、推理层等),虽然有些滑稽与无奈,至少说明语义Web运动走出书斋和实验室,开始注重参与具体应用了。这也是2.0带来的混乱之后的醒悟吧。现在仍有许多人不相信语义Web的理想能够实现,但是我始终认为语义Web,也就是Data Web,与数字图书馆的理想是一致的,但愿Web2.0的发展能够顺利,并且尽快地过渡到3.0。

Powered by ScribeFire.

超星的宿命

星期三, 3月 28th, 2007

本想用twitter唠叨两句,但大家似乎都很重视这件事,先是图林老姜转贴报道,后来表哥发来消息,接着又看到Libnews转述还加了编者按,念在当初还去史超处参观学习过的份上,认认真真地写一段“悼词”吧。

超星走到这一步实际上一点都不奇怪,这是它的宿命。一方面可以用来诠释我们知识产权保护的伟光正到了相当的阶段,另一方面也说明任何新东西都不可能是本土的,只能是舶来的。

且不说超星的发迹有多少原罪,有原罪得远不止超星一个,有些至今还活得好好的。就眼下而言,为什么Google能做而超星不能?既然当初国图收手的时候超星没有收手,丫挺到现在,Google的所作所为应该对超星是绝大的利好,而它却在黎明前倒下了。正反映了我们相关法规和管理体制上的悲哀。

首先我们没有明确的信息公开、合理使用制度,在出版界的反对下这个制度似乎是建立不起来的,并且似乎任何法律都可以溯及以往。所以很奇怪我们一加入国际版权组织,一下子那些特殊历史时期国家投资的作品也全都自动地私有化了,找不到主人的东西也会有人认养。据此而论我们的数字图书馆是永远没有东西可以做滴。

其次我们也缺乏利益之外的中立机构,全都是利益相关者(stakeholder),或者全都在体制中有自己的代理人。于是不管是谁的东西,全都想来分一杯羹。就像公众利益常常会被人利用一样,知识产权保护也不一定就保护了先进生产力,助纣为虐的事情做得太多,以至于早就没有了公信。所以对数字图书馆来说你认为可以做做试试的东西也早晚都会被扼杀。

出版业向来以最大程度地占据他人的智力财富为己任,知识产权真正应该保护的“作者”向来被他们当成人质,即便是国家投资的作品也以各种名目据为己有,而且一谈判就狮子大开口。数字图书馆建设碰到的全是最厉害的钉子户,即使数字图书馆赔得起作者,也养不起出版商。因此完全合法的数字图书馆是根本不可能在中国建成滴。

只有一个可能:体制外变成体制内,那就成了出版业的内讧,可以内部解决。看来超星觉悟得太晚,想做的时候已经没有资源了。

所以,为超星默哀吧。

Powered by ScribeFire.

Lib2.0个人首页

星期三, 3月 28th, 2007


lib20netvibes
keven上传于Yupoo.

Netvibes和Pageflakes的个性化首页服务都有了长足的进展,这是用Netvibes聚合了一些中文有关的Lib2.0资源搜索,用于跟踪最新情况还不错。

什么是Mashup

星期日, 3月 25th, 2007

这里解释得很清楚。

关于Web2.0应用的调查

星期五, 3月 23rd, 2007

JISC最近做了一个Web2.0(在英国教育领域)应用的调查,结果报告在这里可以下载。Andy Powell总结了几点

  • 玩过第二人生的比例很低;
  • 使用del.icio.us的比例也很低,有一点出乎意料;
  • 把阅读和写作博客当成学习或工作的工具的博客比例也相当低。

看来全球与此同凉热啊。

不过国内有老槐、竹帛斋等竭力鼓吹,我相信很快就会超英赶美的!


powered by performancing firefox

2.0的困境与希望

星期日, 3月 18th, 2007

现实总是不完美的,有时甚至是痛苦的。在向图书馆2.0转型的机遇面前,图书馆员、馆长以及整个图书馆行业的所有利益相关者来说都面临抉择。我们正走在一个进退两难的十字路口。

积极倡导图书馆2.0的图书馆员可能在任何地方都是少数民族,当然网上可能稍微好一些,但也不见得能好到哪儿去。面临未知的未来许多人会产生恐惧,这是正常现象,图书馆2.0不可避免地会使图书馆员承受岗位、职位、要求、流程、以及工作量方面的变化,有许多图书馆员拒绝变化,又有什么理由指责他们呢?

图书馆的馆长们能够支持这种变化吗?这种变化意味着承受不同以往的更多、更复杂的服务要求,以及更多的监督、一目了然的绩效数据和苛刻的评价方法。读者的真实体验与馆长的职业生涯会有什么样的直接联系呢?我们固然应该承认并相信大多数馆长还是有事业心、职业心和进取心的,但馆长业绩的评价机制毕竟没有与图书馆2.0所产生的效益挂钩,何况这个效益是什么还没有定论。

读者是否就真的需要图书馆2.0?前面已经说过,图书馆2.0实际上是图书馆自救的产物。网络时代是注意力稀缺的时代,有无数的图书馆的替代品可供读者选择,许多信息服务方式在过去、现在和未来,都不会是图书馆的当然业务,图书馆2.0固然能为读者带来更好的服务,但却并非是读者的必然选择。

更大的阻力并非来自变革的危机,事实情况可能正好相反,来自于当前的一派大好形势。面对我国近年来图书馆事业大发展,任何危机论者都像是在杞人忧天。某些人看起来”数字潮流,浩浩荡荡”,而更多的人则认为”世间本无事,庸人自扰之。”这是最大的忧患。

出于图书馆事业的特殊性,图书馆2.0并不具有自主改革的动力。我们的图书馆事业不是基于法律保障独立运行的社会事业,也不像企业那样具有强烈的生存意识,因此从体制上来说没有明显的升级2.0动因。图书馆事业依附于社会文化事业,要存在自然会存在下去,要消亡也有它消亡的理由。对于未知未来的挑战,只有靠不断的呼吁来警醒,而并没有理论来说服他们。

对于趋势的主动把握能够决定资源的配置和流向,影响到行业的发展方向,因此我们如果不能居安思危,就会丧失当前的大好机遇。如同美国前副总统戈尔在”难以忽视的真相(Inconvenient Truth)”中所说的,我们真正危机在于漠视环境的变化,未察觉环境变化对自己的影响将是致命的。就如同一只温水中青蛙,在温暖中会失去知觉,懵懵懂懂而变得无知无畏。不知道这些对图书馆2.0的呐喊,能够唤醒几人?

图书馆走向2.0

星期日, 3月 18th, 2007

图书馆升级2.0最大的动力可能来自企业。一些图书馆集成管理系统的开发商早就嗅到了机会,开始了技术储备,希望等待业界重新洗牌的机会能够脱颖而出。但是他们往往太高估自己的技术能力,而小看图书馆的判断能力。他们习惯于沉迷于过去的技术老本,不思进取,急功近利,以新瓶装旧酒,甚至连概念都玩弄得似是而非。他们没有意识到,图书馆2.0是图书馆员主导的变革,同时是以服务为主要增值手段的变革,他们不在思维方式上来一个2.0版本升级,他们就不可能进入这个图书馆2.0这个充满机遇的蓝海。单靠出卖产品赚取超额利润的商务模式,恐怕再也难以为继了。

由于互联网技术发展到了一个转型的阶段,网络成为平台,软件就是服务,适合当前”复合型”图书馆需求的商业软件或者服务远没有定型,开源(包括开源软件和开放内容等)是图书馆2.0的一剂天然补药。然而吃这剂补药首先要有一定的身体素质–要有一定的人才储备和持续的资金投入,在管理上也会遇到一定的挑战。开源从来就不是免费的,尽管资源本身免费,但开发与服务不可能是免费的,甚至不是低成本的。开源的最大好处是,你对它具有完全的控制,你不满意的时候,可以随时更换它,而且系统能够能伴随业务的增长而成长。不像购买商业软件,一旦签订协议,你就失去了自由,连数据似乎都不是你的了。

开源运动与图书馆在很多地方是一致的,不仅因为他们都崇尚自由,重视信息的开放存取,而且目前图书馆2.0的许多需求不得不借助于开源软件。图书馆领域有一套复杂的业务规范和需求,诸如馆际互借、元数据互操作、联邦检索、资源仓储和永久保存等等,对于软件的需求十分特殊,图书馆也十分注重遵循开放标准,这并不是说商业公司就无事可做了,相反正因为此图书馆倒更需要商业公司的专业支持和长期服务。

商业公司如果把眼光放远一点,不仅开发和服务可以挣钱,免费的服务也可以通过一定的商务模式而营利。只要看一看当前的许多2.0公司就可以获得一定的启迪。ILAS正在失去广泛的用户基数,能不能转化为新的盈利模式的基础?《全国报刊索引》也死抱着传统的订购模式,能不能通过免费和更好的链接技术而赢得市场?机遇与挑战并存,这些都是值得探讨的问题

如果亚马逊接管图书馆……

星期日, 3月 18th, 2007

让我们根据亚马逊的行为特征,进行一个思想实验:如果亚马逊接管图书馆行业,会建立怎样的系统?

首先亚马逊肯定不具有那么多的专业知识和对图书馆学的感情,它不会把书目系统神秘化或者神圣化,OPAC(Online Public Access Catalogue,即联机公共检索目录)系统只不过是另一个仓储管理或者物流系统而已。用户的体验和方便性才是第一位的。

其次它不可能雇佣那么多成本高昂效率低下的图书馆员进行编目工作,它会与OCLC结成战略同盟,直接以OCLC的数据为基础(OCLC不会不干的,因为这些数据是OCLC的会员图书馆上载的,对于OCLC来说是无本万利的事情)。
同时它会建立”注册用户上载数据”的2.0模式,让用户(或者外包给用户)替它做一部分数据。同时有强大的过滤功能,能够防止Spam、Hacking以及滥用。
它从不认为OCLC的数据就够用,起码它还会把封面图片、目录以及免费阅读的章节加上去,同时附有书、刊或文章的全文检索功能。
它内部已经建立了基本的主题、作者/人物、地名、时代、事件等内容的规范控制机制,但是这种机制必须不断完善,因此它不在乎所有公开的数据是不是”权威”的数据,它有一个反馈评价及纠正机制,能够基本保证对不同主体生产的数据进行评估、分级和及时纠错。

它肯定搞不定MARC,而寻求MODS或DC LIB-AP等简化的元数据。它会把所有的数据打乱,统一按照最有效率的方式操作和存储。但是在输入输出方面,它会支持各种基于XML标准的格式,从而与出版商、发行商、图书馆以及相关的上下游行业建立起紧密的合作和联系。

它会在用户输入提问词的同时,动态地显示该提问词的相关主题、分类、相关关键词、大约命中数、输入同类词的用户、有没有评论推荐、是否可定购、可预订或最 近可借的图书馆信息等等。它会非常神奇地猜测你的喜好,把你归入某些人群中。当然某些”越用越好”的个性化功能需要经过你的设定许可。

它会给最终用户开发一个”豆瓣”,鼓励他们建立社区、标签图书、评论图书、做网摘,想买想借都可随意。它可以依据用户的使用信息建立相关反馈,改进算法,充分挖掘他们的”集体智慧”,制定更好的索引排序系统,传递信息、推送广告、推销商品。

它会以开放数据和开放API的形式(就像它的A9现在做的那样),提供其最新最详尽的书目数据库,并且所有数据提供都有RSS发布。于是给图书馆开发虚拟的”集成管理系统”简直是举手之 劳,图书馆的读者同时就是它的用户,可以向图书馆提供在线的CRM客户管理系统以及虚拟参考咨询服务,使图书馆在向读者提供最优良最详尽服务的同时,又保 证了用户的良好体验,同时图书馆在某种程度上都成了它的社区服务中心和代理商。

它时刻警惕Google虎视眈眈的野心,因此它在语义信息组织和语义互操作方面不断研发,拥有大量专利……

让MARC安乐死

星期日, 3月 18th, 2007

2006年11月12日,全世界最大的联合书目数据库,OCLC的WorldCat起用了9位数的记录号,意味着它的第一亿条记录的诞生[4]。这家总部 位于美国俄亥俄州的图书馆会员制机构,可以说是伴随着20世纪60年代书目数据格式MARC的诞生而诞生,随着MARC的发展而发展,目前已拥有全世界 112个国家5万7千多会员图书馆和超过十亿条的馆藏数据(Items)[5],虽然是非盈利机构,依靠向全世界的图书馆和会员图书馆提供服务,全年的营收逾2亿美元。

MARC是我们这个职业的最重要核心竞争力之一,如同OCLC一样,甚至是我们行业赖以生存的基础。全世界的书目数据基本上反映了当前人类非”实物”文化 遗产的概貌,在迄今为止所生产的所有人类知识中也占有相当比例,如果时间倒退四分之一个世纪,可以说占有绝大的比例。在目前一年的信息产量相当于过去 5000年的总和,而其中绝大多数为数字资源的情况下,这个比例正大幅减少,可能用不了多久,我们所掌控的”知识”记录,就会被复制拷贝,而使我们的 MARC变得微不足道。

MARC最大的价值在于标准化而适于机器处理,从而有利于规模化应用,并极大地提高了系统效率。以历史的眼光来看,MARC领导了图书馆行业最辉煌的时 代,至少说明我们的信息技术应用曾领先于绝大多数行业。然而也是碍于当时的技术,严格的形式化并不是为了读者而设计的,而是为了传统的业务流程(例如卡片 或印刷目录输出)而设计,甚至仅仅为了机器而设计(定长不定长的考虑),造成MARC的七宗罪:

  1. 字段众多,且重复严重。真正对读者有意义的字段(主要指与内容描述有关的字段)很少,因此真正作索引的字段也并不多。据最新的研究统计,80%的书目记录只使用了36个字段或子字段[7],国图数据的抽样中多于30个字段的记录只占0.09%[8],几乎可以忽略不计。
  2. 技术严重过时。格式设计所依赖的是以磁带为主要存储介质的技术,在目前各种集成系统的技术实现中早已采用了关系数据库技术,乃至其它更为先进的全文索引、面向对象技术甚至XML技术(在与其它数据格式进行数据交换时)等,MARC格式可以是一个动态映射的用户视图。
  3. 规范乃至著录规则很不统一,语义含糊。特别是不同国家地区和不同版本的MARC,即便不是不能互操作,也绝难互操作。从各家系统对于多MARC的支持情况就可以看出来。
  4. 字段、子字段标识和结构复杂。书目记录的描述主体、客体及关系模型不清晰,格式规定琐碎、不统一。例如新引入的数字资源链接856字段,著录方式千差万别千奇百怪,造成系统实现方式也难以统一。况且这个字段随着新的链接机制的应用普及,其本身的必要性也值得怀疑。
  5. 数据加工成本巨大,专业门槛高,难以普及。
  6. 数据生产的周期较长,时间滞后,不利于服务开展。
  7. 语义与语法及结构捆绑,适应性和灵活性差,难以适应新媒体和新技术发展的需要。具体表现在难以应用于电子资源编目,以及难以进行无损失的元数据映射。

我们最大的财富正在成为我们最大的包袱。头脑清醒的人没有认为MARC对数字资源还能继续有用,而一旦我们的书目宝库不能融入互联网庞大的信息库中,成为 前朝遗老,我们就有极大的可能被信息社会边缘化。令人振奋的是我们已经看到OCLC(当然这也是为了它自身的生存)正在引领整个行业走在一个正确的方向上,例如DC元数据的提出、FRBR化、”元数据”(XML)化等;美国国会图书馆等业界大佬,虽然步履蹒跚,也并未止步不前;许多图书馆或图书馆联盟,也在积极研究,寻求合作,采取行动。

近年来兴起的一些研究(特别是元数据研究)对书目数据的功能进行了较为全面的梳理,如果把MARC看成一种元数据的话,满足要求的MARC可以完全不必如 此,而且MARC也可以仅作为图书馆集成管理系统中的”一种”元数据而已,而且是粗粒度的、着眼于与历史数据兼容的元数据形式。新的图书馆系统即便仍然以”元数据”为核心,也应该能够灵活地支持多种元数据格式。

MARC面临改造是必然的,然而这一步究竟应该走得多大,才能保护图书馆行业半个世纪以来在MARC上的投资,才能实现平稳过渡?我们依然不清楚。目前编目界围绕RDA的争论就反映了这个问题。换句话 说,我们目前面临的问题,不是MARC该不该死,而是如何使其安乐死?

图书馆如何2.0

星期六, 3月 17th, 2007

建设图书馆2.0要从集成管理系统做起,可能会出乎许多人的预料,一般都是从Web2.0的技术应用做起。例如许多图书馆建立的面向员工甚至读者的博客, 设立了Wiki,提供了新闻RSS甚至新书预告或专题订阅的RSS等,更深入一些,有的图书馆还能够通过向读者提供一些工具,让读者用户在浏览资源的时候 能够方便地链接到图书馆的数据库进行查询。他们的理念是:2.0是以用户为主导,变革应该首先产生于用户界面,产生于图书馆的服务与用户的需求产生碰撞的 临界点。

这些2.0的服务都是必要的、很好的,图书馆在对员工进行2.0培训之后,每个部门都可以发起或参与一定的”2.0改造”项目,由技术部门协助实施,作为走向图书馆2.0的起点。

然而图书馆2.0的意义远不限于此。Web2.0看起来都是小插件小工具,花拳绣腿人人可为,但静水深流,它起因于互联网技术的长期积累,反映了从 理念到 结构的深刻变化。各类互联网应用的2.0化,实际上都可归结为其业务模式的重组和新标准规范的建立,从而引发整个行业的重新融合以及升级改造。图书馆应用 系统的大规模技术升级,大约10年左右来一次。七十年代的主机终端形式,八十年代的客户机服务器形式,九十年代的浏览器服务器 形式,许多大型图书馆的系统更换或者升级,即便不是有意的,也在无意中暗合这个时间表。目前风起云涌的Web2.0,又一次给图书馆技术的改朝换代带来了 契机。

Web2.0以互联网作为平台,将数据变成Intel Inside” (以数据为核心),采用参与式架构设计,达到用户驱动的社会分享和集体智慧的收集,通过开放标准的建立和应用全面支持内容与服务的融合,轻量级的面向服务 的技术能够使服务和应用无所不在(如同时支持各类移动和手持设备),并且支持在用户体验中不断改进完善(永久的Beta版)。把这些特征汇集起来,绝不是 仅仅重新设计用户界面这么简单,也不是依靠单一方面的技术革新所能够达到,所需要的”技术”,甚至超出了技术本身,而包含艺术、文化、认知、媒体、传播以 及社会心理等内容。

图书馆要实践Web2.0,在目前可以预见的技术条件下,图书馆集成管理系统必须脱胎换骨。尽管我们还不能全面确知图书馆2.0需求是什么样的, 但我们可以从两方面着手变革:数据方面和系统平台架构方面。数据方面首先需要摆脱MARC的束缚,融合数字资源管理的各类元数据标准,构建新型的 OPAC2.0和ERM(数字资源管理)系统;在系统平台架构方面支持像构建2.O应用一样构建图书馆服务:仓储的标准化流程和管理、数据的多面展示、应 用的松散集成、社区的自我组织,做到像亚马逊那样管理图书馆。当然,”数字图书馆”的许多目标不是一套集成管理系统能够包含的,例如理想的联邦检索需要依 靠整个互联网实现一定的数字对象调度和永久维护机制,更好和更大范围的”知识”组织也有赖于语义技术的应用突破和大面积实施。在设计2.0版的图书馆集成 管理系统时应该考虑到数字图书馆的远景和需求,我们最终的目标是:把Google的种种功能集成进来,让Google为图书馆打工!

重新定义“集成系统”

星期四, 3月 15th, 2007

Lorcan曾对”图书馆集成管理系统(Integrated Library System)”进行过两种解读:集成图书馆的管理系统或图书馆的集成管理系统(as a system for the integrated library, or as an integrated system for the library)。传统图书馆形成的采编分典流期刊目录等固定的业务模式,在一定程度上是对于图书馆传统业务的标准化,软件系统的采用固化了这套流程,尽 管从来没有100%满足图书馆员的需要(没有一套系统不被图书馆员骂的),称之为”集成系统”并不为过。 然 而一旦把数字资源集成进来,纳入到管理流程之中,图书馆的处理对象就越来越多地”侵入”到传统上的”情报工作”领地:文摘、索引乃至全文,而且要”可存 取”与”可获得”并重,图书馆于是都变成了”复合”型图书馆,其原有的业务系统再称为”集成管理系统”显然已经名不副实了。

新加坡图书馆局在《2000年的图书馆》中提到未来图书馆七个方面的”范式演变”[1],意味着传统图书馆业务模式和管理系统需要进行全面变革。这七个方面是:

  • 从图书的保管者到服务本位的信息提供者;
  • 从单一媒体到多媒体;
  • 从本馆收藏到无边界图书馆;
  • 从我们到图书馆去到图书馆来到我们中间;
  • 从按时提供(in good time)到及时提供(just in time);
  • 从馆内处理(in sourcing)到外包处理(out sourcing);
  • 从区域服务(local reach)到国际服务(globe reach

在 这种”范式演变”中图书馆集成管理系统依靠修修补补或增添模块显然是不行的了。我曾经以为数字图书馆系统可以完全独立于传统图书馆系统之外,经过”门户整 合”而形成复合型图书馆的管理系统;我也曾设想数字图书馆解决方案以传统图书馆系统为核心,在外面或者上面添加应用层、互操作层或者抽象的整合管理层,作 为新一代数字图书馆的解决方案。Web2.0的突如其来让我感到必须打乱现有的业务模式,完全彻底地进行”再造工程”(re-engineering), 因为现在的”信息环境”已经完全不同,人们获取数据、传播信息、接受知识的方式进入了一个没有门槛、随处可得和自由互动的时代,任何行业的应用软件都在为 这种新的环境进行基本架构方面的改造。 应该说我们仍处在一种大变革的过程当中,图书馆2.0是我们走向数字图书馆的一环,上述这些转变究 竟将如何影响我们的业务系统,我们最终能达到怎样的目标,都还是个未知数。我们现在能做的,就是不断地审视我们的新需求,以及现有的技术如何来具体满足这 些需求,进而重新定义”图书馆集成管理系统”。 [1]见吴建中《战略思考–图书馆发展十大热门话题》

图书馆2.0意欲何为?

星期三, 3月 14th, 2007

变革的时代也是动荡的时代,当业界对于该做什么莫衷一是的时候,一方面是最具有创新性和机遇的时期,另一方面也是怀疑与困惑最多、最迷茫的时期。如果不加以及时梳理、引导、总结,人们的热情和新鲜感很快就会被无休止的争论和不成熟的创新所消磨。

自上世纪九十年代开始,图书馆界的先知先觉们就已经开始寻找通向未来的钥匙,这就是数字图书馆。如果说数字图书馆还算是有识之士主动的、自发的、理性的对 于图书馆的改朝换代的话,图书馆2.0是这个进程中的一种催化剂,完全来自外界,却来势异常凶猛,引发为图书馆员自草根而精英的一种自救。OCLC的《环境扫描 》以及《图书馆的社会感知 》(中文节译 )等报告可以看成是这种自我危机意识的觉醒,而后来轰轰烈烈的图书馆2.0运动就是成批的图书馆员自觉的行动了。

全球范围内各种类型的图书馆用户呈总体减少的趋势,这已经是铁的事实。国家图书馆发布的数据 也已证明了这一点,上海图书馆也在经历这样的变化。这种变化实际上已经引发了关于传统图书馆价值的重新思考,作为一项在理念上颇为崇高的社会事业,算一算 人均拥有成本和有效使用成本,实在是一个非常昂贵的事业,世界上可能只有我们还在经历传统图书馆的大规模超常规发展阶段,数字图书馆作为互联网时代图书馆职能 的延伸和替代,即便不能说在经济上有显著的优势,在方便性、效率和效益等方面,其好处和竞争力也是不言而喻的。

然而数字图书馆建设至今,碍于版权、技术和运营模式三大障碍,内容贫乏、机制落后、使用不便,还不足以把日益流失读者拉回到图书馆。近年来一直低调躬身实践的张晓林教授早已提出了”让图 书馆无所不在”的2.0思想,大音希声,大象无形,数字图书馆不必处处彰显,通过”e划通“、”导航条“之类的工具,让信息去找用户,让图书馆的服务融入到读者用户的信息 过程中去,就是最大的成功。

因此图书馆2.0是图书馆的一次全面彻底的为了用户而改变自己的运动。图书馆2.0没有别的目的,只为了把读者用户重新拉回到图书馆来,重塑图书馆对于读者用户的”感知”,不管这个”图书馆”是有形的还是无形的。

变革已经开始…

星期三, 3月 14th, 2007

“不论你们喜不喜欢,这个世界已经变了。……你们不能再仅仅依靠对原先软件的修修补补糊弄我们,你们必须有一套严肃认真的、从头开发的策略,发挥你们的想象力和创造力。否则你们将难以生存。”美国图书馆杂志(Library Journal)专栏作家、美国图书馆界的名嘴”Roy Tennant在”致图书馆软件开发商的公开信“中这样告诫那些长期自诩为图书馆伙伴的商人们。

公平地说,这不是他们的错。软件公司都是靠错误的修正、局部的更新、模块的堆砌、功能的积累、代码的重用过日子,许多情况下,都是”用户”叫他们那样做的。他们一直认为,只有这样,才能在一个十分狭窄的专业化区隔市场中,以最小的代价,取得最大的利润。

现在时代不同了。图书馆自身正在面临革命。在一个什么都冠以2.0的时代,2.0已经成了一个符号,一个象征。尽管谁也说不清它的确切含义,但是它就是”革命”的代名词。你如果不思进取,你只有死路一条。

2.0的到来,图书馆首先感到似乎自己被读者抛弃了。图书馆员特别是图书馆员中的奇客(Geek)们愤青辈出:他们看什么都不满意。图书馆不再是信息的集散地,互联网上几乎什么都有;OPAC不再是查询信息的入口,Google 以搜罗普天下所有有用信息为己任;古罗马澡堂是人们的聚会场所,时光流逝到21世纪,图书馆正在竭力成为市民的公共空间;不仅要做”公共空间”,还要进入 专属于你的”我的空间(MySpace)“,并在你的”第二人生(Second Life)“里占据一席之地……

天谴到来之前真的有预兆,ILS Vendor的日子首先开始不好过了。SirsiDynix刚刚抱团取暖(看来也并不暖和,刚刚得到消息:SirsiDynix已经放弃Horizon8.0的完整版,转而开发”激动人心”的以Sirsi的Unicorn为基础的Rome/罗马,Dynix的用户,哭吧!),Exlibris的新东家赶快把Endeavor揽入怀中,连OCLC也忙不迭与RLG合并。这些看似个体行为,背后却有着深刻原因。

OCLC首席思想家Lorcan Dempsey在他的一些相关帖子中进行了深刻的分析。大致而言,图书馆在数字时代的业务模式(Business Model)虽然还没有定论,但千真万确,已截然不同于传统图书馆了。当图书馆员失去知识伊甸园看门人的角色的同时,图书馆就不再是从前那个天堂。一方面,传统的图书馆集成管理系统满足不了数字资源管理与服务的丰富多彩普遍全面的业务需求,另一方面,图书馆特有的专业化需求正在为更多的新型技术所替代, 特别是大量的开源技术和2.0技术,这个市场已不足以养活那么多的专业公司。

你有压力,我有压力!巴士阿叔也替图书馆与图书馆软件供应商们喊出了的共同心声。2.0时代的到来反映了人们信息获取和传输方式的彻底改变,连图书馆自身已经朝不保夕,寄生图书馆的软件商们更是面临灭顶之灾。这不是相煎何太急的问题,而是一荣俱荣,一损俱损的问题。如果软件商们不看到这一点,在图书馆被千禧一代抛弃的同时,那些图书馆集成管理系统的软件开发商们只能在记载图书馆发展历史的文献中找到他们的位置。

向厦大献礼

星期二, 3月 13th, 2007

表哥约稿,属于死缠烂打的那种,招架不住,没几个回合就答应了。正筹备下个月去厦大捧场,于是相约而行,打算见面讨论一下,还可以根据在厦大与大家的讨论情况修改定稿。

没曾想表哥乃一猛男,准备了一期专辑,要向厦大献礼,已经有精灵LibView等提供的大餐,要等我的小菜,一周交稿,不得有误。虽然我喜欢发论文如发博文一样地快,但论文毕竟不同于博文,时间如此之紧,写什么都还没定,心中实在没底。

图书馆2.0还是一个新鲜事物,还要做许多研究探讨和宣传普及。近几个月一直在努力寻找一些可以实施的东西,不断地在归纳总结与图书馆2.0相关的各类技术应用和实施方案,希望下一步 能推动一些具体的图书馆2.0应用。本来此次去厦大,有许多想法就想和朋友们交流一下,雨僧来沪时大家也提到过一些,例如能不能一起准备一系列的培训(像ALA一样利用年会的机会),一起写一本图书馆2.0的书(可能国内有快枪手已经动笔了),一起把Libpedia搞起来(据说也有人另起炉灶在搞了),一起搞一个平台、 搞一些开发等,不管能不能忽悠起来,如果能有所促进,也算好事。所以想法很多,但都不系统,难以成文。

与花生壳、空心菜一起商量了一下,想到了这样一些题目:

《如果亚马逊接管图书馆》
《将2.0进行到底》
《让MARC安乐死》
《谁来开发图书馆2.0集成管理系统?》
《图书馆2.0相关OSS》
……

目前正在理清思路、材料收集中,如果朋友们有什么想法,欢迎留言。

变革开始了…

星期六, 3月 10th, 2007

节译部分内容(根据自己的兴趣,原帖在这里

你知道吗…?
……
中国正在成为世界上最大的英语国家
目前英语中大约有540000单词,是莎士比亚时期的三倍
纽约时报每周的信息量,相当于18世纪普通民众一辈子所接收的信息量
世界上每天大约出版3000本书
目前每年的信息量大约相当于人类过去5000年的总和
而且这些信息每两年翻番
据说到2010年,翻番的速度是72小时
……
目前的教育

希望学生利用尚未发明的技术
解决未知的问题
从事不存在的职业

……
每八对美国的新婚夫妇,就有一对是网恋而结婚
MySpace已经拥有1.06亿人口,仅次于日本,超过墨西哥,位居全球十一
而且MySpace的每个家庭每天有30个邻居登门拜访
Google每个月可以有27亿次的搜索
……
一秒钟,一根光缆,可以传输1900张CD
或者使1500万人同时通话
这个速度每半年翻三倍,维持20年不变
而且这些光缆已经铺设完毕,随时待命
……
去年笔记本电脑出货4700万台
百元笔记本计划将使欠发达地区5000万到一亿的儿童每年受益

Did you know . . .
Sometimes size does matter.
If you’re one in a million in China . . .
There are 1,300 people just like you.
In India, there are 1,100 people just like you.
The 25% of the population in China with the highest IQ’s . . .
Is greater than the total population of North America.
In India, it’s the top 28%.
Translation for teachers: They have more honors kids than we have kids.

Did you know . . .
China will soon become the number one English speaking country in the world.
If you took every single job in the U.S. today and shipped it to China . . .
China would still have a labor surplus.
During the course of this 8 minute presentation . . .
60 babies will be born in the U.S.
244 babies will be born in China.
351 babies will be born in India.

The U.S. Department of Labor estimates that today’s learner will have 10-14 jobs . . .
By the age of 38.
According to the U.S. Department of Labor . . .
1 out of 4 workers today is working for a company they have been employed by for less than one year.
More than 1 out of 2 are working for a company they have worked for for less than five years.
According to former Secretary of Education Richard Riley . . .
The top 10 in-demand jobs in 2010 didn’t exist in 2004.
We are currently preparing students for jobs that don’t yet exist . . .
Using technologies that haven’t been invented . . .
In order to solve problems we don’t even know are problems yet.

Name this country . . .
Richest in the World
Largest Military
Center of world business and finance
Strongest education system
World center of innovation and invention
Currency the world standard of value
Highest standard of living

England.
In 1900.

Did you know . . .
The U.S. is 20th in the world in broadband Internet penetration.
(Luxembourg just passed us.)

In 2002 alone Nintendo invested more than $140 million in research and development.
The U.S. Federal Government spent less than half as much on Research and Innovation in Education.

1 out of every 8 couples married in the U.S. last year met online.

There are over 106 million registered users of MySpace.(September 2006)
If MySpace were a country, it would be the 11th-largest in the world (between Japan and Mexico)*
The average MySpace page is visited 30 times a day.

Did you know . . .
We are living in exponential times.
There are over 2.7 billion searches performed on Google each month.
To whom were these questions addressed B.G.?
(Before Google)

The number of text messages sent and received every day exceeds the population of the planet.

There are about 540,000 words in the English language . . .
About 5 times as many as during Shakespeare’s time.

More than 3,000 new books are published . . .
Daily.

It’s estimated that a week’s worth of New York Times . . .
Contains more information than a person was likely to come across in a lifetime in the 18th century.

It’s estimated that 1.5 exabytes (that’s 1.5 x 1018) of unique new information will be generated worldwide this year.
That’s estimated to be more than in the previous 5,000 years.

The amount of new technical information is doubling every 2 years.
That means for a student starting a four-year technical or college degree . . .
Half of what they learn in their first year of study will be outdated by their third year of study.
It’s predicted to double every 72 hours by 2010.

Third generation fiber optics has recently been separately tested by NEC and Alcatel . . .
That pushes 10 trillion bits per second down one strand of fiber.
That’s 1,900 CDs or 150 million simultaneous phone calls every second.
It’s currently tripling about every 6 months and is expected to do so for at least the next 20 years.
The fiber is already there, they’re just improving the switches on the ends. Which means the marginal cost of these improvements is effectively $0.

Predictions are that e-paper will be cheaper than real paper.
47 million laptops were shipped worldwide last year.
The $100 laptop project is expecting to ship between 50 and 100 million laptops a year to children in underdeveloped countries.

Predictions are that by 2013 a supercomputer will be built that exceeds the computation capability of the Human Brain . . .
By 2023, a $1,000 computer will exceed the capabilities of the Human Brain . . .
First grader Abby will be just 23 years old and beginning her (first) career . . .
And while technical predictions farther out than about 15 years are hard to do . . .
Predictions are that by 2049 a $1,000 computer will exceed the computational capabilities of the human race.

What does it all mean?
Shift Happens.
Now you know . . .

Cnlib20@Ning的一些情况

星期四, 3月 8th, 2007

除了汉化碰到一些困难,”中文’图书馆2.0′论坛“网站的建设工作基本告一段落。目前已经把去年Info20会议的视频、雨僧访沪的部分视频以及近200张包含许多图林博客照片已经上载。更多的内容陆续增添中……

我们建立这个论坛的目的主要有两个:

1、配合4月21-22日在厦门大学召开的Lib2.07会议
2、作为一个中文”图书馆2.0“交流的基地,聚集一些资源。

感谢大家的积极参与。自3月2日网站设立以来,已经有31名成员接受了邀请或主动加入,已经有七千余次的访问量(有意思的是:基本都是由成员自己带来的访问量),在Ning的社会性网站中也算不错了。我一直很纳闷像 Myspace,Facebook之类的社会性网站(SN: Social Network)为什么会那么受欢迎,建了这个网站才知道,这的确是一个把大家联系起来的好方法!相比而言,SN比Wiki功能更多一些,特别是能够支持功能或数据融合(mashup)是其很好的特点(但据说Myspace已经开始block mashup了),而Ning作为Meta SN(元社会性网络)比其它花哨的SN平台多许多个性化设置功能,因此可以做得更个性化和更实用些,特别能够符合一些学术交流社区的需要。

下一步我希望利用这个平台为大家提供更多的资源,特别是同样在Ning上的一个更大的Library2.0社区,有很多英文资源。另外我希望利用Yahoo!Pipes网络图林有关图书馆2.0的帖子都聚合过来,这样就不需要许多朋友博文发两次了。目前如何组织这些资源也是一个很大的挑战。如果这种SN平台能够与DSpace/Fedora等CM平台结合,就更好了。

Cnlib20是一个参与的平台,图书馆2.0需要您的参与!

cnlib20atning

keven上传于Yupoo.

实在弄不懂的“第二人生”

星期二, 3月 6th, 2007

keven上传于Yupoo.
新生事物刚开始可能都这样吧:粗糙无比而又潜力无穷,让人不敢小觑。

继路透社开设新闻播报、可口可乐开设商铺、一位华人MM成为第一个虚拟世界的真实百万富婆之后,图书馆界也越来越多地利用第二人生(Second Life简称SL)开展服务,争夺千禧一代了。

据说目前大约有400名图书馆员在SL的9个岛上提供服务,许多图书馆员的职位叫做”Gaming librarian”(真吸引人!)。其中澳大利亚图书馆每天能接待1000名游客!

上图为ALA(美国图书馆协会)的华盛顿分部最近在第二人生上召开第一次学术会议的截图,主讲人是VirtualDave Legend(即Syracuse大学的David Lankes),演讲题目是”Participatory Networks: Libraries as Conversations”,大约有60人参加会议。会议完全是现实的翻版,但感觉很酷哦!会议的视频和演讲稿分别可以在这里这里下载。

这里看看,ALA现在还真的是利用2.0技术的先锋呢!

Ning上的图书馆2.0相关社区

星期日, 3月 4th, 2007

ninglib20

keven上传于Yupoo.

library20.ning.com是其中最大的社区,已经有184人(至发帖时),包括许多国外图林博客,并且有很多资源(会议信息、演示、音视频等)可以共享,值得关注。

Cnlib20上线三天访问过千

星期日, 3月 4th, 2007

cnlib20ning

keven上传于Yupoo.

http://cnlib20.ning.com/
祝贺一个!

MyDonews升级Wordpress多用户版

星期日, 3月 4th, 2007

一夜之间MyDonews升级成了Wordpress Mu多用户版,Akismet也在前两天重新起作用了。目前看起来除了汉化不完全以及管理界面中有一些”Not Found”之外,其它一切正常(包括所有设置、插件和Look & Feel)。但愿在速度、稳定性等方面有所改善,这是最重要的。

Anyway, 恭喜一个!