Archive for 8月, 2006

美丽的新娘娶不进门

星期二, 8月 29th, 2006

RFID是我们觊觎了n年的技术,然而上考下察、左顾右盼、权衡利弊、思考再三,还下不了决心。Leon是此中专家(文章一文章二),但却是一个唱衰派专家,不过你不能不承认他说的有点道理。目前看起来,RFID的应用主要有三个问题,成本是一个问题,技术的成熟度是一个问题,而技术的成熟度与应用领域和业务模型是有关系的,最大的问题,在我看来是业务流程和管理上的问题。新技术要有合适的应用,发挥最大的价值,在这方面非要有所创新才行。

有幸与深图的马瑞老师进行了深入交流,使我们看到了深圳图书馆新馆在应用RFID技术方面令人振奋的创新。传统上图书馆一直是新技术的倾销对象,RFID除了标签昂贵之外,设备也是天价。商业公司按照图书馆传统的管理模式开发了自助借还书、读写设备、分拣系统等专用设备,基本上是传统条码设备的翻版。回过头来想一想,难道不能根据新技术的特点,改变一下图书馆的业务流程和工作模式吗?国外的应用重点在节省人力,我们就不能考虑把重点放在提高工作的准确性和效率方面吗?

深圳图书馆首先改变了排架方式。根据以分类为基础的索书号排架对于RFID技术已经没有意义,因为读取号码是机器的事情,排架甚至可以根据著者、主题。”行家”扫一扫,便知有没有。书籍只要定位到某个书架的某层,在层上进行密集排架都可以。这种方式对于上架、整架工作人员的要求也大大降低,基本上把书库工作还原成了”体力活”。

深圳图书馆还开发了专利技术:”智能书车”(见下图)。这项技术是自动分拣系统的替代产品,用于取书和上架。内藏的电脑精确地知道要取的或装载的图书位于书库的哪些位置,当书车走到相应的书架时,就会自动报知工作人员进行操作。借助RFID技术,能够大大提高图书典藏、整架的效率,这个问题是开架书库和阅览室的老大难问题了。

深圳图书馆新馆自7月12日开馆一个多月,约有一半多的流通是通过8台自助系统完成的,这等于在不增加人工的情况下提高了图书馆的服务能力。这使得图书馆可以像24小时银行一样,在城市各处(如中心图书馆的各个分馆、网点)推广无人值守24小时图书馆。当然传统的条码+磁条技术也不是做不到自助服务,但对于整个系统在易操作性和安全性方面的要求较高。技术的进步往往就是这样,一点点不同往往能够成为分水岭。

深圳图书馆技术中心主任王林在清华数图论坛上有一个发言,总结了深图在RFID应用中感受到的好处:

  • 全新排架体系与标识系统(架标/书标直接到层;非接触式直接/批量获得文献标识;架位号+索取号同时入库)
  • 准确快速定位和导航(OPAC检索与直观导航;辅助寻架系统)
  • 高效架位整理与管理(倒架,检查乱架,馆藏清点,新书上架)
  • 多级分检与精确上架(智能书车)
  • 读者自助服务与统计数据采集(充分利用证标识读快、非接触和书标多本采集的特点,用于准确找书+自助借还;自助登记上机;文献利用登记)

RFID使物流行业几乎发生与集装箱技术一样的一场革命,对于图书馆行业呢?有许多地方值得探索,而且应该从理论上进行总结。至少我感到该技术属于”复合型图书馆”的关键技术之一,因为现代图书馆整合数字资源和传统资源,传统资源最大的弱点在于难以精确定位和多角度揭示,可以设想,如果该技术结合虚拟现实技术,工作人员或者读者能够通过系统”看到”他/她要借的书的具体位置,是非常2.0的。数年前我们在复旦大学就看到他们开发的一个此类系统,但是因为无法实现方便的图书定位,后来没有用起来。RFID技术在一定程度上使”物理”图书馆的管理更加灵活,更加”数字化”了。

好的技术应用得好将会事半功倍、如虎添翼,应用得不好会使本来尚可掩盖的弱点暴露无遗,并使管理上的混乱放至最大,使员工和读者怨声载道,造成的结果是还不如不用。RFID是个美丽的新娘,我相信很多图书馆都是要迎娶的,但恐怕需要置办完合适的彩礼、有了充分的准备和信心之后。

深圳图书馆RFID智能小车

上图:深圳图书馆RFID智能小车 (感谢马瑞老师同意拍摄。摄影:贝贝)

Blog游戏:读书

星期一, 8月 21st, 2006

游园点我的名,不得不从。

1. 一本你不只读了一次的图书

《大学语文》。本来就喜欢,教材中之最用心者,篇篇精华。也是同室好友雷震之酷爱,四年下来,书页几无完整,后又伴余枕边两年有余。不时可以从嘴边蹦出一些词曲:”梦回莺啭,乱煞年光遍。人立小庭深院。炷尽沉烟,抛残绣线,恁今春关情似去年?” 那节奏、那韵律,那样的好听…

2. 一本你如果身在沙漠时想读的书

《活着》。世事无常,人生无常。

3. 一本让你发笑的书

《父与子》漫画。曾经一个人笑,后来又与女儿同笑。也看了不只一遍。

4. 一本让你哭的书

中学时看《红楼梦》,算启蒙吧,看到晴雯遭陷,以及黛玉葬花,不禁泪流满面…

5. 一本你希望是自己写的书

《呐喊》。当然这是不可能滴。

6. 一本你希望从未写就的书

《我的奋斗》之类。

7. 一本正在读的书

《滇缅公路》。历史是由战争串成的,人在战争中的渺小如同人之于历史之渺小,幸亏我们的作家具有上帝之眼,通过他们,我们可以看到战争的全景图。再次感谢大狗狗饭饭的书给我!

8. 一本读来有意味的书

《策略家的智慧》。大前研一著,黄宏义译。台北-台湾管理文化 1982年版。翻译得非常非常好的一本书:准确、到位、精彩、本地化,以为就是中国人写的。另外在看这本书之前我还不知道人类有这方面的智慧。

9. 一本改变你一生的书

可惜不是一本,而是一批:《收获》、《十月》、《钟山》、《萌芽》、《中篇小说选刊》等,中学时课上课下一刻不离的刊物。

10. 点名:

Leonz,知道你不爱读书,但是你总读过些什么书吧?

花生壳,写东西动不动就掉书袋,不点你的名可能会跟我急吧?

空心菜,见你最近忙着打印书单,对这些问题一定津津乐道吧?

编目精灵,老槐点名避嫌,我就不管这么多了。

图谋,一定很能说的,缺了他很寂寞。

跳起来读书,打落一地好书,给我们讲讲如何? 为什么很久不更新了?

Talis图书馆应用融合竞赛作品浅析

星期日, 8月 20th, 2006

抽了一点时间粗粗地看了一下Talis图书馆应用融合竞赛(Mashing up the Library Competition)的17个参赛作品(列表说明),感觉有些失望,如果不是参赛要求只限于欧共体国家、美国和英国,国内的一些应用应该也不会逊色多少,至少Leon几个月前做的上图2.0入口,再雕琢得精致一些,完全可以参赛(不知道是不是偶大言不惭)。

以下是对这些项目的初步考察,议论都是博客语言,不一定正确,欢迎批评、补充、纠正。

Library Map Mashup 一个集成Google Maps的Mashup应用,利用现成的数据,把加拿大某个地区的图书馆位置标了出来。特点是比较灵活,不像我们只在一张地图上实现,它可以选择地区,呈现多个地区的图书馆分布。这样的话我们是否可以做一张全国图书馆分布图呢?
go-go-google-gadget 把借阅信息、到期信息、图书馆的借阅排行和新到图书信息做成Google个性化页面的插件(gadget)。属于客户端桌面的mashup,对于具体图书馆的读者来说是一项比较贴心的服务,有一定的代码工作,但只需要改改Blyberg的代码应该就可以了,成功与否似乎取决于图书馆自动化系统是否有”二次开发”的可能(API是否开放给图书馆)。
NJIT catalog: book covers, PURLS, tagging, usage stats, and reviews (from Amazon) 新泽西技术学院图书馆的应用,比较典型的图书馆2.0应用,精灵曾经给我们介绍过类似的案例。这里有一个介绍的ppt可以下载(http://www.talis.com/tdn/node/1523, 11MB多)。从亚马逊网上书店获取图书封面、永久地址、分类标签、使用数据、书评等信息,集成到图书馆的OPAC中来。这使我想到国内的当当网数据很不规范(不是xml输出),豆瓣网的API也只有图书信息(通过http://www.douban.com/isbn/xxxxxxxxxx/获取),如果要hack网页工作量很大,而且很难保证可用性。
Book Trackr 为本地图书馆的读者生成一个Feed种子,可以跟踪所欲借图书的状态。作为email预约图书服务的一个补充。
Lib20 Library Toolbar 给浏览器安装一个工具条,集成图书馆所能提供的查询、参考咨询、快速连接、告知等服务,作用类似于Google桌面的Gedget。
OU Traveller & Book Details Greasemonkey scripts 滑猴子的扩充用户代码,根据ISBN号查阅图书的详细信息,如果图书馆没有此书,可以推荐购买。另外还mashup了很多乱七八糟的功能,例如到google books中去查有没有该书等。似乎还没有完成开发者的预期功能,详细介绍http://blogs.open.ac.uk/Maths/ajh59/007319.html
Danish contribution: Search interface à la Web 2.00 这个项目可能是所有17个参赛项目中技术含量最高的,是个很有功力的”集成检索”应用(Summa),后台集成了多种资源,包括通过OAI连接的图像数据库(是不是效果好另当别论),在查询结果合并和相关性排序方面也有创造。
Library Patrons Who Borrow To Create 提供图书借阅与在线朗读应用的集成,作为图书馆的一种特殊服务(www.readingwithmomsanddads.org)。想法来自于一个非图书馆员。
book cover browser 一个通过随机浏览封面而进入OPAC的服务。还没有弄懂为什么要这样做(说明的网页打不开http://exlibris.ath.cx/?p=89)
The LibMap 又一个图书馆地图,但图上有图,并能够允许用户自己编辑(有点像wiki的功能),利用了Talis的API以及silkworm directory的服务,我估计这个应用很有可能获奖。说明文字见http://informationtakesover.co.uk/libmap
Consuming library new books feeds 利用OPML对各个图书馆的新书报道Feeds种子进行mashup,用了很多Web2.0技术,例如用了Ning的服务,并用JSON进行Feeds的数据传递。具体如何做的我还没有完全看懂,看起来要弄懂2.0的mashup技术,可以从解剖这个例子开始。说明文字:http://blogs.open.ac.uk/Maths/ajh59/007311.html
Maps of place of publication 书目查询的结果可以显示出版社的地图分布。好像看不出有什么大用,想法比较怪。说明在此:http://home.comcast.net/~mmcm/zlibmap/readme.html
Amazon2OU Library Pivot Browsing 一段Greasemonkey代码,可以在查询书目时显示亚马逊书店有关该书的用户创建的所有信息。很好的想法,与把买书人吸引到图书馆来的想法相反,把亚马逊的读者俱乐部生产的信息集成到自己的系统中。只是这些信息是只读的,如果能与OCLC的Wikid进行mashup,还可以加上自己的评论等等,营建自己的读者社区,就更好了。豆瓣网的内容何时可以为我所用?让我们拭目以待。
Lillian - A Virtual Librarian 一个虚拟的图书馆参考咨询员,形象设计很有女图书馆员的特点,只是老是听不懂你说什么,老是重复话语。看起来还没有msn的自动机器人小I聪明。应该利用msn的技术结合语音合成也可以开发出自动回复的参考馆员,技术上应该已经不难了。这个Lillian还远不能实用,要被人骂的。
Alliance Second Life Library 2.0 一个很怪异的网络游戏,不知道与Lib2.0有什么关系,可能其中的角色扮演是图书馆员拯救世界吧,经过一长串程序下载了客户端,还没有上去玩。
Feed based library interface 认为图书馆惯常的种子Feeds应用不太过瘾,除了新闻、新书、新应用、新资源的报道之外,还加上了图书内容、摘要、封面、期刊现刊目次及摘要、检索结果等的rss服务。也即把电子资源的内容报道通过rss提供。具体怎么做还没有仔细看。
BiblioPage.com 亚马逊的一项辅助服务,超过50万的书目信息,用标签、随机的方式浏览,以及可以查询。整个网站的架构采用完全开源的LAMP技术,应该说是个很好的书目管理系统。可以学习的地方有很多。如何与亚马逊的开放API集成,还没有看到。

关于Lib2.0的文章

星期五, 8月 18th, 2006

这次清华DL论坛上没有把这篇《Web2.0技术图书馆应用分析》的链接做到屁屁踢里,答应了几个朋友在这里公布一下(接受超平师和包工头的意见,只有屁屁踢是不行滴,别人是看不懂滴,以后有空要多多部落格和屁得福),欢迎下载,并提意见。http://www.libnet.sh.cn/sztsg/fulltext/reports/2006/libraryTech20.pdf

几个说明:

  1. 这篇文章本来是为毛军先生组稿的《现代图书情报技术》”跨界合作”专栏而写,后来根据编辑部要求进行了浓缩修改,篇幅删掉了近一半(主要是图表和前半部分文字),文字也做了很大改动,”博客味”主要是由毛军先生帮忙剔除的,最后也是由毛军赐名为《从Web 2.0到图书馆2.0:服务因用户而变》,估计将于《现代图书情报技术》2006年第十期刊出。所以在这里要向毛军老弟特别鸣谢!
  2. 本文是一个没有最终定稿的版本,图一和图四(关于Ajax的图示,忘了给出标号了)都没有给出出处,其它的图表都是自己的创造,也没有给出说明。秦健老师在审阅时曾提出这些意见,一直没有修改,因此如果需要引文,最好引正式发表在《现代图书情报技术》中的版本。
  3. 在这里提供本文给大家参考,主要因为其内容较全,有一些背景说明和更多的图示。最近我介绍数图2.0的许多观点在其中都有涉及,所以也算是屁屁踢演示文件的补充说明吧。
  4. 另外有一篇葛秋妍独立完成的文章《Web2.0技术和软件在图书馆的应用现状研究》因本人感到未达到发表质量而没有投稿,作为背景材料在这里也一并提供给大家参考。
  5. 文章内的许多观点不一定正确,欢迎大家来函商榷,批评指正。

穿过“黑洞”是光明(Black Hole or Dark Age)

星期四, 8月 17th, 2006

不知道乔纳斯*帕姆(Jonas Palm)先生的《数字黑洞》是不是吓住了一些图书馆、博物馆馆长,或者让一大批Stakeholder们捂紧了钱袋?这虽然不是崭新的论调,但是把数字化项目与恒星的生命周期作为类比,确实既形象又引人入胜,是一个讨巧的修辞手法。

然而通读文本,除了一个”数字黑洞”的标题吓人,文章的主旨并不是对数字化的反动,从某种意义上来说倒正是相反。作者在不断地提醒大家,对于数字化项目要”想好了再做”,”如果没有考虑未来、无法充分保障各类维护费用的话,先期数字化的高昂成本和投资都将付诸流水”。

文章的最大贡献在于指出了数字化的最大成本并不是存储介质,以及”数字化”工作本身,而是数字化之后的长期保存和利用。帕姆先生详细介绍了瑞典档案馆数字保存项目的成本构成,分析了数字媒体的特点和项目在不同阶段可能遭遇的不同成本风险,以及容易被忽视的费用陷阱。文章提出了一种有趣的保存方法:先数字化,再不定期地将数字化文件还原成缩微胶片。这种数字化与传统载体结合的永久保存思路,很是新颖。

对于文中认为对数字化的巨额投入是一种浪费的观点本人难以苟同。要知道新的经济形式在旧的经济学理论中总是难以解释。信息经济为什么会创造那么多的就业、创造一多半GDP?按照古典经济学理论只有从事第一产业的人在创造财富,世界上只有20%的人口创造财富养活80%好吃懒做的人?这显然是不符合实际的了,新的行业在不断创造新的经济增长点,成本的提升正是经济增长的动力。如果不是资源有限,浪费也是经济增长的一种形式。当然,这样说绝对了。

作者似乎也有一种过于相信”原始”载体的倾向。如果越原始越好,那么口口相传是最好的,但却是最易丧失的。作为文明的保存,普通文字是需要识字才能够阅读,这也并非毫无门槛,我们现在还能读懂印加荒漠中永久保存的大地画吗?玛雅文化的历史遗留呢?需要识字才能保存的文化,是一种成本很高的文化,相比较而言利用机器识读只是很小的成本了。将来借助于机器,会有越来越多人类直接可以获得直观的感觉(图片、动画、声音)的永久保存,这些优势反而是用文字表述所难以企及的。

数字图书馆必须穿越这个”帕姆黑洞”,当然能不能成功穿越还未可知。文字记录的永久保存,包括未来的数字化保存和数字化服务,永远是图书馆不得不承受之累。对于这个黑洞,图书馆穿得过要穿,穿不过也要穿,不穿过这个数字黑洞,我们的后代就会进入一个对”前数字时代”一无所知的”数字荒漠”,我们就会面临”数字断代”的危险。对数字资源的恐惧会使我们的职业进入一个黑暗的世纪(Dark Age)。凤凰涅磐,浴火重生,谁能够坚持到最后,谁就能看到无限的光明。

(《数字黑洞》的翻译稿将于《图书馆杂志》今年第11期刊出,译者为Jackie。在这里做一广告。)

我的讲稿:讲不完的beta版

星期三, 8月 16th, 2006

此次受国内最高学府邀请参加数图论坛,自然不敢怠慢,拿出平生所学唬人,准备了cutting-edge的最新内容:一个56页的泡泡(ppt),涉及Web2.0的概念、Lib2.0的概念、Web/Lib2.0与数字图书馆的关系、与Semantic Web的关系、tag、mashup等等等等,许多独门秘笈,最后还有上图”上海年华”的远景架构(自我感觉直逼张大帅e-science数图架构了)。无奈大会主持张甲先生一分钟也不多给,一会儿一张催命符,写着”5 Minute”、”1 Minute”,放在你面前,只好草草了事。这个DL2.0主题命运多桀,从5月25号info20会议以来一共讲了4次,没有一次讲完的,看来真的如大狗狗所说,是永远的2.0版了。

My presentation on Tsinghua DL Seminar 2006

清华归来

星期三, 8月 16th, 2006

带着遗憾从清华匆匆返沪,上图这两天有两个国际 会议要开,不得已提前一天告别会议,许多精彩的内容和交流讨论都不能参加了。 但是心中还是充满了喜悦,感到收获巨大。非常感谢清华图书馆提供了这么好一个机会,感谢曾蕾、张甲等”海外赤子”们每年不辞劳苦,为我们准备最新鲜的数图大餐,尤其感谢姜爱荣、郑晓惠等老师的邀请,使我不致于错过这次会议。因为没曾想开这种专业会议还会有名额限制,使得我的许多同事都没能来成,只好由我回来向他们传达会议精神了。在此我要提请会议组委会注意,不能允许像厦门大学这样的不限人数的代表团出现,这对于贫困地区(尤其是西部地区)的图书馆员、数字图书馆爱好者是极不公平的! 我想通过这次会议,大家的主要收获可能并不是知识上的。过于紧凑的日程安排难免使大家短期内消化不良,但通过交流明显使大家感受到了一种气氛,一种图书馆IT工作者的文化:务实、求知欲旺盛、充满理想和责任感、同时伴随一些说不清的无奈和身处边缘的危机感。会上的各种观点、思想的碰撞使大家获得了大量的信息和反馈,有助于了解大家都在想什么、做什么、关心些什么、困惑些什么,可以矫正和趋同每个人心目中对数字图书馆的愿景,这或许是最有价值的。如果说5月末Lib20研讨还是一种地区性草根小圈子的聚会的话,这次数图研讨班可算是图林”技术派少数民族”大团结了。我想这个会议与同时由北大召开的”中美馆长论坛”具有截然不同的文化吧?或许频繁穿梭于”两会”的萧德宏萧馆长能够给我们做一番比较。

本人参加此次会议的十大收获:

1. 王雪茅的数图MBA训练营;
2. 曾蕾的”四代知识组织”说;
3. 张甲的个性化知识搜索(可惜我只能看ppt);
4.林夏年年有新意的”信息可视化”;
5. 刘伟玲的OpenURL实践(要是能再加一些技术展望就更好了,例如新版OpenURL标准的讨论等);
6. 国家科学图书馆的张氏数图架构领先国际;
7. 朱强对”CADLIS多项世界第一”的答辩;
8. 国图数图建设新进展;
9.饭饭的赠书(使我在北京机场的漫长等待交给了《滇缅公路》);
10.意外获得一本NSTL《中美数字图书馆高级研讨班(第二期)》资料汇编。

开会

星期六, 8月 12th, 2006

随着叶群峰深深的一鞠躬,”首届中文维客年会“谢幕了。我想小叶应该感到非常满意了,作为一个涉世不深的年轻人,拥有一群很好的朋友的友情帮助(如两位相当不错的主持人),以及一帮志同道合者的积极参与(包括一帮候补大腕的Wiki元老、名人),虽然其中不乏广告演讲,但总体来说,是”一次交流、友谊、成功的大会”,开得不仅紧凑、务实,而且也体现了IT文化中应有的平等与民主的理念。在这里向叶群峰戴静中表示祝贺!

一个朋友说起这个Wiki年会算不算”非会(Unconference)”,于是特地把这篇Understanding the Unconference找出来看了看,发现严格意义上还不算。

“非会”有四个原则:

  1. 人无闲人;Whoever comes is the right people.
  2. 事起于当起;Whatever happens is the only thing that could have,
  3. 行于所当行;Whenever it starts is the right time,
  4. 止于不得不止。When it’s over, it’s over.

也就是说这是一种志同道合者的聚会,没有固定的程式,没有必须的发言者,可以在露天场所,开会时一切都可以随即组织,一切”惯例”都可以打破,所有人员都有自己的角色可以扮演。这在传统中是不可想象的,这是一种会议形式的创新。

IT是个很奇怪的东西,创造出一种崇尚个性、追求自由、以平等务实为最高价值的文化,只有在这种文化氛围中,人是最具有创造力的。不仅是unconference,还有Mashup Camp,以及近年来在国外学术界大量产生的”虚拟研究组织”(如DCMI、IEEE/LOM等),都是富有成果的组织创新形式。反观我们的”官会”,席卡座次来不得半点马虎,等级森严,让你坐前面你不能赖在后面,让你发言你还不得不说。人格不能保证,思想没有自由,何谈创造!

Wiki五宗罪

星期五, 8月 11th, 2006

明天”首届中文维客年会“,小戴小叶要我捧个人场,不得不在”百忙中”抽点功夫,了解一下这Web2.0四美之一。华山论剑都是高手,纸糊的关公也不能掉了底子,临阵学个三板斧可以凑合一天。

Wiki虽然被誉为内容管理的利器,在我看来却一直是个还没长成就要结果的生瓜蛋子,骨架子撑起来像模像样,脸还是娃娃脸。又像早先Mosaic出现之前的WAIS,生涩无趣的排版,密密麻麻的文字。如果不是教书先生布置作业,真不知谁会去翻动一下。也可能这就是教书先生自恋自虐加整人弄出来的玩意,电子版说文解字,网络版康熙字典,有么子用啊?!

Wiki的问题不在没有内容内容太多或难以控制,不在有没有精英能不能找到成就感,不在环境不好遭人打压动不动就疯掉,也不在卖不掉广告换不来米面搞起来像公益事业。真正的问题在这个东东从娘胎里一出来就存在了。

1、 太Wiki了。一个速成的超文本架构(超媒体怎么办?),很2.0,傻子都会用,还唬得人人都像李爵士一样牛X。屏蔽了三层结构,安装好了就可以编写,模型与关系、语义与语法都是现成的,该有的功能应有尽有(是吗?),好吗?很好!是给编辑而不是给hacker用的,缺的就是想象力!
2、 内容与形式捆绑,知识组织方式单一。自诞生以来就与PPR维基百科联系在一起,以至于许多人听到维基/维客就是维基百科。许多Wiki系统连Folksonomy都不支持,遑论Taxonomy!? 更别说分面分类,多角度揭示了。条目一多便难觅入口,只适合单线思维外加一两个书末索引的百科全书,想换一种活法?即便不是不能,也是妄想!
3、 结构化程度不够,未引入微结构/微内容格式等规范,要成为机器自动可读还需要艰苦努力。这导致了可重用性不强。
4、 无权威控制机制。权威控制只能靠社群成员人工改来改去,如果吸收图书编目中的思想,采用规范词表、分类体系以及权威档,岂不事半功倍?
5、 大多Wiki系统搜索能力有限,结合差强人意的内容导航,要找东西只能是瞎子摸象,凭运气了。幸亏只是查找词条,如果想知道”知识就是力量”是谁说的,或哪里的Kiwi果最便宜?就麻烦了。

总之啊总之,没有图书馆员参与的知识系统能叫专业?笑话!(想知道百度为什么牛?查查李彦宏本科学什么专业就知道了)

数图高研班的主题

星期一, 8月 7th, 2006

分析了一下2004(深圳)、2005(厦门)和今年清华大学连续三届”数字图书馆前沿问题高级研讨班“所涉猎的主题(下一届是不是应该到上海来办了?),您感到是不是都是你想了解的呢?是不是还有什么重大遗漏?这些问题在整个数字图书馆体系中分别处在什么位置?每位专家的介绍是否切题?到位?思考一下这些问题可以作为图谋正在进行的关于高研班调查的补充。

问题领域

2006

2005

2004

战略/宏观管理 战略策划(王雪茅) OCLC环境扫描(曾蕾)
概况/趋势 数图新技术(林夏) 全球性数字图书馆(陈树新) 国外数图概况(曾蕾)
数图发展动向(可视化等)(张甲)
保存/存储/数字资产管理 数字保存(曾蕾) 数字存储(林夏) 长期保存(秦健)
数字资产存储管理(秦健)
数字资源管理(刘伟玲) 数据的保护保存(张甲)
机构库IR(王雪茅、萧徳宏、李春旺) 数字馆藏内容建设(林夏) 数字资产管理(张甲、郑晓惠)
数字化技术 图像处理及元数据(曾蕾)
知识/信息组织 数字图书馆2.0(刘炜) 语义网实例(曾蕾)
知识组织与界面技术(曾蕾) 语义网与知识分类系统(秦健) 实用分类系统(秦健)
可用性测试(周晓英)
知识组织(张振海) 元数据与互操作(曾蕾) 元数据与科学信息组织(张甲)
资源整合 资源整合 门户建设(姜爱荣) 基于内容的浏览(林夏)
开放链接技术OpenURL(刘伟玲) 链接技术(张甲)
服务 数字服务(张甲) 基于使用的数字信息开发(张甲)
可视化(林夏) 可视化(林夏)
OPAC的个性化(张甲)
(增值服务) 信息抽取(张智雄)
人员培训 馆员素质教育(陈书梅)
相关应用领域(教育) Learning Object(陈树新) 资源数字化与教育(曾蕾、秦健)
案例/实例介绍 案例1:数字图书馆(王雪茅) 斯坦福数字图书馆实例(张甲)
案例2:大学数图论坛(萧德宏) 古籍数字化(兰飞)
案例3:数图建设心得(郑晓惠)

LOCKSS值得关注

星期日, 8月 6th, 2006

关于LOCKSS(Lots Of Copies Keep Stuff Safe)的介绍我就不多说了,请Google

LOCKSS的运行模式是符合潮流的:分布、共享、责任与利益兼顾,依靠契约建立机制而不是单凭觉悟,经营实体与社会公益机构分别承担各自的角色。图书馆从来不是数字化资源的生产商,图书馆进行数字化大多只是出于保护”遗留”文字遗产的需要,都是古老的、孤立的、需要保存的东西。而各类出版商(包括各种数字出版机构)本来就是以数字方式生产信息,自然他们才是数字信息的源头(当然真正的源头是作者,对于图书馆来说2.0时代每个人都可能是出版商)。然而东西是他们出的,作为整个人类文化遗产的表现,它们并不一定能够承担起永久保存、永续使用的责任,这实际上就是LOCKSS想法的伟大之处。

LOCKSS是开放运动中的一个颇为奇怪的东西,甚至可以说是一类”有理想”的东西吧,至少中国的出版商们是打死也不会同意这么做的。这个想法如果能够实践得好,十分有助于树立图书馆在数字保存中的独特地位。许多馆长都担心数字资源不订了怎么办?给一份光盘介质毕竟只是权宜之计,而且许多出版商实际上都不愿这么做。这就更显示了LOCKSS技术上的独特之处,其真正有价值和有意义的地方在于其运行模式(归功于张甲的同事Vicky,呵呵,真聪明)。如下所述的一些前提条件如何能使其得到有效的扩大呢?通过图书馆界的抗争?还是晓以利害,或以利益进行诱导(例如全国图书馆的60亿市场规模)?

以下”LOCKSS的工作原理“来自“数字图书馆前沿问题高级讨论班”网站

LOCKSS能够保存期刊,必须具备以下2个前提:
1 出版商允许LOCKSS系统收集和保存其出版的期刊资源。他们通过在网站上加上许可声明的页面并把它链接到所出版的各个期刊卷次来表示他们允许LOCKSS的操作。
2 LOCKSS工具需要知道它要获取的期刊的页面位置和相关信息,从而避免它在爬网站时超越期刊的界限,转而试图去收集整个网站或部分目录等无关信息。对如何加入一个新的出版平台并设置相关信息?LOCKSS提供一个填入式(fill-in-the-blanks)工具,图书馆员或管理员通过这个工具来收集 平台信息并测试信息是否正确。这些信息保存在一个文件(the LOCKSS plug-in)里,随后将文件加到出版商的网站上或者其他支持LOCKSS的存储库中。这样就保证所有的LOCKSS系统用户能够获得该平台的资源。

中科院图书馆(ie. 国家科学图书馆)2003年5月就加入了LOCKSS,OCLC也于最近成为正式成员(我对OCLC加入其中感到有些困惑,它是代表成员图书馆加入呢?还是作为一个数字资源的出版发行商加入?如果是前者,那就太厉害了,目前LOCKSS只有九十多个成员馆,而OCLC有9000多个!成员馆的地位肯定是不同的。如果作为后者,那也没有什么好说的。不过有一点值得注意:OCLC参与任何联盟,都是希望做老大的)。

谈谈开放内容Open Contents

星期六, 8月 5th, 2006

开放内容是开放运动的三大支柱(Open Contents,Open Source,Open Access)之一,也是数字图书馆的三大内容来源(数字化、购买或租用以及免费资源导航)之一。很多图书馆早期在建立网站时都曾经把”网络资源导航”作为一项重要内容(上图在1997年还曾野心勃勃,想建立一个搜索引擎来利用免费的网上信息,后来经系统调研之后否决了这个想法)。目前除了偶尔听说有”学科门户”之类的建设项目似乎与此有些关系,整个图书馆界好像都放弃了这类资源,是管不过来吗?还是不屑去管?没有能力去管?不知为什么。

“开放内容”运动正如火如荼。尽管现在预测其能否成为”主流”为时过早,至少已经对主流的出版行业构成了强大的威胁。值得注意的是,开放内容与开放存取是紧密相连的,一个是原因一个是结果,有时也可以不作区分。Google、Yahoo!以及图书馆界的大规模数字化项目不去说它,个别国家的大规模Web Archiving计划不去说它,渐成潮流的OA运动促成IR(机构库)遍地开花也不去说它,颇为奇怪的一种图书馆与出版商共生共荣的LOCKSS方式也暂且不说,美国正广受争议的FRPAA(Federal Research Public Access Act of 2006)如果最终获得通过,这将是西方国家自上世纪各类信息公开法案之后最重要的促进信息公开的举措,也将使网络上有价值的开放内容呈现一次飞跃。

虽然有一种极端的观点认为图书馆可以没有馆藏,例如目前在英国风起云涌的Idea Store、在各高校的Learning Commons以及美国、澳大利亚、新加坡的Information Commons等,但这类”图书馆”也必需依托网络资源提供各种服务,包括各类数字图书馆的服务。OCLC的图书馆思想家Lorcan在他著名的”图书馆资源四象限图”中明确告示了两种资源是图书馆的新挑战,那些认为图书馆可以死抱着传统资源也能长生不老青春永驻万寿无疆的学究们应该醒醒了,图书馆如果仅仅与印刷图书捆绑在一起,它也必将与印刷图书一样被边缘化,或者供奉在干净漂亮恒温恒湿的橱窗里供人瞻仰,从而以另一种方式得到永垂不朽。

因此建设数字图书馆绝不应忽视开放内容,相反以人类文明的看护者自居的图书馆应该越来越重视开放内容,能否组织、管理、利用好开放内容将是图书馆在未来能否立足的关键。

年会发言ppt

星期五, 8月 4th, 2006

实践承诺,我在年会上的发言稿提供下载(可点击下图,5.2MB)。

这个”对策”是我发言的中心内容。 前述众多”狼来了”的呼喊已经不能引起众人的警觉,于是希望对狼群的形势判断还能有助于大家未雨绸缪,或者亡羊补牢。

关于本页slide的进一步解释:

  • 重新定义图书馆:正如麦当劳认为自己做的是房地产生意而不是卖快餐一样,你怎么认识图书馆,就会形成怎样的思维框架和观念,从而指导你的决策和行动。这也是一种”范式转变”,特别在社会转型期我们尤其需要换一个角度看自己,跳出图书馆界看图书馆。最新一期《新世纪图书馆》头一篇提到明确定义图书馆本质的重要性,我非常赞同,但却同时认为事物的定义必须得到公认、没有异议、永葆青春,这就未必了。社会科学的研究可以有不同的角度、方法、模型,没有种认识可能都是相对真理,解决一时、一地的特殊问题,没有必要求全责备,更没有必要站在自己的坐标系中拷问别人,这就显得狭隘甚至无知了。所以图书馆也完全可以有多种定义,甚至重新定义。
  • 打造图书馆的核心能力:去年对图书馆核心能力的讨论,也碰撞出不少思想火花。虽然不可能有个定论,大家都看得出来,对图书馆的本质有怎样的认识,对核心能力就有怎样的归纳。上帝的归上帝,凯撒的归凯撒。认为图书馆应该是天堂,就要编织天堂的梦想,认为图书馆是工具,就要努力使这个工具变得好用。本人在演讲中只是举了两个例子,有人认为图书馆不能失去作为一种交流场所的功能,于是发展起了Information Commons、Learning Commons、Idea Store等概念,有人(例如本人)认为图书馆的本质是实现知识的组织和交流,就应该打造知识组织的核心能力,就应该研究基于本体的知识组织。
  • 创新业务模式和服务模式:这是2.0时代我们必须主动去做的,虽然我们还没有方向,但令人欣慰的是许多业界大鳄都以一种积极进取的姿态进行尝试,例如CALIS、国科图、国图等。这些尝试都有必要进行适时的总结和深入的研究。图书馆并非只有公共图书馆,图书馆学也并非图书馆精神学,图书馆学会也不是民主斗士、书商俱乐部或者自娱自乐的小团体,虽然做学问的人不多,学问还是不少的。
  • 重新塑造图书馆员:即2.0时代对图书馆员的要求。近来这方面的讨论很多,ppt中罗列了Library Views(林宏泰)博客上的翻译,没有展开。

年会发言前的思考

星期三, 8月 2nd, 2006

以下是年会发言的前夜自己的一些思考。

争议也罢、呼喊也罢,数字图书馆毕竟还在发展,而且也一同到了2.0时代。

乱花渐欲迷人眼,浅草也能没马蹄。数字图书馆近来的发展越来越让人看不出眉目。朱强老师想明年开一个数字图书馆成果研讨会,而在这之前似乎应该好好梳理一下。CALIS做了些什么、国科图做了些什么,国图又做了些什么,这些所作所为哪些是对的,代表生产力的发展方向和广大读者的根本利益,哪些又做的有疑问,值得商榷,哪些又根本欠考虑,等等。

重新认识图书馆: 图书馆不是信息太阳系的中心。

数图现状:

  • OAI已经生根
  • OpenURL也获得商业应用
  • 机构库成为前沿
  • 元数据规范及应用深入人心
  • 资源整合成为焦点
  • 联邦检索走出图情领域
  • 用户管理SSO成为必须

技术前瞻:

  • 元数据六国未灭难统天下
  • 数字保存雷声大雨点小
  • 统一资源定位还只是理想
  • 2.0任重而道远

大厦将倾,独木难支

  • 数字化的统一协调,可能吗?
  • 数字化费用:能负担吗?
  • 长期保存:能承担吗?
  • 版权框架:能支持吗?
  • 只有政府来做数字图书馆,行吗?
  • 标准规范制订了,有权威性吗?如何维护和执行?
  • 教育下一代:不能仅靠精神、理念、责任感