Archive for 4月, 2008

信息资源描述的“假设系统”

星期日, 4月 6th, 2008

昨天雨师谈到,在远洋老师的FRSAR模型中,他希望研究一下在背后支持这个模型成立的”公理体系”。 时间无多,未及深入探讨。但这肯定是一个很有意思的问题。雨师提到我应该继续完善那个贸贸然提出的信息资源描述”同一场论“(原来是数字图书馆同一场论,实际上是一套为了解决数字图书馆语义互操作的体系框架,信息资源描述在其中居于核心位置),直觉告诉我,与雨师这个”公理体系”有很大关系。 回来之后想了一下,可以有以下基本假设(不成体系,更不是公理,只是一种理解。持续完善中…):

1.可标识是可描述的前提条件。任何事物,不论是物理的、抽象的或者概念的,作为认识和交流的对象,首先必须能够以某种方式(有意义或无意义,能解析或不能解析,需调度或无需调度)进行标识,才能够进行描述。 2.任何数字对象至少具有”标识符”属性。标识体系是任何描述系统首先需要确立的系统,不论是有形的、无形的,具体的、抽象的。 3.任何一个标识体系,都可以(构建/看成)是一个封闭系统(复杂性可控)。 4.数字图书馆是数字对象的集合,其中的数字对象可以以不同的标识体系进行标识,以不同的元数据方案进行描述。因此数字4.对象是数字图书馆的组织基础,元数据是数字图书馆(数字对象)的结构基础。 5.元数据提供了数字图书馆的微观结构,领域本体提供了数字图书馆的宏观结构。 6.任何描述(不是陈述),最后都能够简化为”主体、谓词、客体”的一阶谓词逻辑(或其可控的扩展)形式的组合(即RDF(作为一种模型而不是语言)形式)。 7.所谓元数据元素,实际上就是描述信息资源的谓词(属性)词表(包括各类结构限定和取值限定)而已。 8.微内容是一类由微格式(包括RDFa)表示的数字对象,通常具有可共享、可重用、结构化和规范化的特性。 9.SKOS是一套用以表达数字对象的”主题”属性(或aboutness)的微格式,由一套属性词表(表现为RDFS)和形式化描述规范构成。 10.作为主题属性标识的SKOS和作为领域本体的知识组织系统具有完全不同的功能,不可同日而语。


Technorati :

雨师访沪

星期六, 4月 5th, 2008
keven上传于Yupoo, 由相机iPhone拍摄.

大旗代表沪上图林亲切接见,本人二陪。 雨师向大家抱歉,由于日程太紧,无法杭州论剑了。


[转贴]当今中国博客文化之批判

星期六, 4月 5th, 2008

在”伊甸文苑“看到转贴的本文(据说原文出自湘里妹子学术论坛,作者不详),很有感触,在此予以广而告之。虽说也应了作者”转贴文化”之论,使本帖沦为原作者所痛恨之糟粕行列,但也希望籍此印证对于网络文化不必过于苛求,良币也需要运用一定手段才不致为劣币完全驱逐。(以下全部为转贴)

曾几何时,Weblog这个即时网络日志形式,在我们的视野中出现,并迅速为网民所接受和使用。曾几何时,中国的Weblog忽然盛行和充斥着大量非艺术 的艺术,非文学的文学,非原创的原创、非严肃的严肃……。虽然我们也能看到一些真正严肃、负责、原创作品的反抗声音,但却显得十分微弱,被淹没在一种现代 简易操作性之中――文化的异化过程之中。假如要给这种异化找到一个象征性的词语,这个词就是”刻奇”(Kitsch)。

Kitsch是西方语言中都有的一个词,在中国又译作”媚俗”。《现代英汉综合大辞典》将”刻奇”解释为:”投大众所好的无美学价值的艺术或文学,拙劣的 作品”。《牛津现代高级英汉双解词典》解释为:”(艺术、设计等)矫饰的,肤浅的,炫耀的”。商务印书馆《德汉词典》定义为:”迎合低级趣味的伤感文学 (或艺术)作品”。

格林伯格在《前卫与刻奇》中提出了刻奇内涵的经典界定:”刻奇”象征着那个大量制造文化的时代,它是”我们时代所有那些赝品的缩影”。本质上说,”刻奇” 的基本特征就是:商业性、绝对性,矫情性,以及崇拜现代性。典型体现为:隐藏商业目的,虚假的激情,做作粗俗的坏品味,投合大众的作秀,不反映真实等等。 哈洛德·罗森伯格给”刻奇”的定义是:”已经建立起规则的艺术;有可预期的受众,可预期的效果,可预期的报酬。”如果以”刻奇”来考察当下的中国博客文 化,我们会发现,市场经济大潮中诞生的博客,在市场经济时代这个普遍丧失现实感的时代中,已经明显地烙上了”刻奇”的印记。

整体博客文化正在刻意营造、受到纵容的大众文化享乐。言情文学,流行歌曲,技术教学、温情写作、资源下载等纷纷以博客面孔登台,让人们沉浸在虚幻的温柔富贵乡中。

多数博客们缺少真诚、缺少严肃,已经不讳言虚假,明目张胆地转贴或整合大量网络作品,一味诉诸读者情绪上的条件反射,一味期待点击率、留言率,一味追求高 更新率背后的哗众取宠。空洞、做秀、转贴的博客日志成为时下博客文化的主人,制造虚假的博客繁荣,向”媚俗文化”表演着最奴婢式的集体献媚。

一些原创性网络日志主人也开始宣布”逃避崇高”,以无伤大雅、无病呻吟的小烦恼小快乐供人消遣,从艺术形式上遵循”容易和明显的美学快感逻辑”,体现出 “实用与感官的一致”。木子美、竹影青瞳之流更是荒诞不羁,竟然凭着绯闻和大胆描写性爱来吸引读者眼球,以实现一夜成名并获取商业价值的目的!

还有很多伪原创性网络日志,表面上装作是原创的、真实的、惟一的,其实却是简单整合网络资料而投大众所好并使人们的情感变得廉价。

博客商们服从市场法则,追求注册率和点击率价值,与大众文化的包装或炒作一般无二;虽然刻意掩饰免费注册背后的商业目的,眼睛却始终瞄准着其中潜在的商 机,期待有朝一日赢得暴利;为了商业目的而纵容简易、随意的、非原创的转贴整合行为,催生浮躁的博客文化心理;通过不断删除那些与自己博客定位规则不同的 博客,以清除自己实现未来商业目的道路上的障碍。

总之,今天的由博客商和上述大多数博客作组成的中国博客文化,基本上是形式大于内容,简单,粗糙,缺乏精神含量和反思能力,不关注博客形式上和内容上的 美,不关注博客的目的完成与否,更关注作秀和获取名利,就像画着蒙娜丽莎的烟灰缸,发着荧光的圣母玛丽亚雕像,印在机场出售的信封上的非洲艺术,体现了由 博客商、博客、大众传媒和读者共同构筑并通过博客文化市场推出的审美趣味。它们的共同特点是为了唤醒和满足大众的情感需求,它们的共同目的是为了满足某些 中国式中产阶级的情感和文化消费,从而导致文化艺术符号的贬值。可以说,时下的中国博客文化已经在相当程度上符合哈洛德·罗森伯格给”刻奇”的定义:”已 经建立起规则的艺术;有可预期的受众,可预期的效果,可预期的报酬”,因此可以恰如其分地称其为”刻奇”或者”媚俗”。

因此,无论目前制造了多么繁荣的博客文化氛围,我看到的都不过是一幕博客商与金钱,博客与做秀共谋的”刻奇”大合唱。

当然,从根本意义上而言,只要人们需要赋予生活以价值意义,”刻奇”就不可避免。无论我们如何鄙视它,”刻奇”都是人类境况的一个组成部分,它从根本上反 映了人类在赋予人类生活以价值方面的失败。博客文化背后的大众文化”刻奇”是远离生活,逃避价值,不是真正的文化艺术。要把握生活与艺术之间的关系,需要 具有一种深刻的现实感,从生活出发,而不是从某个价值观念出发。可是,当代文化艺术的困境却是:我们需要的这种情感不能被制造,它所依赖的人类自由的想象 力和判断力却在不断衰退。

昆德拉说:”人处在一个真正的缩减的漩涡中,胡塞尔所谓的’生活世界’在漩涡中宿命般地黯淡,存在坠入遗忘。”

的确,除了文化的”刻奇”,文化的”缩减”也似乎成为中国当下社会文化和社会生活的唯一走势。在市场经济及其实用主义的漩涡中,读书和思考被缩减为看电 视、赏大片,友谊被缩减为交际和公共关系,爱情被缩减为性,大自然被缩减为豪华宾馆和高尚住宅中的室内风景,对土地的眷恋被缩减为旅游业,真正的精神冒险 被缩减为假冒险的游乐设施。总之,一切精神价值都被缩减为实用价值,永恒的怀念和追求被缩减为当下的官能享受。

遗憾和可悲的是,博客这个新兴的网络文化,无形中也卷入了这个缩减的漩涡中,甚至为之推波助澜。博客文化缩减成了简单即时的大众传媒,绝大多数博客们不再 孕育和创造,只求在博客商主办的”优秀博客”、”博客排行榜”中登榜亮相。一些优秀写手们亦不甘心于默默无闻地固守自己的原创领地,而是将眼睛顶着博客文 化市场,揣摩和迎合大众读者心理,用广告、申请链接、推荐链接等手段提高知名度和点击率,和他们一起成为博客媒体上的热点人物。在这种情形下,写出来的不 再是作品,而成为一种动作,一个没有未来的当下事件。

博客成了一种时髦,意味着站在时代前列,领受着自己刻意制造和他人盲目跟从的无价值喝彩。博客文化中原创冲动被大大削弱,转贴博客的蔓延状态不再使人感到 嘲弄和悲凉,反倒大行其道并为多数博客所纷纷效仿。博客,在一定程度上蜕变为掩盖blogger个人创作贫乏和空虚的花哨饰物。一些博客常常怀着唯恐自己 创作率和更新率不高的焦虑和力争最有内容可写的超效率激情,不断地好新骛奇、努力寻找可转贴的内容,渴望制造更新最快、选题最奇、独树一帜的轰动效应,其 中包涵着的矫情和媚俗是不言而喻的。令清醒的读者不自觉地断定:支配着他们的仍然是大众传媒的那种哗众取宠的精神。

当看到博客们不再认真思考,而是随意转贴,不再严肃写作,而是任意整合的时候,我心中明白了一个真正可怕的过程正在博客文化中悄悄地进行――与负责任地原 创写作一起消失的还有我们的整个心灵生活。可以说,博客频繁当机并不足以造成博客文化的死亡,博客文化的真正死亡,是在博客们不图原创、不复原创而导致博 客文化成为巨大的转贴资料存储硬盘的那一天到来的。

面对这种”媚俗”"转贴”"缩减”的博客文化氛围,我们应当举起了唐吉柯德之剑,要用”负责任的原创”来对抗当下博客文化的平庸化、随意化、简易化潮流, 唤回对被遗忘的生活原创的记忆。一个负责的、严肃的博客,敢于正视认真观察社会、严肃思考生活的表达使命,不应在根本价值问题上随波逐流,默默推动着原创 作品在当下浮躁的博客文化环境中继续探索存在的真理。

当然,严肃不等于拒绝调侃,我们可以调侃一切神圣和非神圣的事物,然而,在这种貌似玩世不恭下面,应当蕴藏着一种根本性的严肃,即对于我们存在境况的始终 一贯的关注!一言以蔽之,优秀的博客,优秀的弄笔者,负责任的博客,归根结底是严肃的,倘若没有这种内在的严肃,再漂亮的形式、再漂亮的内容也必将流为媚俗。


Technorati :

语义网范式

星期五, 4月 4th, 2008

最近Alex Iskold在著名的2.0网刊读写歪脖(Read/Write Web)上发表了一篇”语义网范式:语义技术指南”(Semantic Web Patterns: A Guide to Semantic Technologies)的博文,实在是偶数年来一直想写的一个主题。当然如果是俺写,一定不及Alex之万一。对于众多对语义网(鉴于Semantic Network一词几乎已淡出人们的视线,俺也不坚持一定要把Semantic Web翻译成语义万维网了)充满好奇的”数字图书馆人”来说,进行一下入门教育是非常必要的。就像Eric MillerDC-2004上Keynote的:”语义网是什么?就是数字图书馆。”(他说过吗?原话在哪儿? 偶不记得了。) 语义网命中多桀。一说是自1994年在李爵士的脑中闪现(见证据),然FOAF之父DanBri却用了一个证明与Web是同时出现的(顺便一说,DanBri的头像实在是很酷哦),这是一张SW史前的草图,可惜是电子版,没有画在餐巾纸上,无法证明什么。为尊者讳,在互联网领域说一个东西很老是不礼貌的,虽然语义网大旗一直扛得很艰难,几乎被Web2.0抢了风头,但是现在可以改一个名头,称之为Web3.0,凤凰涅磐,浴火重生。 闲话少说,言归正传。Alex开篇就说,语义网是一个百变精怪,对于不同的人可能是不同的东西。让我想起emiller对于数字图书馆瞎子摸象的比喻:对于某些人来说语义网是Web中以RDF或OWL表示的数据(OWL实际就是一种RDF,RDF又都是XML);对另一些人来说RDF干脆就是微格式;还有人认为语义网只是基于语义的Web服务,另一些人则认为是网络上的人工智能…… Alex的这篇”语义网范式(Semantic Web Pattern)”,主要把混沌一片的语义网应用和各种对语义网的认识进行了梳理,可以认为是当前的”语义网类型学”。

1、自底向上和自顶向下:从方法学上认识语义网。

2、主流标注技术:RDF, 微格式和Meta Headers(HTML文件头)。

3、用户分类:面向最终用户还是面向企业。

4、开放语义API。

5、语义搜索。

6、情境(上下文)技术。

7、语义数据库。

原文对上述每个类型都进行了简要的评述并列举了一些例子。文章发表后引来了很多讨论和争议。我们暂且不去评说这些分类和评述是否一定正确,从帮助我们学习和认识语义网的角度来说,还是十分有益的。


Technorati :

08数图高级研讨班征集主题

星期五, 4月 4th, 2008

第五期”数字图书馆前沿问题高级研讨班”将于今年12月再次鸣锣开班,上海的同仁们有福了!本次会议由上海交大主办,郑巧英馆长特命我广而告之,为了更切合国内的情况和大家的具体需求,目前正在征集主题,欢迎大家前往提出(您可以在线填写提交表单)。 很高兴此次霍普金斯大学图书馆也加入了支持行列,又能见到雪茅兄了! 征集主题的全文如下:

2008年数字图书馆前沿问题高级研讨班预告暨主题征集通告

数字图书馆前沿问题高级研讨班已连续成功举办四期(2004·深圳、2005·厦门、2006 ·北京、2007 ·桂林),对国内数字图书馆建设起到了积极的推进作用。

在 四海期待、人心振奋的2008奥运年,数字图书馆前沿问题高级研讨班将由上海交通大学图书馆、美国霍普金斯大学图书馆、中国图书馆学会数字图书馆专业委员 会 (Digital Library Committee , China Society for Library Science) 联合举办,将于2008年12月中旬在上海交通大学即将落成的新馆隆重举行。在此,我们诚邀海内外从事数字图书馆研究和建设的同仁们齐汇交大,共聚一堂, 一起研讨数字图书馆前沿理论、技术、方法、应用、合作等问题,指点当前,畅想未来。趁着交大新馆开馆的东风,我们力图将本次会议办成数字图书馆界具有纪念 意义的一次盛会。

本 届会议,除了前几届一直积极支持本会的境外华裔专家之外,还将有约翰·霍普金斯大学图书馆馆长(Winston Tabb)等一些国内外著名数字图书馆界专家倾力参与,就国内外数字图书馆发展的前沿技术和未来趋势、数字图书馆建设的管理与战略规划、图书馆系统的新走 向、开源软件的应用、图书馆资源整合与data curation、仓储系统的进展、相关标准的制订、图书馆服务创新与技术应用实例等众多方面进行共同交流,共叙友情。

此为本次研讨班预告,同时也向海内外专家和积极参与数字图书馆研究和建设的同仁们广泛征集会议主题和培训课授课内容。您所关注的就是我们所欢迎的!您可以在主题征集页面中提交您的宝贵建议和意见,我们将对好的建议和意见进行汇总,并积极采纳和准备,力争让本届研讨班举办得更富有成效,发挥更积极的作用。

主题和培训课内容征集截止时间为2008年4月20日。我们将在广泛听取和汇总各方反馈后,于2008年5月中旬在本网站发出研讨班正式通知,并开始接受报名。

期待并感谢您的关注和参与!

上海交通大学图书馆

颠覆未来的网络技术

星期三, 4月 2nd, 2008

“读写歪脖“的Richard MacManus在去年九月预测了影响未来的十大网络技术,给人的感觉似乎平淡无奇,然而对于技术酒徒而言,越是接近未来,越是醉的厉害,越是会感觉言之有理。

这十大趋势是(这里直接采用译言的翻译,其中错误不少):

  1. 语义互联网(Web只是因特网Internet上的一种应用而已,翻译成语义万维网更准确);
  2. 人工智能;
  3. 虚拟世界;
  4. 移动网络;
  5. 注意力经济;
  6. 网站即服务(原文为Web Site as Web Services,Web服务有特定含义,并非泛泛的”服务”);
  7. 在线视频/网络电视;
  8. 丰富互联网应用(这里翻译得不太好,rich internet app特指ajax一类的、把浏览器当客户端的应用);
  9. 国际互联网(译者对Internet、Web等概念弄不清楚,这里International Web指万维网真正的国际化,而不是以美国、欧洲甚至中国等少数国家为主,当然更不是以国家为界限的超级局域网);
  10. 个性化。

其中许多已露端倪,如虚拟世界(如WOW,第二人生等)、移动视频(3G手机已经放号)等,其它也有不少耳熟能详,但如果不去亲身体验的话,往往是体会不到其中的奥妙和威力的。我们身边有很多人(特别是领导或资深教授)往往太聪明,仅仅依靠形而上的经验和放之四海而皆准的辩证法来认识事物,对于他们来说太阳底下没有新东西,于是很难给他们讲清楚鸡蛋为什么能孵出小鸡,而石头不能。

对于thema-nomen模型的补充

星期二, 4月 1st, 2008

看了远洋老师新近的博文( ),又引发了很多思考,想起做博士论文时参考Sowa “Knowledge Representation“书中的一个模型(C.K Ogden and I. A. Richards. The Meaning of Meaning,1923),不知是不是可以对thema-nomen模型做一点补充?

the meaning of meaning

查到这里有进一步阐释,很有启发。截图两张:

一点感想:概念和概念的表达,是为了交流服务的,模型的建立有助于达成有效的交流,有时不必拘泥于nomen是否表达了正确的thema,正确性判断可以留给系统的建立者和用户,铁路警察各管一段,系统的设计者只要确认交流的成立,nomen肯定是表达了某个thema的,就成了。否则可能把事情弄得很复杂,难以实现,更难推广应用。

(以上两图来自Harold R Solbrig,Christopher G Chute “A Common Terminology Services (CTS) Back-end to Protégé”,见:http://protege.stanford.edu/conference/2004/slides/3.1_Solbrig_A%20Common%20Terminology%20Services%20(CTS)%20Back-end.pdf