Archive for 11月, 2004

Ontology大牛Tom Gruber访谈- -

星期一, 11月 29th, 2004

Dr. Tom Gruber' s (Co-founder and Chief Technical Officer of Intraspect Software) Interview
For the Official Quarterly Bulletin of AIS Special Interest Group on Semantic Web and Information Systems, Volume 1, Issue 3, 2004

Tom Gruber (tomgruber.org) ,就是那个在 Ontology 最牛的牛,给 Ontology 下定义而被无数人引用的那个大牛,最近又说了一些很牛的话:

他说:”每个本体都是一个条约–一项社会要约–存在于想共享某些事物的人之间”( “Every ontology is a treaty - a social agreement - among people with some common motive in sharing.” )

他把 Ontology 分为形式化的、半形式化的和非形式化的,他认为形式化的本体会很难达成,会有很多限制,而半形式化的本体更有用,办形式化的本体:形式化的一半由机器来处理,半形式化部分给人读的。有意思。

The term “Semiformal Ontology” refers to a ontology which has a few bits of formality but is largely informal. It is the analog of what Tom Malone calls semistructured data, such as email or office forms. A semiformal ontology could support technology to processing of its formal parts but leaves it to the reader make sense of the informal parts.

Tom 认为 Ontology 工具(他的 Intraspec 公司正在干这个明堂)将对其应用带来很大便利,特别是对那些不懂技术的用户。

Tom 还认为半形式化本体由于能够结合上下文,会工作得很好。


Technorati :

再次讨论(2004年11月26日)- -

星期五, 11月 26th, 2004

继续讨论:

> 1、项目要求我们提出资源集合元数据标准规范登记注册系统的需求,我们还是要提的;
> 2、由于不涉及服务注册,而且目前的注册系统主要是人工查阅、使用的,因此我们现在对于资源集合元数据标准规范的登记注册需求,与专门组的各个方案基本相同;
> 3、对于资源集合元数据标准规范的登记注册,希望能够包括我上一封邮件提到的一些内容,即能够提供元素、元素修饰词、编码体系、编码模式、整套方案等内容的检索、管理、更新等等。


近期讨论(2004年11月23日)

星期四, 11月 25th, 2004

1、 如何理解资源集合的登记系统问题?

2、资源集合的内涵是什么?


发件人: zy
发送时间: 2004年11月24日 17:32
各位老师好,最近大家都在以Email方式交流课题问题,这样很好。在此我也想问大家两个问题:

(1)如何理解资源集合的登记系统问题,资源集合的登记我认为有两种理解:

a.资源集合元数据规范(包括元素)登记

b.资源集合及其服务登记

如果理解为资源集合元数据规范的登记,我个人认为与基本组和专门组的元数据规范登记应该没有太大的区别吧?如果是这样,为什么资源集合组需要专门来做登记系统的需求分析,而这一层面的需求分析是否会和登记组的工作重复?

如果理解为资源集合及其服务的登记,则表明所谓的登记系统就是一个资源和服务的联合目录?不知道我的理解是否正确?如果是这样,是否主要依照DC2004年会论文集中Ann的那篇文章的思路来写就可以了呢。

(2)资源集合服务的内涵是什么?

资源集合服务的内涵可以理解为通过资源集合获取资源对象的一种服务形式,也即资源集合本身提供的一种服务形式。例如数据库,作为资源集合,提供了检索手段,可以让用户查找到资源对象。

资源集合服务是否还指可以通过其他服务方式获取到资源集合,例如通过信息门户,可以获取到某一个数据库的URL地址。


上述两个问题是基本的概念问题,和我们的课题密切相关,希望能得到大家的反馈意见。

我个人认为仅仅依靠文献做研究不太可取,虽然也看了一些文献,但是有些疑问久久得不到解决,希望能在此讨论,谢谢大家。



lsh:

Sent: Wednesday, November 24, 2004 5:56 PM


任务书任务描述:

元数据登记系统是元数据应用的一个重要环节。通过登记系统的注册机制,各种元数据从而建立和保证相关元数据标准的普及、反馈和修订机制,并能实现元数据标准的推广和普及。

本项目元数据登记系统采用开放但集中的归口管理,建立统一的注册登记网站,但可以支持个课题组不同的元数据方案进行注册登记。资源集合元数据也需要提出自己的注册需求,在登记系统中实现资源集合描述元素的开放定义和管理,并且进行初步的开放实验。
我觉得是第一种理解,资源集合元数据也应该作为一个元数据规范在元数据登记系统中注册,从而可以被广泛地引用,而不是说资源集合元数据组自立一个单独资源集合元数据登记系统。
From: zy
Sent: Thursday, November 25, 2004 8:36 AM

谢谢小l的答复。
如果完全依据任务书来看,资源集合元数据登记是实现资源集合元数据规范(包括元素)的登记。但是问题是为什么资源集合需要专门提出自己的注册需求,也就是说资源集合元素与其它专门数字对象描述元素的注册需求有什么本质的不同?我很担心如果这样做会和元数据登记组的工作基本重合。不知大家怎样理解这个问题? 

From: lsh
Sent: Thursday, November 25, 2004 9:36 AM


是不是可以这样理解:元数据登记组建立好了元数据登记系统,咱们资源集合组上它那去登记一下,好让其他用的人知道有资源集合元数据方案可以拿来用。
打个俗一点的比方,要结婚的情侣,先得提出要结婚的需求,然后到婚姻登记处去登记,别人才会知道他们算是合法夫妻了;-)
所以,资源集合组的任务是提出登记注册需求,而不是再去建立一个登记系统。


From: Keven
Sent: Thursday, November 25, 2004 10:06 AM

各位好!
我的理解也与小l一致。对于我们的总课题来说,资源集合元数据规范的注册也是注册到一个体系中去的,而不是单独的注册系统。而且大多数功能也都是一样的,不外是提供参照、查询、版本控制、日常维护、更新管理、事务管理和其他服务等等。我不知道目前中科院的这个基于DCMI注册体系支持哪些功能,就我的了解以及对ISO11179的认识,注册系统管理的对象可以有:
1、元素;
2、元素修饰词(或称子元素);
3、编码体系修饰词;
4、元数据标准规范词表(即一个元素集合整体,作为一个标准规范。目前许多注册体系要么是单独的元数据标准的注册系统,要么只是一个大杂烩词表管理系统,没有还原成不同的、整套的标准规范的能力);
5、元数据应用纲要(来自不同标准规范的元素,共同组成一个领域元数据规范,比4更进一步,是一个领域应用的词表,而不是更加严格的规范,但其中可能有一些扩展元素需要自行维护);
6、各类形式化方法(XMLS、RDFS等编码模式);
7、其他的非结构化应用文档。
从性质上看,资源集合描述元数据规范只是一个应用纲要,与专门元数据组的许多规范一样。注册系统主要需要对其中的扩展元素、元素限定、修饰词、编码体系等进行登记管理,最好能够管理到其特殊的定义(比如名称Title元素,沿用基本定义没有问题,但是在各个应用纲要中可以添加一些内涵外延的限定,或者举例等),并且能够在登记注册系统中能够单独抽出来。
除了上述共性之外,资源集合描述元数据规范的注册对于未来支持基于Web Service的自动服务(例如自动解析、映射、dumpdown等),要求比其他元数据方案更高。
简单讨论至此,没有来得及查阅课题组相关文档和其他文件,欢迎拍砖。
From: lxy
Sent: Thursday, November 25, 2004 10:57 AM

各位:
现在关于曾燕的第一个问题,我了解了一些,但为什么对于她的第二个问题没人回答呢?
(2)资源集合服务的内涵是什么?
资源集合服务的内涵可以理解为通过资源集合获取资源对象的一种服务形式,也即资源集合本身提供的一种服务形式。例如数据库,作为资源集合,提供了检索手段,可以让用户查找到资源对象。
资源集合服务是否还指可以通过其他服务方式获取到资源集合,例如通过信息门户,可以获取到某一个数据库的URL地址。
我现在有两个问题:
一是资源集合所提供的服务到底有哪些呢?想来想去,只有检索,我想不出来其他,是不是因为我对资源集合的概念狭义化了?服务的属性需要在”元数据规范”中体现吗?
二是注册系统一般是不是都针对专门的类型的,比如,有元数据登记系统,知识本体的登记系统,那服务的登记系统会不会有,登记系统之间会不会老死不相往来?对资源集合所能提供的服务,是否也需要登记?联系到第一个问题,如果资源集合的服务包含在元数据规范中(这有点不太好想像,大概只能通过编码体系来解决),那登记就由元数据登记系统代劳了。但如果不是,我们需要提一个服务注册的需求吗?可惜,《我国数字图书馆标准规范建设之元数据标准规范开放登记系统》子项目大概只管到元数据标准。
From: JADE_XIA
Sent: Thursday, November 25, 2004 1:25 PM
各位:

我有2点理解要补充:
1。资源集合所提供的服务,除了检索资源对象以外,还有很重要的一种服务是”聚类”的服务,也就是”集合”这个词本身所包含的意义,就是把具有相同特性的一堆对象聚集在一起,以满足特定的需要。资源集合应该是个动态的概念,每个集合都是根据一定的主题或目的由一个或多个对象组成的。
这里,组成集合的这个”主题”或”目的”很关键,同一个资源对象可以因为某个主题属于这个资源集合,也可以由于另一个主题属于另一个资源集合。资源集合描述元数据所起的作用就是在资源对象描述元数据的基础上,在更高的层次,更有针对性地描述一堆因为某种共同特性而聚集在一起的资源对象,以起到分类和导航的作用。

2。关于服务注册的问题。这个问题可以交给web services,因为web services本身就有服务注册的机制。我们的元数据登记系统只管到刘老师所列的那些东西就行了,没有必要管理服务。但我们还是要提出资源集合元数据服务注册的需求,因为资源集合元数据要能够支持web services,肯定要满足一定的要求,如要遵循一定的置标规范和接口规范。这些要求具体有哪些,是什么,我们也应该考虑到的。
From: yyzh
Sent: Thursday, November 25, 2004 1:28 PM

K老师最后一段讲的是Metasearch技术。Metasearch中很重要的一项是Resource Metadata,又包括两种类型:Description metadata和Technical metadata。我觉得目前我们的资源集合元数据还只是Description metadata的层面。因此,未来我们课题的可能应用或许会是:使用者利用这些信息,来决定在做某个特定的检索时,是否需要选择这个数据库。

如果每个数据库厂商都能建立对其资源的最准确的描述,那是最好不过的。如果不是,这项工作需要每个图书馆自行处理?就会面临很多的问题。

我们的工作如果能够邀请到数据库厂商参加,是最好不过的。不过就目前的发展现状来说并不乐观。Z39.50 Explain 功能就是建立在这个假设的基础之上。但实际上,到2000年,Z39.50 server中作了这项工作的还不到1%;而且即使是实现了,所用的格式还五花八门。

未来的Semantic web或许可以使得这一想法走得更远,但目前还看不到什么出路。
From: lsh
Sent: Thursday, November 25, 2004 4:55 PM

> k的分析很准确的。每个资源集合其实可以看成数据提供者DP,而要发现这些DP并
> 去使用它就要借助一个中间人,就是注册中心,这好像是一种普遍的做法,
> 在OAI的应用中,这种原型已经出现,Identify命令返回的信息基本可以认为是一种资
> 源集合描述,而且在此框架内大家都已经遵循OAI-PMH协议了,所以从技术上实现
> 自动化的数据通讯问题已经解决,但是要得到DP的baseURL还是要从其他地方获得,所
> 以OAI组织建立了一个DP的Registry,需要从DP获取数据的SP必须先从DP Registry那找
> 到某个
> DP的baseURL。更进一步的做法是DP Registry事先对每个DP发一个Identify命令获得DP
> 的描述信息,然后供SP们检索发现和选择。
>
> 所以要实现更广泛的资源集合的自动化的metasearch,除了描述性元数据以外,还需要
> 技术性的元数据,比如遵循的标准、协议、查询语法等等。这些都要由某个注册机构来
> 提供。
> 这一点同意zyy的看法。


Technorati : , , , , ,