计算机“语义”与知识
星期四, 6月 30th, 2005数字图书馆的诞生恰逢其时,语义Web技术正日趋成熟。语义是知识的基础,语义是对机器而言的,而知识是对人来说的。计算机如果不能处理语义,那么分布式的数字图书馆体系实际上是无法真正达成的,人就无法通过诺大的因特网,获取自己想要的知识。
然而语义Web是个很新的东西,直到前不久,计算机科学中所有的东西,都基本上与语义无关,或者至少说是”弱语义”的。计算机与语言有着天然的联系,但是却尽可能躲避”语义”,其主要原因是,至今为止,计算机语言的发明主要是为了机器去读、去理解的,虽然一步步地走向人性化,但最终目的还是为了机器”理解”。为了利用计算机超出人类的巨大的存储能力和运算能力,人首先要把需要解决的问题化作机器可以操作的模式、模型、语言、数码,但是最终所获得的结果还必须”善解机意”的专家去解读。
我们在这里把”语义“定义为”语言表达的含义(meaning of meaning)“,对于计算机来说这种含义必须在一定的环境(领域知识)中具有唯一性,而且在传输的过程中不致走样,从而最终传递给人的信息就成为具有语境的信息–知识。当然人最后如何理解得到的”知识”就不属于系统所能掌控的范围了。
计算机不关注语义的另一个原因是计算机只把”信息”作为其处理的对象(客体)而不是其自身的一部分。软件从硬件中独立出来之后却还没有获得像硬件那样连续20年指数级的发展,自身却经历了两次严重的危机,根本还来不及顾及其处理的对象以及由信息构成的语义。而今Web的发展使信息体的规模一下子发展到了全球范围,使数字化的规模遍及了人类接受信息的各个方面(可能还是要基本上排除味觉、触觉、嗅觉,我很纳闷为什么这方面没有一种感觉的还原能够进一步的数字化呢?如果有那真是”虚拟实境”可以胜过现实环境了,人生活在梦中理想就能真的实现了。这使我想到听觉还原和存储技术的发明的确很伟大)。计算机科学已经无法忽略信息的存在以及信息作为其研究对象的巨大价值(传统上”计算机信息处理”学科的内容是重”处理“而不是重信息的)。从信息技术的角度来看基于Web的所有东西除了体量庞大之外似乎并没有什么技术难度,然而这正给计算机科学带来了完全不同的课题,从某种程度上说彻底转变了计算机技术的发展方向(从七十年代开始的高精尖的第五代计算机人工智能研究,而今人工智能也开始以Web作为一个难得的Testbed,试验其早期提出甚至发展的非常成熟的一些理论)。当然计算机科学的理论基础还是非常牢固的,人们可以继续把Web作为图灵机、把网格作为Petri网进行研究,并没有什么新意或者理论上的突破。
语义的表达从某种程度上来说即知识的表达,似乎到目前为止,计算机界还没有公认、统一的知识表达手段,人工智能中即有多种知识表达方式,比如谓词逻辑、语义网络(此网络非彼网络:Semantic Network,与Semantic Web完全不同,所以我一直避免用语义网络称呼SW,而用语义Web)、描述逻辑、框架结构、产生式系统、演绎系统和过程性知识等等,每种方式表达知识的能力都不相同,都有各自的局限和弱点(为什么这些强大的知识表达体系应用情况并不理想?是否因为对于前提约束过多?不适应半/非结构化为主、关联模糊的复杂信息环境?)。不像我们图书馆学,目录学(包括所有形式的二次文献)就是我们的知识表达。当然也不能勉为其难,计算机专家是为机器打工,需要让动物听懂人的语言都那么困难,别说机器了;而图书馆员是为人服务,语言可以有一定的模糊性和不确定性。这两者似乎不可同日而语。(但是我也常常纳闷为什么不同的大脑经受树突轴突的刺激之后的反应模式会接近或相同,既然这样计算机也应该能够模拟,或者携带这种相似性。)
- 评论人:而立
Mon Jul 04 15:33:43 CST 2005 
谢谢先生的指点!情报工作的知识管理是否可以借鉴企业知识管理的概念?两者是范围的区别吗?”一定范围”和”更大范围”?先生倒是提醒了我”这时你甚至可以自己定义自己的论题,定义自己所要论述的’知识管理’概念 “。实际上我在做的论题是”面向科技情报工作的知识管理”,而那篇关于知识管理的知识共享文化的文章是我以前做的,由于两者的概念定义不一样,所以我比较混淆。
- 评论人:kevenlw
Mon Jul 04 13:33:01 CST 2005 
知识管理与知识共享文化,本人没有研究,不能提供什么有价值的观点。如果你对于概念吃不准,应该再多看一些资料,一段时间之后自然就会明白别人在说什么,就能明白相关概念的异同。这时你甚至可以自己定义自己的论题,定义自己所要论述的”知识管理”概念。凭直觉判断你所要论述的”知识管理”就是企业知识管理,企业知识管理的目的就是在一定范围内对于知识的共享。而图书馆所进行的知识组织是为了在更大范围内共享知识,实际上是”交流”和”传播”知识。
- 评论人:而立
Mon Jul 04 08:46:58 CST 2005 
按照先生的说法,如果谈及情报工作的知识管理,应使用知识组织更为合适,是吗?因为我研究生的论文是关于知识管理的知识共享文化的论题,所以,现在我做情报工作的知识管理实在有点摸不着头脑。我知道南大的苏新宁老师主要研究知识管理的数据挖掘、数据组织方面的课题,但他是计算机背景。像我,图书馆学背景,该从什么角度切入知识管理?请教先生!冒昧,我可以联系北大的董小英老师吗?
- 评论人:kevenlw
Sat Jul 02 20:41:12 CST 2005 
to 而立:就我所知,知识管理通常就是指”企业知识管理”,图书情报界有时将知识组织与知识管理混用,这时这两个概念是不一样的,但是知识组织的技能可以被应用于知识管理,例如北大的董小英老师就去了光华管理学院,专职从事知识管理研究。知识管理中的”知识”主要是指载体化的”信息资源”和存在于组织机构中以各种形式存在的隐性知识,以及成员头脑中的Know-how,不同的知识管理学说”流派”对这些”知识”都有不同的”管理”方法,例如不同的理解、不同的代码化方法,有”学派”偏重于利用计算机管理而另一派强调人性化管理,等等。这应该有大量的资料可以查到。但是不论如何不要与人工智能中的”知识”混在一起了,这里讲的是具有逻辑联系的事实、概念、规则组成的知识,他们是非常不同的。
- 评论人:而立
Sat Jul 02 18:45:57 CST 2005 
请教先生,如果涉及到”体系”研究,具体应该包括哪些方面的内容?最近我在做有关知识管理体系研究方面的论文,但是说实话,我对此最基本的概念还有点模糊!而且流行在企业领域的知识管理和我们图书情报界的知识管理完全是两码事,是凡涉及到体系,概念很大,着眼点应该在哪儿呢?两种知识管理能完全割裂吗?彼此关系是怎样?万分感谢!
- 评论人:招聘信息
Fri Jul 01 13:52:28 CST 2005 
上海图书馆上海科技情报研究所招聘信息
1、发行业务员职位要求: 1)大学本科以上学历,发行专业优先。 2)具有较强的人际交往和沟通能力、团队合作能力。 3)工作认真负责,积极主动,具有开拓精神。
2、英语版权编辑职位要求: 1)大学本科以上学历,硕士优先。 2)热爱编辑工作,工作责任心强。 3)精通英语,听﹑说﹑读﹑写﹑译能力均佳,口语能力强; 4)具有良好的中文文字能力; 5)有较强的商务谈判能力。 6)有较强的人际交往、沟通能力。
3、策划宣传编辑职位要求: 1)大学本科以上学历,硕士优先。 2)热爱编辑工作,工作责任心强。 3)具有良好的中文文字能力; 4)具有较强的人际交往、沟通能力。 5)具有较强的组织管理和活动策划推广能力。
4、研发工程师职位要求: 1)本科以上学历,计算机及相关专业,英语六级以上; 2)熟悉计算机和网络的体系结构,了解网络编程和数据库原理; 3)精通一种或数种常用开发工具,具有较强的编程能力; 4)熟悉并掌握J2EE规范,具有一定的JAVA程序开发经验,有JAVA相关认证证书者优先 5)熟悉网络服务(web service), XML、RDF等语义万维网相关标准与开发技术; 6)良好的工作作风及文档编写能力,极富责任心,有团队合作和职业精神,能够承受一定工作压力,学习能力强,逻辑思维能力强,耐心细致。
有意者请发送个人简历至 xiangchen@libnet.sh.cn ,请注明应聘岗位。
- 评论人:a
Fri Jul 01 09:45:08 CST 2005 
“适合k先生”之贴,其实很不适合k先生,实乃大材小用也。倒是那些工作能胜任的人很多,所提的要求有点理想化,也就是所求并不一定为所需。
- 评论人:hengxuan
Thu Jun 30 22:58:19 CST 2005 
厦门大学在电子信息工程与汉语言方面有专门的研究
学科
你可以找一下他们研究
- 评论人:适合K先生
Thu Jun 30 18:57:57 CST 2005 
上海市人民政府机关事务管理局信息中心(地址:大沽路100号)为全额拨款事业单位,隶属于上海市人民政府机关事务管理局。主要职能为负责市级机关集中办公场所计算机网络系统硬件设施的规划与建设;承担市级机关集约化计算机网络系统硬件设施的信息安全与运行保障和本局计算机信息系统的技术开发、信息维护等。
因工作需要,诚聘以下人员:
一、信息中心副主任1名。要求:
1.计算机及相关专业大学本科或本科以上学历,年龄40岁以下(经验丰富者,年龄可适当放宽);
2.具有10年以上计算机专业工作和5年以上部门经理(主管)经历,能够独立策划计算机网络系统的规划、建设和实施方案;
3.具有良好的个人品质和较强的协调沟通、组织管理的领导能力。
二、网络系统管理工程师2名。要求:
1.计算机及相关专业大学本科或本科以上学历;年龄35岁以下(经验丰富者,年龄可适当放宽)。
2.有5年以上计算机专业工作经历和从事过3年以上计算机网络系统维护保障工作。
3.有用VB、SQL和ASP等工具开发项目经验。
4.具有较强的组织协调、项目管理及沟通能力和良好的个人品质及团队精神。
有意向者可将本人有关材料寄大沽路100号(邮编200003)上海市人民政府机关事务管理局人事处或发电子邮件jgjrsc@sohu.com。截止日期:2005年7月8日。
上海市人民政府机关事务管理局
2005年6月28日
- 评论人:吸墨纸
Thu Jun 30 16:21:04 CST 2005 
互联网简单来说就是由电线连接、使用同一种语言的大量电脑形成的一种协议,创建之初就是为了让大家交流。在上世纪七八十年代,一定区域内的人用email联系。这就是第一代互联网。第二代的发展始于一些高端人才,他们希望和在其他国家的同事一起工作,于是就产生了链接。但只有创建者有权加入链接,而后又出现了博客。但这还是第二代,因为创建者给浏览者提供自己选择的链接。
2002年左右,出现了bookmark(书签)的概念,人们可以由此迅速找到自己所要的信息,但这是和全世界分享的。这就是互联网第三代,因为浏览者也可以参与进来,决定书签的内容。而后,Tag也应运而生。总之我认为,迄今为止,互联网共经历了三代。
- 评论人:先锋媒体
Thu Jun 30 14:34:16 CST 2005 
2005 年,是中国商业互联网诞生的第十个年头, 10 年大浪淘沙, 10 年互联网改变了中国人的集体智商。 2005 年 6 月30 日,在行业发展的历史坐标点,作为中国领先的 IT 媒体,搜狐 IT 频道在北京香格里拉饭店摆下了 10 年论剑的英雄宴――” 2005中国互联网与新通信高峰论坛”,中国互联网与新通信领域的开山鼻祖、新势力代表、学术权威以及主流媒体精英济济一堂,共同见证中国商业互联网 10 年发展的风雨历程,畅想未来 10 年发展的广阔空间以及新的商机和拐点。
搜狐总编辑兼副总裁李善友说,相信在未来十年网络发展当中,搜狐也好,新浪也好,我们自己很难说得上登堂入室的媒体,在未来十年当中我相信我们能够成为影响中国社会的先锋媒体。
- 评论人:资料
Thu Jun 30 11:29:45 CST 2005 
徐滇庆(加拿大安大略大学教授):数据库的共享问题即使在北美都很难做到,它涉及到一个知识产权,数据库因为经济学研究,每搞一个数据库需要大量的时间和金钱,但是解决这个问题很好的办法就是在一楼正在开一个会,王执和我们几个人都参与了,就是我们共同搞了一个规范,每国家都按照规范组织起来,然后大家连接在一起共享,这个思路我觉得在中国非常值得推广,就是你不一定要付钱,但是你要承担劳动,你要把你承担的数据做好,然后参与到这个组里面,然后你再共享,但是一般的共享需要10万美元以上,但是我们是不用钱的,所以它是一种不成型的一种公司制度的结构。是大家做股东一起来做。这样资源共享是可以做到的,而无偿地要用别人的数据库,这个大概很难跟别人谈,偶尔施舍性质的给你一次可,长期用大概有问题,资源共享问题我的见解也很粗糙,抛砖引玉,供大家参考。
- 评论人:坚韧
Thu Jun 30 08:17:26 CST 2005 
执着的研究精神,令偶敬佩。





