徐枫国家信息中心 中国国家信息中心、高级工程师 徐枫

2017-09-14
字体:
浏览:
文章简介:[IT168 报道]各位领导,各位专家下午好,今天我在这里向大家介绍一下,政务信息资源目录体系,核心元数据标准及其相关应用,在介绍标准之前,我们首先强调的是元数据的概念和作用,后面我介绍一下核心元数据的标准和核心元数据标准的使用.元数据的概念有三个重要的部分,元数据是关于数的数,通俗的讲元数据类似于商品标签,书目卡片这样的,对资源的说明,元数据要说明的是信息资源的对象是什么,有什么作用,以及使用者如何得到,这些基本的问题.元数据主要的作用,在政务体系中,主要提供内容的是共享政务信息资源的目录,元

【IT168 报道】各位领导,各位专家下午好,今天我在这里向大家介绍一下,政务信息资源目录体系,核心元数据标准及其相关应用,在介绍标准之前,我们首先强调的是元数据的概念和作用,后面我介绍一下核心元数据的标准和核心元数据标准的使用。

元数据的概念有三个重要的部分,元数据是关于数的数,通俗的讲元数据类似于商品标签,书目卡片这样的,对资源的说明,元数据要说明的是信息资源的对象是什么,有什么作用,以及使用者如何得到,这些基本的问题。

元数据主要的作用,在政务体系中,主要提供内容的是共享政务信息资源的目录,元数据能够有效的描述各种共享政务信息资源,是政务信息资源目录体系建立的基础。在具体的实际工作过程中间,政务部门的管理人员,是要利用元数据实现政务信息资源有效的管理和服务。

在目录服务中心,通过元数据掌握各个部门的共享信息资源的数量,质量以及发布方面的情况,作为用户可以通过元数据更快捷的,全面的,以及有效的方式,访问,获取,使用共享的政府信息资源。

核心元数据标准内容包括20项,有资源名称,资源出版的日期,资源的摘要,资源的负责方,资源格式信息,关键字说明,空间范围说明,时间范围说明,安全限制分级,信息资源的语种,信息资源采用的字符集,信息资源的分类,信息资源的数据加工的说明,信息资源连接地址,信息资源标识符,信息资源服务信息,元数据的标识符,元数据的语种,元数据练习方,元数据的创建日期。

作为资源名称主要是定义了一个数据资源的名称,它的数据类型属于字符串的类型,这项元数据信息,这是必写的信息,举一个例子,比如说气象局有一个,他是中国地面气侯资料国际交换站日值数据。第二个必写项是资源的摘要,这是非常重要的元素,用处主要是对资源的内容进行简单概括的描述,类型也是字符串。

这也是在一个技术中间,必须要出现的。比如说刚才讲的日值信息,它进行描述,比如说这个数据是中国194个地面气象资料的交换站,从1951年1月,到2003年12月的信息,整个的数据集,包括地面的日平均气压,日平均气温等等,13的要素的信息,数据集基本的内容做了介绍。

第三个必选的是资源的负责方信息,这个作用主要是对资源的完整性,正确性,真实性等负有责任的政务部门的名称和地址信息。这个信息很重要,要专门描述出资源是由谁来提供的权威性的信息。这是保证信息权威性的一种重要的信息,这是符合信息,包括了有许多相关的,像单位名称,地点等等这方面的信息。

这个元素是一个必选项,而且可以出现多次,往往有的信息资源可能不光是一个部门负责,可能由两个部门,三个部门负责,或者有不同的级别职责的部门,采取资源的发布。

第四个必选项信息是资源分类,这也是比较重要的信息,我们必须给资源一个分类的属性,便于用户在使用的时候,进行查找,也便于我们在资源管理的时候,进行管理,这是一个必选项,而且可以出现多次,这项元素为什么出现多次呢,我们可以对一个信息资源从多个角度进行观察,一个信息资源可能在不同的视角下,体现分类提醒,比如说我们有关键词的主体分类,我们可以有时间方面的分类,也可以有空间上的分类,还有一个就是从不同的角度,比如说从业务角度,学科角度进行分类,这样便于使用者,从关心或者是熟悉的知识方面来查找信息资源。

最后一个必选项就是资源标识符,这是一个政务信息资源具体唯一不变的标识,编码,这前面房院长介绍了具体的标准,我们对每一个信息资源都应该给一个唯一的标识。那么它主要做出了信息的调用,信息的管理,信息的查询方面起到了一个唯一的标识符的作用。

这个元素也是一个必选项,而且可以出现多次。 元数据标识符对资源的描述也是唯一的,类似于前面的资源标识符,一般来讲元数据标识符,和数据标识符一一对应。这个数据一般是由系统内部应用随即产生的,这个不一定有具体的含义。

刚才我简要介绍了一下核心元数据的内容,具体核心元标准的使用呢,我下面介绍一下。这个核心元数据标准的使用,主要有三方面的类型的人员,一方面是共享受信息提供的部门的人员,一方面是政务之间共享目录中心的人员,还有一个是共享信息资源的使用部门。下面我具体介绍一下。

对于共享信息提供部门主要有三方面,一是著录元数据,根据核心元数据标准的要求,填写各项内容,这叫著录过程,同时还有内容审核,审核元数据中各项信息与实际资源情况是否一致,最后一项是提供元数据。 著录方式,从技术上有两种,一种是自动方式,对于一些信息系统有比较好的元数据的应用机制的数据,往往形成数据资源本身的时候,会产生一些基本信息。

对于这样类型数据,我们可以采用自动方式,根据标准相应的规定,从中抽出相应的对资源描述信息来自动编录,还有一种是手动方式,我们对一些非结构化的资源,一些比较复杂的信息资源,我们需要用手录的方式,用工具的方式,来进行编目录。

对于目录服务中心,主要有两方面职责,一是形势审核,主要是根据核心元数据标准和要求,来适合各个资源提供部门,提供元数据,是不是符合标准,同时还有管理职责,按照标准建立核心元数据,进行管理和发布。这里面审核重点,主要包括必选项是否填写了,所有项填写的内容,是否符合标准,我刚才讲了原数据表是否符合资源的真实情况,这是由元数据的提供方来考虑的。

第三个就是信息共享的使用部门,实际上这也就几方面,在政务信息资源共享的范围内,很多部门是提供数据的部门,也是使用数据的部门,使用部门主要是通过基于元数据形势的目录查询和定位共享信息资源,也就是说使用部门要使用目录中心,和共享资源提供部门,共同通过形成的一个元数据和目录的体系,来对信息资源进行发现和定位,查找信息资源。

这种查找是可以多种。简单来说,可以有,比如说传统的检索词这样的查询,还有一种,就是说符合的查询,还有比较常见的就是分类查询,主要三种方式。

在元数据标准使用上有两种方式,一个是标准映射,一个是数据转换。对于已有的资源目录,我们怎么使用,实际上信息共享,我们不是今天才开始的,很多部门已经接触很长时间了。这些目录信息我们怎么样使用,不能说这个标准制定出来以后,我们就用这两种方式解决已有资源目录的使用。标准映射是通过软件完成标准间的自动转换,原有目录内容不需修改,数据转换按照新标准要求转换后重新建库。

在使用中我们还会碰到核心元对一个特定信息的描述,可能还不能全面描述的情况。需要对元数据标准进行拓展的时候,我们也规定了扩展的方式,主要有几个步骤进行拓展,首先要分析现在已有的元数据,对这个资源的描述是不是够用,如果不够的话,我们会根据新的特点,定义一个新的元素和代码表。

并且定义一个严格的约束条件。增加或者减少代码,这几种方式,来拓展说明,最后要把拓展的文档,把相关信息注入到管理的平台上。然后对这个拓展标准进行使用,这个扩展的机制主要是为了保证特定类别的信息资源的描述,保证一个标准的拓展机制。

最后我想很形象的给大家介绍一下具体的应用。这是一张图,对于元数据的内容,我们主要是由部门,按照元数据的标准,针对资源的特征,进行自动,或者手动编码,来形成元数据,第一项就是目录内容,这些目录形成之后,交到目录中心,或者是连接到目录中心,形成基于目录中心一个统一的一站式的目录访问的目录库,形成一个目录查询库的应用。第二是通过目录来发现定位信息资源,主要是目录中心来完成的。

第三个图是用户使用方的一个视图,通过元数据的目录的入口,我们可以通过浏览方式,下载方式,获得信息资源,建立本地的应用,第三是很典型的例子,这个例子就是从信息资源目录上面,我们通过浏览功能,可以浏览元数据所描述的,所定义的,来进行应用,我就简单介绍到这儿,谢谢大家。

陈小筑司长:谢谢徐枫先生,前一阶段的发言,主要是来自科学研究标准方面,下一阶段的演讲,主要是来自各个方面企业,看看他们对目录资源交换体系的一些想法,以及对标准制定的实现和认识方面的情况,跟大家分享一下,下面我们欢迎大唐电信产业集团公司的总工邓洁霖工程师,他为我们做的报告是构建政务信息资源目录体系的技术支撑环境。大家欢迎。