地学数据、地质知识的一个典型特点就是具有空间属性,在地学研究中这些空间属性可以通过经纬度、坐标等数值形式得以精确反映,但知识表达更普遍的情况是以区域或地名的形式出现。例如,研究人员在进行青藏高原研究时,往往希望通过查询青藏高原、西藏地区、特提斯成矿带(中国)甚至第三极等一些具有明显区域特征的关键词查询需要的数据资源,而很少有人直接通过青藏高原空间区域的范围(北纬26°00′12″~39°46′50″,东经73°18′52″~104°46′59″)来查询。因此,如何把用户对空间范围的查询语义转化为对地名或区域的查询,或者直接揭示用空间语言表达的地学知识的空间特点,成为地质空间术语语义研究需要解决的问题之一。
目前在地质术语研究与应用方面取得的重要成果有《地质学汉语叙词表(2010)》、《地球科学大辞典》、《石油主题词表》、《地质矿产术语分类代码(GB 9649-2009)》等,这些成果在规范专业术语使用的同时,也对空间术语进行了部分规范。这些术语词典、词表的出版,使广大地质工作者有了学术交流的共同语言,为撰写论文和检索文献提供了极大便利。但长期以来,空间地质名词的学科化与规范研究基本上处于半空白状态,一直套用行政地名系统、地理空间系统语义(地名叙词),没有建立起系统的空间地质语义体系,这不利于对地学知识的空间挖掘和本质的揭示。地学文献信息资源的知识挖掘等要求更为系统的知识组织,尤其是语义层面的知识组织规范。
2012~2013年启动实施的地质调查项目《地质叙词语义第一部分 空间地质叙词》对国内主要是近三十年的地学知识中包含的空间信息进行了梳理,整理了近4万条知识性空间语言信息,明确了5万多条词间关系,探索了空间语言的空间位置关系计算,为地学知识的空间挖掘、分析进行了准备。该项目由中国地质图书馆主持承担,主要完成人有丁群安、刘振锋、刘素芳、王欢、宋韦剑、朱薇薇等。
一、成果主要内容
成果内容包括两部分:编制了技术规范——《地质叙词语义第一部分 空间地质叙词》,为空间地质叙词的内容拓展提供了技术规范;对地质空间语言的语义进行了拓展和规范,为基于空间的知识管理、挖掘提供了必要的理论和基础支持。
1.《地质叙词语义 第一部分 空间地质叙词》
该叙词规范共有8章和3个附录。主要章节分别是:范围、规范性引用文件、术语和词间关系符号、空间地质叙词的选定、词间关系处理、空间地质叙词编码、空间地质叙表结构及编排、空间地质叙词表的使用和维护。附录包括三部分:附录A空间地质叙词主表,附录B空间地质叙词范畴索引表,附录C空间地质叙词英汉对照索引表。
该规范以“中国地质文献数据库”和《地质学汉语叙词表》(2010)为基础,结合地学文献空间属性标引与检索需要,编制了空间地质叙词647个。其中,政区类名词193个,地理类名词305个,地质类名词149个,中国名词329个,外国名词318个,具有代用关系的叙词60个。
2.拓展了地质空间术语的语义范畴
地质学领域常用的空间术语主要有行政、地理、地质三类。行政和地理类术语由于词语的社会认知度高,便于公众、一般研究人员识别,在标注应用上,主要描述研究行为、对象、问题所处的区域。地质类空间术语一般都含有地质专业信息,一般与研究的地质问题、现象关系密切,在使用和区分上主要利用空间地质术语的通用名进行识别。因此除政区外,地理类和地质类的术语分别按照《地球科学大词典》、基础地理信息要素分类与代码空间要素信息进行规范。行政类空间语言一般与国家、国家权力下的行政空间划分相关联,其命名与行政确认、区划变迁有直接关系,一部分与行政区区位相关,如华东地区,表示中国东部地区。地理类空间语言主要由自然地理地貌决定其空间范围,部分命名可能受行政因素影响,部分地理名词与行政名词通用,如台湾与台湾地区、台湾岛通用。地质类空间语言一般由地质研究人员根据特殊的地质空间、地质现象提出,与一定的地质理论、特殊的地质问题关系密切,地质空间术语有较强的地质专业属性,如板块学说的华北板块,大地构造学说的喜马拉雅造山带、断裂带,含油气盆地学说的渤海湾盆地、珠江口盆地等。
(2)对地质空间术语进行了体系化研究
地质类空间语言一般由地质研究人员根据特殊的地质空间、地质现象提出,与一定的地质理论、特殊的地质问题关系密切,有较强的地质专业属性。项目以“中国地质文献数据库”、《地质学汉语叙词表》(2010)常用的空间地质类地名词和《地球科学大词典》不同学术观点为基础,按照学科范畴特点对空间地质信息通用名进行研究,将通用名归入学科范畴。通用名包括板块、地台、地盾、地块、地堑、盆地、坳陷、凹陷、古陆、地轴、地槽、断裂带、断裂、构造、构造带、造山带、褶皱带、缝合带、隆起、成矿带、成矿省、成矿域、地震带、裂谷等单元名称,为空间地质术语在知识标引、分类方面打下了基础。同时,项目结合当前应用热点,对重点的成矿带、盆地进行系统补充。从地球科学大词典、石油主题词表中遴选184系列空间地质名词,在文献应用中进行查证,按照至少使用三次的原则进行筛选查证。增补叙词成矿带17个,盆地29个,断裂带18个,并重点对其英文译名、词间关系进行了梳理。
二、成果的应用前景和意义
空间语义在一定程度反映了地质学研究的深度、广度和层次性,与常规的地学术语词典、规范相比,地质空间语义不直接反映地学知识体系变化,但它反映了地学科学事实变化和科学认识的变化。空间地质语义的研究填补了地质学知识组织规范体系的一项空白,加速了国内地学知识体系的构建,为建立更为广泛的空间语义网络提供了必要的知识和理论准备。地球系统科学研究涉及天文、气象、海洋、地质、生物等领域,需要打通交叉学科的术语壁垒,地质空间语义的规范研究,为融入即将到来的更为广阔的空间语义网络做好了知识和理论准备。另一方面,通过知识的空间属性揭示,为识别地学在不同区域内的各种问题,展示地学的区域结构特点,更好地开展地学知识挖掘、地学科技工作部署和野外工作基地选择提供了基于空间知识计量的科学分析数据。