基于语义表达的中药概念数据模型构建

2022-03-14 08:49:48 | 浏览次数:

对照,确定了它们之间的关系,检验概念数据模型的范围。唐忠[12]分析军用电子设备试验数据,研究设计了试验数据库概念模型,采用时间、设备和试验题三维关联数据模型,满足试验数据库管理系统应用需求。

在中医药领域,数据模型研究基本处于探索阶段,还未见系统完整的概念数据模型,语义web技术得到了一些应用[13]。目前,由于没有统一语义的数据模型标准,没有参照,重复建设,低质量的数据模型直接影响应用系统的质量,更谈不上应用互操作,阻碍了信息资源的的集成、交换。

中药概念数据模型属数据模型范畴,一方面通过梳理中药知识体系,分析中药类数据资源,基于基础数据进行中药概念信息抽取,另一方面利用中医药领域内本体及现有模型指导约束概念及概念间关系的确定。利用本体与数据结合构建概念数据模型,明确概念含义,理清概念间关系,有利于数据建模的准确性,促进信息资源的集成与交换;在语义层面上有利于补充领域本体。

2研究方法与步骤

21中药及相关业务领域概念特征分析

211中药业务领域数据资源分析

中药概念数据模型中的概念来源主要基于中药领域数据资源进行抽取。中药领域数据来源需根据概念数据模型构建需求设定。

一方面,中药领域核心概念来源要考虑反映中药核心知识体系,需分析中药领域权威辞典、工具书、教材,如《中华人民共和国药典》《中华本草》《中药大辞典》《中药学》《临床中药学》等;另一方面,中药概念数据模型是针对数据构建的模型,要考虑反映中药领域数据库信息特点。

中国中医科学院中医药信息研究所的中药相关数据库包括中国中药数据库、中药科技基础信息数据库、中药药理实验数据库、中药化学实验数据库、中药化学成分数据库、中国方剂数据库等;相关数据库包括中医临床疾病数据库、中医医案数据库、有毒中药数据库等。另外,中国科学院的中国中草药数据库、中药有效成分数据库、中药基本信息数据库、中国中成药数据库、中国英文中药数据库,上海中医中药数据中心的SIRC/TCM中医药信息系统,中国科学院武汉植物园的神农架药用植物数据库与华中药用植物数据库,复旦大学生物多样性科学研究所的上海市药用植物数据库查询系统等。通过分析这些数据库系统的数据集与核心数据元,利用权威辞典对数据元进行规范抽取,可以作为中药核心概念的可靠来源。

成框架,中药概念数据模型包含中药及相关业务领域术语资源、数据资源、信息系统等方面概念的抽取,进行中药概念数据模型構建,以中药为核心进行相关业务领域数据资源概念抽取如图2。

22中药及相关业务领域概念及概念间相互关系

杨喆[15]等基于国家卫生信息概念数据模型为基础,提炼和描述卫生领域数据元,表达数据元及其语义关联。该方法与中药概念数据模型中基础概念抽取一致。在中药及相关业务领域概念抽取中,以中药知识体系为核心概念体系,相关业务领域概念为补充完善。前期研究[16]对中药知识资源体系进行了比较,结合“中医药数据元标准研究”中药类数据源[17],进行中药类数据元整理修订,结果如表1。基于数据元进行核心概念的抽取与描述,示例如图3。

在进行中药概念数据涉及的业务领域分析研究中,需结合调研咨询、业务梳理、专家讨论等,辨析中药及相关业务域概念含义及其在理论中的地位、性质、作用,确定核心概念、非核心概念,比较概念含义及其重要性,确定核心概念、非核心概念,对中药领域概念与相关业务领域概念进行梳理。

23中药概念数据模型构建

参考中药工具书、教材、相关专著及中药规范数据元研究成果,根据其含义及其在理论中的地位、性质、作用,确定核心概念、非核心概念,对核心概念与非核心概念之间的层次、类属、逻辑关系等进行深入辨析,确定其相互关系;结合中药相关业务领域,分析中药域与其他域之间的关系,进行中药概念及关系的考量。以本体论方法为指导,全面分析提取概念间的语义关系,以TCMLS的56种语义关系为参照,结合其语义关系适用情况,进行适当的增删调整,梳理中药概念间的语义关系,基于统一语义表达,构建中药概念数据模型。

中药概念数据模型的建立,一方面希望可以作为数据物理模型的上层,指导数据库规范建设,方便数据交换与共享,另一方面作为领域概念信息的抽取,可以丰富和补充TCMLS,完善中医药领域顶层本体建设。

3结语

运用本体与数据相结合的方法,基于基础数据进行中药及相关业务领域概念及概念间抽取,概念及概念间关系的确定需结合利用领域本体TCMLS,重用概念及概念间关系,兼顾HL7 RIM模型,建立概念间关系,在概念层面建立中药数据模型。这种构建概念数据模型的模式,概念来源于基础数据,能够反映数据结构特点,利用语义表达概念间关系,可在语义层面上提供知识共享与重用,为中药本体的构建提供来源。

概念数据模型一方面要有较强的表达能力,另一方面也需要简单、清晰,易于理解。在实际应用过程中,必须进一步转换成为逻辑数据模型、物理数据模型,才能在具体数据库中实现[18]。

参考文献

[1]余彤鹰.札记:本体及数据、信息、领域、企业建模与模型.http://www.eeforum.org/wp/pub/ty/201102p2491.html,20160607.

[2]Studer Rudi,Richard Benjamins,Dieter Fensel.Knowledge engineering:principles and methods[J].Data and Knowledge Engineering,1998,25(1/2):161197.

[3]苏里,朱庆伟,陈宜金,等.基于地理本体的空间数据库概念建模[J].计算机工程,2007,33(12):8789.

[4]郭磊.根据方证相关理论构建中医药关系型数据库概念模型探讨[J].山西中医,2009,25(3):6061.

[5]张丽颖,马鸣华,金岩.基于本体的医学科研信息模型的建立与分析[J].中华中医药学刊,2013,31(10):22592261.

[6]李明,张昌林,包汉飞,等.中医证候本体表达模式的构建与应用研究[J].上海中医药杂志,2013,4(1):711.

[7]周扬,王振国.中药Ontology概念关系体系的构建探析[J].中国中医药信息杂志,2009,16(3):9697.

[8]娄苗苗,杨喆,刘丹红,等.基于领域信息的卫生信息概念数据模型构建方法[J].中国数字医学,2015,10(1):7477.

[9]石建军,许国华,何民,等.交通地理信息系统数据模型的研究进展[J].北京工业大学学报,2004,30(3):311322.

[10]熊方平,马进山,陈新燕,等.中国石油一体化勘探开发数据模型研究与实践[J].信息技术与信息化,2011,(3):4955,60.

[11]张玉海,徐勇勇,刘丹红,等.国家卫生信息概念数据模型与HL7RIM的映射研究[J].第四军医大学学报,2006,27(11):9991001.

[12]唐忠,周含冰,何荣茂,等.军用电子设备试验数据库概念模型设计[J].计算机与数字工程,2013,41(1):148150.

[13]于彤,崔蒙,李敬华.语义Web在中医药领域的应用研究综述[J].世界中医药,2013,8(1):107109.

[14]刘丽红,朱彦,李海燕,等.中医药一体化数据模型的构建[J].中国数字医学,2015,10(10):7072.

[15]杨喆,刘丹红,娄苗苗,等.基于信息建模的数据元标准化方法[J].中国数字医学,2016,11(2):5860,70.

[16]刘丽红,贾李蓉,刘静,等.中药本体相关概念描述探讨[J].中国数字医学,2016,1(2):9092.

[17]董燕,张竹绿,李海燕,等.中医药数据元提取规则与分类探讨[J].中国数字医学,2013,8(11):7980,88.

[18]梁礼方.数据模型[J].金融科技时代,2014(1):4551.

(2016-06-08收稿责任编辑:白桦)

推荐访问: 语义 中药 构建 表达 概念

相关文章