论文详情

语义出版技术在非遗数字资源共享中的应用研究

24    
关注“壹学者”微信 >>
第一作者认领本论文 邀请作者认领本论文

第一作者:翟姗姗

作者简介:翟姗姗,ORCID:0000-0002-2787-0183,华中师范大学信息管理学院副教授。武汉 430079;许鑫,ORCID:0000-0001-7020-3135,通讯作者,华东师范大学经济与管理学部信息管理系教授,博士生导师,E-mail:xxu@infor.ecnu.edu.cn。上海 200241;夏立新,ORCID:0000-0002-4162-2282,华中师范大学信息管理学院教授,博士生导师;石义金ORCID:0000-0002-4964-7054,华中师范大学信息管理学院助理实验师。武汉 430079

人大复印:《图书馆学情报学》2017 年 06 期

原发期刊:《图书情报工作》2017 年第 20172 期 第 23-31 页

关键词: 语义出版/ 非遗数字资源/ 资源共享/ 语义关联/ semantic publishing/ intangible-cultural-heritage digital resources/ resource sharing/ semantic association/

摘要:[目的/意义]当前非遗数字资源共享主要通过构建门户网站和数字资源库实现,不能有效解决资源共享时出现的语义异构和互操作问题,也无法使资源在深层次的语义和概念层面互联。以新的导向合理组织非遗数字资源并采用更为有效的方式进行资源交互与展示,对非遗资源在全人类范围内的共建共享具有重要意义。[方法/过程]提出基于语义出版技术的非遗数字资源共享方案,构建以“楚剧”为具体应用背景的语义出版实例,验证语义出版技术在非遗数字资源共享中的可行性。[结果/结论]利用语义出版技术实现非遗数字资源共享,可以将出版单位细化到知识单元,有效建立知识单元之间及与外部数据集间的语义关联,并通过知识单元内容重组实现资源共享。

分类号:G250

1

引言

非物质文化遗产(以下简称“非遗”)是人类智慧的结晶和宝贵的精神财富,运用科学手段实现非遗资源集成共享,对传承人类文化传统,促进人类可持续发展都具有重要意义。早在20世纪90年代初,美国国会图书馆启动“美国记忆”计划,对历史记忆与文化档案等进行数字保存与共享,其中就包括音乐、艺术、民俗等大量非遗内容。为使广大公众更广泛、自由、平等地分享世界文明成果,1992年联合国教科文组织正式启动“世界记忆”项目,借助互联网数字虚拟技术在其门户网站上提供了大量可供无偿下载的技术出版物和手册等。我国在非遗数字化共享实践和研究方面起步较晚,国务院出台《关于加强非物质文化遗产保护工作的意见》、颁布《中华人民共和国非物质文化遗产法》等举措,推动了我国非遗数字共享的开展。2011年,国家图书馆开始启动“中国记忆”项目,其中就包括采用新媒体手段对蚕丝织绣、中国年画等非物质文化遗产的再现与共享。

数字化方式因其无破坏性、传播面广等优势已逐渐成为当前非遗传播与共享的发展趋势,而其数字化的异构性、多源性、活态性对传统资源共享方式提出了新的挑战。一方面,现有的资源描述方式难以满足用户从海量信息资源中获取规律、模式、特色等知识性内容的需要;另一方面,Web2.0环境下的网络资源非常复杂,导致非遗信息资源内容特征由静态到动态,信息单元之间的关系呈现非线性、多维性、模糊性。因此,本文借助语义出版技术提出一种非遗数字资源共享方案,以期有效解决当前非遗数字资源在出版模式与资源共享中存在的组织方式单一、关联程度不高、集成维度较低、个性化程度低等问题,基于语义出版平台实现非遗数字资源共建共享。

2

相关研究

李纲等将信息资源共享方式分为文献资源共享与网络资源共享[1]。日前,非遗信息资源共建、共享的途径主要为:一是采用分类法、主题词表等传统知识组织工具构建各类非遗门户网站,如“中国非物质文化遗产网”“上海非物质文化遗产网”等,通过提供一站式访问入口实现非遗信息共享;二是在三馆协同环境下,对各机构保存的非遗资源进行加工、整理,通过构建非遗特色资源库,并在一定程度上实现本馆资源和外部网络资源整合,进而组成一个有序的等级系统。以上资源共享方式只能在有限范围内实现不同资源系统中各数字资源在物理、逻辑和结构上的整合,并不能解决资源共享时出现的语义异构和互操作问题,也无法使资源在深层次的语义和概念层面互联。近年来,语义网技术的研究逐渐深入,基于文献与网络的非遗数字资源共享上升到语义层面的知识共享,故本文主要聚焦非遗数字资源语义层面的共享。

2.1

非遗数字资源共享研究现状

基于语义的非遗资源建设是非遗资源共享的必然趋势,也是网络技术和网络资源发展到一定规模与程度的要求。当前,从共享方法与手段出发,基于语义层面的非遗数字资源共享主要可分为:

2.1.1

基于元数据的非遗数字资源共享

异构、多源的数字资源一般采用不同的元数据标准,不同非遗领域所使用的元数据标准差异巨大。完善的元数据标准可以准确地实现非遗资源外部特征与内容特征的揭示,从而促进非遗数字资源共建共享:Dc、CDWA、MPEG-7等通用元数据规范的制定为研究者构建非遗数字资源元数据标准体系提供了必要依据。

2.1.2

基于本体的非遗数字资源共享

20世纪90年代,国外就开展了基于本体的信息资源共享方式研究,该方式主要基于领域本体模型对异构数字资源进行语义标注,通过构建元数据知识库实现资源共享。而国内针对于非遗领域本体构建的研究很少,一般有两种方式:一是借鉴较为成熟的本体(如CIDOC CRM、ABC Ontology等)进行复用,以实现非遗数字资源开发与利用。二是选取特定范畴进行领域本体或应用本体的构建,如谈国新等从中国古典建筑三维模型检索的角度出发,创建了基于本体的语义标注模型[2];翟姗姗等在建立二维元数据标准的基础上构建了楚剧知识本体,实现了本体导航与可视化检索[3]。

2.1.3

基于关联数据的非遗数字资源共享

关联数据作为构建数据之网的关键技术,在实现资源关联与共享方面具有天然的优势。它通过发布和链接结构化数据使得分散异构的数据孤岛实现语义关联,从而使资源整合成为无缝关联、无限开放的整体。目前关联数据应用于非遗领域的研究主要集中在关联模型、组织模式的构建。仝召娟等在非遗元数据标引的基础上生成RDF/XML描述,以建立起对象与对象间的关联关系[4];王伟等融合了关联数据技术与分众分类法,有效展示所收集的徽州文化数字资源的主要知识群落与知识单元细节[5];董坤应用关联数据技术实现了非遗知识元间关联关系的语义化描述与揭示[6]。

综上,无论是非遗特色资源库、非遗门户网站还是基于语义层面的非遗数字资源建设,都为非遗资源共享提供了必要的实现手段和有效途径,并已经取得了实践进展。大多数研究集中于非遗资源共享的概念、类型、模式、方法等方面,但仍存在着一些问题:①导向性问题。现有的非遗数字资源共享的目标性不是很强,资源服务方式仍以文献查询、原文提供等传统方式为主,资源共享的呈现与展示可视化程度不高。②微内容问题。不能很好地将资源组织单位由出版单元或文献细化到揭示资源“微内容”特性的知识单元。③多维度问题。缺少一种综合多个维度的信息描述方式,导致资源共享方式单一、集成度不高。语义出版的提出,为解决上述问题提供了契机。

2.2

语义出版相关研究与实践

D.Shotton首次系统地提出语义出版概念,并将其界定为一种语义增强的期刊出版形式[7],其价值在于通过出版物内容的语义揭示以及外部资源的知识关联实现数字出版功能的提升,通过结构化描述实现计算机理解的方式,使得出版物内容更易于直观呈现,能够显著提高读者的阅读效率[8]。近年来,在英国皇家化学学会、爱思唯尔、自然出版集团、美国科学公共图书馆等众多知名学术组织及出版机构的参与和共同推进下,语义出版已经初步实现了从理念构想向实践应用的过渡,研究成果不断涌现。

语义出版目前最为广泛应用是在学术出版领域,渗透到学术资源采集、概念识别、组织、利用等各个环节,极大地促进了学术研究的开展,如使用nano-publication实现资源内容非结构化向结构化的转变[9];借助mircropublication通过自然语言陈述、数据、方法、材料支撑、分析、评论等多方面内容形成文献的科学论证链[10];使用关联数据发布OA期刊及期刊中所涵盖的科研数据[11-12];对科学文献进行语义标注,提取文献篇章中的模型、假设、方法、图表及结果等[13];融合关联数据与本体技术实现学术期刊数字资源深度聚合[14];使用语义出版技术实现科研人员间的交流、寻找合作对象、建立科研合作关系[15]等。除此之外,语义出版技术也在教育、多媒体出版中得到了一定程度的应用,如对电子书进行语义标注,辅助教学过程中的互动式学习[16];安徽大学出版社开发的“科普读物语义导航阅读平台”[17],对该平台上20个系列百种图书进行了计算机语义自动标注。

目前尚未有针对非遗数字资源的语义出版物,也尚未有把语义出版技术应用于非遗资源共享的相关研究。

3

利用语义出版技术实现非遗数字资源共享的优势分析

非遗的无形化和活态化使其数字化保存与共享存在较大难度。一方面,传统的数字资源组织与共享方式并未解决非遗资源间的语义异构现象;另一方面,当前的数字化技术并未实现非遗数字资源与开放环境下的网络资源互联。语义出版作为数字出版发展的高级形态,颠覆了传统数字资源以单一出版单位进行组织共享的模式,以内容管理为核心,深入到出版物内容加工、制作、利用的各个环节。

3.1

数字资源加工阶段

大量非结构化内容的存在是数字资源再利用效率低下的原因之一。对非遗数字资源进行结构化描述,是有效进行其内容深度加工、实现资源共享的数据基础。而语义出版技术通过元数据描述出版信息,从源头上把大量非结构化信息变成结构化信息,并为其内容添加语义标签,从而实现对资源的结构化描述和知识单元的语义标准,进而实现其语义互操作,解决非遗数字资源内容上的语义异构问题。

3.2

数字内容制作阶段

实现非遗数字资源共享的关键条件是揭示资源间的及其内在的语义关联,而现有的关联技术如文本映射、聚类分析等,虽各有优势但大都仅考虑了实例层的关联,很少深入到资源的微观内容结构。由于语义出版物的语义化过程也是一种穿凿过程,故数字资源在出版前就进行了内外部特征和相关关系的揭示与组织,依靠URI和为此实现不同来源资源的关联与共享[18],通过URI自动发现、整合与该URI(实体、概念)有关的资源,再通过谓词揭示与这些资源的各种语义关系,并可将同类内容组织聚合实现资源共享,有效实现了非遗出版物外部特征、内容特征及相关关系的深入揭示。

3.3

语义出版物利用阶段

非遗数字资源的海量与多样性使得由三馆主导的信息共享不可能穷尽所有用户需求,最有效的解决途径之一就是面向用户需求在网络出版平台上开展个性化推荐。语义出版的新特征使得出版商需要改变传统的为用户提供服务的方式与形态,使其以尽可能少的阅读量快速浏览、查找文章信息。语义出版物通过给资源内容添加语义标签,提供增强型文本帮助用户提高阅读效率;借助不

上一篇

下一篇

*非会员只能阅读30%的内容,您可以单篇购买,也可以订购全年电子版,或成为壹学者高级会员,畅用壹学者站内优质学术资源和服务。

近期0位学者阅读过本论文

回应区(0条)

确定

回应