论文详情

英国数字人文项目研究热点分析  

关注“壹学者”微信 >>
61 1  
第一作者认领本论文 邀请作者认领本论文

第一作者:林泽斐

作者简介:林泽斐,男,1983年生,南京大学信息管理学院博士研究生,江苏 210093,福建师范大学社会发展学院讲师,福州 350007。

人大复印:《情报资料工作》2018 年 01 期

关键词: 数字人文/ 英国/ 研究热点/ DHCommons  digital humanities/ UK/ research hotspot/ DHCommons/

摘要:文章基于DHCommons数字人文项目平台的项目资料,通过统计分析、共词分析、可视化分析等方法,对英国数字人文项目的学科领域、研究内容和研究热点进行了实证分析,认为英国数字人文项目存在4大热点研究领域,在此基础上对与热点领域相关的英国数字人文项目涉及的典型活动进行了梳理,以期为我国机构开展数字人文项目实践提供借鉴。

1

研究背景与问题的提出

数字人文是数字技术与人文学科的交叉研究领域。数字人文研究的前身为人文计算(Humanities Computing),最初着眼于于文本资料的数字化和计算语言学领域,其起源可以追溯到1949年意大利耶稣会的布萨(Busa)神父和IBM公司合作利用穿孔卡片创建的一个数据库,该数据库收集了有关圣徒阿奎那(Acquinas)著述的所有文字并建立了索引[1]。在此后的数十年时间里,计算机技术被逐步应用于文学、历史、地理和艺术等众多人文领域中。伦敦大学学院霍基(Hockey)教授[1]认为,人文计算的发展可分为四个主要阶段:(1)1949年至70年代早期的萌芽阶段,出现了诸如剑桥大学文学与语言学计算研究中心等机构和第一个结合计算机和人文研究的期刊Computers and the Humanities,但这一时期的相关研究受到技术水平的掣肘;(2)70年代~80年代中期的“联合”时期,这一时期人文学者和计算机界展开了一系列合作,出现了以牛津语词索引程序(OCP)为代表的合作项目和以计算机和人文学科学会(ACH)为代表的合作组织;(3)80年代中期到90年代初的“新发展”阶段,在这一阶段,个人计算机和电子邮件讨论组的出现促使更多的学者以更高效的方式投入人文计算的研究,并诞生了文本编码倡议(TEI)等成果;(4)90年代初以后的成熟阶段,这一时期互联网的出现促进了计算机在人文领域更广泛的应用,基于多媒体和超文本的人文计算项目开始出现。2004年,《数字人文指南》(A Companion to Digital Humanities)一书首次用“数字人文”一词替代了“人文计算”。相比“人文计算”一词对技术的侧重,“数字人文”的表述更加强调相关研究的人文属性[2],故很快在学术界得以普及,成为该领域的核心术语。

近年来,我国的数字人文研究方兴未艾。为调查我国数字人文研究现状,笔者利用CSSCI来源期刊数据库和CNKI数据库对篇名或关键词为“数字人文”或“人文计算”的文献进行了检索,经合并清洗后共得到81条相关记录。从相关文献可以看出我国学者对数字人文的研究主要着眼于以下方面:一是对数字人文研究热点与趋势的分析;二是探讨数字人文在史学研究、历史地理学、档案学等具体人文领域的应用策略;三是有关数字人文研究的支撑环境与基础设施建设,特别是图书馆、档案馆对数字人文研究的支持策略;四是从人文学科的视角讨论数字人文对人文研究方法和人文精神的影响。国内学者在分析数字人文研究热点和趋势时主要采用文献计量方法,如柯平、高胜寒等[3,4]学者均对国内外数字人文文献发表年份、研究主题、学科分布和高被引文献进行了统计分析和可视化研究,以明确数字人文研究的热点、演化路径和发展趋势。值得注意的是,基于大样本的国际数字人文项目实证分析在我国尚未见有研究涉足。数字人文作为计算机与人文科学相结合形成的应用性交叉学科,其应用成果往往是以数字人文项目的形式所体现,因此从国际数字人文项目实践的角度可以更有效地揭示该领域的研究热点,进而为我国开展相关项目提供直接的借鉴。

研究内容是数字人文项目实践的核心要素,一定的研究内容决定了数字人文项目活动的“原材料”和研究领域,多个项目间一致性的研究内容则形成数字人文研究的热点问题。目前学术界对于数字人文实践热点的看法不尽相同,如朱本军和聂华[5]认为数字人文实践的内容集中在四个层次:一是人文数据库或数据集的建设;二是人文数字工具的开发使用;三是将传统定性人文研究转变为定性研究与定量研究相结合的形式;四是人文领域的创造性破坏与建设,如艺术品的全息展示。王晓光教授[6]认为国际数字人文的实践前沿领域包括六个方向:(1)历史学方面的基于GIS的历史地理可视化;(2)文学方面的文本挖掘与TEI标准;(3)语言学方面的基于大型语料库的语料库语言学;(4)舞蹈方面的视频捕捉、运动分析与虚拟现实再现;(5)考古学方面的图像分析、色彩还原和数字重建;(6)数字图书馆和网络数据库。为了从实证角度分析数字人文项目的研究内容和研究热点,本研究利用DHCommons数字人文项目数据库中的项目数据,通过统计分析、关键词共现分析和可视化分析等方法,对英国数字人文项目的主题、热点和特征进行了研究。

英国在数字人文研究领域具有较强的代表性。笔者以表达式TS=digital humanities OR TS=humanities computing在Web of Science数据库中对SCI-EXPANDED、SSCI和A&HCI三大子库进行了检索,并将结果文档类型设置为“Article”,共得到372条有效记录。通过作者国籍分析可知,英国(含国籍为ENGLAND、SCOTLAND、WALES和NORTH IRELAND)学者在三大数据库中发表的数字人文研究论文共70篇,数量仅次于美国(127篇)位居第二;在数字人文领域发文量最多的机构中,前两名均为英国机构,分别为伦敦国王学院(KCL)和伦敦大学学院(UCL)。因此,英国的数字人文活动的研究热点可在一定程度上反映西方数字人文项目的前沿领域。

2

项目平台特征分析

本研究基于centerNet(数字人文中心网络)所建设的DHCommons项目数据库(http://dhcommons.org/projects)调查英国数字人文项目的开展情况。centerNet是一个国际性的数字人文中心合作网络,于2007年在美国国家人文基金会和马里兰大学联合主办的会议上发起成立,创始成员包括马里兰大学、牛津大学、伦敦国王学院、澳大利亚国家大学等18家机构的数字人文中心,目前已有来自19个国家的超过200个成员机构加入该合作网络[7]。DHCommons是centerNet所构建的在线数字人文项目信息交流平台,其建设目的在于为数字人文项目和希望参与项目研究的学者搭建合作的桥梁[8]。对于数字人文项目的管理者,可通过DHCommons发布项目的信息以及与项目相关的事件通知;对于数字人文项目的参与者或希望参与项目的学者,可以利用该平台发布个人档案、确认参加会议或与项目管理者取得联系。DHCommons的数字人文项目数据库起源于伦敦国王学院的数字人文项目ICTGuides和arts-humanities.net,早期的建设目的是搜集和发布英国数字人文项目相关的活动、方法、工具和相关学者信息,其部分项目数据来源于数据库建设者的搜集,部分来源于平台用户的主动提交[9,10]。目前,DHCommons项目数据库除收录英国数字人文项目外,也收录其他国家所开展的数字人文项目,多数收录的项目都对项目名称、研究内容、学科领域、项目链接、项目参与者、研究机构等信息有详细著录,部分项目还著录了项目的起止时间、研究素材、研究方法、研究工具等内容。

为调查DHCommons项目数据库中的项目特征,笔者通过Web采集器从项目信息页面抽取了项目特征字段,并将其转换为结构化数据的形式。通过对采集的项目数据统计可知,截至2017年4月,DHCommons共收录783个数字人文项目的信息,其中收录的最早项目为格拉斯哥大学和伦敦国王学院于1965年开始编制的英语历史词库(The Historical Thesaurus of English)。表1列出了经分组统计得到的参与项目数最多的前5名研究机构,从这些机构均为英国知名大学可推断DHCommons所收录项目应以英国机构所主导或参与的项目为主。

为进一步分析DHCommons中项目的参与国家,笔者利用搜索引擎逐一确定项目的研究机构所属国,共得到41个参与国家。通过对参与国进行分组统计可得到数据库中参与项目国家排名,其中参与项目最多的前5个国家见表2。由于大量数字人文项目由多个机构合作开展(DHCommons数据库中项目平均参与机构数为2.2个),故部分项目存在多个参与国,本研究将其分别计入各参与国项目总数中。通过统计结果可知,DHCommons所收录项目以欧美国家开展的数字人文项目为主,但少数非欧美国家机构也参与部分项目的研究,如哈佛大学、北京大学和台湾“中央研究院”共同建设的“中国历代人物传记资料库”(CBDB)、剑桥大学和北京大学共同开展的“驯化马起源”研究等项目均被DHCommons收录。在参与研究的欧美国家中,英国机构参与项目数远多于其他国家,这一方面应与英国在数字人文研究领域的学术地位有关,另一方面也反映了DHCommons在项目搜集上偏重于英国机构所开展的研究,因此本研究在项目研究热点分析过程中以英国机构所参与的数字人文项目作为分析素材。

3

英国数字人文项目特征分析

3.1

学科领域分析

DHCommons所收录项目包含“研究领域”(Fields)字段,通过分析该字段数据可为了解数字人文项目所属的学科领域提供帮助。本研究从DHCommons数据库中筛选出参与机构国籍包含英国的项目共590个,其中542个项目已标注有项目的研究领域。DHCommons在项目学科领域分类上借鉴了arts-humanities.net项目的分类方式,将数字人文项目按研究领域分为19个类别。笔者通过查阅项目描述信息,对未标注研究领域的项目的类别字段进行了补全,经统计得到不同研究领域被标注次数排名(表3),其中跨学科研究项目按照所属学科被归入多个学科类别。从研究领域统计结果可以看出,历史研究(含考古)、语言文学研究、图书馆/信息和博物馆研究是英国数字人文项目最重要的研究领域,而包含音乐、舞蹈、戏剧等在内的艺术类学科作为一个整体亦在数字人文研究中占有一席之地。

*非会员只能阅读30%的内容,您可以单篇购买,也可以订购全年电子版,或成为壹学者高级会员,畅用壹学者站内优质学术资源和服务。

近期0位学者阅读过本论文

回应区(0条)

确定

回应