admin 管理员组

文章数量: 1086019


2024年5月1日发(作者:linux日志放在哪个文件夹)

·理论研究·

大数据历史与新文科建设

马 敏 薛 勤

*

摘 要:

随着大数据时代的来临,大数据历史成为历史新文科建设的突破点。

数据库建设的丰硕成果与大数据历史专业的建设经验为历史新文科建设提供了

镜鉴。历史工作者要坚定不移地坚持以马克思主义为指导,不失时机地把本领

域的学术研究同中国哲学社会科学理论建设紧密结合起来,充分利用大数据历

史与新文科建设的契机,构建具有中国特色、中国风格、中国气派的哲学社会

科学,为新时代中国特色社会主义事业做出贡献。

关键词:

大数据历史;新文科建设;中国特色哲学社会科学

作者马敏,华中师范大学中国近代史研究所所长,资深教授(武汉

430079);薛勤,华中师范大学中国近代史研究所博士生(武汉 430079)。

当今世界面临百年未有之大变局,科技革命和产业革命加速了社会大变革。习近

平总书记2016年在哲学社会科学工作座谈会上发表的重要讲话指出:“哲学社会科学

是人们认识世界、改造世界的重要工具,是推动历史发展和社会进步的重要力量,其

发展水平反映了一个民族的思维能力、精神品格、文明素质,体现了一个国家的综合

国力和国际竞争力。”

1

2018年8月,中共中央要求高等教育要努力发展新工科、新医科、新农科、新文

科,正式提出“新文科”概念;2019年4月29日,教育部根据习近平总书记重要讲

话精神启动“六卓越一拔尖”计划2.0,全面推进新工科、新医科、新农科、新文科建设;

2020年11月3日,《新文科建设宣言》发布,标志着新文科建设进入全面启动的新阶段。

《新文科建设宣言》明确了坚持走中国特色的文科教育发展之路,构建世界水平、中国

特色的文科人才培养体系。这一建设目标将引领未来历史学科的改革方向,也为史学

*本文为国家社会科学基金重点项目“近代中国寺庙概况量化研究”(编号:18AZS020)的阶段性研

究成果。

1

 习近平:《在哲学社会科学工作座谈会上的讲话》,《人民日报》2016年5月19日,第2版。

·28·

大数据历史与新文科建设

工作者在史学研究、学科建设、人才培养等工作中树立了新目标。近年来,随着大数

据时代的来临,史学领域正在发生重大变革,若干新问题、新方法、新领域应运而生,

这对历史新文科建设既是挑战,也是机遇。

一、历史数据库及其相关研究

随着信息技术产业的不断发展,量化统计方法在人文社会科学研究中不断被广泛

而深入地运用。人文社科研究与大数据的结合在国外起步较早,尤其在数据库建设方

面更是成效显著。

1

进入21世纪,随着国内互联网、云存储、云计算等信息技术的高

速发展,大数据在改变社会生活的同时,对历史学也产生了剧烈冲击,20世纪80年

代以来,计量史学成果大量涌现,国际合作也逐步加强。

大数据对史学研究的影响,在历史资料的发掘与利用方面表现的尤为突出。史料是

史学研究的重要基础,关于史料搜集,傅斯年先生有句名言:“上穷碧落下黄泉,动手

动脚找东西。”历史研究向来注重扎实的史料基础,史料积累对史学研究者来说至关重要。

当今,历史文献数据库实现了纸质史料的数字化及可检索化,大大提高了研究者的工作

效率。更重要的是,史学研究突破了传统研究模式下个体研究者的精力限制,实现了史

学家期望的“上穷碧落下黄泉”式的史料收集规模,一定程度上改变了目前史学研究中

存在的碎片化问题,为实现长时段、整体性、微观与宏观相结合的史学分析创造了有利

条件。基础性历史数据库有如“二十五史全文检索系统”“国家清史工程数字资源总库”、

北京爱如生公司开发的“《申报》数据库”“中国基本古籍数据库”、青苹果数据中心开

发的各类近现代报刊数据库、中国社会科学院近代史研究所构建的“抗战文献数据平台”

等历史文献类数据库;此外,还有大量研究性数据库的建成,具有代表性的有美国著名

中国思想史研究学者、哈佛大学教授包弼德(Peter·K·Bol)主导的哈佛大学费正清中

国研究中心与中国台湾“中研院史语所”及北京大学中国古代史研究中心合作开发的“中

国历代人物传记资料库”(CBDB)、香港科技大学人文社会科学学院李中清—康文林研

究团队正在建设中的“中国双城多代人口数据库”(CMGPD)、“中国历史官员量化数据

——

清代”(CGED-Q)、“中国大学生量化数据库”(CUSD)等;台湾政治大学金观

涛教授与刘青峰教授合作建设的“中国近现代思想史专业数据库(1830 —1930)”、浙

江大学陈红民教授等主持的“蒋介石研究资料数据库”、清华大学倪玉平教授等主持的“清

1

 具有代表性的是五大人文社科数据库,包括美国的国际微观共享整合数据库(Integrated Public Use

Microdata Series,简称IPUMS)、加拿大的巴尔扎克人口数据库(BALSAC Population Database,简称

BALSAC)、荷兰历史人口样本数据库(Historical Sample of the Netherlands,简称HSN)、瑞典的斯堪

尼亚经济人口数据库(Scanian Economic Demographic Database,简称SEDD)、美国的犹他人口数据库

(Utah Population Database,简称UPDB)等。

·29·

新文科教育研究 2021年第1 期

代商税数据库”、中山大学吴滔教授主持的“明代价格数据库”等。

数据库建设的蓬勃发展除了依靠技术层面的成熟,更离不开国家的大力支持。通

过统计国家社科基金立项项目,我们可以看到,自1991年以来共有312个与数据库建

设相关的项目立项,2010年以后数据库相关项目获得国家社科基金资助比例最高,占

总数的91.09%;国家对数据库建设的投入在2010年后成倍增加,在所有数据库相关

项目中52.25%为重大项目和重点项目,28.53%为一般项目;以学科分类来看,语言

学数据库项目立项最多,占比37.64%,历史学数据库相关项目占比7.86%,包括中国

历史学科12个,考古学2个。

1

(见图1)

民族问题研究

5.94%

中国历史6.44%

体育学

4.46%

图书馆、情报与文献学

22.28%

重点项目

9.94%

冷门绝学

0.64%

青年项目

8.33%

西部项目

10.26%

中国文学8%

其他14.34%

语言学38.12%

重大项目

42.31%

一般项目

28.53%

按学科分类

按项目类别分类

图1 国家社科基金关于数据库的项目统计(1991—2020)

史料发掘与利用的便捷化充分体现了新科技革命对史学研究的助力,在此基础上

也推动了史学研究在视野和方法上变革性的转变。大量数据库的建设与公开利用,在

某种程度上打破了个人或特定群体对史料的垄断,形成了更为良性的学术生态;传统

历史学信息获取与史料组织方式的改变也促进研究者从更普遍、更基层的角度发现隐

藏的史实与规律。

香港科技大学李中清—康文林研究团队是国内大数据历史研究的实践者之一。该

团队构建的“中国大学生数据库”(CUSD)项目,收集了来自中国35所高校的40万

份大学生档案记录以及大量中国留学生档案及出版资料,分为三个子数据库:“民国

时期大学生数据库”(CUSD-ROC)、“中华人民共和国学生数据库”(CUSD-PRC)、“中

国留学生量化数据库”(CUSD-OS)。该研究团队通过对“中华人民共和国学生数据库”

(CUSD-PRC)中1949—2002年间北京大学和苏州大学的大学生学籍卡片的宏观量

化分析,发现基础教育的推广、统一高考招生制度的建立以及重点中学的设置等制度

1

 数据来源于《国家社科基金项目数据库》,/skygb/sk//Index/seach,访问

时间:2021年1月25日。截至当前日期,数据库暂未收录2020年国家社科基金立项数据,2020年

数据由笔者统计。

·30·

大数据历史与新文科建设

安排共同推动了中华人民共和国的社会流动,以致中国高等教育领域出现了一场无声

的革命。

1

该研究团队的另一项目“中国历史官员量化数据库”,录入了历史上超过

400万条官员数据,内容包含官员的籍贯、出身、职掌、字号等基本情况。目前该数

据库产出的多项成果,很大程度上突破了传统政治史研究的范畴,精准且深入地考察

了清代官员的社会来源、流动、仕途迁转乃至官制变化。此外,中国人民大学清史所

夏明方教授在中国灾害史料的文献管理、数据化建设及灾害史研究的范式转换中,借

助大数据思维及计算机网络技术构建中国灾害史数据库,实现了史料考订与数据信息

化集成的有机结合。该数据库建成后,不仅可以链接中国各个朝代的灾害信息,还可

以和全球其他区域进行对比,提高历史灾害数据库的完备性、可靠性,进一步推动中

国灾害史、环境史乃至政治、经济、社会、文化等多方面研究,实现自然科学和社会

科学多学科交叉的研究。

2

此类数据库重视对长时段、大规模记录中的人口和社会行为等内容进行统计描述

及彼此间关联性的分析,突破了政治史、经济史、社会史等传统领域的范畴,拓宽了

史学研究的视野。研究内容大多通过大量数据将传统史学研究和定量研究结合,既揭

示了历史过程与规律,又对认识人类社会发展规律具有现实借鉴意义。在全球化的当下,

有利于中国史学研究“走出去”与世界对话,有助于中国在世界舞台上争夺国际话语权。

近几年,在大数据时代背景下,以往不受关注的史料开始引起跨学科研究者的注

意,多学科多领域的参与也为史学研究注入了新鲜血液,不同学科理论及研究方法在

传统史学基础之上迸发出新火花,史学研究呈现出百家争鸣、百花齐放的繁荣景象。

著名经济学家陈志武教授是较早关注历史大数据的研究者之一,目前已建立了一

个在国内颇具影响力的量化历史研究团队。陈志武教授认为不管是自然科学还是社会

科学领域,科学研究方法的基本流程是一样的。其中,第一步是提出问题和假说;第

二步是根据提出的研究问题和假说去找数据,或者通过设计实验产生数据;第三步是

做统计分析、检验假说的真伪,包括选择合适的统计分析方法识别因果关系、做因果

推断;第四步是根据分析检验的结果做出解释;第五步是写报告或文章,把科学过程

研究出的结果报告出来。

3

他们运用上述研究方法产出诸多突破性成果,例如通过统计

清代1732—1895年间刑科题本中近五千多个命案的记录,对民间借贷双方的关系进

行了定量分析,发现在借贷纠纷引发的命案中,一旦借贷利率高于零,被打死方为贷

方的概率为60%,而且利率越高,被打死的是贷方的可能性也随之增加,这说明一旦

1

 参见梁晨等:《无声的革命:北京大学与苏州大学学生社会来源研究(1952 —2002)》,《中国社会科

学》2012年第1期。

2

 参见夏明方:《大数据与生态史:中国灾害史料整理与数据库建设》,《清史研究》2015年第2期。

3

 参见陈志武:《量化历史研究的过去与未来》,《清史研究》2016年第4期。

·31·

新文科教育研究 2021年第1 期

发生债务违约,放贷方所承担的包括生命风险在内的违约成本是不对称的、且显得更高,

推翻了传统“高利贷剥削”论和放贷者“超经济强制”论的推断。

此外,“历史地理信息系统”(HGIS)近年来在史学研究中的兴起也是大数据历史

方兴未艾的表征之一。大批地理学者通过对传统史料的信息化处理,拓宽了历史学的

研究视野和研究方向。我国复旦大学历史地理研究中心与美国哈佛大学、加州大学伯

克利分校等机构合作研发了“中国历史地理信息系统”(CHGIS)。以著名历史地理学

家谭其骧所主编的《中国历史地图集》为基础数据源,运用GIS技术,使时空量化分

析成为可能。若将该数据库与“中国历代人物传记数据库”(CBDB)结合使用,亦可

帮助研究者分析中国历史人物社会网络、时空分布等内容。华南师范大学赵耀龙通过

收集藏传佛教寺院的相关数据,构建了藏传佛教寺院历史地理信息数据库,采用定性

和定量相结合的研究方法,探究了寺院时空分布及演化机制,实现了史料的可视化分

析及表达。同样是利用“中国历史官员量化数据库

——

清代”(CGED-Q),南京师范

大学胡迪教授通过分析官员的任职轨迹和任职时空轨迹相似度计算模型,进而分析清

代官僚结构、政治运行、社会变动等问题。

值得一提的是,部分历史研究者误以为运用历史大数据的定量分析方法是史学“域

外之物”,甚至形成了将“定量”与“定性”、“量化历史”与“传统史学”对立的观点。

这其实是一种错误的认识。诚然,大数据历史引起学术界广泛关注有赖于计算机技术

的飞速发展,但传统史学家对量化数据收集、整理的历史源远流长,中国史学对量化

研究方法的史学实践也由来已久。

无论是《史记》中的《货殖列传》,还是《汉书》及历代史书中的《食货志》《地理志》

等古籍中,都留下了有关人口、田亩、赋役、物价、贸易乃至气候、地理等大量的统

计数据。著名史学家梁方仲先生利用这些旧史籍中的数字进行历代户口、田地、田赋

的统计,其著作《中国历代户口、田地、田赋统计》在推动中国社会经济史收集和利

用数字资料,进行量化统计分析方面有着开创性的贡献。章开沅先生1983年在《关于

改进研究中国资产阶级方法的若干意见》一文中,就提倡要重视中国近现代史研究中

的人口等统计资料的重要价值。

1

陈春声也强调了统计方法在史学研究中的独特作用,

认为统计方法可以为处理大量数字型的历史资料提供便利的方法,使一些在其他情况

下难以使用的资料有可能为人们所用。

2

笔者在1997年就开始关注中国近代社会发展

指标体系,提倡要从统计数据出发进行长时段研究,指出计量方法应用于历史统计资料,

可以使社会史、政治史、经济史等多研究领域从中受益,并强调在一流学科建设中大

1

 参见章开沅:《关于改进研究中国资产阶级方法的若干意见》,《历史研究》1983年第5期。

2

 参见陈春声:《统计分析方法在史学研究中的运用》,《学术研究》1985年第3期。

·32·

大数据历史与新文科建设

1

数据历史是重要的趋势与方向;李伯重也认为科学化的历史学是用科学的方法研究历

史,大数据研究方法引领历史研究走向科学化,

2

并将量化研究和比较研究两种方法结

合起来,运用于其江南经济史的研究中,得出了许多独创性的研究结论。

二、大数据历史专业与历史新文科建设

随着大数据与历史学的融合与交叉,史学研究有了突破和进展。然而,作为学术

积累和传承的载体以及学术进一步发展创新的平台,历史学科建设融入新技术和新方

法也成为必然趋势。《新文科建设宣言》中强调,新文科建设有三大基本抓手,包括“专

业优化”“课程提质”“模式创新”。近年来多所高校在历史学科建设方面做出的努力和

尝试,也为新文科建设提供了镜鉴。

在专业建设方面,部分高校已率先进行了结构改造。2015年,华中师范大学率先

设立大数据历史专业。该校参与大数据历史研究的方法革命,尝试突破传统历史学的

思维模式,整合中国史、世界史、社会学、教育学、经济学、政治学、信息技术等传

统优势学科,实现了定量研究与定性研究、多学科交叉的深度融合,尝试为历史学科

专业建设探索新路子。

在课程设置方面,华中师范大学大数据历史专业开设了许多别有特色的专业课

程,在夯实历史专业传统优势课程的基础上,开设了数门跨学科跨专业新兴交叉课程、

实践教学课程。设置了“A New History of a New China”(全英文)、“Big Data and New

Methods in Chinese Social History: Collection, Transcription, Analysis”(全英文)、“数据

分析基础与应用”等课程,引导学生跨学科跨领域知识的融会贯通。中国人民大学清

史研究所也在硕士生课程中开设了数字人文、计量统计相关课程,包括数字人文与历

史研究在内的课程对开阔学生的研究视野大有裨益。南京大学数字人文中心也开设有

数字人文相关课程。

在人才培养方面,近年来高校在突破传统育人模式和科研模式中做了诸多探索。

自2011年武汉大学成立国内高校第一个数字人文中心后,包括上海大学、北京大学、

中国人民大学、南京大学等高校相继开设“数字人文”或“量化历史”等相关研究平台,

成为了历史新文科建设的试验田。在学术论坛方面,耶鲁大学终身金融学教授、北京

大学经济学院特聘教授陈志武,伦敦政治经济学院马德斌教授(Debin Ma)与清华大

1

 参见马敏、陆汉文:《建构民国时期(1912—1949)社会发展指标体系的几点思考》,《华中师范大学

学报(人文社科版)》2001年第1期;马敏、陆汉文:《民国时期政府统计工作与统计资料述论》,《华

中师范大学学报(人文社科版)》2005年第6期;马敏:《大数据与一流历史学科建设》,付海晏主编:

《大数据与中国历史研究》第2辑,北京:社会科学文献出版社,2020年,第3-9页。

2

 参见李伯重:《大数据与历史学科学化》,《北京日报》2017年7月10日,第15版。

·33·

新文科教育研究 2021年第1 期

学龙登高教授的研究团队自2013年起举办的量化历史讲习班,截至目前已举办七届,

吸引了大批对量化方法在历史研究中应用有浓厚兴趣的青年学者,取得了很大的成功;

台湾大学及中国台湾“中研院”自2009年起每年举办数位人文与数位典藏的国际研

讨会,颇具规模。一部分高校采用形式灵活的各类暑期班、系列讲座等模式推动跨学

科拔尖人才的培养。华中师范大学“大数据与中国历史”系列讲座由该校高等研究院、

历史文化学院共同举办,邀请在量化历史研究、数字人文研究方面素有专长的资深教授、

新锐青年学者做专题讲座。中国人民大学清史研究所举办了各类硕博士生的数字人文

暑期班和工作坊,推广大数据历史最前沿的研究成果。

我们认为,要进一步推动大数据历史与新文科建设的融合,须从如下方面入手:

师资队伍建设。要推动历史新文科建设,开展跨学科跨领域的大数据研究,相应

的师资配备十分重要。他们不仅要有丰富扎实的历史学基础知识,还要有跨学科跨专

业的知识储备,同时要了解马克思主义理论,把马克思主义基本理论与大数据历史的

研究优势相结合。由于我国长期学科专业划分过细,高校具有跨学科思维能力的师资

力量相对缺乏。近年来,高校提出各种解决措施,着力国际交流与合作,引进一批通

专结合、中西融合的跨学科高水平人才,同时鼓励本土教师和学生“走出去”,积极参

与海外高校的交换学习和学术交流。

华中师范大学大数据历史基地班以问题研究为导向进行师资团队建设。2015年9

月,在人文社会科学高等研究院下成立人文研究生班,以“大数据历史”为重要研究方向,

与香港科技大学人文社会科学学院、美国罗格斯大学等校联合培养研究生,聘请海外

优秀人才以及学校计算机、信息管理专业教授担任研究生导师。

人才培养模式探索。面对世界百年未有之大变局,要在大国博弈竞争中赢得优势

与主动,实现中华民族复兴大业,关键在人。新文科建设强调要实施以育人育才为中

心的整体发展战略,构筑学生、学术、学科一体的综合发展体系。以人为本、培养应

用型文科人才,是新文科建设人才培养重要目标之一,也是形成历史学科中国学派、

中国话语的核心力量。历史新文科人才培养首先要坚持价值引领,坚持用马克思主义

唯物史观指导历史研究,旗帜鲜明地反对和抵制历史虚无主义等错误思潮。青年学生

尚处于发展阶段,只有引导其树立正确的历史观、民族观、价值观,提高思想觉悟、

道德水准、文明素养,才能培养出担当民族复兴大任的新时代历史研究人才。其次,

历史新文科人才培养要紧跟大数据历史发展的新趋势,响应教育部新文科建设的号召,

优化传统历史学科结构,开设跨学科跨专业新兴交叉课程、实践教学课程。此外,还

须注重应用型复合人才的培养。

目前来看,高校在历史新文科人才培养中取得了一定的成绩,其经验与教训为未

来历史新文科建设提供了参考。以华中师范大学大数据历史基地班为例,从2015年至

今,该专业培养三届硕士研究生。下表(见表1)对往届大数据历史硕士毕业生的就

·34·

大数据历史与新文科建设

业去向进行了统计。

表1 大数据历史专业前三届毕业生就业去向统计表

单位:人数

年份

2015

2016

2017

中学(高中)

11

8

6

高校

2

1

1

升学

4

1

3

政府机关

1

1

0

企业

1

0

1

其他

1

3

2

总计

20

14

13

根据统计,超过50%硕士生毕业后在中学任职,接近20%的毕业生继续深造读博。

从生源构成来看,每届学生的本科专业仍以历史为主,跨专业考生每年占比不超过2%;

从学位论文研究方向来看,绝大部分学生的论文选题仍倾向于传统史学领域。

通过对华中师范大学大数据历史专业人才培养情况的总结,可见该专业为武汉大

学、复旦大学、华中师范大学等高校输送了具有多学科背景的复合型人才;但由于大

数据历史相关师资队伍的缺乏,使得在拓展学生研究视野、提高学生研究能力等方面

还存在一定的局限。这也是未来历史学科建设乃至整个新文科建设中必须重点解决的

问题之一。此外,由于专业设置仍处于起步阶段,客观上知名度不高及受学生就业考

量的影响,该专业学生生源相对本校近代史方向竞争力较弱,学科背景缺乏厚度和深度,

这也是复合型人才培养中的一大问题。

学术刊物建设。期刊建设对新文科建设同样具有重要意义。大数据开发的方兴未

艾,使国内数字人文相关的期刊建设也不断发展。目前已有的专业数字人文类期刊,

包括由清华大学市场与社会研究中心于2014年创刊的《量化历史研究》,该刊依托于

每年由陈志武、马德斌、龙登高研究团队合作举办的量化历史讲习班,吸纳每届讲习

班优秀学术资源办刊,诸位作者主要通过分析收集历史资料和量化数据的途径,将定

性资料进行量化,再根据量化后的数据做回归研究,为史学界提供了方法和研究范式

上的新视角。2017年,华中师范大学历史文化学院和人文科学高等研究院创办了《大

数据与中国历史研究》。同年,由舒健主编的《大数据时代下的历史研究》出版,这

也是国内关于大数据化与当代历史研究的重要成果。2019年清华大学、中华书局联

合主办了《数字人文》季刊,旨在为数字人文研究提供理论探讨和专题研究。

与国内方兴未艾的数字人文研究的热潮相比,相关期刊的建设起步较晚,发展也

相对较滞后。华中师范大学创刊的《大数据与中国历史研究》的发展具有一定借鉴意

义。该刊主导策划了“大数据与中国历史研究”的系列讲座,每年定期邀请海内外素

有专长的研究者举办专题演讲以及座谈,而这也构成了该刊的重要与特色内容。除了

演讲实录外,还设置了专题研究栏目,向人文以及社会科学各领域专家学者约稿,同

·35·

新文科教育研究 2021年第1 期

时还不定期开设学位论文专栏、新书评介等栏目。该刊内容侧重以历史数据为基础进

行量化分析,范围涉及政治史、经济史、社会史、人物关系史、宗教史等研究领域。

专题论文主要来源于国内、国际较有影响的学者,也吸收优秀硕、博文章投稿,发表

作者单位包含国内外各大知名高校及研究机构,包括英国伦敦政治经济学院、美国加

州大学伯克利分校、法国高等实践研究院(EPHE)、清华大学、北京大学、南京大学、

中国社会科学院等。他们都在大数据历史研究领域取得了不凡的成绩,在传统史学和

大数据方法的理论与实践结合方面拥有丰富的经验。学位论文专栏吸引了上海交通大

学、华中师范大学、复旦大学优秀硕、博士生来稿,鼓励在研学生大胆进行这方面的

研究探索,培育大数据历史专业未来人才队伍的后备资源。

大数据历史或数字人文类刊物一经出版,备受学界关注,取得了一定的成果。各

期刊的建设方向各有不同,但也存在一些共性问题,尤为突出的是稿源问题。目前该

类期刊大都仍处在起步阶段,总体影响力较小。在国内较片面的科研评价体系下,大

部分作者出于现实考量将其作为投稿首选的意愿较低,因此,来稿总体上面临着数量

少、质量低等现实困难。

三、结 语

在大数据时代,多学科交叉与融合是未来史学研究乃至历史学科建设的新机遇、

新趋向,而新文科建设背景下的历史学科建设也对史学工作者提出了更高的要求。习

近平总书记在哲学社会科学工作座谈会上指出:“坚持以马克思主义为指导,是当代

中国哲学社会科学区别于其他哲学社会科学的根本标志,必须旗帜鲜明加以坚持。”

1

这就要求史学工作者要勇担时代重任,在具体研究工作中不仅要自觉运用马克思主义

立场、观点、方法去分析问题、研究问题和解决问题,也要结合实践不断丰富和发展

马克思主义,为中国特色社会主义理论建设添砖加瓦。多学科融合也要求史学工作者

必须加强自我锻造和锤炼,在夯实史学功底的同时不断更新知识储备,提高跨界融合

能力,在本学科研究的内容与方法上寻求创新与突破,为构建中国特色哲学社会科学

提供重要的内容支撑、理论建设和道路指引。

“历史研究是一切社会科学的基础”,

2

学科建设是构建中国特色哲学社会科学的

重要环节,历史学科是中国特色哲学社会科学中极为重要的基础学科。因此,新文科

建设能否构建一个全方位、全领域、全要素的哲学社会科学体系,历史学科的建设至

关重要。新文科建设重点在“新”,强调学科交叉与融合,要求打破学科之间的壁垒。

大数据历史专业建设恰好契合新文科建设的要求和方向,是历史学科改革的试验田。

1

 习近平:《在哲学社会科学工作座谈会上的讲话》,《人民日报》2016年5月19日,第2版。

2

 《习近平致中国社会科学院中国历史研究院成立的贺信》,《人民日报》2015年8月24日,第1版。

·36·

大数据历史与新文科建设

大数据与历史学科的有机结合,将有利于打破传统学科分类的藩篱,从全球化和学科

综合的视角理解和研究历史,对于历史学科体系的创新与发展,打造具有中国特色的

哲学社会科学平台有着突破性意义。

研究方法与手段的更新是推进包括历史学在内的哲学社会科学发展的重要途径。

大数据历史的发展使某些传统史学不可能完成的任务变成了可能,对深入挖掘中华优

秀传统文化资源有着巨大的帮助。近年来,国家社科基金项目专门设立了“冷门绝学”

专项,旨在推动有重要文化价值和传承意义的学术研究。目前,已有考古和文献学领

域的学者与计算机专家合作,开展甲骨文修复和考证等研究工作。大数据智能技术在

古文字考释中也可发挥重要作用,如进行汉字字形的精准识别,建设语料库以及古代

历史与制度的相关数据库等。

1

这类研究不仅有助于提升我们对中华传统文化的自信,

还有利于培植未来创新发展的文化土壤。

历史学是一门科学,历史科学研究需要提出具有重大意义的真问题,既能够真切

而深刻地反映历史发展的本质与规律,又能引领时代变革、社会发展、文明进步和理

论创新。

2

如前文所述,当前虽然有大批基础性历史文献数据库如雨后春笋般涌现,

但是以问题为导向的研究性数据库总体上还是数量偏少。历史学者要善于利用数据库

的特点和优势,提出具有时代意义的宏观论题。比如中国的现代化研究中,我们提出

应构建一个“中国现代化历史进程大数据库”,把中国现代化有关的经济、社会、城

市生活等内容数据化,将实证与理论结合,以真实数据客观地反映中国现代化的发展

水平与艰难历程,用事实和数据证明中国共产党带领中国人民从新民主主义革命、社

会主义革命到社会主义建设的探索及改革开放所取得的伟大成就,为探索具有中国特

色的社会主义现代化道路提供坚实的依据。

在全球新冠疫情肆虐的今天,中国抗疫成绩得到了国际社会的广泛认可,中国特

色社会主义制度的优越性、中国国家治理体系和治理能力也受到了世界其他国家前所

未有的关注。史学工作者要不失时机地把本领域的学术研究同中国特色哲学社会科学

理论建设紧密结合起来,利用大数据历史与新文科建设的新契机,为新时代中国特色

社会主义事业的发展做出更大的贡献。

1

 参见吴振武:《古文字考释与人工智能》,《光明日报》2020年11月7日,第12版。

2

 参见《中国社会科学》杂志社编辑部,方军执笔:《理论是问题之树盛开的花朵

——

〈中国社会科学〉

2021年重点选题构想》,《中国社会科学》2021年第1期。

·37·


本文标签: 历史 研究 中国 数据 建设