AI史学的应用及其前景
来源:中国社会科学网

4月16日下午,由中国社会科学院近代史研究所青年工作小组、中国社会科学院大学历史学院近代史系、中国历史研究院近代以来中国历史学知识体系研究中心共同主办的第179期青年读书会暨研究生论文写作经验分享系列讲座第三讲在京举行。中国社会科学院古代史研究所副所长朱浒应邀作题为“从数据库到知识库:AI史学的应用及其前景”的学术讲座。讲座由近代史研究所副所长高国荣主持。

讲座伊始,朱浒结合个人在灾害史、经济史领域的治学经验,谈及处理海量历史文献与数据所面临的信息甄选缓慢等难题。他表示,当前,电子书、数据库等数字化资源虽已广泛应用,但史学研究者仍需与时俱进。随着AI技术的发展,史学研究应超越对“数据库”检索的单纯依赖,转向搭建本地—个人的“知识库”,实现对既有文献资料的高效整合与重新利用。

朱浒立足历史数据库的基本属性,介绍了数字化基础平台的建设目标与功能架构。他表示,史学数据库具备数据平台、研究工具、成果交流与可视化结果四大核心功能,包含原始记录库、原始文献库、派生专题库、成果交流库以及用户界面、管理界面、专题界面等内容。其中,历史文献的数据源,涵盖史料类型、文献直接来源信息以及原始出处信息。然而,以往建设的历史数据库大多停留于“资料大搬家”阶段,信息分类提取的效率仍然有限。人工智能技术的出现,为突破这一瓶颈提供了新的可能。

朱浒重点分析了当前人工智能工具难以直接应用于史学研究的原因与对策。他认为,网页版Deepseek等通用大模型存在数据隐私风险、上传文件限制以及混乱结果输出等局限。区别于单纯依赖模型微调技术的网页对话,本地—个人知识库则以RAG(检索、增强、生成)技术为支撑,增强了信息验证功能。具体实践步骤包括准备外部知识库、运用Embedding模型将自然语言转化为高维向量、将用户提问向量化。他还说明本地部署Deepseek-R1等对话大模型的环境准备流程,以及如何通过AnythingLLM创建工作区。

聚焦AI在专业学术研究中的已有应用,朱浒提出,AI与学术文献库连接的核心目标,并不是让AI直接生成文献,而是实时调用权威学术数据库。他详细介绍了用AI解析专业学术文献以及识别古籍的操作步骤,并演示了当前与史学相关的数智平台使用方法。

朱浒还围绕AI时代下史学研究者的任务与出路,提出了前瞻性建议。他认为,未来,应转向原始文献库、原始记录库与专题数据库的协同建设,让以往搭建的历史数据库“复活”。应尽快让AI史学产出真正的研究性成果。目前,相关探索仍停留在概念层面,但从AI出发的专题学术综述已初具规模。同时,亦不可忽视知网与CALIS外文期刊网文献被AI利用的隐患与风险。

高国荣表示,从传统卡片式史料整理到当下数字化与智能化工具的应用,体现了史学研究方法的时代转型。进入人工智能时代,史学研究者既不能将AI视为“洪水猛兽”,亦不能对其盲目依赖,应在保持问题意识与学术规范的基础上,积极探索AI在史学研究中的辅助作用。

所内外50余位学界同仁参加活动,围绕AI技术的适用边界与学科差异性、信息隐私保护与数据滥用风险、学术伦理规范的制定、个人知识库与大型数据库的效能对比、技术迭代与研究者适应能力之间的张力等问题,展开深入讨论。

  • 主       管: 陕西新华出版传媒集团有限责任公司
  • 主       办: 陕西新华出版传媒集团有限责任公司
  • 智力支持: 中国社会科学院西部发展研究中心
  • 出       版: 陕西出版传媒集团报刊有限责任公司
  • 编       辑: 《西部学刊》编辑部
  • 编辑委员会主任: 石鸣
  • 编辑委员会副主任: 叶子
  • 执行主编: 朱希良(上半月)赵良(下半月)
  • 编辑一部主任: 朱希良(兼)
  • 编辑二部主任: 赵良(兼)
  • 综合服务部: 李功(主任)付小梅(副主任)严丽洁
  • 数字出版部: 邢恬恬 袁宝燕
  • 责任编辑: 杨军 雷智勇 冯小卫 王宝林 张震 杨超
    王延河
  • 编辑部电话/传真: (029)89520620
  • 网       站: www.xbxkzz.com
  • 投稿邮箱: xbxkbjb@126.com