今年以来,浙江省档案馆以档案数字化深度转型为抓手,利用大模型技术对馆藏良渚遗址考古档案进行知识化梳理,形成了良渚遗址考古档案专题知识库,全方位展示党和政府以及社会各界发掘、保护良渚文化遗址的历程全貌。这一创新举措标志着我国档案管理工作在人工智能技术应用方面迈出了重要一步。
良渚古城遗址自2019年列入世界遗产名录后,愈发成为文明对话与文化研究的焦点。以其对实证中华五千年的文明史特殊的圣地地位和所蕴涵丰富的考古档案价值而言,良渚遗址对我们了解新石器时代中原地区的社会政治、经济、文化等各个方面都具有极高的历史价值和极大的学术意义。然而,这些档案体量庞大、类型复杂、资源分散,仅凭人工整理难以充分释放其价值。浙江省档案馆通过引入大模型技术,成功解决了这一难题,为文化遗产保护提供了新的技术路径。
专题知识库基于档案多模态数字资源治理平台,利用大模型强大的语义分析理解能力,对800余份与良渚遗址考古有关的馆藏档案进行要素智能识别与知识关联重构。具体技术实现包括:
要素抽取与知识关联:系统自动抽取档案中的人物、机构、主题、事件、时间等要素及相互联系,建立"实体—关系—实体"的语义三元组关联关系,实现档案资源从"文本存储"到"数据可用"的转变。
多维标签体系:按照"时间+事件、规范+技术"的双轴整理逻辑,对档案进行分类标注,建立主题、类型和实体的多维标签体系,构建了知识分类库。
可视化展示形式:
以知识图谱形式直观呈现考古发掘、保护和开发的关联网络
以知识百科形式系统展现考古发掘的各类知识要点
以知识年表形式清晰再现考古发掘的历史过程
浙江省档案馆还部署了档案数字资源大模型底座,建成馆藏档案数据仓,采用检索增强生成(RAG)技术,支持自然语言交互,实现文本、图像等多模态智能检索,大幅提升档案检索查全率和查准率。
良渚遗址考古档案知识库的建成具有多重价值:
学术研究:为考古学家和历史研究者提供了系统化的知识资源,能够快速获取良渚文化相关考古发现、研究成果和历史脉络,提高研究效率。
文化传播:通过可视化展示和智能问答功能,向公众普及良渚文化知识,增强文化自信,促进中华优秀传统文化的传承与传播。
档案管理创新:为全国档案行业提供了大模型技术应用的典型案例,推动了档案工作从数字化管理向知识化服务的转型。
国际交流:作为世界文化遗产,良渚遗址的国际关注度不断提升,该知识库为国际学术界提供了研究中国早期文明的重要数字资源。
浙江省档案馆表示,将继续深化大模型技术在档案管理中的应用,计划将这一模式推广到其他重要历史档案的整理工作中。不断的对知识更新和完善使得我们的知识库始终能保持着对最新的考古发现和研究进展的把握,从而始终保持其较高的学术前沿性。
依托于这一的创新实践,不仅为我们对文化遗产的保护提供了更为先进的技术手段,也为人工智能的深入人文社科的应用开辟了广阔的新天地,充分体现了“科技+文化”的高水平的融合发展典范。