近日,国家档案局办公室印发《关于推进人工智能在档案行业应用的意见》(以下简称《意见》)。《意见》围绕数据基础、应用场景、算力设施、算法监控、安全管理、保密风险防范等方面提出明确要求,为档案行业引入人工智能技术提供了政策指引。现就技术层面要点解读如下。
一、高质量档案数据集建设
《意见》要求加强档案数字资源建设,推进电子档案收集与传统载体数字化,开展文字、语音、图像识别。数据标准化方面,需规范著录、探索数据标注,通过补正缺失、修正错误等方式实现数据清洗。最终构建具备完整性、准确性、安全性、可追溯性的多模态高质量数据集。这是人工智能应用的基础前提。
二、典型应用场景优先推进
《意见》列出优先发展场景:智能化档案接收检查、档案著录、档案编研、档案检索、档案盘库、开放审核、档案数据脱敏、数据清洗、专题库构建、音像档案修复、档案知识服务等。要求促进AI技术与档案业务深度融合,同时探索新场景。档案部门应结合实际需求,选择成熟度高、可控性强的场景稳步推进。
三、算力设施部署与数据安全边界
《意见》鼓励有条件的档案部门建设区域智能算力平台,提供算力支持、模型训练、语料处理等服务。审慎使用外部算力服务时,优先选择自建平台。重要约束:不得将档案数字资源总库部署在非自建算力平台上。算力平台上线前需完成安全风险评估,明确业务范围与数据划分,确保档案数据不脱离可控环境。
四、算法安全与伦理风险管控
《意见》要求关注算法可能存在的后门攻击、设计缺陷等风险,及时做好安全排查。算法需完成备案审查,应用上线前及使用过程中持续评估安全风险,防范算法漏洞、数据泄露、数据污染、后门嵌入。同时加强伦理风险研判,防止虚假信息和伪造内容生成。
五、保密管理与权限控制
压实人工智能应用安全管理责任,贯穿研发、训练、应用全过程。建立数据权限管理策略,防止非授权访问和越权操作。不得使用档案数据在非自建算力平台上进行大模型训练。部署应用时需采取技术措施筛查输入输出数据,识别拦截涉密敏感信息。档案数据汇聚、关联后涉及国家秘密的,须遵守保密法规要求。
六、高效节约与合规审核
《意见》强调避免重复建设,注重投入产出匹配。尽量使用轻量化解决方案,严控建设和运维支出。档案业务部门须对人工智能应用结果进行审核确认,不得以AI替代职责履行。
万林科技长期服务档案行业,在档案数据治理、智能著录、开放审核、知识服务等领域提供符合政策要求的技术方案与实施服务,助力客户稳妥推进人工智能应用落地。