简帛网

 找回密碼
 立即注册
樓主: 张宇鑫

[原创] 探索人工智能在簡牘整理與曆史研究中的應用

[複製鏈接]
 樓主| 發表於 2025-5-6 15:02 | 顯示全部樓層
本帖最後由 张宇鑫 於 2025-5-6 15:08 編輯

全球利用人工智能进行简牍文字补释的首次尝试
——读莫伯峰先生等撰《人工智能模拟辞例归纳的初步测试》

本文为笔者人工结合DeepSeek生成。

**题目**:《人工智能模拟辞例归纳的初步测试》  
**作者**:莫伯峰、邱炜琦、谢泽澄
刊于《汉语言文学研究》2021年第3期。

### **摘要**  
古文字考释中的辞例归纳法,其实是综合了经验和理性两个方面共同作用的一种词义推定方法。人工智能语言模型现在主要模拟了人类经验主义的方法,并在日常语言处理方面取得了比较好的效果。如果将此类模型运用于古文字领域来模拟辞例归纳,也定会有所助益。我们基于Bert模型,用《四库全书》作为特定语料对模型进行了训练。以《上博简》(1-9)中2103个字为测试对象,模拟专家的部分辞例归纳能力,预测被遮蔽起来的文字。在总数23157 的备选字符中,前300预测正确率达到59%,前100预测正确率达到46%,前50预测正确率达到38%,前10预测正确率达到25%,前5预测正确率达到20%。可见,人工智能在古文字领域也具有类似人脑凭借语言经验进行辞例归纳的能力。同时,结果也提示,必须结合理性主义方法,才能实现完整的辞例归纳能力,建立相关的知识库必不可少。

### **关键词**  
古文字、辞例归纳、人工智能  

### **分析**  
1. **测试工具**  
   - **模型**:谷歌BERT模型(Bidirectional Encoder Representations from Transformers),结合SQuAD1.1和SWAG等数据集。

2.测试对象:《上博简》(1-9)中的2103个字,故意制造缺字供人工智能补释。

3. **测试原理**  
   - 基于经验主义方法,通过大规模语料训练模型,模拟人类语感(概率统计);  
   - 对比理性主义(语言知识规则)与经验主义的效果差异,强调语言系统的符号性和概率性关系。  

4. **测试方法**   
   - 通过《四库全书》(23157字)和《上博简》(1-9)等数据集训练与验证;  
   - 故意制造《上博简》的缺字,然后供人工智能补释,对比模型预测结果与人类专家的答案,评估准确性和可解释性。  

5. **测试结果**  
   - **成功案例**:模型在部分辞例中预测较准确(如“今”字位列预测第五);
在总数 23157 的备选字符中,前300预测正确率达到59%,前100预测正确率达到46%,前50预测正确率达到38%,前10预测正确率达到25%,前5预测正确率达到20%。   

6. **测试的不足**
只是利用已有简牍文本作文字补释试验,而未能提出新的文字补释意见。  
- 生僻字、异体字预测失败率高(如“FAIL, not in top 300”);  
- 预测结果缺乏关联性(如高频字“之”干扰生僻词排序);  
- 依赖数据均衡性,古汉语字频极不均衡影响效果。  
- 缺乏结构化古汉语知识库,无法整合领域知识(如铸刻位置、历史背景);  
- 未解决复杂语言现象(假借字、古今字);  
- 机器语感与人类语感差异显著,预测结果缺乏理性干预和可解释性。  

7. **测试价值**  
   - 验证了AI在简牍文字补释中的辅助潜力(如缩小备选词范围);  
   - 提出“知识+数据”双驱动的必要性,为第三代AI发展提供实践依据;  
   - 推动古汉语知识库构建与跨学科合作(语言学、计算机科学)。  

8. **未来研究方向**  
   - 构建古汉语知识库,整合字词层级关系和语义规则;  
   - 结合理性主义(语言知识)与经验主义(统计模型),优化预测逻辑;  
   - 提升模型对复杂语言现象(异体字、假借字)的处理能力,楚简文字复杂,舍弃字图而改用通行字使人工智能更难准确分析古文字音、形、义,而秦汉简疑难字少,更适宜作试验;  
   - 增强预测结果的可解释性,模拟人类“混合语感”(经验与理性结合)。  
 樓主| 發表於 2025-5-8 15:14 | 顯示全部樓層
本帖最後由 张宇鑫 於 2025-5-8 15:29 編輯

重要论坛:青年论坛·圆桌派|AI能给宋史研究带来什么?

青年学者是学术界的生力军,他们的思考与探索为学术发展不断注入新的活力。“人大复印报刊资料 人文”公众号“青年论坛”栏目继推出“创作谈”之后,再推出“圆桌派”。“圆桌派”以圆桌会议或青年工作坊的形式围绕某个学术问题展开讨论,交汇多维视角,碰撞新锐观点,力求以速记笔触凝固思想碰撞的瞬间,用原生态记录展现学术争鸣的温度。

本期“青年论坛-圆桌派“奉献给读者的是圆桌会议“AI能给宋史带来什么”。与会学者围绕AI在史料点校翻译、文本润色、数据库构建、历史场景复原等维度的潜力展开交锋既探讨技术革新对古籍处理与跨学科研究的赋能,亦反思“幻觉”风险与学术伦理边界。

2025年3月28日,由湖北大学历史文化学院主办的“AI能给宋史带来什么?”圆桌论坛,在湖北大学逸夫人文楼D1013室举办。会议由湖北大学历史文化学院廖寅教授和黄光辉副教授主持。与会学者围绕相关问题进行了深入讨论。


湖北大学教授廖寅:当下,学术界讨论最多的话题莫过于“AI”,探讨这一新事物对我们日常生活和学术研究可能产生的影响。对学者来说,我们关注的焦点是如何更高效地运用AI技术支持学术工作。目前,AI的应用似乎还仅仅停留在回答一些简单的基础性问题。那么,AI是否能够在宏观层面上对文章的立意和整体构思提供帮助?其辅助程度究竟如何?在座的各位不妨分享自己的见解,通过充分交流和自由讨论,让AI技术能更好地服务于我们。


河北大学研究生李沈洋:我将结合自己的使用体验,就“历史学者运用语言模型进行多维度分析”这一主题谈几点看法。语言模型,作为一种人工智能技术,往往能够通过学习大量文本数据来理解和生成自然语言。这种学习过程在很大程度上是对前人经验的模仿。在历史学研究中,语言模型可以协助学者处理和分析古籍档案、文献等文本资料。作为时下最热门的语言模型之一,DeepSeek凭借其强大的文本生成与理解能力可以高效处理、分析文本资料,精准识别关键信息并生成有逻辑关联的新内容。相较于其他模型,DeepSeek在精确性、效率、定制化及交互性等多维度均展现出显著的优势。这里我们可以打个比方,传统上,当病人前往医院时,医生一般无法立即确定其病情,往往需要通过全面的诊断流程才能得出最终结论,而DeepSeek则类似于设置了一个预诊台,能够初步判断病人的病情状况,由此大大提高了接下来“诊断”环节的效率。


至于多维度分析,我主要讲以下四点:一是海外学术论著的翻译实践;二是相关文献的检索与系统性分析;三是语言创作与文本润色策略;四是史料的点校、翻译及深度解析。


对第一点而言,我选取日本学者藤本猛所著《北宋末の宣和殿:皇帝徽宗と學士蔡攸(北宋末的宣和殿:宋徽宗与学士蔡攸)》作为典型案例展开探讨。针对日文文献的数字化处理流程,具体操作路径为:首先将纸质文献转化为数字化文本,通过逐页截取图像数据形成完整电子文档,继而导入人工智能翻译系统进行处理。经对比分析可以发现,深度求索(DeepSeek)人工智能系统的译文输出在学术规范性与专业准确度方面,已呈现出与传统专业译者相当的翻译水准。需特别说明的是,深度求索系统当前采用意译策略,设置的验证旨在通过专业译者译文的样本导入,使系统实现翻译策略的优化升级。经实验验证,在系统完成专业翻译样本学习后,其译文质量显著提升,最终达到与专业译者相媲美的学术翻译水准。


此外,大语言模型本身就可以承担多语种学术著作的翻译功能。在具备基本阅读能力的前提下,此类技术可以在一定算法的帮助下,为提取的文本信息提供术语对齐、句式转化等基础性帮助,使海外著作的学术翻译取得事半功倍的效果。


四川大学副教授尹航:如何判断它的翻译可以与专业翻译媲美?如果你不自己读的话,难道需要依据DeepSeek本身判断DeepSeek吗?
河北大学研究生李沈洋:主要是依据自己使用DeepSeek的经验来判断。


对于第二点,以DeepSeek协助我搜集关于元丰改制后宋代中央文官迁转的研究成果为例。因为DeepSeek还未与知网、谷歌学术等数据库连接,因此检索结果并不完全符合预期。他主要依靠公共网站,为我整理出了一些基础信息。我们不应期望其进行主动创作,而应向其提供已有的研究成果和数据,以期获得我们所需的结果。因此,当我提出更具体的要求,希望他通过从2014年至2023年《中国史研究》中寻找关于元丰改制的文章,以及分析在此期间宋史研究的方向、热点、难点以及重点的演变时,DeepSeek可以从政治、制度、经济、社会、思想文化等多个维度进行综合概括。由此可见,当我们向其提供一个明确的研究成果范围时,它所总结的答案更为精确。


关于第三点“语言创作与润色”,我引用邓小南教授所著的《信息渠道的通塞:从宋代“言路”看制度文化》一书中的内容作为例证。我将选定的段落输入DeepSeek系统后,其产出通常呈现出一种线性结构,主要是套用既有的研究成果,但这种成果难以通过查重检测。从这一过程,我们可以观察到人工智能在语言创作方面所展现的若干特征:首先,其句式往往过于规整;其次,表达情感显得中立;第三,隐喻和修辞手法的运用较为贫乏;第四,信息整合与原创性方面存在不足;第五,理论的应用显得表面化;最后,问题意识较为浅薄。


关于第四点“史料点校、翻译与分析”,我选取《铁围山丛谈》作为案例。该书中华书局出版了点校本。在未接受任何特定指示的情况下,我将此书文本交由DeepSeek进行标点处理,点校结果虽然有一些小错误,但整体而言,文本的可读性并未受到太大影响。关于翻译与分析部分,DeepSeek提出了太宗强调“宁不妄杀人”的三个原因:首先是树立威信的需求;其次是平衡权力的策略;第三是司法示范的需要。DeepSeek还指出,这一案例生动地揭示了从五代时期的滥用刑罚向宋代“慎刑恤狱”的司法理念转变。尽管DeepSeek的翻译可能不够全面,但它确实能够补充我们在史料分析方面的不足。针对“慎刑恤狱”这一概念,我认为并无不妥,然而对于太宗的“刀鞘”与疑犯凶器相匹配的问题,DeepSeek提供的史源包括《涑水记闻》和《续资治通鉴长编》等文献,然而经过查证,这些文献并未记载相关事件。尽管如此,DeepSeek从宋代司法对物证重视的历史背景以及可能的合理性推测方面,为我们的研究提供了有益的思路和启发。


四川大学副教授尹航:我曾经担任CBDB项目的经理,并对人工智能领域有所涉猎。您刚才提出的观点颇具启发性,尽管某些内容乍看之下似乎有误,却能为我们提供思考的新方向。我们需特别关注一点:这些工具主要是为那些明知其可能出错的用户所设计。我想知道您的解答源自何处?DeepSeek又是如何产生的?这些都涉及学术伦理问题。它所依据的论点虽已普遍接受,但假若被在该领域学识尚浅的人使用,其创新性便需格外审慎对待。此外,关于学术成果的润色,目前尚无明确的标准。我们对人工智能的期望不应仅限于增加两个创作角度,而应更深入地解读核心观点,实现更深层次的人机交互。当前大多数人能够利用大型模型获得80分,但若情境改变,是否仍能从80分提升至90分?这正是我们目前面临的一个主要困惑。


湖北大学副教授黄光辉:现在请各位自由发表意见,进行讨论。我们比较关注的是,对于学术研究而言,AI润色究竟具有何种实质性的意义,而不仅仅是表面的修饰?


四川大学副教授尹航:现在对于AI的印象就如同之前我们对于数据库的印象,目前来说主要的用法在于:一是可以交互式提问;二是它在整理大量重复的资料时,一定是比较有效的。


西北大学教授贾连港:我在使用AI时发现,可能在前人研究得越成熟的课题中,它的润色和思路也就会越清晰;前人研究得越少他提供的东西可能就越不具体。


河南大学研究员王战扬:我曾广泛使用多种人工智能工具,愿意分享个人的使用经验。首先,我会前往档案馆搜集历史资料,并将这些资料与相关论文整合,构建起一个个人研究的知识库。随后,我利用人工智能对知识库中的所有论文和历史资料进行分析,以期形成论文的研究热点、研究视角和研究框架。然而,在这一过程中,我注意到一个问题:人工智能提供的分析可能会引导用户陷入一种伪逻辑之中,使得用户在撰写文章时难以辨别逻辑的正确性。它甚至会将用户提供的某些观点以不同方式重新表述,这容易让人误以为是学术上的创新。此外,我还尝试使用人工智能处理大量长达数万字的历史资料,但过程中它可能会编造细节以支持其观点,最终结果可能导致一种学术不端行为。


湖北大学副教授黄光辉:目前来看,我们大家都是将AI作为一种工具来用,我们都不是研究数字人文的,现在我们就有请专门研究数字人文的冯博文老师来谈一下体会。


湖北大学讲师冯博文:我汇报的主要内容是以Deepseek R1离线版为分析工具,以陶渊明的《桃花源记》为分析内容,通过初级、中级、指谬-归因、改进验证四级分层指令实验,来探讨当前大数据模型分析史料的原理、问题与对策。一般而言,在缺乏明确历史资料和研究方法指导的情况下,初级阶段的AI尝试从历史学角度提炼问题,其回答覆盖了流民隐逸、坞壁组织、南方开发、乌托邦想象等多个维度。这种多维度分析虽有其优势,但也存在随意捏造论据、错误引用史料的严重问题。以这一现象为例, 我们可以发现AI在应用于史料分析时所存在的“幻觉”问题:在分析史料的过程中,AI基于其训练数据进行推理,并在推理过程中填补所谓的“漏洞”,优先保证文本的流畅性而非真实性,从而产生虚构内容。进入中级阶段,用户向AI提供明确的历史资料和研究方法指导,得到的回答包括:首先,指出桃花源故事在陶渊明之前已有流传,并存在不同版本,反映了地方传说的多样性;其次,分析史书记载的变异,阐释了传说在传播过程中的层累现象及其背后真实的社会基础;再次,结合地理和武陵地区的历史,强调了原住民聚落的自洽性;最后,探讨了故事中可能存在的道教或隐士文化影响,指出了故事的多重象征意义。在第三阶段的指令实验中,用户连续指出前两个阶段AI生成的错误,AI能够核查自身回答的错误,并进行总结性修正声明,承诺未来将采取“引文三重核查制”。基于此,进入第四阶段,用户为了验证Deepseek是否有所改进,在同一窗口让其分析另一段同类型史料,并避免出现之前指出的错误。然而,史料捏造与误引率仍然高达95%,但现代社会科学话语或概念的使用大幅减少,比喻式表达基本消失。我认为,AI史料分析中高“幻觉”率的原因主要有四点:首先,模型在训练过程中接触的污染性数据比例,直接决定了输出初始幻觉率的高低;其次,模型错误地结合了来自不同来源的信息,生成了连贯的答案;再次,模型在训练时接触了大量跨学科学术文献,导致在历史分析中不自觉地使用社会科学框架;最后,为了防止表述生硬,模型会自动补全文学性修饰,以保证表达的流畅性,但却牺牲了精准性。因此,只有深入理解大模型数据的基本原理以及历史研究的基本流程和步骤,才能更好地将大数据应用于历史研究。若要利用AI分析史料、辅助研究,需要高度的人机协同,例如设计具体且逻辑严密的指令、使用多个AI进行交叉验证,历史学者需要充分理解AI“幻觉”的成因,并尝试从中获取灵感。


河南社会科学院研究实习员李潇阳:我赞同冯老师的看法,人工智能在当前历史研究领域面临的主要挑战是错误频出,史料来源的可靠性不足,因此它仅能作为研究的辅助手段。历史研究的核心应当是人类,而非人工智能。因此,历史学者应坚持传统研究方法,并在研究过程中融入人类的思考与感悟。同时,我们也必须长期面对由人工智能引发的学术伦理问题。


厦门大学教授梁建国:我认为在历史研究领域,人工智能技术更适宜于从事辅助性的学术综述工作。其优势在于能够迅速且高效地搜集网络上已发布的文章,并且这些文章的格式通常较为规范。然而,必须明确的是,使用人工智能生成的综述内容并不适宜公开发表。此类综述主要是对现有研究成果的整理,而非创新性的贡献,因此其中包含的大量资料仍需研究者亲自核实。人工智能的局限性在于其数据库内容的庞杂性,这可能会导致研究者思维的分散,以及论据的繁复和错误。尽管如此,人工智能技术的长处在于它能够为学者提供一个多维度、跨学科的思维发散,从而激发研究者的创新灵感。


西北大学教授贾连港:本人在研究宋太宗时期一位未及第诗人的史料时,通过Deepseek平台进行查询。结果发现,人工智能给出的答案与网络搜索结果以及诸多教师撰写的论文和资料完全一致。然而,从整体上看,这些内容仍属于对现有数据的整理和归纳,并未展现出真正的创新性。所谓的分析和逻辑推导过程,实际上反映的是创作者自身的逻辑分析。人工智能无法创造出具有深刻思想和更深层次价值的内容,其所谓的创新实质上是源自作者的创新。


河北大学教授王晓龙:在对Deepseek与豆包这两种大数据模型进行比较后,本人更倾向于豆包在回答效果和准确性方面的表现。据本人的实际体验来看,人工智能处理具有固定答案和明确知识领域的问题,例如政府公文、法律条文等,表现更为出色。然而,对于那些需要创新思维的学科领域,人工智能的应用则显得不太适宜。

四川大学副教授尹航:依我之见,人工智能若能与爱如生、中华经典古籍库等历史数据库相结合,未来在历史研究领域必将迎来突破性的发展。


湖北大学讲师徐欣欣:人工智能的进展融合了连接主义与符号主义这两种理论范式。在推理过程中,AI应用了逻辑规则,将诸多现实事物抽象化为概念,这体现了符号主义的特点。然而,符号主义的局限在于必须人为设定大量规则。相对地,连接主义则模拟人脑神经元的工作方式,神经元作为网络中的节点相互传递信号,每个节点涉及众多参数,这些参数和节点的数量决定了成本的高低。AI幻觉的产生与人工智能背后的这两种规则密切相关。例如,若设定的权重比例不当,可能导致输出数据与实际情况不符。因此,要消除AI幻觉,一种途径即为不断改进大模型,调整模型架构和参数。除此之外,档案领域正在关注的检索增强生成技术(Retrieval-Augmented Generation)与AI大模型的结合也为该问题的解决提供了思路。RAG技术可将档案资源作为外部知识库,在无需对大模型进行微调训练的前提下,即可增强大模型在档案领域的知识储备和性能表现,显著减少AI生成的幻觉现象。同时,RAG模型可以通过限制知识库的权限来实现安全控制,确保敏感信息不被泄露,规避档案开放利用中的诸多问题,为档案部门AI应用的部署解决技术痛点,将会便利历史研究中对更大范围档案资源的智能检索。即便如此,AI幻觉难以百分之百解决;技术也并非万能,只能一定程度上提供便利。从事学术研究仍需要不断提升自身的知识储备、视野和写作功底,才能在应用AI生成结果时提高分辨和整合能力,让AI的应用“如虎添翼”而非被AI误导。


中山大学副教授陈烨轩:人工智能技术的确为人类带来了诸多便利,其初衷在于解放人类,使其不再被琐碎事务所困扰。这并不意味着依赖人工智能技术会导致人类思维能力的衰退。人类应当学会掌握和利用技术,不断进行更新和迭代。因此,人工智能更适合那些具备知识储备和辨别能力的个体使用,以省略基础性和重复性的劳动,从而将更多时间投入到深度思考之中。

广州大学助理研究员林泽杰:近年来,中外学者的宋史研究不断深入,成果显著,但现有研究不免受到文献资料繁多、学科知识交融困难等诸多因素影响。在AI技术快速发展的当代社会,将宋史研究与AI技术融合,从文本处理与勘误、数据库建构与检索、历史场景复原等方面突破研究桎梏,乃是未来必然趋势。我认为,AI技术将在以下三点发挥更大作用。


一、文本处理与勘误。与魏晋南北朝隋唐时期不同,现存宋代的史书、典籍、笔记小说、诗歌文集、金石碑刻等文献可谓是浩如烟海。这一方面为宋史研究提供了宝贵的文献资源,但另一方面也意味着文本的校勘与整理工作极为艰巨。AI自然语言处理技术(如OCR字符识别)的突破,为史料的处理与数字化提供了可能。举例而言,利用OCR技术大规模扫描古籍文本并转化为可编辑文本,辅以文本校对与纠错,充分提高了古籍数字化与精细校勘工作的效率。在此基础上,借助深度学习模式比对分析《宋会要辑稿》《续资治通鉴长编》等文献古籍,不仅可以揭示版本古籍间的微妙差异,更可以通过事件抽取技术而构建出庞大的知识图谱,理清笔记、奏议等不同史书间的记载矛盾,为宋史研究构建起结构化的信息框架。


二、数据库构建与检索。依托AI技术构建起宋史研究数据库,可以大幅度提高宋史史料的检索效率和利用价值。结合深度学习和语义检索模型,AI数据库不仅能够依据检索需求而准确展现出相关史料,还能够匹配与关键词检索相关的其他文献。比如在基于AI语义识别而构建起的《宋史》数据库中,研究人员可以提出“两宋时期的‘岁币’含义”“宋代的关税税收与田产征收”等复杂问题,令系统自动整合复杂文献并提取相关信息,进而依托时序关系而建立经济学数据模式,最终将结果以图表可视化的方式展现出来。如果更进一步,还可以通过将宋史正史、碑刻文献、海外古籍、实录等各类数据库进行关联融合,构建起开放的、可交叉验证的宋史史料研究数据库,从而为推动宋史研究从“孤证”走向“群证”增添助力。


三、历史场景动态复原。众所周知,历史研究是在文献考证的基础上,对过去国家政治制度、社会生活与经济文化的解读和复原,以达到贯通古今之目的。以《清明上河图》为例,借助地理信息系统和3D系统可以完整还原北宋东京汴梁城的城市景观、街道布局以及市井生活,使“纸上的宋朝”演变成为可视化的体验空间。这不仅有助于研究人员直观理解宋代的空间结构与社会风貌,也为宋史教育和文化传播提供了沉浸式体验的渠道。在此基础上,通过深度学习和数据训练等途径,还能够令AI模拟出宋代的人口流动、商业贸易和官僚系统变化的动态过程,帮助研究者更深刻理解不同历史事件背后所隐藏的制度原理。比如可以将AI技术与《东京梦华录》相结合,自动依据书中的描述生成虚拟场景,模拟当时的节庆场景与商贸活动,复现出历史的“日常性”,进而推动社会生活史研究的发展。


安徽大学博士生卢子蒙:我认为,人工智能的最大优势在于能够显著减少大量非创新性的重复性工作,例如调整参考文献的格式。其次,它在提取资料方面表现出色,尽管某些关键词难以检索的史料,人工智能仍能完成部分工作,但研究者仍需亲自审阅。最终,在增强指令的辅助下,人工智能能够助力研究者迅速归纳出核心观点。


中国人民大学博士生江震:人工智能具备翻译多种外语文献的能力,即便是小语种翻译亦能精准完成,从而助力研究者迅速获取阅读材料。对于研究者而言,人工智能宛如一把雕刻艺术的刻刀,使雕刻者能够精确控制角度与力度。


重庆大学讲师赵耀文:关于AI与学术研究的问题,我个人持积极乐观的态度。诚如各位老师指出的那样,AI对学术研究的最大助力是方便了史料检索。尽管有这样或那样的问题,但在资料搜集效率方面有所提高,这一点是不可否认的事实。2018年,《史学月刊》第9期组织了“大数据时代史学研究的理论与方法”笔谈,学者们已经有非常前瞻的思考了。各类报刊媒体也有不少讨论。下面,我想结合自己使用的体会谈一些感想。


一是在思想认识上要积极接纳,充分利用。使用新技术、新工具开展研究,能给我们提供极大的便捷。有人担忧或者焦虑自己会被AI取代,这其实是对自己从事的研究工作没有准确的认识,对学术研究的定位不明晰。我认为,学术研究中对AI应该有个基本的定位,那就是:AI是一项工具、一种技术手段。作为学者,不应焦虑学术研究会被任何工具取代


二是注意使用的边界。随着科学技术的发展和社会的进步,我们自然不能忽视社会变迁带来的影响,学术议题具有时代性,学术研究理应关切时代问题,正所谓“一代有一代的学术”。史料检索高效,并不意味着不深入分析就下结论,当下有一种被称为“检索体”的论著,主要体现为史料堆砌,解读粗疏,学术性受到较多的质疑。


学术研究中利用AI的方式和技巧非常重要。2025年2月,中国历史研究院历史研究杂志社发布了《关于规范生成式人工智能工具使用的启事》,明确指出“语言润色、文献检索、数据整理与分析、思路开拓等辅助研究环节”的使用和其他不可使用的范畴,是首个行业规范。事实上,就我个人使用的情况来看,上述可以使用的范畴中,仍有无法达到预期目标的情况。语言润色似乎是最容易实现的,可实际情况是润色之后表达的意思和原本要表达的意思会出现背离。甚至会虚构一些原本不存在的意思。文献检索是大家公认助力最大的方面,却忽视了古代文献的复杂性,依靠字符匹配搜集而来的文献,仍旧需要学者再进行仔细爬梳。


三是重视学术规范和学术伦理。问题意识离不开广泛的阅读,对史料的分析要置于具体的语境之中。AI生成的文档内容逻辑单调,模式化严重,看似严谨,实则缺乏深度思考。更关键的是往往会虚构、捏造很多原本没有的史料,误导我们的研究方向和结论。因此,学术规范和学术伦理在AI时代显得格外重要。


借用王家范先生的话,“世界上有一种职业是任何再先进的机器人也无法替代,那就是历史学家”。我们应以充分地自信,敞开怀抱接纳AI新技术,在学术研究中恰当使用AI工具,始终相信人(历史学家)的能动性和创造性。谢谢!


河北大学研究生李沈洋:聆听各位发言后多有感悟,与其说“AI能给宋史带来什么”,毋宁说“我们将通过AI带来什么样的宋史”。前贤时哲已探讨过历史知识的“普及”与历史研究的“提高”之间的关系。在宋史研究取得重大发展的同时,却看到我们的成果无法实现“破圈”的结果。宋史研究成果的大众化传播目前主要通过电子媒介,而大众对宋史存在不少偏见,我们不用让AI为宋史“正名”,但我们需要以正确的价值取向反馈社会。在完善的法律法规出台前,既然无法阻挡生成式AI获取信息,不如暂且搁置争议,让宋史的研究成果通过AI传播。


湖北大学副教授黄光辉:综合各位的观点来看,我们还是更倾向于认为,人工智能实际无法取代人文科学领域的研究者,因为它缺乏人文精神和情感温度。简而言之,人工智能仅是一种工具,其能够为我们带来的创造与价值取决于个人的观点和智慧。这里我借用罗翔教授的一句话来结束今天的这场圆桌讨论,“人工智能是无法进行价值判断的,作为老师最重要的不是知识传输,而是在陪伴中进行价值意义和智慧的传递,以微小的力量延续人类的文明。人生的意义是在人生智慧”。谢谢大家的发言!

信息来源:人大复印报刊资料 人文
https://mp.weixin.qq.com/s/qG40pjbiRCA6J5JXcDATgQ
 樓主| 發表於 2025-5-9 11:03 | 顯示全部樓層
关于规范生成式人工智能工具使用的启事(合辑)

1.中国历史研究院主办刊物
https://mp.weixin.qq.com/s/h086TANWCXeIXxhk2cahXg

2.《中国历史地理论丛》
https://mp.weixin.qq.com/s/mCMolKK3GxfkUg7sSDC1MQ

3.《山东大学学报(哲学社会科学版)》

https://mp.weixin.qq.com/s/AjJ8thZfg0SpUW9kA9IJ6Q

4.《江南大学学报(人文社会科学版)》
https://mp.weixin.qq.com/s/727C_YzrpDCteH9akRyaDA

5.《中国文艺评论》
https://mp.weixin.qq.com/s/z3xa_bHqA1VAzGbOskftog

信息来源:中国人文社会科学综合评价研究院
https://mp.weixin.qq.com/s/ZM_90glabmKJPf1JE8VaCw
 樓主| 發表於 2025-5-10 12:13 | 顯示全部樓層
本帖最後由 张宇鑫 於 2025-5-10 12:23 編輯

武汉大学简帛研究中心与文化遗产智能计算实验室推动简帛整理研究数智化

重要文章:《数字人文时代的简帛文献整理与研究》

中国古代简帛文献大致是指在纸张广泛作为书写载体之前,书写于竹木简牍、绢帛上的古代文献。《尚书·多士》曰:“惟殷先人,有册有典。”李学勤先生指出早在有关殷商的文献和商代甲骨文中,已经有了典册的踪迹,那时人们已利用竹木制简,用绳编联成册,用于记录各类文献。

考古学意义上的简牍发现,始于20世纪初西方探险家在中国西北地区的探险活动,斯坦因、斯文赫定等人相继在尼雅、楼兰、敦煌等地获得数量不等的汉晋木简。1930年,中瑞“西北科学考察团”在西北广袤的区域之内通过科学考古的方式再次发现汉简1万多枚,是建国前古代简牍资料的一次重大发现。新中国成立后,随着考古事业的发展,地下出土的简牍资料数量迅速增加,其出土地点遍布全国的广大区域,主要集中在湖北、湖南、甘肃、内蒙古、河南、安徽、江西、江苏、山东等省年代由战国、秦汉以至魏晋时期迄今为止约有40万枚、300万字左右。从目前的考古发现来看,简帛文献大致上承甲骨文和金文,下启纸质的写本和刻本文献,其主要内容包括律令、公私文书、文化典籍和卜筮、丧葬记录,涉及当时社会、政治、经济、法律、军事、文化、思想、科技等众多领域,成为中国出土文献中的重要门类、人类古代文化遗产中的珍品,为探索古代历史的具体景象和发展演进,提供了珍贵而丰富的原始资料。

武汉大学简帛研究中心长期致力于中国古代简帛文献的整理与研究,连续主持多个国家级重大项目,推出多种简牍整理与研究方面的系列成果,是公认的简牍整理与研究重镇、简帛学科发展与国际交流的推动者和资料信息中心。武汉大学文化遗产智能计算实验室针对文化遗产活化利用的现实需求,充分利用大数据、人工智能等先进技术和数字人文理论方法开展跨学科研究。双方结合专业特长和技术优势为简帛文物的保护、整理和研究赋予科技力量,推动简帛文献的文本复原和内涵研究。

1 中国简帛文献综合数字平台

为满足对简帛图像、释文和著录等的管理和研究工作需求,简帛研究中心和文化遗产智能计算实验室合作,通过严谨、规范的数据结构设计,搭建简帛文献数据库,在此基础上全面实现简帛图像、释文和著录等的精细化管理。该数据库立足于已刊布的战国、秦、汉简帛文献,以及学界对这些重要文字、文献持续研究而达致的学术认知,系统总结、整合简帛发现、研究的成果,全面实现简帛文献的数字化,将这些珍贵的简帛文物转化为便于保存、利用和传播的文献资源。

为了进一步提升数字平台的信息服务能力,在实现简帛文献数字化的基础上,继续开发中国简帛文献公众服务平台,为研究者和公众提供开放的公共学术资源。平台侧重字形辨析、偏旁分析和辞例组合,实现单字字形、偏旁、辞例和释文的检索,并提供全文浏览功能。平台的使用大幅度改善简帛文献整理、研究的工作条件,提高简帛文字、文献的释读效率和研究质量,推进简牍文献的数字化利用。

公众服务平台各项功能正在建设和完善中,目前进行的是郭店楚墓竹简、包山楚简、周家台秦简的单字、辞例和释文修订、整理工作。

2 基于图模型的里耶秦简图谱构建及实体消歧技术研究

本项目的主要任务是基于机器学习和数据挖掘技术对简牍文献中的数据进行知识提炼和挖掘分析,构建其知识图谱,辅助相关领域专家开展学术研究,提高简牍文献数据的处理效率和挖掘深度。

我们首先选取里耶秦简作为研究对象,重点挖掘其中记录的人名、职官等信息,以目前学界已有判断为基础,采用频繁项集挖掘算法找出里耶秦简中频繁出现的职官对供领域专家校对,并补充、修订图谱关系。

对里耶秦简中重复人名的疑难,我们则采用SimRank++算法计算人名之间的相似度,对相似度高的实体进行合并消歧,从而进一步完善其图谱的构建。

SimRank算法是一种基于图的拓扑结构信息来衡量任意两个对象间相似程度的模型,其核心思想为:如果两个对象和被其相似的对象所引用(即它们有相似的入邻边结构),那么这两个对象也相似。在SimRank的基础上,SimRank++考虑了结点相似度证据并加入了边的权重。通过SimRank++计算,发现担任少内啬夫的壬16-24与担任田官佐的壬4、承担书手职责的壬5具有高度的相似度,结合领域专家的鉴定,认为他们有极大的概率在现实世界中对应同一个人。

3 基于大规模预训练语言模型的残缺简帛文字补全研究

本课题使用了自然语言处理领域的大规模预训练语言模型,该模型蕴含大量从训练语料库中学到的知识,同时能根据语境理解所需补全的语句,从而完成残缺简帛文字的补全任务,提升简帛文献修复整理的工作效率,完善简帛文物数字化保护流程。

该模块针对传世文献和出土文献分别设置了多专家系统模型和简繁融合模型。多专家系统模型使用不同子任务分别建模字符、词汇和语句层级的补全能力,再通过门控机制将子模型融合,在传世文献测试集中达到70%的准确率。简繁融合模型通过简繁体词表融合的方式,在出土文献测试集中达到57%的准确率。

随着出土简帛数量的不断增加和研究的持续深入,简帛文献的数字化保护、整理和研究是今后的发展方向和必然趋势。出土简帛兼具文物、文献的双重属性,利用数字化技术对出土简帛文物进行保护与整理,建设大型数据库把这些珍贵的文物转化为可以长期保存与传播的数字资源,基于人工智能和机器学习深入挖掘蕴含其中的历史文化信息,做好新时代简牍文物的整理与应用,推进中华优秀传统文化创造性转化和创新性发展。

编辑 | 李静 田越
审校 | 王玉珏

信息来源:文化遗产智能计算文科实验室
 樓主| 發表於 2025-5-10 12:30 | 顯示全部樓層
本帖最後由 张宇鑫 於 2025-5-10 12:34 編輯

全球首个简牍数智人才培训班已于2024年12月在西北师范大学开办

“数字简牍”文化遗产智能计算人才队伍培养讲习班


一、项目背景

为响应国家文化数字化战略,推动文化遗产保护领域的信息化与智能化建设,培养面向未来的智能计算专业人才,西北师范大学依托“文化遗产智能计算人才队伍培养+‘数字简牍’信息化平台研发”重点项目,特别举办本次讲习班。课程聚焦人工智能(AI)、大模型与知识图谱技术在简牍数字化保护与研究中的创新应用,旨在提升学员的技术水平,推动文化遗产领域的智能化发展。


二、讲习班课程目标

1. 掌握AI与大模型、知识图谱技术的核心理论与实践操作。

2. 深化对简牍数字化保护和智能信息处理技术的理解,培养创新型研究思维。

3. 通过实际案例学习,提升学员在文化遗产智能计算中的技术应用能力。


三、课程安排

时间

主题

第一天

8:00-12:00

开班仪式

简牍数字化资源共享平台介绍

简牍研究AI大模型:

技术概述与发展方向

14:30-18:30

简牍文献处理智能化:

大模型AI工具与提示词优化

第二天

8:00-12:00

面向简牍的智能决策:

大模型与Agent模式

14:30-18:30

简牍智能处理的核心:

GPT模型原理与实战

第三天

8:00-12:00

简牍文献的深度处理:

Hugging Face Transformers实战

14:30-18:30

简牍知识图谱构建:

LangChain与定制化知识库实现

第四天

8:00-12:00

简牍知识图谱基础:

图数据库与知识表示方法

14:30-18:30

简牍知识推理:

知识抽取、融合与推理技术


四、招生信息

招生人数:全国限招30人。

招生对象:

高校及科研院所从事简牍学、历史学、文献学研究的学者及研究生。

从事文化遗产保护、AI与大数据相关领域的技术人员。

对简牍研究与智能计算技术有浓厚兴趣的人员。

费用:本次讲习班全程免费,学员需自理交通与食宿费用,安全保障自行承担。

时间:2024年12月6日至12月9日(共4天)。

地点:西北师范大学云亭校区,甘肃省兰州市安宁东路967号。


五、报名与筛选流程

1.报名方式:

填写报名表:学员需下载并填写《“数字简牍”文化遗产智能计算讲习班报名表》。

提交报名表:将填写完整的报名表发送至邮箱:

jiandu_digital@126.com。

邮件标题格式:“讲习班报名+姓名+单位”。附件命名格式:“报名表_姓名_单位”。

报名截止:2024年11月30日。报名截止日期后,培训组将不再

接受报名材料。

2.筛选流程:

初审:培训组将根据报名表内容进行资格审核,筛选符合以下条件的学员:

在简牍学、文化遗产保护、AI技术领域有相关经验或研究兴趣。
报名表内容填写完整,能清晰阐述学习目标和培训期望。

二审与候补安排:

初审通过的学员将进入二审环节,由项目组综合考虑学员的研究背景、技术基础及报名顺序,最终确定录取名单。
如有录取学员因特殊原因无法参加,将从候补名单中递补。

录取通知:录取结果将在2024年12月1日通过邮件通知,请确保填写的联系方式正确有效。

提交的报名表内容将严格保密,仅用于本次讲习班的录取筛选。


六、联系方式

主办单位:西北师范大学简牍研究院、甘肃省简牍智能计算与数字人文工程研究中心

联 系 人:齐颖、王晨阳、江占浩

联系电话:15736212730、15095334748、15993149406

电子邮箱:qiying@nwnu.edu.cn570617554@qq.com15993149406@163.com


七、特别说明

本次培训为甘肃省重点人才项目支持,旨在推动文化遗产保护领域的智能化建设。我们期待您的加入,与全国优秀学者与技术人员共同交流与学习,为文化遗产保护事业贡献力量!

信息来源:简牍学
 樓主| 發表於 2025-5-13 09:38 | 顯示全部樓層
本帖最後由 张宇鑫 於 2025-5-13 09:43 編輯

重要讲座:人工智能时代中国近现代史史料的收集、使用与写作

01 讲座时间
2025年5月16日(周五)上午9:30

02 讲座入口
小鹅通观看

03 讲座亮点
·以中国近现代报纸为切入点,聚焦人工智能时代史料研究;
·辩证探讨人工智能角色,结合数据库与文本提取等新技术;
·系统梳理史料写作方法,强调传统与新技术协同,兼具实用性与启发性。

04 主讲专家
河南大学 贺怀锴教授
河南大学历史文化学院中国近现代史教研室主任,河南省高等学校人文社会科学重点研究基地中国近现代社会转型中心副主任。河南省本科高校青年骨干教师,河南大学“百人计划”人才,历史文化学院博雅拔尖人才。主要研究方向为中国近现代军事史、中共党史、国史研究。在《近代史研究》《当代中国史研究》《史学月刊》等CSSCI期刊发表论文20余篇。主持国家社科基金青年项目1项,国家社科基金重大项目子课题1项,博士后面上资助项目1项等。

信息来源:人文学术社
近现代史史料的搜集.png
 樓主| 發表於 2025-5-13 14:03 | 顯示全部樓層
本帖最後由 张宇鑫 於 2025-5-13 14:09 編輯

重要会议:高校哲学社会科学实验室联盟第二届会议

一、会议时间
2025年5月13日-5月15日

二、会议主题
数智时代哲学社会科学与人类文明新形态

三、会议地点
武汉大学

四、主办单位
高校哲学社会科学实验室联盟
武汉大学

五、承办单位
武汉大学人文社会科学研究院
武汉大学信息管理学院
武汉大学文化遗产智能计算实验室

信息来源:文化遗产智能计算文科实验室
平行论坛一.png
平行论坛五.png
 樓主| 發表於 2025-5-18 19:33 | 顯示全部樓層
本帖最後由 张宇鑫 於 2025-5-19 09:21 編輯

中國(含大陆、港澳台)簡帛整理研究數智化相關文獻簡目

數智化指數字化和人工智能化,各文獻按時間先後排列。

1.陳爽.利用國際互聯網絡檢索簡帛金石數據[J].中國史研究動態,1999,(1).

2.李申申.基於輕量級架構的簡牘圖像信息系統[D].碩士,成都理工大學,2006.

3.楊斯涵.圖像分割技術在簡牘保護中的應用研究[D].成都:成都理工大學,2006.

4.胡平生.論簡牘整理國家標準的制定[C].出土文獻研究(第8輯).上海:上海古籍出版社,2007.

5.張娜.簡牘圖像增强與分割研究[D].成都:成都理工大學,2007.

6.白玲玲.中醫藥古文獻語料庫建設的語料分類問題研究[D].濟南:山東中醫藥大學,2007.

7.劉瑛,王緒本.簡版圖像文字切分算法研究[J],科學技術與工程,2007,7(21):5586-5589.

8.劉瑛:《OCR技術在簡牘圖像數字化中的應用》,碩士學位論文,成都理工大學信號與信息處理專業,2007年12月。

9.覃慶炎:《簡犢數字圖像增强算法研究與應用》,碩士學位論文,成都理工大學信號與信息處理專業,2008年5月。

10.梁鬆濤、趙彥平:《淺析我國出土文獻數據庫建設的制約因素及對策》,《圖書館工作與研究》2008年第4期。

11.鄭杰文:《論我國古籍整理的幾個重點》,《陝西師範大學學報(哲學社會科學版)》2008年第5期。

12.張偉.簡牘圖像中文字修復的研究與應用[D].成都:成都理工大學,2008.

13.覃慶炎,王緒本,蔣維.反鋭化掩模法在簡牘文字增强中的應用[J].微計算機信息,2008,3(24):24l-242.

14.石民.先秦漢語自動分詞及詞性標注研究[D].南京:南京師範大學,2010.

15.石民,李斌,陳小荷.基於CRF的先秦漢語分詞標注一體化研究[J].中文信息學報,2010,24(2):39-45.

16.張陽潔:《基於閾值的圖像分割技術在簡牘中的應用》,碩士學位論文,成都理工大學信號與信息處理專業,2010年6月。

17.蘇衛國、王文濤:《簡牘整理研究的現實困境與簡牘數字化的發展方向》,《魯東大學學報(哲學社會科學版)》2011年第6期。

18.張再興.互聯網時代出土文獻數據库建設的思考與實踐[J].中國文哲研究通訊,2011年,21(2)

19.何志華.香港中文大學中國古籍研究中心出土文獻數據化研究之回顧與前瞻[J].中國文哲研究通訊,2011年,21(2)

20.程少軒.[上博簡字詞全編資料库]的設計和製作[J].中國文哲研究通訊,2011年,21(2)

21.魯家亮、李靜.數字時代的簡帛研究[J].中國文哲研究通訊,2011年,21(2)

22.單育辰.淺談數字化時代的出土文獻及相闢資源資料库[J].中國文哲研究通訊,2011年,21(2)

23.毛建軍:《簡帛文獻數字化述論》,《蘭台世界》2011年第8期。

24.蘇衛國、王文濤:《試論簡牘數字化的規範問題》,《魯東大學學報(哲學社會科學版)》2012年第3期。

25.陳小荷,馮敏萱,徐潤華等.先秦文獻信息處理[M].北京:世界圖書出版公司北京公司,2013.

26.張再興.秦漢簡牘語料库建設中基礎語料的處理標準統一問題.[J].中國文字研究,2014,02:53-56.

27.尤建輝:《出土文獻數字化整理簡述》,《黑龍江史志》2014年第21期。

28.劉磊.基於内容的秦漢瓦當小篆文字識别方法研究[D].西北大學碩士學位論文,2015.

29.樓蘭:《我国出土简帛文献电子索引建设研究述评》,《蘭台世界》2015年第26期。

30.溫博雅.漢簡語料庫的設計與應用[D].華東師範大學碩士學位論文,2016.

31.吴相錦.古文獻文字圖像分割與差異性比對演算法研究[D].蘭州交通大學碩士學位論文,2016.

32.嚴順:《先秦文獻的語料庫構建探究》,《江蘇科技信息》2016年第12期。

33.張蘭雲.簡牘文字提取與識別研究[D].西北師範大學碩士學位論文,2017.

34.李靜:《淺析簡帛文獻的數據庫建設》,《江漢考古》2017年第5期。

35.王敏.簡牘圖像修復技術研究[M].上海:上海古籍出版社,2018:35-50.

36.肖攀.設計專用電腦軟體輔助編纂古文字字編的設想[J].古文字研究,第三十二輯,2018(08):649-656.

37.孟忻:《“中華字庫”工程第七包“兩漢吴魏晉簡牘文字”資料庫建設研究》,《圖書館學研究》2018年第12期。

38.馬海雲,張忠林.一種多技術融合的古體漢字識别方法研究[J].中央民族大學學報(自然科學版),2018,27(03):44-47.

39.劉春雪:《我國出土文獻數據庫出版述論》,《出版與印刷》2019年第1期。

40.匡陝勇、蘇展:《郭店楚簡的數字展示技術開發與應用》,《江漢考古》,2019年第2期。

41.程少軒:《資料視覺化技術在上古音研究中的應用》,“古文字與上古音青年學者論壇”,福建廈門,2019年。

42.吴崢:《〈岳麓書院藏秦簡〉語料庫建設暨若干漢字智慧識别相關研究》,碩士學位論文,湖南大學中國語言文學專業,2019年5月。

43.吴崢.圖像處理演算法在秦簡文字編建立過程中的應用與價值[EB/OL].中國高校人文社會科學信息網,2019(05)

44.田園:《基於深度度量學習的戰國簡文字識別技術》,碩士學位論文,河南大學計算機技術專業,2020年8月。

45.張紅.簡牘圖像數字化處理中的問題與對策[J].圖書館學研究,2020(11):45-48.

46.樓蘭:《戰國楚簡文獻電子引得建設芻議》,《長春工程學院學報(社會科學版)》2021年第1期。

47.莫伯峰、邱煒琦、謝澤澄:《人工智能模擬辭例歸納的初步測試》,《漢語言文學研究》2021年第3期。

48.王强.人工智能在簡牘研究中的應用探索[M].上海:上海科學技術出版社,2021.

49.陶珩、张钦科、刘浩男、戴苗鹏、李曙:《湘西里耶秦简文字数字化检测技术研究与实现》,《電子製作》2021年第18期。

50.盛一涵、田雨嬌:《歷史語言學的數字成像:“古音小鏡”網站——兼議數字人文項目生長路徑》,《數字人文研究》2022年第1期。

51.唐傑、劉銘、陳鐿文:《基於出土文獻資料庫的集外字數字化處理方法研究》,《商洛學院學報》2022年第2期。

52.白廣珍、宋朋遙、張興:《文物所載模糊信息的清晰化提取技術應用概述》,《福建文博》2022年第4期。

53.陳晨.簡牘檔案數字化資料標準體系構建[J].檔案學通訊,2022(04):78-85.

54.朱琳:《數字人文視阈下秦漢簡牘文本挖掘研究——以里耶秦簡(一二卷)爲例》,碩士學位論文,西北大學科學技術史專業,2022年5月。

55.唐傑:《基于出土文献数据库集外字字库的数字化处理方法研究》,碩士學位論文,西北大學科學技術史專業,2022年6月。

56.朱琳,馮慧敏,劉銘等.數字人文視域下秦漢簡牘文本挖掘研究——以里耶秦簡(一、二卷)爲例[J].渭南師範學院學報,2022,(6).

57.劉多、劉影:《我國簡帛研究的科學知識圖譜分析》,《文化學刊》2022年第10期。

58.李賀、祝琳琳、劉嘉宇、樊嬌、侯力鐵:《基於本體的簡帛醫藥知識組織研究》,《圖書情報工作》第66卷第22期,2022年11月。

59.文玉鋒、馬倩妮、楊克虎、周文傑:《數字人文“二手證據”循證範式研究:以敦煌漢簡爲例》,《農業圖書情報學報》2022年第11期。

60.王建欣:《出土文獻數字化建設現狀研究》,《古籍整理研究學刊》2023年第1期。

61.趙桂芳、賈連翔:《簡牘圖像信息采集過程中的保護及要求》,《出土文獻》2023年第1期。

62.林强.高校簡牘檔案數字化課程設置研究[J].教育評論,2023(02):150-155.

63.張昊蘇:《論郭店楚簡數字化工作之得失:兼及出土文獻資料庫的開發標準問題》,《數字人文》2023年第4期。

64.劉輝.簡牘檔案數字化的法律問題探討[J].知識產權,2023(05):90-95.

65.汪政阳:《基于深度学习模型的秦简文字识别方法研究》,碩士學位論文,吉首大學電子信息專業,2023年6月。

66.莫伯峰、胡韌奮:《利用人工智慧技術進行竹簡編聯的初步測試——以〈清華簡〉爲例》,《古文字與出土文獻青年學者論壇(2019)論文集》,上海古籍出版社2023年。

67.何悄吟、王曉光:《數實共生:預見數字人文未來圖景——2023年中國數字人文年會綜述》,《數字人文研究》2024年第1期。

68.鄭樑、程少軒:《出土文獻韻文數據的視覺化呈現——以簡帛方術文獻爲例》,《中國語言戰略》2024年第2期。

69.劉銘、馮慧敏、陳鐿文:《數字人文視域下簡帛文獻的分詞研究——以〈里耶秦簡牘〉爲例》,《語言文字應用》2024年第3期。

70.盛威、彭歡、盧彥傑、劉偉:《基於深度學習的馬王堆漢墓簡帛文字識別研究》,《電腦與信息技術》2024年第6期。

71.姜維:《簡牘文獻的整理研究與活化思考》,《出版廣角》2024年第6期。

72.胡毓博:《基於深度學習的簡牘文字識别與檢測方法研究》,碩士學位論文,西北師范大學電子信息專業,2024年5月。

73.盛威:《基於深度學習的中醫古籍缺失文本修復和手寫文字識別研究》,碩士學位論文,湖南中醫藥大學電子信息專業,2024年5月。

74.谢文达:《基于深度学习的战国竹简文字识别》,碩士學位論文,西華大學電子信息專業,2024年6月。

75.李勝楠:《真實場景下的楚系簡帛古漢字識别研究》,碩士學位論文,武漢工程大學計算機科學與工程學院,2024年6月。

76.數字清史實驗室主辦《數字史學發展動態》2025年第1期。

77.方北松:《建議大力推進簡牘文字信息提取設備的研發》,《中國文物報》2025年3月12日第2版。

78.遲楊:《知識驅動的古文字字形識别與語義跟蹤研究》,博士學位論文,吉林大學人工智能學院,2025年3月。

79.張鵬立:《簡牘檔案研究中數字化技術的賦能與困境》,《檔案管理》
2025年第2期。


(注:不完整待完善,點擊下方pdf文件可下載部分文獻)

知识驱动的古文字字形识别与语义跟踪研究_迟杨.pdf

5.89 MB, 下載次數: 72

真实场景下的楚系简帛古汉字识别研究-李胜楠.pdf

6.83 MB, 下載次數: 75

战国楚简文献电子引得建设刍议_楼兰.pdf

115.35 KB, 下載次數: 74

湘西里耶秦简文字数字化检测技术研究与实现-陶珩.pdf

1.51 MB, 下載次數: 91

我国简帛研究的科学知识图谱分析-刘多.pdf

2.07 MB, 下載次數: 79

我国出土简帛文献电子索引建设研究述评_楼兰.pdf

134.5 KB, 下載次數: 72

文物所载模糊信息的清晰化提取技术应用概述-白广珍.pdf

1.37 MB, 下載次數: 87

数字人文视阈下的秦汉简牍文本挖掘研究——以里耶秦简牍(一二卷)为例-朱琳.pdf.pdf

3.04 MB, 下載次數: 78

数字人文视域下秦汉简牍文本挖掘研究——以里耶秦简牍(一、二卷)为例-朱琳.pdf.pdf

357.86 KB, 下載次數: 77

数字人文视域下简帛文献的分词研究——以《里耶秦简牍》为例-刘铭.pdf.pdf

1.49 MB, 下載次數: 82

数字清史实验室主办《数字史学发展动态》2025年第1期.pdf

1.22 MB, 下載次數: 84

数字人文“二手证据”循证范式研究:以敦煌汉简为例-文玉锋.pdf

1.96 MB, 下載次數: 73

数实共生_预见数字人文未来图景——2023年中国数字人文年会综述-何悄吟.pdf.pdf

2.12 MB, 下載次數: 71

试论简牍数字化的规范问题-苏卫国.pdf

230.91 KB, 下載次數: 74

人工智能模拟辞例归纳的初步测试-莫伯峰.pdf

489.89 KB, 下載次數: 79

秦汉简牍语料库建设中基础语料的处理标准统一问题-张再兴.pdf

1.19 MB, 下載次數: 79

浅析简帛文献的数据库建设-李静.pdf

126.92 KB, 下載次數: 86

莫伯峰、胡韌奮:利用人工智能技術進行竹簡編聯的初步測試.pdf

11.27 MB, 下載次數: 77

论郭店楚简数字化工作之得失...土文献数据库的开发标准问题_张昊苏.pdf.pdf

1.34 MB, 下載次數: 73

简牍整理研究的现实困境与简牍数字化的发展方向-苏卫国.pdf

172.81 KB, 下載次數: 87

简牍文字提取与识别研究-张兰云.pdf

3.03 MB, 下載次數: 66

简牍文献的整理研究与活化思考-姜维.pdf

1.19 MB, 下載次數: 83

简牍图像中文字修复的研究与应用-张伟.pdf

7.99 MB, 下載次數: 77

简牍图像增强与分割的研究-张娜.pdf

6.25 MB, 下載次數: 79

简牍图像信息采集过程中的保护及要求-赵桂芳.pdf

1.59 MB, 下載次數: 72

简牍数字图像增强算法研究与应用-覃庆炎.pdf

5.74 MB, 下載次數: 74

简牍档案研究中数字化技术的赋能与困境-张鹏立.pdf

1.34 MB, 下載次數: 76

简帛文献数字化述论_毛建军.pdf

116.76 KB, 下載次數: 79

基于阈值的图像分割技术在简牍中的应用_张阳洁.pdf

1.54 MB, 下載次數: 78

基于深度学习模型的秦简文字识别方法研究-汪政阳.pdf

3.23 MB, 下載次數: 74

基于深度学习的中医古籍缺失文本修复和手写文字识别研究_盛威.pdf

3.19 MB, 下載次數: 90

基于深度学习的战国竹简文字识别-谢文达.pdf

2.71 MB, 下載次數: 72

基于深度学习的马王堆汉墓简帛文字识别研究_盛威.pdf

1.2 MB, 下載次數: 73

基于深度学习的简牍文字识别与检测方法研究-胡毓博.pdf

4.67 MB, 下載次數: 75

基于深度度量学习的战国简文字识别技术-田园.pdf

5.29 MB, 下載次數: 82

基于出土文献数据库集外字字库的数字化处理方法研究-唐杰.pdf

5.04 MB, 下載次數: 77

基于出土文献数据库的集外字数字化处理方法研究-唐杰.pdf

790.13 KB, 下載次數: 90

基于本体的简帛医药知识组织研究-李贺.pdf

1.14 MB, 下載次數: 89

漢簡語料庫的設計與應用_溫博雅.pdf

16.41 MB, 下載次數: 89

方北松代表:建议大力推进简牍文字信息提取设备的研发_本报记者__徐秀丽.pdf.pdf

81.86 KB, 下載次數: 76

出土文献韵文数据的可视化呈现——以简帛方术文献为例-郑樑.pdf

453.46 KB, 下載次數: 74

出土文献数字化整理简述-尤建辉.pdf

109.88 KB, 下載次數: 68

出土文献数字化建设现状研究-王建欣.pdf

869.73 KB, 下載次數: 71

OCR技术在简牍图像数字化中的应用-刘瑛.pdf

5.81 MB, 下載次數: 73

《岳麓书院藏秦简》语料库建设暨若干汉字智能识别相关研究-吴峥.pdf.pdf

7.85 MB, 下載次數: 88

“中华字库”工程第七包 “两汉、吴、魏、晋简牍文字的搜集与整理”-.pdf.pdf

158.92 KB, 下載次數: 83

“中华字库”工程第七包“两汉吴魏晋简牍文字”数据库建设研究-孟忻.pdf.pdf

2.38 MB, 下載次數: 71

 樓主| 發表於 2025-5-19 16:17 | 顯示全部樓層
本帖最後由 张宇鑫 於 2025-5-19 16:21 編輯

天回医简整理研究数智化新进展:“出土医学古籍Agent”发布

5月16日,成都中医药大学隆重举行“5·18国际博物馆日”系列活动暨出土医学文献文物数字研究学术研讨会。活动以“历史与未来对话:AI时代下医学文献文物的数字活化”为主题,通过国家二级博物馆揭牌仪式、出土医学数据研究成果发布、名老中医薪传计划暨首批捐赠、学术研讨、文化体验等环节,展现中医药文化与现代科技的深度融合。

大会发布了省级重点实验室出土医学文献文物保护研究数字实验室自研的“出土医学古籍Agent”,展示了人工智能技术对“天回”汉代医简等文物进行数字化保护与研究成果。成果以出土医学文献文物为核心资源,依托尖端扫描、存储、算力设备,通过智能数据库构建、数字研究、展示传播、修复保护四个分实验室协同联动,撬动科技与人文融合之力,构建从古籍解码到文化传承的创新生态,引领出土医学文献文物研究前沿。

国锦琳主持重点实验室学术委员会聘任仪式。本届学术委员会由来自中国中医科学院、上海中医药大学、四川大学、中国科学技术信息研究所、成都文物考古研究院、四川省图书馆和成都中医药大学的11名相关领域专家组成,学术委员会主任委员由我校中国出土医学文献与文物研究院院长柳长华教授担任。杨静颁发聘书。

围绕“AI时代下医学文献文物的数字活化”四川大学计算机学院教授、出土医学文献文物保护研究数字重点实验室学术委员会委员蒋玉明从研究背景、技术方案和特色创新的角度作《融合数字孪生的名中医诊疗全过程生成智能方法及智慧传承平台研发》学术报告。柳长华教授以《中医古籍数字化:保存、活化与共享》为题,从古籍整理与知识获取关系、古籍数字化是古籍整理的延续、古籍数字化重在知识分类以及古籍与人工智能结合三阶段等角度,传授了自己多年的研究与思考,破解古籍文献研究之道。

信息来源:中国出土医学文献与文物研究院
 樓主| 發表於 2025-5-20 17:11 | 顯示全部樓層
本帖最後由 张宇鑫 於 2025-5-20 17:12 編輯

重要講座:數字人文、人工智能與古籍數據庫

舜徽講壇·學術講座第十五期(總第二十四期)

主題:數字人文、人工智能與古籍數據庫

報告人:唐宸
安徽歙縣人,浙江大學博士,臺灣中山大學聯合培養博士,現爲安徽大學副教授,清華大學數字人文團隊成員。研究方向爲中國古典文獻學、數字人文。在《文獻》《文學遺產》《清華大學學報》《中國音樂學》《中國典籍與文化》《數字人文》等刊物發表論文二十餘篇,其中多篇被《新華文摘》《人大報刊複印資料》《文學研究文摘》全文轉載或摘編。目前正主持中央宣傳部課題《海內外古籍中繼資料與資料庫彙聚整理研究》。在數字文獻學基礎設施建設方面,研發了“中國古典文獻資源導航系統(奎章閣)”、“全球漢籍影像開放集成系統”等網站。

時間:2025年5月21日下午2點

地點:華中師範大學新文科樓南樓402會議室

主辦單位:華中師範大學歷史文化學院、歷史文獻研究所、文獻學與經學史研究群

信息來源:華師文獻
舜徽讲坛.jpg
您需要登錄後才可以回帖 登錄 | 立即注册

本版積分規則

簡帛網|手机版|小黑屋|

GMT+8, 2025-6-2 21:27 , Processed in 0.045226 second(s), 14 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回復 返回頂部 返回列表