2021年12月12日,由华东师范大学思勉人文高等研究院副院长王峰教授组织策划的“数字人文与文学计算”工作坊及第二次文学计算工作会议以线上线下融合的方式顺利召开,该工作坊受到华东师范大学“数字人文与文学计算”协同创新团队、思勉人文高等研究院和身体美学中心联合支持。受邀参加工作坊的嘉宾有:天津大学计算机学院薛霄教授、河海大学理学院张建勇副教授、复旦大学生命医学伦理研究中心杨庆峰教授、佰旗信息公司总经理王凯先生、新华三公司资深架构师李富先生、华东师范大学城市与区域学院张红副教授、集美大学文学院周伟薇副教授、华东师范大学中文系柏晓鹏博士,以及华东师范大学中文系参与研究和文学文本标注工作的部分学生。此次会议的议程主要包括:回顾第一次会议内容,总结前一阶段的工作经验与成果;在此基础上梳理现阶段的主要工作内容,并明确团队明年的工作计划。会议由王峰教授主持并做汇报,与会嘉宾对汇报中的重要问题展开细致讨论,从各自的专业视角提出了诸多看法与建议。
首先,王峰教授与团队一起回顾了于今年6月5日召开的第一次文学计算会议。第一次会议确立了分词、生成词向量、词类清洗、重复性搜索、实词库搜索、树立主角以及进行神经网络运算建模等七个最初目标;第一次会议之后确立了具体工作流程等内容,并在其后的研究中予以实践检验。上述工作目标和实现方法在研究开展的过程中暴露出一些问题,如基于社会学语义分析的方法难以平移到文学虚拟性语义研究中、文学计算的语义分析具有特殊性和复杂性难以确定准确的研究方式、语义处理模型以英文为主导致汉语应用效果不佳等。因此,在研究工作推进的过程中,“数字人文与文学计算”协同创新团队针对这些具体的问题,积极寻求有效解决方案,对工作目标和流程进行了一些调整。
其次,王峰教授对目前工作推进的详细情况进行了说明。现阶段“数字人文与文学计算”协同创新团队着手进行三个方面的工作:一是解决文本的角色词的准确定位问题;二是对著名文学文本进行标注;三是建立初步的运算模型。
最后,王峰教授概述了团队下一阶段的四个工作目标,即:大量标注小说文本;完善角色和情节定位,动用语义分析在句子中对角色进行运算;完善小说计算的整个流程;建立起四大名著文学图谱(包含文学地图)。
受邀参会的学者和工程师在汇报结束后,结合汇报内容和现阶段研究推进的具体情况,对目前团队工作的技术路线、技术难点、技术迁移、各部分工作的推进程度与精力投入配比、相关应用场景开发等具体问题展开了深度讨论与交流。“数字人文与文学计算”工作坊第二次会议在热烈的讨论氛围中圆满落幕,与会专家约定展开长期在线协作,共同推进后续研究工作。