西南官话多模态语料库
South West Mandarin Multimoding Corpus

西南官话文献语料库介绍

——来自西南官话特色文献的文本语料数据集
作者:张超 访问量:113 发布单位:西南官话语料库管理组 录入时间:2024年2月7日 01:18
【摘要】 西南官话文献语料库之语料来源于两类文献:一是清末民初传教士西南官话文献,二是清末民初西南本土文本所写的具有西南官话特色的文献。

        西南官话文献语料库之来源文献包括两类:一是清末民初传教士西南官话文献,二是清末民初西南本土文人所写的具有西南官话特色的文献。对两类文献语料的处理有所不同,具体如下。

       一、传教士西南官话文献

       传教士西南官话文献基本上都如实记录当时当地的西南官话口语,所以均全文录入。


       二、西南本土文人文献

       西南本土文人所撰写的文献有小说和剧本两种,小说中的人物对白和剧本中的角色对白都具有西南官话特色,但小说中的叙述部分和剧本中的画外音部分通常书面色彩较重。因此只将小说人物对白和剧白角色对白作为语料录入本语料库。