大地语料库・大地コーパス —— 软件下载

大地语料库
大地コーパス

大地语料库官方图片

检索功能

  • 大地语料库软件在“检索”标签页提供KWIC检索功能。用户可在检索框输入字词或语句,并选择语料范围,如全部文献、中国文献、日本文献等,还可选择下位分类如“中国诗文词赋”、“日本汉诗文集”,以及添加自己的语料文件进行查询。查询模式分为不含异体字和包含异体字的查询。检索完成后,用例总数在左侧视图显示,详细结果在右侧视图显示,包括国别、年份、作品、卷次、例句等。如需更长上下文,请点击例句或文件名点击例句查看完整文本,或右键点击打开完整文本并跳转至关键词位置。点击检索结果最右侧“底本”链接,可以获取底本相关信息和所藏网站链接。检索结果可通过复制粘贴或CSV文件形式进行保存。
描述

分析功能

  • 大地语料库软件在“分析”标签页内设置了共起分析和相似词检索功能。共起分析可输入检索字词并选择分析模式(统计邻近字词、指定跨距内N-gram或单词),用以观察字词用法。例如,检索“鯨”后1字,会获得“鲸鲵(23次)”、“鲸鱼(12次)”、“鲸吞(9次)”、“鲸吸(4次)”、“鲸波(3次)”等结果。相似词检索则利用Word2Vec模型查找相似字词,支持单字及多字词检索,显示最相似的词及余弦相似度值,有助于深化语义理解和拓展研究。例如检索“孔子”,会获得“夫子(相似度:0.8802)”、“孟子(相似度:0.8756)”、“仲尼(相似度:0.8364)”等结果。大地语料库软件通过这些功能,支持用户把握汉字词用法并进行中日比较。
描述

画图功能

  • 大地语料库软件针对汉字词历时及历史研究,设计了“画图”标签页中的多样化数据分析与可视化功能:(1)提供柱状图&折线图功能,展示词汇频次与频率的历史变化,并进行中日间的比较。(2)设计对比图功能,实现时代间、板块间N-gram使用频率的可视化对比。(3)提供词共现网络图功能,揭示检索关键词的搭配情况。大地语料库软件通过集成在“画图”标签页中的各项功能,从多个方面回应了汉字词历时与历史研究的需求。
描述

报告生成

  • 为便用户,本软件增设自动报告功能。用户在“报告”标签页中依次输入调查字词、选比较范围(中日全部文献或日本汉诗文与中国诗文词赋)、选择是否含异体字、指定保存路径,最后点击生成,即可获得docx格式的报告。报告分时代加入中日用例,从整体使用情况、历时的使用变化、搭配情况三个角度进行比较,并附初步结论。此功能节约使用者手动整理数据和进行统计计算的时间,可以有效提升汉字词研究的效率。
描述

元数据

  • 大地语料库软件中,在“元数据”标签页下,提供本语料库软件的基础信息以及各板块文献的详细信息(包括时代朝代、年代、文献名称、卷次、简评、作者、底本、所藏、馆藏号、书写刊行时间、录入所使用的资料、资料链接、录入中去除的部分等内容等)。方便使用者了解收录语料全貌、作品背景、把握数据特质、以及进行底本查证。
描述
HOME

© 2024 大地语料库版权所有

苏ICP备12043372号-2