分项说明
平行语料库

资源简介

《平行语料库》目前包括句子级对齐的“汉英双语对齐语料库”约100万句对和“汉日双语对齐语料库”3万句对。除资源建设之外,北京大学计算语言学研究所也研制了用于加工和使用双语平行语料库的软件工具集,基于这些工具,可以以更加有效的方式加工双语对齐语料库以及辅助提取双语语料库中的语言统计信息。

最新进展

  • 增加了14,663个名词、动词、形容词,以及1993个区别词、时间词、处所词、方位词、副词、数词。词典规模已达到6.6万余条词条;
  • 开发了一个全新的语素库
  • 对原有的“词语”、“词类”、“同形”、“拼音”、“兼类”、“备注”等字段进行了统一检查、修订,语义属性描写质量有了显著提高;

授权列表

目前已有中国大陆境内、外的20多个单位用户从北大计算语言所购买了这部词典的许可使用权:

  • IBM
  • Intel
  • Fujitsu……
  • Toshiba
  • NTT
  • Canon
  • Sail-labs

 

  • [1].王雷; 常宝宝; 俞士汶.汉语对应英语定语从句结构的一种自动翻译方法[C].:第五届全国青年计算语言学研讨会论文集.2010-10-11 00:00:00.0.
管理员信箱:athing@pku.edu.cn