主要研究方向:

中文计算的基础理论与模型研究

从语言、认知和计算三个方面对语言各个层面的计算进行研究在词法、句法、语义、篇章结构等不同层面开展语言规律的研究, 重视适用于中文自动计算的基础理论体系的整合与创新;

从认知角度研究语言加工的机理,考察中 文句子各层级的结构表征、语义加工和歧义消解规律;

建立统计与规则相结合的有效计算 模型,研究从单点、线性序列、到层次结构不同层面歧义消解的有效学习算 法以及适应于大规模语料处理的高效学习方法。

大规模多层次语言知识库构建的方法研究

语言知识库建设的相关基础理论及 知识描述体系的研究;

语言知识库建设规范、语言知识库 的构建流程和语言知识一体化加工方法;

语言知识库建设的关键技术以及支 撑工具与平台的构建,以提高语言知识库构建的自动化程度;

建设具有国际先进水平、规模大、质量高的以汉语为核心的综 合型语言资源和知识库系统。

国家语言资源整理和语音数据库建设

运用先进仪器和技术采集言语 活动的实际场景;实现语音及相关资料的数字记录、储存和分析;

汉语方言和民族语言 基础数据库构建,以实现多语多方言“知识提取”和多语多方言历史关系分析;

研究高效的算法,判 定多语言历史关系的数学模型与算法,特别是汉藏语亲缘关系的量化计算。

海量文本内容分析与动态监控

海量文本的内容表示 与有效组织形式的研究;

文本内容深层知识抽取 的方法研究和计算模型研究;

面向互联网络,以语言文 字工作的舆情动态监测为核心的应用研究。

多语言信息处理和机器翻译

开展大规模汉英双语语料库的 集成加工方法和加工平台研究,探索双语(多语)词典的自动编撰方法;

开展多种技术相融合的 自动机器翻译方法研究和计算机辅助翻译方法研究;

面向互联网络的多语言 处理技术研究,特别是翻译技术的研究。

研究团体:

中文计算基础理论与模型 :

学术带头人:沈阳,詹卫东

学术骨干:陆俭明,袁毓林,郭锐,周晓林,朱彦,吴云芳,董秀芳

国家语言资源整理和语音数据库建设 :

学术带头人:陈保亚,孔江平

学术骨干:王洪君,李小凡,项梦冰,汪锋,段慧明,张化瑞,胡俊峰

大规模多层次语言知识库构建的方法 :

学术带头人:穗志方,袁毓林

学术骨干:俞士汶,王洪君,郭锐,刘扬,朱学锋,段慧明,吴云芳,赵东岩

海量文本内容分析及动态监控 :

学术带头人:孙斌,王厚峰

学学术骨干:李素建,胡俊峰,周晓林,杨建武,万小军 ,赵东岩 ,苏 祺

多语言信息处理和机器翻译技术 :

学术带头人:王厚峰,常宝宝

学学术骨干:俞士汶,王逢鑫,胡壮麟,詹卫东,张化瑞,俞敬松,刘扬,何卫,万小军,苏 祺

客座研究人员:

黄居仁 香港理工大学教授

刘群 中科院计算所研究员