基于Web的中英术语翻译获取方法研究

2010年4月第27卷第2期沈阳航空工业学院学报

JournalofShenyangInstituteofAeronauticalEngineeringApr.2010Vo.l27 No.2

文章编号:1007 1385(2010)02 0055 04

基于Web的中英术语翻译获取方法研究

董燕举

1,2

白 宇 蔡东风

11

(1.沈阳航空工业学院知识工程中心,辽宁沈阳 110136;2.沈阳航空工业学院计算机学院,辽宁沈阳 110136)

摘 要:从Web双语资源中获取术语翻译具有很大应用价值。从实用化术语翻译角度出发,设计了一个基于Web的中英术语翻译系统。该系统使用Google搜索引擎,通过关键词扩展技术搜索词汇表类型网页,从其搜索结果摘要中抽取术语翻译。实验结果表明系统取得良好性能:TOP1的正确率达到90.9%,TOP3的正确率达到95.4%。

关键词:术语翻译获取;Web信息抽取;术语翻译;信息检索;Web挖掘中图分类号:TP391

文献标识码:A

当今科学技术发展日新月异,每个学科都拥

有大量专业术语。术语是表达一个专业领域知识的核心词汇。术语翻译是将一种语言术语翻译为另一种语言的等价词汇。科技文献翻译要求专业性和准确性,术语翻译成为其核心问题和难点问题。

术语翻译最简单的方式是直接查找各种专业词典。但专业词典的词汇量总是有限,特别是不能及时吸纳补充新术语,造成大量未登录术语词汇。而当前Web是世界上最大的动态知识库和信息库,其中存在大量术语词汇双语资源,如在线双语词典、双语对照词汇表、双语对照网站等。因此可以利用Web上双语资源进行术语翻译,将术语翻译问题转变为在Web中获取对应目标语言翻译的过程。其研究目标是给定一个源语言术语,在Web中获取其对应的目标语言术语。例如对一个中文术语 母线槽 ,中英术语翻译过程即是在Web中搜索并获取它的对应英文术语 busduct 。基于Web的术语翻译获取技术研究涉及信息检索、信息抽取、自然语言处理等多个研究领域,在辅助机器翻译、跨语言信息检索、领域双语词典构建等领域中都具有重要应用价值。

各种语言学习网站和专业网站存在大量专业双语词汇表网页(本文简称词汇表网页),如图1所示。词汇表网页中的双语词汇一般属于特定专

收稿日期:2010 01 07

基金项目:辽宁省自然科学基金(20062006);辽宁省高校创新团队支持计划项目(2007T140)

作者简介:董燕举(1973 ),男,硕士,讲师,主要研究方向:信息检索

基于Web的中英术语翻译获取方法研究

,E-mai:l163.。

业领域,包含很多专业新术语和惯用语,因而具有

专业性、时效性、高质量等特点,是优质的专业双语词汇资源。本文设计了一个基于Web的中英术语翻译获取系统,该系统使用了基于搜索词扩展的定位搜索技术,利用Google搜索得到包含术语翻译的词汇表类型网页摘要,直接从网页摘要中获取术语翻译。该方法抽取模式设计简单,而且不用下载每个网页,处理效率较快,所获取的术语翻译质量较好。实验表明该系统取得了良好的翻译正确率。另外,尽管本文论述的是中英术语翻译获取问题,实际上该方法同样可应用于其它语种的术语翻译获取。

图1 机械专业中英词汇表网页示例

1 相关研究

基于Web术语翻译实质上是从Web的双语资源中获取术语对应的翻译项,其研究包含两个关键问题:(1)术语翻译获取来源定位问题,即找

Word文档免费下载Word文档免费下载:基于Web的中英术语翻译获取方法研究 (共5页,当前第1页)

你可能喜欢

  • 技术认证
  • 翻译术语
  • 专利要求
  • 专利翻译
  • 文言文翻译方法
  • 合同翻译方法
  • 成语翻译方法
  • 翻译的基本方法

基于Web的中英术语翻译获取方法研究相关文档

最新文档

返回顶部