热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

自然语言处理(机器翻译IBM模型系列)

机器翻译方法概述直接转换法基于规则的翻译方法基于中间语言的翻译方法基于语料库的翻译方法-基于事例的翻译方法-统计翻译方法-神经网络机器翻译基于规则的翻译过程分成6个步骤:(a)对源

机器翻译方法概述

  1. 直接转换法
  2. 基于规则的翻译方法
  3. 基于中间语言的翻译方法
  4. 基于语料库的翻译方法
    - 基于事例的翻译方法
    - 统计翻译方法
    - 神经网络机器翻译
基于规则的翻译过程分成6个步骤:

(a) 对源语言句子进行词法分析
(b) 对源语言句子进行句法/语义分析
© 源语言句子结构到译文结构的转换
(d) 译文句法结构生成
(e) 源语言词汇到译文词汇的转换
(f ) 译文词法选择与生成
自然语言处理(机器翻译IBM模型 系列)
自然语言处理(机器翻译IBM模型 系列)
自然语言处理(机器翻译IBM模型 系列)
自然语言处理(机器翻译IBM模型 系列)

对基于规则的翻译方法的评价:

优点:
可以较好地保持原文的结构,产生的译文结构与源文的结构关系密切,尤其对于语言现象已知的或句法结构规范的源语言语句具有较强的处理能力和较
好的翻译效果。
弱点:
规则一般由人工编写,工作量大,主观性强,一致性难以保障,不利于系统扩充,对非规范语言现象缺乏相应的处理能力

统计机器翻译

自然语言处理(机器翻译IBM模型 系列)

噪声信道模型

一种语言T 由于经过一个噪声信道而发生变形,从而在信道的另一端呈现为另一种语言 S (信道意义上的输出,翻译意义上的源语言)。翻译问题实际上就是如何根据观察到的 S,恢复最为可能的T 问题。这种观点认为,任何一种语言的任何一个句子都有可能是另外一种语言中的某个句子的译文,只是可能有大有小[Brown et. al, 1990]。
自然语言处理(机器翻译IBM模型 系列)
自然语言处理(机器翻译IBM模型 系列)
自然语言处理(机器翻译IBM模型 系列)

统计翻译中的三个关键问题:
(1)估计语言模型概率 p(T);
(2)估计翻译概率 p(S|T);
(3)快速有效地搜索T 使得 p(T)×p(S | T) 最大

自然语言处理(机器翻译IBM模型 系列)
自然语言处理(机器翻译IBM模型 系列)


推荐阅读
author-avatar
福田商务汽车-日照方傲
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有