枫林在线论坛精华区>>技术交流
[145304] 主题: BABELCODE 方案简介
作者: leaflet (Leaf)
标题: BABELCODE 方案简介[转载]
来自: 61.129.*.*
发贴时间: 2004年01月04日 22:47:47
长度: 6957字
(原文出处 http://www.babelcode.org/doc/intro_cn.htm)

BABELCODE 方案简介

创作可机器翻译的内容

http://www.babelcode.org

 

姚子渊 (info@babelcode.org)

复旦大学计算机系本科一年级生

2003 年 12 月 13 日

 

目录

概览与演示

作者与读者预备条件

翻译流程

集成创作环境与源脚本语言

       创作概览

       解析式构建 (自由发挥)

       使用宏 (固定的模板)

巴别代码 (BabelCode): 为可机器翻译内容设计的编译格式

词典

翻译引擎

 

概览与演示

目前机器翻译和计算机辅助翻译的理论和实践存在严重问题:

l       分析型与统计型机器翻译方式产出令人误解和不舒服的结果,主要归因于完美的歧义剔除是不可能的。所以它们对于行业级强度的应用是不合格且不可靠的。

l       计算机辅助翻译牵涉到真人翻译员并且对多语言译本需要额外的努力,造成巨大的费用、时间和真人翻译失误的风险。

在 BabelCode 方案里,我提出一系列的方法,它们可以使作者能直接创建可机器翻译的内容,并保证翻译的正确性、有效性和可读性,外加一个好处:你可以自动由单个源文件得到多语言译本。

 

在这里你可以检视模拟使用我的系统得到的翻译样例:

1.    Oh, say can you see by the dawn's early light

What so proudly we hailed at the twilight's last gleaming?

哦,看,你可以借助拂晓初期的光,看见我们如此骄傲地、向黎明最后的泛动致敬过什么吗?

 

2.        更多的例子将在这里补充…

 

作者与读者预备条件

要求作者掌握他的母语(读和写)、基本语法分析能力和一种源脚本语言。不要求他掌握任何外语。

 

要求读者掌握他的母语(读)。不要求他掌握任何外语。

 

翻译流程

想写什么

(1. 作者、IAE 和词典) à

源脚本文件

(2. IAE) à

BabelCode 文件

(3. 翻译引擎和词典) à

为读者准备的目标语言版本
 

关于这三个过程的注释:

(1)   作者通过一个集成创作环境 (IAE) 和一个或多个词典,创建一个源脚本文件。

(2)   IAE 自动把源脚本转换成一个 BabelCode 标准格式文件。

(3)   某个翻译引擎 (TE) 根据这个 BabelCode 文件以及它用到的词典,翻译出需要的目标语言版本。

 

如你所见,人工干预仅仅在创作过程(第 1 步)中涉及。

参见这些涉及到的关键部件: IAE, 词典, 源脚本, BabelCode, 和 翻译引擎.

 

集成创作环境与源脚本语言

集成创作环境 (IAE) 和源脚本语言是直接跟作者打交道的用户接口(界面)。

 

IAE 是一个提供作者编写源脚本的环境的软件程序。IAE 还能自动把源脚本转换成 BabelCode 文件。

 

源脚本并不是一种单一格式,而是对任何作者用来表达意念的用户脚本语言的通称。而 BabelCode 是一个编译后的、被所有翻译引擎识别的标准格式。源脚本和 BabelCode 的关系好比 Pascal / C 源文件和机器码的关系 
========== * * * * * ==========
返回