• 智能翻译解决方案提供商
    memoQ中国区销售服务商

memoQ量化翻译质量

用memoQ量化翻译质量 | 编辑时间和编辑距离报告

您有一个项目,其中既需要翻译新的内容,又有校对之前的译文,那么,改如何衡量工作量呢?
审校者完成这份审校任务到底花了多少时间、修改了多少内容呢?如果初始文档已经用MT(机器翻译)完成,那么机翻的质量到底好不好呢?
memoQ中,您可以通过两份报告,帮助您轻松衡量以上这些问题!
我们以一个真实案例来展示在memoQ中是如何处理这个问题的。
Trent Gamblin是一位游戏开发商,他请Michał Tosza(英语-波兰语译者,memoQ培训师,游戏本地化专家)为他的游戏Monster RPG 2新版本翻译和审校。
以下是由memoQ生成的一份自动化质量检查报告的截图:
通过这份报告,提示了许多译文质量问题,比如译文不一致、拼写错误、未翻译句段等等。那么这次翻译的工作量到底有多大呢?
Michał Tosza表示,有了memoQ的帮助,不仅可以提供时间跟踪报告(即完成工作所耗费的时间成本),还可以提供编辑距离报告(即修改单词、句段数量等报告)。
Michał Tosza以这次翻译任务为例,在下文中详细展示描述memoQ的这两个功能,让您可以轻松衡量审阅专家在审校时花费的时间和完成的工作量,也能让更好地了解他们的工作。

时间跟踪

作为甲方,从memoQ中获得时间跟踪报告,可以导出为Excel文本,显示完成工作所花费的时间:“审校此翻译所用时间为6小时35分35秒”。

1.首先,审阅专家在memoQ的界面中点击选项(Option)按钮———多种选项(Miscellaneous)按钮———编辑时间(Editing time)中勾选“我工作时记录编辑时间”(Record editing time when I am working) ,来打开编辑时间功能。
memoQ还可以设置停止记录工作时间前休息的时间长度。一般设置成5分钟比较合适。如果审阅专家暂停工作,这个设置可以防止记录无效的工作时间,比如想去喝杯咖啡后再回来继续工作,但还开着memoQ工作界面,有了这个设置,这些时间就不会被记录在内。但是需要注意,有时候处理很长的字符串,阅读修正要花上好几分钟,所以不要把这个时间间隔值设置得太小!
然后,单击确定,如下图:
2.现在切换到项目概览(Overview)部分,然后单击报告(Reports)选项。审阅专家可以自定义设置,选择跟踪编辑的句段、字或者字符。
然后,打开编辑器开始审校吧。在每个已确认的句段页面下方,memoQ会显示编辑该句段所花费的时间。
注意:如果要跟踪编辑时间,审阅专家要么在memoQ中切换为“审校者”身份再开始工作,要么以“译员”身份进行,但是在这种情况下,不论有没有做修改,都要手动确认每一句段。

3.完成审校后,就可以获得报告了。

1)返回项目主页(Project home——概览(Overview),然后单击报告(Reports)选项
2)在底部的编辑时间选项中单击创建报告选项。

3)跳出“创建编辑时间报告”对话框。

(1)可根据提示自定义设置,比如字符数是否要包含空格。
(2)可选择用memoQ的字数统计方法。但是memoq也提供更加人性化的服务,如果您之前习惯于使用TRADOS 2007,也可以选择使用该TRADOS 2007的字数统计方法。
(3)校对标签可能非常耗时,所以它们也应归为审阅专家审校工作的一部分,这里可以设置一个标签包含的单词数和字符数。经常会有一些校对混乱的标签让Michał Tosza非常头疼有了这个设置,他的工作量得以恰当衡量。
完成设置后,单击“确定”。

4.导出报告

  • 编辑时间(Editing time):在结算时,为您和您的审阅专家/供应商提供工作时间依据。
  • 每小时的字数(Words per hour):代表了审阅专家的工作速度。速度受文本类型、初译的译文质量等因素有关。对于客户来说,这项统计便于您了解审阅专家的审校速度,有了这个作为参考,如果再有一份大量冗长的工作需要审阅专家帮助完成,就可以估算出他们大概需要花费多少时间。

5.浏览完所有数字后,单击“导出”,以CSV格式保存报告。

memoQ是一款功能强大的多语言管理系统,无论是机器翻译还是人工翻译,它都支持跟踪编辑时间。如果有译后编辑工作,您可以要求审阅专家提供编辑距离报告(或者编辑时间和编辑距离两份报告都要)。编辑距离报告可以让您评估初译或者机器翻译的译文质量。报告显示改动的地方越多,就意味着译文的质量越差,这也为机器翻译工程师在调整MT引擎时提供了依据。

编辑距离统计报告

简单来说,编辑距离意思是“为得到更佳译文,需要修改多少单词和短语”。

您可能想知道审阅专家在译后编辑时:
  • 所编辑的句段数;
  • 所修改的字符数;
  • 规范化的编辑距离的概念。

即审阅专家编辑所花费的时间,更改了多少地方, 机器翻译引擎的质量等等。
1.正常导入已翻译的双语文档。
2.导入句段时,把它们都设置成“已编辑”状态,然后开始审校。

3.完成后,转到项目主页(Project home)——翻译(Translations )——右键单击历史(History/Reports)

4.“Minor versions of the document for major version 1”窗格中“1.0”代表初始的译文版本,“current”代表您修改后的译文版本,按住Ctrl分别单机这两个版本可以进行比较。
单机最下方“ Calculate edit distance可以获得编辑距离报告
5.在“ 编辑距离统计 ”选框中,记得在“字数统计”中勾选“memoQ”,在距离衡量标准中选择“Levenshtein”。(当然,您也可以选择另一个,)单击“计算”。
底部的窗格会显示您需要的信息:
  • 已编辑的句段(Edited Segments):表示所编辑的句段数量。在句段里添加或删除空格都会包括在内。
  • 绝对编辑距离(Absolute edit distance):表示已更改的字符数。任何更改都会计算在内,比如添加、删除、替换等。
  • 标准化编辑距离(Normalized edit distance):这里是一个0到1之间的数字。“0”表示整个文本都没有修改,“1”表示整个文本都修改了。修改的地方越多,这个数值越接近1。
关于“Levenshtein”(来自维基百科)莱文斯坦距离,又称Levenshtein距离,是编辑距离的一种。指两个字串之间,由一个转成另一个所需的最少编辑操作次数。允许的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
以下是一个来自维基百科的例子:
单词“kitten”和“sitting”之间的距离是3,因为只有以下三次编辑才是将kitten更改为sitting的最少操作次数:
kitten→ sitten(用“s”代替“k”)
sitten→sittin(用“i”代替“e”)
sittin→sitting(在末尾插入“g”)。
这三次编辑操作次数就代表这次Levenshtein距离为3
6.导出并以HTML格式保存报告(HTML格式比CSV格式更直观清晰)。

大功告成,审阅专家就可以把这份文件发送给您了!有了上文的解释,相信您对这些数字代表的含义了解更多了一些。

当今,随着翻译技术发展,虽然机器翻译给审阅专家带来了危机感,但是却极大增多了就业机会,译后编辑的需求正不断增大。memoQ作为一款技术领先、功能强大的多语言管理系统,为审阅专家提供了良好的工作环境。上面讨论的两份报告在当今翻译行业中非常有用,既为审阅专家提供了工作量依据,又满足了用户的要求。