TechWeb报道9月1日消息,据科技博客techcrunch报道,我们每天都在使用不同的技术,但却不知道它们的工作原理。事实上,了解机器学习引擎并不容易。今天,谷歌在iResearch博客发布了一篇有趣的文章,详细介绍了机器翻译的一些问题的性质及其解决方案。
机器学习已被证明是一个非常有用的翻译工具,但它有个弱点。翻译模式逐字逐行的翻译倾向是其中之一,这可能导致严重错误。
Jakob Uszkoreit在公司的自然语言处理部门解释了这个问题。比如,下面这两个句子:
我过街后就到了银行(bank)。
我过河后就到了岸边(bank)。
显然,“bank”是指每句话都有不同之处,但是,逐字翻译的算法可能很可能挑选错误的含义——因为它不知道哪一个“bank”是正确的,除非它能看到句子结尾。你稍加留意就能发现,这种歧义随处可见。
谷歌的解决方案是所谓的关注机制,也就是说在翻译软件中内置一个名为“变压器”(Transformaer)系统。它将句子中的单词逐一进行比较,以确定它们之间是否以某种关键方式相互影响——例如,看“他”或“她”是否在说话,或者像“银行”这样的词是否以特定的方式表示。就像下面这个动图:
当翻译的句子正在构建时,关注机制将每个单词随附到每个单词之间进行比较。
据此前报道,谷歌翻译的竞争对手DeepL也在使用关注机制。该公司称,自己所研发基于神经网络的DeepL Translator翻译结果要优于微软和谷歌,当用户输入文本的时候,DeepL的人工智能能够捕捉最细微的差别,而且有别于其他服务的是在翻译中会尽可能的还原和模仿。
但有趣的是,谷歌可以让人们有机会看到系统的运作原理,Transformer给每个词提供一个与其他单词相关程度的得分,你可以看到它认为哪些是相关的词,哪些是潜在相关词。(yoyo)
新闻热点
新闻爆料
图片精选