当前位置:主页 > 图片新闻 >
图片新闻
  • 同声传译翻译软件可以取代人
  • 本站编辑:小编发布日期:2019-02-01 23:20 浏览次数:
同声传译翻译软件可以取代人
作者:编辑部
模仿只能在单调的水平上重现习惯,因此模仿声音不能以错误的方式完成。它应该只能创建七个图像。
10月25日,研究总监和微软的里克·莱斯特微软研究院博士,微软公布的最新研究成果在天津举行的“二十一世纪的计算机会议”。与此同时,一个美丽的模型,用于绘制世界“通过语言无语言交流”。
一个惊人的40年吸引同声传译美国科幻电视连续剧“星际迷航”中,有一个非常“令人吃惊”的工具,叫做翻译的宇宙。
星际舰队成员将其放在胸前徽章上,整个星空联盟广泛用于将所有已知语言翻译成听众可以理解的语言。其余的未知语言也可以通过几个句子进行分析。转换。
根据作品的构成,宇宙译者直到22世纪才会被发明。
然而,在休息的想象力,这种翻译的出现,可能不用等那么久,他最近指出,“同声传译”是宇宙翻译的一个重要环节。
在这个十分钟的演示中,Rest以中等速度讲英语。他身后有两个巨大的屏幕。
观众看到其中一个屏幕用英文文字显示他们的单词,速度只比他们的声音慢0.5秒。
在其他屏幕,通过提取相当于中国的话,英文文本的字上半部分,已经在中国的句子按照中国字的下部的顺序排列。
而最激动人心的时刻到来了。翻译的中文短语以标准中文的形式“说出”。声音与Rest非常相似,速度基本上是当我用英语说话时,机器将“通过说”模拟声音的中文翻译,莱斯特他似乎正在自己做同声传译。
他说,微软的同声传译可以翻译26种语言,如西班牙语以及英语和中文。
实验室尚未离开实验室,但未来可以进行同声传译。有些人甚至大声说那些正在学习翻译的人并没有失业。
对单词感知的看法是什么?华丽演示的第一步是使用计算机识别Rest的英语演讲,但这可能是最困难的一步。
根据莱斯特,第一语言识别使用简单的图案比较,并且该计算机尝试以匹配已知的检查由语音产生的波形的特定字,并且是相关的。
但是,这种方法的失败率太高。
从1970年代到1980年代,隐马尔可夫模型(HMM)被广泛使用。他使用来自几个人的训练数据来创建更强大的语音统计模型,并成为语言识别的主流。
“即使在今天,即使使用最好的语音系统,任何语音中每个单词的错误率都会高达20%到25%。
“其他人说。
“两年前,多伦多大学和多伦多大学的研究人员,利用一种称为深层神经网络,技术是模仿人类大脑的行为。”相比,语音错误率减少了30%欲我做到了。以前的方法
也就是说,上述四个或五个单词中的一个有错误,并且有7或8个单词有错误。
虽然没有透露技术细节,潘洁林副研究所中国社科院声学实验室声学研究所的,这种技术仍然使用网络,而不是基于的HMM框架他说。神经细胞模拟语音特征的分布,8到90,在这个时代有用。
计算能力得到改善,模型可以更加详细和“更深”。
该方法的准确性与数据的积累有关。黄联生,谁是清华大学的计算机科学教授告诉记者,电脑了解更多的信息,说得更变得聪明起来,并学习更多的数据。这是“机器学习”,但机器学习仍然有限。
从这个意义上讲,潘杰林也同意:“如果针对人们的”学习“进行优化,语言识别的表现将会大大提高。“
是否可以用人工翻译取代机器翻译?
说话人的语言是公认的,翻译英语的方法也是一个大问题。
根据数据,近几十年来,由于机器翻译质量问题,它不是翻译的主流。
我们经常使用软件翻译页面,由此产生的文本混乱是显而易见的。
Rester说他的演示需要英文 - 中文翻译中的两个步骤。
“第一步是提取我所说的单词并找到相应的中文,这不是简单的,而是一个相对简单的步骤。”
第二步是重新调整词序以符合中国习俗。这是正确翻译语音的重要一步。“
哈尔滨工业大学机械智能与翻译实验室的曹海龙研究员宣布了Restan同意当前机器翻译方法的程序。
困难在于翻译的选择和顺序。不同的语言有不同的词序。单词可以翻译成另一种语言,并且可以存在多个候选翻译。因此,机器翻译结果偶尔会充满空白。
用于提高准确性的现有方法基于统计。莱斯特也承认,微软的同声传译在文本中有很多错误,翻译结果可能非常有趣。
但他表示,统计方法和大数据的引入会给文本的翻译带来巨大的变化。
但是,黄连生并不那么乐观。
由于在特定字段字义有明确的规定,与由经济字段80%的法律,或者它可以实现90%的准确度,精度更高的在机器翻译某些区域我认为它会被获得。
在一般领域,机器翻译的准确性不是很高,这取决于人的翻译经验。
模仿需要多少钱?
“几年后,我想跨越人们之间的语言障碍。”当Rester用英语说这句话一段时间后,微软的同声传译员回应了他在中国的声音我说了一句话。
听证会的观众发出了热烈的掌声。
事实上,如果说话者的声音存储在翻译中,那么沟通会更加流畅。
莱斯特先生还表示,他不能说他自己的声音中国人“说话”,中国不能将是他真正令人兴奋的。
他说,为了达到这个效果,需要一个包含数小时中文讲话的语音合成系统。
另外,我录制了一小时的英语语音数据,提取了我的声音属性,最终得到了说中文的效果。
潘杰林说,这是一种定制的语音合成技术。
一般情况下,机器正常,但也足以模仿的两个固定的男性和女性的声音,让特殊的人的模仿,让您的语音数据,节奏的声音有必要提取相关特征的参数。频率和音调也是基本频率,例如技术术语。
调整合成系统可以生成模拟声音。
然而,黄连生认为,欺骗不能以错误的方式进行,因为模仿只能在单调的水平上重现习惯。
例如,你可以自己动摇独自行走的习惯来模仿你自己的行走,一步一步,左右两边的大小。
但是,人们谈论的信息太多了。从理论上讲,可以分析节奏和频率,但仍然不可能完全量化技术。