将本站设为首页
收藏文学官网,记住:www.wxhqjs.net
账号:
密码:

文学书院:看啥都有、更新最快

文学书院:www.wxhqjs.net

如果你觉得好,恳请收藏

您当前的位置:文学书院 -> 科技入侵现代 -> 第67章 你们能比我更懂机器翻译(5k)

第67章 你们能比我更懂机器翻译(5k)

温馨提示:如果本章属于内容错误等情况,请点击下面的按钮发送报告,我们会在一分钟内纠正,谢谢

  我们先来谈优化算法和规则设计。

你们一直的问题在于,你们对于规则集的扩张没有引入更加细化的句法规则。

因为存储有限,你们觉得扩充对照词汇库就够了。

实际上句法规则显得更加重要。

你们需要做到,引进常见的高频句型。

对上下文进行依赖处理。使词汇翻译考虑前后词,通过有限的上下文窗口来减少歧义。

比如свет同时有光和世界的意思。

这个完全可以根据前词判断是光还是世界。”

沃森弱弱提醒道:“教授,你还会俄语啊?”

林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?

我同时会俄语、德语、英语和汉语。”

多语言大师的身份,给林燃的理论增添了几分可信度。

在这个时代,科学家们会几门语言并不奇怪。

当然一些敏感部门会提高对你的怀疑。

以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。

“另外翻译过程,应该是模块化设计,而不是简单的映射关系。

它应该分成预处理、翻译、后处理三部分。

预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。

这样来降低单次计算的复杂度,提高规则的复用率!”

林燃的话给了在座研究团队的成员们非常多的灵感。

就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。

大家都有点迫不及待去尝试了。

所有研究人员都疯狂在笔记本上记录下林燃所说的。

虽然不确定教授的方法是否管用,但有路总比之前没有好。

再者,如果你不好好记下来,到时候被开除只是教授一句话的事。

“好了刚才我们讲了一些简单的内容,现在才是最难的。

因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。

我把它叫做基于频率的词对齐。

这也是我们引入统计模型的核。

我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。


  本章未完,请点击下一页继续阅读!

看了《科技入侵现代》的书友还喜欢看

苦境:今天世界毁灭了吗
作者:海客无心随白鸥
简介: 什么叫我今天毁灭世界了吗?今天世界毁灭了吗?受不了了,跟你们爆了!

更新时间:2025-12-16 00:05:00
最新章节:第一百四十六章:请神容易送神难
虎贲郎
作者:中更
简介: 董卓之后,三辅大乱天子蒙尘,勤王志士汇聚雒都残垣断壁之中,肉食者鄙拔剑四顾,国贼凶狠...
更新时间:2025-12-16 03:07:00
最新章节:第835章 林间亡魂
重活一次我要选择自己的人生
作者:提笔圈地
简介: 农家子李毅飞,前世浑噩如泥,重生2005,竟得“过目不忘”的能力!

更新时间:2025-12-16 03:02:31
最新章节:第 529 章 你让一个处长去管副部的事
抢我功绩?大妖压境你们哭什么?
作者:水兔儿
简介: 李未央重生了。重生到了自己十七岁,被家人第一次索要军功的时候。

...
更新时间:2025-12-16 00:01:00
最新章节:第四十三章:真话假话,并不重要
少将军,今日份暗杀请查收
作者:墨染尘笺
简介: 重生归来,她要复仇!可,傲娇疯批少将军却自我攻略,骤变粘人小奶狗。

更新时间:2025-12-16 00:04:00
最新章节:第九十三章 调虎离山
六年后,我携四个幼崽炸翻前夫家
作者:相思一顾
简介: 外界传言,南知意不孕不育,婆婆嫌弃,因此成为帝家弃妇。谁知六年后,她携崽回归,惊艳众...
更新时间:2025-12-13 02:03:55
最新章节:第2845章 有意为之