机器翻译技术与应用
2022-02-21 21:29:23 0 举报
AI智能生成
计算机辅助翻译基础
作者其他创作
大纲/内容
人工智能与机器翻译
人工智能
三个层次
计算智能
感知智能
认知智能
三个支柱
数据——大数据
算法——深度学习,人工神经网络
计算能力——云计算
应用
字符识别
语言识别
视频识别
图片识别
智能检索与决策
智能机器人
影响
市场格局
生产方式(人机交互、云服务)
专业能力(语言、翻译、技术、管理、营销)
学科建设(学科方向、发展层次、学科队伍、人才培养)
机器翻译
利用计算机软件实现不同语言之间的全自动翻译技术
大数据翻译任务的唯一解决方案
机器翻译的典型应用场景
网页信息浏览
浏览器翻译插件
跨语言搜索
实时口译
旅游口译
会议口译(同传)
跨境电商/社交
商品介绍
用户评论浏览
跨语言自动客服
跨语言商品搜索
国际化企业
技术/产品/服务推广
语言服务企业
把机器翻译插件运用到CAT工具中
在线云端、私有定制
机器翻译的主要方法
基于规则(形式if...,then...)
优点
直观
便于处理复杂结构和进行深层次理解
不依赖于具体的训练语料
缺点
主观因素强
覆盖性差
规则之间冲突
开发成本高
基于语料库
基于实例翻译
基于翻译记忆
优点:翻译质量有保证
缺点:100%匹配及高相似概率很低
基于模板
通过泛化例句得到模板
利用模板翻译新句子
统计机器翻译
原理
利用机器学习技术,大规模从平行语料库中自动学习翻译知识
优点
可解释性高
模块添加方便
错误易追踪
缺点
数据稀疏
对复杂结构无能为力
依赖先验知识
神经机器翻译
优点
考虑上下文语义,译文流畅
缺点
没有理解语言
漏译
术语误译
指代关系错乱
原理
神经语言模型
预测出现可能性最高的词
循环神经网络
分布式表征(数字表示词)
词向量
计算词与词之间的相似度
计算同义概率
训练难度大
不完全正确
神经机器翻译
编码器-解码器
注意力机制(优先计算哪些词)
0 条评论
下一页