一、对我国几种机器翻译软件译文质量的测评(论文文献综述)
张法连[1](2021)在《从《民法典》英译看法律翻译质量管控体系建构》文中指出《民法典》英译是我国法治进程中具有里程碑意义的大事,是贯彻落实习近平法治思想的重要举措。分析评估《民法典》翻译过程和英译本质量发现,法律翻译过程是系统工程,翻译质量受译员水平、组织管理、资源协调等关键因素制约。完善国家法律翻译实践体系顶层设计,加强法律翻译组织管理,注重法律翻译新兴交叉学科建设迫在眉睫。法律翻译是国际传播能力建设的重要组成部分,是中国法治域外传播的关键路径。加强法律翻译质量管控体系建构研究,对促进法治中国域外传播,推动构建人类命运共同体建设,意义重大,影响深远。
阳琼[2](2021)在《在线翻译质量文类差异:基于人工测评的比较分析》文中指出近年来,百度、谷歌、有道、搜狗相继推出自主研发的神经网络在线机器翻译系统,"同一类型文本译文质量是系统A还是系统B好"成为业内外人士关注的热点问题,分文类在线翻译质量评测的现实紧迫性已然凸显。本研究设计基于文本类型的在线翻译质量评测标准,从忠实度、可懂度、文类辨识度和文本功能效度四个维度对主流在线翻译系统展开汉译英质量评测,发现搜狗翻译的表情型、信息型文本译文质量最优,而百度翻译的呼唤型文本翻译质量最佳。搜狗、百度、有道翻译汉译英质量已超越谷歌翻译,但其译文文本功能效度仍有较大提升空间。有主旨阅读需求的大众用户可据此研究结果,分文类选择搜狗翻译或百度翻译进行主旨翻译;译者可分文类在线初译,重点针对译文可懂度和文本功能效度进行译后编辑;研发者亦可分文类进行机器翻译系统训练,向专业化垂直在线翻译平台发展。
陈小花[3](2021)在《古文今译理论研究百年史》文中进行了进一步梳理
白明骏[4](2021)在《面向司法文书的文本智能纠错与质量估计方法研究》文中研究表明
阮佳佳[5](2021)在《目的论视角下《中华锦绣:贵州蜡染》(节选)翻译实践报告》文中进行了进一步梳理
于倩[6](2021)在《《中华人民共和国电子商务法条文释义》(节选)英译实践报告》文中研究说明
赵文轩[7](2021)在《机器与人工俄汉模拟交传比较分析报告 ——以“2019普京连线”为例》文中研究说明近年来,人工智能产业备受国家的关注和政策支持。而机器翻译作为人工智能的一个重要分支也获得了飞速发展,开始在各个领域为人们提供翻译服务,造福更多人群。作者以百度翻译与谷歌翻译的手机端软件为研究对象,创新性地将其应用于俄译汉交传翻译实践,并将同一翻译素材进行了人工俄译汉交传翻译。然后,作者从交传翻译活动进行的必要条件、过程、译出语三个维度,将机器翻译与人工翻译做了对比分析,对机器翻译的优缺点进行了归纳总结,并针对机器翻译在本次实践过程中暴露的缺点提出了对应的改进建议。最后,作者对机器翻译的未来进行了展望和思考。该报告对进一步提升机器俄译汉交传翻译质量具有借鉴意义,该实践有助于提高翻译行业从业者和研究人员对机器翻译的认识,为机器翻译领域的研究提供一定可借鉴的经验和方法。机器翻译凭借与译员迥然不同的翻译形式和众多优点使作者认为:机器翻译在未来的某些领域可以完全替代译员。这是挑战,更是机遇。应该利用好这一机遇,使机器翻译代替译员的部分体力和脑力劳动。高校或其他翻译人才培养单位应与机器翻译制造企业扩大合作,形成产学研一体化发展,及时了解机器翻译发展进度和社会对于高级翻译人才的准确需求。
段田园[8](2021)在《五款机器翻译译文质量评测 ——以四类文本翻译为例》文中研究表明自从机器翻译诞生以来,机器翻译能否取代人工翻译这一疑问一直存在,尤其是目前机器翻译正处于繁荣期。这一疑问促使学者对机器翻译的译文质量进行评测研究。但是,已有研究在评测对象和待测文本类型的选择方面具有一定的主观性,对机器翻译译文错误的分析方面也缺少一定的理论指导。随着网络技术的日益发展,利用网络来发布问卷利于研究者进一步了解机器翻译使用者的客观需求。另外,语言学也在不断地发展,在语言学理论的指导下,对机器翻译译文中存在的错误进行分类和分析,增强了评测结果的科学性。本文以五款机器翻译为研究对象,其中有道翻译、谷歌翻译、百度翻译和腾讯翻译君为调查问卷中96位使用者使用率最高的四款机器翻译,另一款机器翻译为Deep L,是目前流行且评分较高的机器翻译。四种待测文本为使用者常遇到的新闻、文学、经济和科技文本。在实证研究的过程中,采用五分制,选用可懂度和流畅性两个评测标准对20个译文进行打分。其次,以表格的形式对机器翻译的译文质量进行对比评测。在分析译文的过程中可以发现译文中存在各种各样的错误,在语言学“错误分析理论”的指导下从词汇、句子和其他三个层面对其进行分类,并选择典型例句进行具体分析。最后对错误产生的原因进行了深入剖析。此外,机器翻译译文质量评测研究的出发点是为了满足使用者的实际需求,因此结论中也指出了充分利用机器翻译的方法。研究发现,在英译汉翻译中,有道整体表现最佳,Deep L位居第二,百度次之,腾讯和谷歌表现最差。在翻译四个类型的文本时,机器翻译在翻译新闻文本时整体表现最佳,在翻译文学文本时整体表现最差,在翻译科技和经济文本时表现一般。而且译文中仍存在错误,词汇和句子层面的错误比较严重,其中语境分析和表达的地道性是机器翻译的难点。但是,就机器翻译的整体质量而言,机器翻译整体表现较为可观。本文最后指出对于机器翻译不能全盘否定,使用者可以通过译前编辑和译后编辑,同时使用多个机器翻译来充分利用机器翻译。
唐小雪[9](2021)在《汉维词语的人机翻译对比研究 ——以《习近平谈治国理政》为例》文中研究表明近年来,机器翻译随着计算机技术的不断发展,越来越多的被应用于汉维翻译中,在翻译界的重要作用日益凸显。本论文以公开发行的《习近平谈治国理政》(卷一、卷二)原文及维吾尔语版人工译本、在线翻译后的机器译本共三个文本,借Ant Conc3.5.8(windows)、Em Editor等软件工具,建立三语平行语料库并获取语料数据,通过分析人机两个维译本的语料数据,进行基于词语的人机翻译对比研究,一方面考察汉维语词类的人机翻译情况,一方面为汉维机器翻译提供改进意见,以期汉维机器翻译在未来得到更全面的发展。全文共分为六部分,引言介绍选题相关情况,并对现有机器翻译研究成果进行梳理综述。第一章是语料库的研制及数据分析,包括类符/型符、词性分布、词频以及平均句长,以此总结译本词汇特征。第二章从实词和虚词中挑选占比最大的8个词类,通过数据分析并结合实例探讨人机译本的翻译情况。第三章是以前文的数据作为支撑发现人机翻译在词语翻译时的差异主要体现在词语选择、词语形态及词类范畴三个方面。第四章是对机器翻译问题进行的探讨,总结出机器翻译具有过译、欠译、词序错误、选词错误及词形变化错误这5种错误类型,并根据本文反映出的问题为未来机器翻译提供了几点优化建议。结论部分概括总结全文。
刘丁[10](2021)在《基于迁移学习的低资源神经机器翻译方法研究》文中研究指明机器翻译是人工智能领域的重要课题,研究利用计算机实现一种自然语言到另一种自然语言的自动转换技术。随着深度学习技术的发展,神经机器翻译建模领域蓬勃发展,基于此的机器翻译模型成为极具挑战性的课题。目前神经机器翻译模型的性能严重依赖于平行语料库的质量与规模。然而当前高质量大规模的平行语料对绝大多数语言对来说十分有限,导致神经机器翻译模型在这些场景下的表现受到了一定的限制。本论文即选题于此,预期通过模型迁移和数据迁移达到提升低资源条件下的神经机器翻译效果。首先,本文阐述了神经机器翻译与迁移学习理论及其相关技术。对神经机器翻译进行论述,介绍了各种模型的优缺点,并选定Transformer神经机器翻译模型框架。针对低资源中英平行语料与藏汉平行语料,分别采用三千万中英平行语料、10万中英低资源平行语料与10万藏汉平行语料对Transformer机器翻译架构进行预训练,其中编码器解码器都由6个相同的隐藏层组成,模型参数的初始化由Transformer均匀分布完成,模型的训练采用Adam作为优化器。在此基础上加入BPE操作以避免未登录词影响,并采用Multi-bleu进行模型评估。随后,介绍了迁移学习的提出背景、定义以及常用分类,阐述了该技术在处理新领域训练数据不充足问题时的优越性,并逐一叙述了各类迁移学习适用的领域与优缺点。根据各种迁移学习方法适用性研究,确定选用模型迁移与数据迁移方法并进行方法实现。在模型迁移部分,将预训练模型效果较好的参数迁移至低资源中英、藏汉机器翻译模型训练中,从而达到知识迁移目的。模型迁移方法首先将三千万中英语料在Transformer翻译系统上进行模型训练并记录其最优模型参数,然后将其作为低资源中英与藏汉语料的初始化参数,最终达到减少训练时间与提升翻译效果的目的。数据迁移模型首先通过现有平行语料训练低资源汉语->英语、汉语->藏语翻译模型,然后将大规模的汉语单语数据输入系统进行back translation操作,以构造伪平行语料,获得伪语料后进行back translation循环操作,最后在低资源中英平行语料与藏汉平行语料上测评数据迁移效果并记录,循环一直持续到模型性能不再提升为止。实验结果显示,本论文提出的迁移学习方法对低资源神经机器翻译系统翻译效果有一定提升。基于模型迁移学习的低资源神经机器翻译模型在低资源的中英、藏汉翻译任务中分别提升了3.97和2.64个BLEU值,并缩短了训练时间;在此基础上,通过基于数据迁移学习方法进一步提升2.26和2.52个BLEU值。实验结果证明,本论文提出的迁移学习方法对低资源中英、藏汉神经机器翻译模型效果有一定的提升,但其翻译效果仍不足以满足人们日常交流需求,后续将继续展开工作,下一步会考虑融合其他数据增强技术与有针对性地改进模型来共同完成提升翻译效果。
二、对我国几种机器翻译软件译文质量的测评(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、对我国几种机器翻译软件译文质量的测评(论文提纲范文)
(1)从《民法典》英译看法律翻译质量管控体系建构(论文提纲范文)
一、立法文本的翻译质量评估 |
(一)立法文本翻译标准 |
(二)法律翻译质量的制约因素 |
二、《民法典》英译本质量简评 |
(一)译文商榷之处 |
1)“人格权”、“人民法院”的英译 |
2)单复数形式使用 |
3)前后表述一致问题 |
4)法律英语语言表述特点 |
5)法律英语惯用法问题 |
6)法律术语的移植问题 |
(二)翻译质量的制约因素 |
1)译者因素 |
2)组织管理因素 |
(三)翻译过程中的质量管控 |
1)译前管理 |
2)译中管理 |
3)译后管理 |
三、国家政府赞助法律翻译实属必然 |
四、法律翻译学科建设举足轻重 |
五、结语 |
(2)在线翻译质量文类差异:基于人工测评的比较分析(论文提纲范文)
引言 |
一、主流在线翻译系统 |
二、研究设计 |
(一)研究问题 |
(二)评测语料来源 |
(三)评价参数与评测标准 |
(四)评测小组构成 |
(五)数据收集与分析 |
三、分析与讨论 |
(一)表情型、信息型文本,搜狗翻译均为最优 |
(二)纯呼唤型文本,百度、有道各具优势 |
(三)信息+呼唤型文本,百度翻译最佳 |
(四)所有文类,谷歌翻译质量均最差 |
(五)本土平台,译文文本功能效度低 |
四、结论与建议 |
(一)分文类选择系统,提升主旨翻译效能。 |
(二)分文类在线初译,提高译后编辑效率。 |
(三)分文类训练系统,研发垂直在线翻译系统。 |
(7)机器与人工俄汉模拟交传比较分析报告 ——以“2019普京连线”为例(论文提纲范文)
中文摘要 |
Аннотация |
前言 |
第一章 机器翻译简介 |
1.1 机器翻译的发展 |
1.2 神经网络机器翻译 |
第二章 译前准备 |
2.1 了解交替传译任务 |
2.2 机器翻译系统的选择 |
2.3 机器翻译系统的调试 |
2.4 译员译前准备 |
2.4.1 2017年和2018年“普京连线”相关资料收集与交传训练 |
2.4.2 重点词汇准备 |
2.5 模拟交传的设备和环境准备 |
2.6 翻译时间和翻译形式计划 |
第三章 机器交传与人工交传对比分析 |
3.1 机器与人工交传的必要条件比较 |
3.2 机器与人工交传的翻译过程比较 |
3.2.1 语音拾取延迟 |
3.2.2 语音拾取中断 |
3.2.3 译后信息留存 |
3.3 机器与人工交传的译出语比较 |
3.3.1 语音和语速 |
3.3.2 译出语质量 |
第四章 翻译实践总结 |
4.1 机器俄汉交传的优点与不足 |
4.2 机器翻译的改进建议 |
4.2.1 优化语音识别录入功能 |
4.2.2 提升译出语文本的质量 |
4.3 未来展望和思考 |
4.3.1 机器翻译安全问题 |
4.3.2 机器翻译在俄汉口译领域的发展方向 |
4.3.3 机器翻译对翻译人才培养的影响 |
4.3.4 机器翻译的未来 |
结语 |
参考文献 |
致谢 |
攻读学位期间发表论文 |
附表:重点词汇 |
附录:原文/译文 |
(8)五款机器翻译译文质量评测 ——以四类文本翻译为例(论文提纲范文)
Abstract |
摘要 |
Chapter 1 Introduction |
1.1 Background |
1.2 Research Objectives and Significance |
1.3 Machine Translation |
1.4 Literature Review |
1.4.1 Research Status of Machine Translation |
1.4.2 Research Status of Quality Evaluation of MT Outputs |
1.5 Research Questions and Innovations |
1.5.1 Research Questions |
1.5.2 Innovations |
Chapter 2 Manual Evaluation of MT Outputs |
2.1 Questionnaire Results |
2.1.1 Five Machine Translations |
2.1.2 Four Text Types |
2.2 Evaluating Criteria |
2.3 Evaluating Process |
2.4 Evaluating Results and Its Analysis |
2.4.1 The Performance and Analysis of Each MT |
2.4.2 Overall Quality and Analysis |
Chapter 3 Error Analysis of MT Outputs |
3.1 Error Analysis and Its Application |
3.2 Detection of Errors |
3.3 Classification of Errors and Sample Analysis |
3.3.1 Lexical Errors |
3.3.2 Sentence Errors |
3.3.3 Other Errors |
3.3.4 Context Analysis |
3.4 Sources of Errors |
3.4.1 Great Differences Between Chinese and English |
3.4.2 Limitations of MT |
3.4.3 Limitations of Users |
Chapter 4 Conclusion |
4.1 Main Findings |
4.2 Limitations and Prospects |
Bibliography |
Appendix |
Acknowledgements |
(9)汉维词语的人机翻译对比研究 ——以《习近平谈治国理政》为例(论文提纲范文)
中文摘要 |
摘要 |
Abstract |
引言 |
一、选题背景及意义 |
二、研究现状 |
三、创新之处 |
四、研究方法 |
第一章 《习近平谈治国理政》平行语料库的建立及数据分析 |
第一节 版本选择 |
一、汉语版本 |
二、维语译本 |
第二节 平行语料库的对齐与研制 |
第三节 平行语料库的检索分析工具简介 |
第四节 《习近平谈治国理政》语料库数据分析 |
一、类符/形符比(TTR) |
二、词性分布 |
三、词频 |
四、平均句长 |
小结 |
第二章 《习近平谈治国理政》各类词语的人机翻译对比 |
第一节 实词的人机翻译对比 |
一、汉维实词翻译问题概述 |
二、各类实词的人机翻译对比探讨 |
(一)名词 |
(二)代词 |
(三)动词 |
(四)形容词 |
小结 |
第二节 虚词的人机翻译对比 |
一、汉维虚词翻译问题概述 |
二、各类虚词的人机翻译对比探讨 |
(一)介词 |
(二)副词 |
(三)助词 |
(四)连词 |
小结 |
第三章 汉维词类人机翻译的共性与差异 |
第一节 人机翻译的共性 |
第二节 人机翻译的差异 |
一、人机译本词语选择的差异 |
二、人机译本词语形态的差异 |
三、人机译本词类范畴差异 |
小结 |
第四章 《习近平谈治国理政》机器翻译问题探讨 |
第一节 机器翻译中的错误分析 |
一、过译 |
二、欠译 |
(一)隐化 |
(二)漏译 |
(三)缺失适应维语语法结构的词语 |
(四)缺失习惯性词语 |
三、词序错误 |
四、选词错误 |
五、词形变化错误 |
第二节 机器翻译的整体性效果评价 |
第三节 未来机器翻译工作的建议 |
小结 |
结语 |
参考文献 |
后记(致谢) |
读硕期间发表的论文目录 |
(10)基于迁移学习的低资源神经机器翻译方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 研究目的和意义 |
1.3 问题定义和分析 |
1.4 国内外研究现状 |
1.4.1 国内研究现状 |
1.4.2 国外研究现状 |
1.5 论文章节概要 |
第2章 相关理论技术 |
2.1 机器翻译技术 |
2.2 神经机器翻译 |
2.2.1 循环神经网络 |
2.2.2 循环神经网络变形结构 |
2.2.3 基于自注意力机制的语言模型 |
2.2.4 Transformer模型 |
2.3 机器翻译评价指标 |
2.3.1 手动评估 |
2.3.2 自动指标 |
2.4 基于迁移学习的神经机器翻译方法 |
2.4.1 迁移学习知识背景 |
2.4.2 领域适应 |
2.4.3 迁移学习分类 |
2.5 本章小结 |
第3章 模型迁移方法实现 |
3.1 方法概述 |
3.2 语言资源 |
3.3 数据预处理 |
3.4 相关方法 |
3.5 实验设置 |
3.5.1 计算环境的设定 |
3.5.2 实验模型数据设置 |
3.6 实验结果 |
3.6.1 主要实验结果 |
3.6.2 模型的实验与分析 |
3.7 本章小结 |
第4章 数据迁移方法实现 |
4.1 方法概述 |
4.2 相关方法 |
4.3 方法描述 |
4.4 实验设置 |
4.4.1 计算环境的设定 |
4.4.2 实验模型数据设置 |
4.5 实验结果 |
4.5.1 主要实验结果 |
4.5.2 模型的实验与分析 |
4.6 本章小结 |
第5章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读硕士学位期间发表论文 |
致谢 |
四、对我国几种机器翻译软件译文质量的测评(论文参考文献)
- [1]从《民法典》英译看法律翻译质量管控体系建构[J]. 张法连. 中国翻译, 2021(05)
- [2]在线翻译质量文类差异:基于人工测评的比较分析[J]. 阳琼. 东方翻译, 2021(04)
- [3]古文今译理论研究百年史[D]. 陈小花. 四川外国语大学, 2021
- [4]面向司法文书的文本智能纠错与质量估计方法研究[D]. 白明骏. 哈尔滨工业大学, 2021
- [5]目的论视角下《中华锦绣:贵州蜡染》(节选)翻译实践报告[D]. 阮佳佳. 贵州财经大学, 2021
- [6]《中华人民共和国电子商务法条文释义》(节选)英译实践报告[D]. 于倩. 沈阳建筑大学, 2021
- [7]机器与人工俄汉模拟交传比较分析报告 ——以“2019普京连线”为例[D]. 赵文轩. 黑龙江大学, 2021(09)
- [8]五款机器翻译译文质量评测 ——以四类文本翻译为例[D]. 段田园. 河北大学, 2021
- [9]汉维词语的人机翻译对比研究 ——以《习近平谈治国理政》为例[D]. 唐小雪. 喀什大学, 2021(07)
- [10]基于迁移学习的低资源神经机器翻译方法研究[D]. 刘丁. 西北民族大学, 2021(08)