作者:智信禾
时间:2018-05-08
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。同时,机器翻译又具有重要的实用价值。随着经济全球化及互联网的飞速发展,机器翻译技术在促进政治、经济、文化交流等方面起到越来越重要的作用。机器翻译技术的发展一直与计算机技术、信息论、语言学等学科的发展紧密相随。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,随着计算机计算能力的提升和多语言信息的爆发式增长,机器翻译技术逐渐走出象牙塔,开始为普通用户提供实时便捷的翻译服务。
近年来机器翻译技术的发展尤为迅速,特别是在大数据的推动下,从 2016 年开始神经网络算法骤然升温使得机器翻译技术有了突破性发展,相应的专利申请量也有了极大的提升。
实践中,在机器翻译类案件申请过程中,除了常规的新颖性创造性问题外,笔者发现这类案件被保护客体的问题所困扰。本文旨在以复审委对机器翻译类案件关于保护客体问题支持以及不支持的案例分析,根据目前现行专利审查基准,找到一些撰写注意点。
案例一(决定号:44768)
一种机器翻译方法及系统
驳回决定所针对的独立权利要求如下:
“1. 一种机器翻译方法,其特征在于,包括:
获取待翻译的第一语种的语句;
识别所述第一语种的语句的主语词组、谓语词组和宾语词组;
翻译所述第一语种的语句的主语词组、谓语词组和宾语词组为第二语种的主语词组、谓语词组和宾语词组;
按照所述第二语种的语言表达方式排布所述第二语种的主语词组、谓语词组和宾语词组,形成为第二语种的语句。
复审委复审意见:
权利要求1请求保护一种机器翻译方法,其限定的方案实质上是借助于具有特定格式的中间语言模型,先将第一语种的格式转换为符合中间语言模型格式的统一语义表达式语句,再将该语句中第一语种的词组翻译为对应的第二语种,最后按照第二语种的语言表达方式,组成第二语种的语句。由此可见,权利要求1限定的方案只是根据发明人自己的主观认识,对自然语言之间的转换规则进行了规定和定义,借助于发明人自己规定的中间语言模型以及人为规定的各语种之间的语言对应关系,实现了各语种语言之间的翻译转换,并不是对机器翻译方法的技术性改进,也没有在机器翻译上体现不同语言文字自身固有的客观语言规律与计算机技术结合的改进,因此并没有采用技术手段。该方案所要解决的问题是按照人为规定实现自然语言之间的翻译转换,不构成技术问题,获得的效果仅仅是实现自然语言之间的翻译转换,也不是技术效果。因此,权利要求1不属于专利法第2条第2款规定的技术方案,不属于专利保护的客体。
案例二(决定号:FS15125)
驳回决定所针对的独立权利要求如下:
1、一种翻译处理方法,包括:
登记具有对应翻译规则的注释的类型;
识别要处理的文档;
从所识别的文档中提取添加给文本元素的注释;
识别所提取的添加给文本元素的注释的类型;以及
根据所登记的与所识别的所提取的注释的类型相对应的翻译规则来翻译所述文本元素。
复审委意见:
权利要求1要求保护一种翻译处理方法,其属于涉及计算机程序的申请,其要求保护的方案所要解决的问题是经过机器翻译的文档的质量具有相对较低的标准(参见说明书第1/9页“背景技术”部分第8-9行),而人为针对每个不适当的译文进行手工输入适当的译文的处理方式降低了执行机器翻译的优势(参见说明书第1/9页“背景技术”部分第19-21行),也就是说,所述方案解决的是由于手工校验不适当译文效率低下而导致机器翻译优势不能充分发挥的问题,并不是技术问题;所述方案中虽然涉及一些技术特征,如识别文档、识别注释类型等,但这并不是针对所要解决的问题所采用的手段,针对所要解决的问题所采用的手段是人为监控错译部分,根据人的主观判断而区分的错译类型向其中添加不同类型的注释,并根据该错译类型,也即根据该注释类型调用与之对应的人为制定的编辑方法来对错译部分执行相应处理,可见,针对所要解决的问题无法离开人的主观判断,不受自然规律的约束,因而不构成技术手段;所述方案获得的是能在短时间内获得高质量的译文,并且不会为用户增加额外负担(参见说明书第7/9页第8-9行)的效果,也就是说,所述方案获得的是得到用户预期的高质量译文的效果,并不是技术效果。
因此,权利要求1要求保护的方案所解决的问题、针对所要解决的问题所采用的手段、所获得的效果都不是技术性的,因此不属于专利法实施细则第2条第1款规定的技术方案,不属于专利保护的客体。
以上是经过复审也未获得支持的例子。
上述两个反面例子我们得到的启发是:
1、需要在技术特征上写出在机器翻译上体现不同语言文字自身固有的客观语言规律与计算机技术结合的特征,从而体现采用了技术手段。
例如案例一,独权中的特征均着重于两个语种的语法成分,没有体现出机器在进行翻译时需要做的对应的工作,例如机器如何识别出对应的主语谓语宾语等,机器如何对不同类型的词性进行排布等。
2、在撰写申请时,从背景技术中描述的要解决的技术问题开始就要避免从人为的角度出发,需要从机器处理的角度出发。
例如对于案例二,人为参与的过多,使得整个方案被认为均是基于人的主观判断人工操作完成,从而被认定不是技术方案,没有技术效果。
鉴于篇幅限制,下面我们结合一个正面案例看看支持的情况。
案例三(决定号:93085)
因为保护客体问题被驳回的权利要求如下:
1. 一种基于正确翻译结果与对应关系的自动翻译方法,其特征在于,包含如下步骤:
接收翻译要求,该翻译要求包括:源语种、源语料、目标语种;
在多语种对应关系数据库中检索源语料是否存在,若存在,则判断目标语种的认证结果是否为OK,若是,则呈现翻译结果;
若否,则判断源语料的语句类型以及类型词是否存在,若存在,则判断目标语种的语句类型以及类型词的认证结果是否为OK,若是,则呈现翻译结果;
若源语料不存在并且源语料的语句类型或类型词不存在或者目标语种的语句类型或类型词不存在,则选择机器翻译或人工翻译;
当选择机器翻译时,将翻译要求提交给翻译机器,然后获得机器翻译结果,之后提交人工认证、翻译与分解,并将人工认证、分解的结果记录在多语种对应关系数据库中;
当选择人工翻译时,直接提交人工认证、翻译与分解,并将人工翻译与分解的结果记录在多语种对应关系数据库中。
复审委的意见:
根据本申请说明书的背景技术部分记载:现在已经有很多进入到试用阶段的机器翻译工具,这些机器翻译工具都是基于规则(例如通过对语法的解析,对意思的解析等)来推断出翻译结果。它们的最大缺陷是不能保证翻译结果的正确性。越是口语化的翻译要求,越容易出现错误。因此利用这些翻译工具翻译出来的结果只能作为半成品,作为专业翻译人员提高翻译效率的辅助工具。对于那些不懂目标语言的人来说,由于无法判断翻译结果的正确与否,因此他们无法使用这类翻译工具。因此,业内存在一种技术需求:提供一种适用于多语种之间互译的、保证翻译结果正确的自动翻译方法与系统。由上可知,本申请要解决的问题是如何利用自动化的翻译方法来提高翻译的正确性,其属于技术问题。为了解决该技术问题,在权利要求1的方案中限定了一种自动化的翻译流程,其中,“接收翻译要求”、“检索源语料、源语料的语句类型及类型词是否存在”、“判断认证结果是否为OK”、“呈现翻译结果”、“提交人工认证、翻译与分解,并将人工翻译与分解的结果记录在多语种对应关系数据库中”涉及到数据的接收、检索、判断、呈现、发送、记录等数据处理技术,也涉及到数据库、通信网络等软硬件设备,这些均属于解决上述技术问题的技术手段。通过该权利要求的方案,获得了规范化、自动化翻译流程及提高翻译正确性等技术效果。因此,该权利要求属于专利法第2条第2款所说的技术方案,属于专利保护的客体。
从复审委对上述案例的意见来看,对上述总结的两点做了很好的呼应。
从背景技术开始,避免人为因素,体现技术缺陷;而后解决问题的特征均从机器处理的角度出发,利用一系列机器处理的动词,包括“接收”“检索”
“判断”“呈现”“提交”“记录”等来呈现技术实现过程。所以虽然在审查阶段被以不符合专利法第2条第2款的规定不是保护客体被驳回,但是最终在复审阶段仍然得到了复审委的支持,值得我们借鉴。
以上,与各位共享,欢迎深入讨论。