Tmxmall语料对齐系统在华为完成部署,助力华为多语语料数据建设

发布时间: 2017-11-16 来源: 上海一者信息科技有限公司
华为是全球领先的信息与通信技术(ICT)解决方案供应商,专注于ICT领域,坚持稳健经营、持续创新、开放合作,在电信运营商、企业、终端和云计算等领域构筑了端到端的解决方案优势,为运营商客户、企业客户和消费者提供有竞争力的ICT解决方案、产品和服务,并致力于使能未来信息社会、构建更美好的全联接世界。目前,华为约有18万名员工,业务遍及全球170多个国家和地区,服务全世界三分之一以上的人口,是国内企业产品全球化做的最好的企业。在产品销往全球多个国家和地区时,都需要将产品使用说明书翻译成多语语言,在这过程中华为内部积累了大量的多语使用说明书,如何将这些多语使用说明书快速做成双语平行语料库来助力多语产品翻译以及神经网络机器翻译训练,对于华为是迫切需要解决的问题。

为了快速、高效、优质地构建双语平行语料库,华为对多款语料对齐软件进行了深入的调研、测试、评估,最终选定Tmxmall语料在线对齐系统作为华为多语语料数据建设的首选软件。经过Tmxmall与华为经过细致的需求澄清和沟通,Tmxmall创始人兼首席技术官陈件领衔的技术研发团队分赴华为西安、南京分公司进行部署,经过一系列严苛的测试,最终顺利完成交付。这是继强生制药、中伦律师事务所等行业合作客户后,Tmxmall再添重量级合作客户。

Tmxmall语料对齐系统可将双语文本快速、精准地制作成平行语料库,以其高效性、易用性获得了众多企业的青睐。华为此次将Tmxmall对齐版块整套部署至内部网络,将加快自有双语或多语文本到平行语料库的转换进程,为多语言辅助翻译和训练神经网络机器翻译构建“语料大数据”的基础,从而为产品更好地走向国际提供支持。

Tmxmall 在线对齐是一款基于浏览器的专业语料对齐平台, 提供了非常人性化的交互界面,方便用户快捷地调整对齐结果,极大程度上提高文档对齐效率和用户对齐体验。目前,该款产品凭借其易操作、对齐快速高效、所需人工干预极少、自动对齐质量极高的特点,受到高校、翻译公司、人工智能企业、高新技术企业等各类公司的青睐,在语料对齐领域已经成为技术最先进,使用频率最高的一款对齐软件。据统计,Tmxmall在线对齐可轻松实现每人每天20-30万字的对齐量,是市面上同类产品对齐效率的2-3倍。Tmxmall自主研发的智能对齐算法使得该系统可自动对齐原文及译文语料中“一对多、多对一、多对多”的句子,使得原本需要人工介入的连线调整工作完全被自动化程序替代,从而大幅降低人工干预的工作量,使对齐工作真正变得高效。