文言文机器翻译

在线文言文机器翻译即日起开始试运行。这个本来去年年末就可以上线,但由于各种各样问题,只好在2015年第一天上线。现在系统还在各种微调、提高性能,会经常更新,统计模型也会不时更新。由于资源限制,翻译速度可能略,也可能出现各种错误。

这个项目从2014年5月起开始试验,使用了Moses统计机器翻译系统,逐渐完善了各种配套工具,例如文言文分词(基于结巴分词)、简繁转换、分句等。主要使用维基文库、维基百科数据建立了三元文言文、现代文语言模型。平行语料采集于几个文言文翻译网站,使用机器翻译辅助句对齐,目前共有约五十万句。

经测试, 这个翻译系统总体优于百度,特别是现代文翻译文言文;更优于简单查找替换翻译系统。但由于词库等原因,人名地名可能处理不好。总之,能用。