《阳光藏汉机器翻译系统》应用效果良好
日期:2015年02月10日 西藏自治区科技厅
西藏大学现代教育技术中心承担的2012年西藏自治区重点科研项目——《基于短语的藏汉统计机器翻译关键技术研究》,在藏语自动分词与词性标注、藏语语料库、基于短语的藏汉统计机器翻译技术等领域进行了深入研究,取得标志性研究成果——《阳光藏汉机器翻译系统》,经实际应用效果良好。
《阳光藏语自动分词系统》的分词速度达到每秒1000个藏文单词,在藏文现代公文领域的分词准确率达到95%。为了辅助藏语自动分词与词性标注,修订完善了《信息处理用藏语词类标记规范》(编号:MZ115-018),使之更符合藏文自动分词与精确标注和藏汉机器翻译的实际需求;研发了用于辅助藏语自动分词与标注的藏文电子词典,包括10万词条的“机读词典”和“人读词典”。藏语语料库建设了约300MB字节的藏语通用语料库,包括约10MB藏语训练语料、30多万句对藏汉双语精确对照语料等。