最近在学习NLP,实验中要进行一个汉字繁体转简体的操作,而这个操作Python没有标准库可以使用(其实我也不知道有没有),需要使用一个第三方的代码进行实现。该代码主要需要两个代码文件:
- langconv.py : 实现字体的转换,github源码地址
- zh_wiki.py : 记录简体汉字和繁体汉字的键值对字典,github源码地址
langconv.py
代码在网上倒是很好找到,在github上也方便直接复制,但是zh_wiki.py
就很难找到了,因为这个文件是在是太长了,一般博客不会直接贴出来。而我去github复制有,没法打开raw页面,在项目页面直接复制由于浏览器的原因没法一次性复制,不然电脑会卡主,最后只有一次复制两千行,拼接成一个完整的文件。为了方便大家复制,直接点击代码右上角的复制按钮即可完成复制,点击上方列表的代码文件名可直接跳转到对应代码位置。
这里还有一个代码的使用教程:Python 汉字简体和繁体的相互转换。
代码:
1 | #!/usr/bin/env python |
1 | # -*- coding: utf-8 -*- |