2007年4月7日星期六

谷歌拼音输入法的词库导入方法

  这些天使用谷歌拼音输入法的时候,发现谷歌输入法的用户词库导入导出功能有严重的缺陷,不能方便的导入个人词库。不过通过一些变通的方法也可以完成批量词库的导入。

  对于个人词库来说,人名是一个非常重要的词库,特别是公司同事的姓名。对于搜狗输入法来说,可以直接将以回车分割的姓名文件做为词库导入,非常方便扩充个人词库。通常情况下,我们只需要将个人通讯录按照姓名存为文本,就可以导入到搜狗输入法,很简单且易于操作。我们还可以将经常使用的专业单词也批量导入,这样就可以让自己的输入法在短时间内迅速成为一个个性化的顺手而好用的输入法。可是在谷歌输入法中却不支持这样的简易导入方式,只支持指定格式的词库导入,很不方便。

  不过,我通过分析搜狗和谷歌两者的词库格式,发现用户词库还是很类似的,于是我就依样画葫芦,找到了一个可以将搜狗用户词库转换为谷歌用户词库的方法,是的谷歌输入法中也可以批量导入搜狗拼音的用户词库。

  首先要将需要的词语先导入搜狗输入法,然后再搜狗中选择导出,将用户词库导出为一个文本文件。

  之后,在EXCEL中打开词库,会出现一个“文本导入向导”,选择分隔符号为空格,就会出现如下图的显示界面。

文本处理

  删除1、2行,将B列放在第一列,C列放在第二列,A列放在第三列,D列删除。最终整理为如下图所示的格式。

文本处理

  然后将文件另存为“文本文件(制表符分割)”。用记事本打开这个文件,将单引号全部替换为空格,重命名为dic后缀的文本文件。

  这时候,再在谷歌拼音输入法设置的“辞典”里点导入,即可导入词库,我用此方法成功将我在搜狗拼音输入法里的1万多词库导入了。

  最后,谷歌输入法于今天更新了版本为1.0.16.0,支持如下功能:

  1. 支持“TAB”键翻页功能
  2. 修改双拼方案中的错误
  3. 全角模式下“/”键将打出顿号
  4. 修正了Windows Vista系统下的安全问题
  5. 词典质量更新

  更新后,原先词库中的搜狗开发人员的姓名就没有了。另,搜狗实验室里有搜狗提供的公开词库供人下载,里面的“使用许可证”指出,“在利用搜狗实验室数据进行深入研究而获得的成果中,应指明数据的提供方(搜狐研发中心)”。