2007年4月5日星期四

搜狗拼音和谷歌拼音之争

  谷歌拼音输入法昨天刚刚发布,就引起了不少争议,在techweb就有人发帖说,谷歌拼音输入法的词库是使用搜狗输入法的,理由是“在搜狗词库建立之初就加入了词库指纹,即十几个很偏僻、但不影响输入的词汇。里面就有数位搜狗员工的名字。Google居然也能够打出来。例如:赵立洋、佟子健、吕杰勇。”

  我尝试使用谷歌输入法输入这些人的名字,的确是这样的,这些人的名字是很典型的冷僻词,一个输入法的词库再大,也不可能将网络所有冷僻词都包含进去,因此我也怀疑可能两者使用较为类似的词库。胡洋则认为这可能是由于谷歌使用网络搜索的原因。我觉得这个解释有点牵强,毕竟那些词是相当生僻的单词。不过也有可能,两者都引用了一些公共的无版权的词库,而这个词库中恰好又有这些人的名字。为了求证两者词库是否相同,我测试输入更多的词汇,这时我发现有些词是谷歌有的而搜狗没有,比如“和菜头”,在谷歌输入法中就是一个词汇,而搜狗则没有,对于一些其他的博客名或者网站名也有类似的效果,因此我觉得,可能谷歌输入法的词库使用了一些公共词库以及大量人们的搜索词汇组成的,因此数量较多,写长句子的时候较为顺手,两者词库虽然相似,但是并非完全相同的,具体是否盗用词库,我也很难判断。(另:搜狗实验室里有搜狗提供的公开词库供人下载,有可能谷歌开发人员进行了一些借鉴。)

  在测试谷歌输入法的时候,我发现这个输入法从一开始就站在一个较高的起点,很多实用的功能也大多建立在其他输入法的经验值上,是一个不错的输入法。做为输入法的前辈,搜狗输入法同样也是优秀的,其各种功能并不比谷歌输入法弱,谷歌拼音输入法比搜狗拼音多的功能,比如“自动同步”、“一键搜索”,其实并不是什么复杂的功能,词库同步无非就是本地和服务器同步一个文件而已,一键搜索就更不用说了,紫光早就集成了百度搜索和百度插件。搜狗没有提供这些功能,是因为有所忌惮。将用户输入的单词放在服务器上,如果有关部门要求提供这个月输入某某关键词的所有用户清单,你该怎么办呢?搜索插件则已经和流氓软件成为同义词了,搜狗输入法不开发这样的功能,显然是很珍惜自己的名声。

  自从去年六月份看到搜狗输入法后,我就放弃了紫光拼音输入法,因为其不稳定、常年不更新、捆绑百度插件。尽管最开始的版本有一些缺陷(比如网址输入问题),但是其快速反馈和修改使得搜狗拼音输入法功能越来越多,越来越好用。诞生大半年来,更新了多个版本,从搜狗拼音输入法官方网站长长的更新日志,还有搜狗输入法的官方博客,我可以感觉出搜狗的确也是在认真的做中文输入法,认真聆听用户的心声。

  中文输入法本来就类似一项公益事业,开发投入大而收益小,我们不可能总指望微软来做“智能ABC”这样的输入法给我们使用,因此对于这些做中文输入法的开发者,我们不能对其过于苛求,毕竟这些都是造福于网民大众的事情。