|
Google谷歌拼音输入法昨天一经发布便引起了广泛的关注,小编也下载试用了觉得在词库方面非常不错!整句输入方面尤其厉害,这时以动态词频和网络词库著称的搜狗拼音站出来指责谷歌拼音输入法使用了搜狗词库。
搜狗谷歌字库 抄袭还是参考?
反方:抄袭
搜狗拼音开发人员的blog贴出了这样一篇文章:
gpy的智能性和词库和sogou很相似.不过出乎意料的一件事情是gpy居然也使用了sogou的词库,我们加在搜狗拼音中的彩蛋居然在gpy中也有(我,子健,mark,jerry的名字,基本上都是生僻人名).这至少说明google这帮人够懒的.相应的,我们的很多词库错误也被原封不动的拿去了,例如冯巩的音标成了pinggong.但我们的一些错词他们没有,估计是有过再加工.这件事情值得记录一下,嚷了很久的“狼来了”终于成为事实,将来会有更多的竞争,当然不是什么坏事.
几点感受:
1)gpy界面延续了google产品的一贯风格,很典雅.当然,这个东西是仁者见仁智者见智的,没法说一定比sogou好. 2)gpy的一些功能,sogou不是不能做而是不敢做,怕被人骂流氓,十年怕井绳呀.不过google开了个头就好办了.. 3)gpy的bug和sogou的bug很类似,估计也中了不少ms的道儿... 4) gpy的智能性和词库和sogou很相似.不过出乎意料的一件事情是gpy居然也使用了sogou的词库,我们加在搜狗拼音中的彩蛋居然在gpy中也有(我,子健,mark,jerry的名字,基本上都是生僻人名).这至少说明google这帮人够懒的.相应的,我们的很多词库错误也被原封不动的拿去了,例如冯巩的音标成了pinggong. 但我们的一些错词他们没有,估计是有过再加工. 5)很多细节功能方面sogou还是领先的,但gpy的起点很高, 不容忽视,是个强大的对手.
最后,感叹一下品牌效应.
有人在网上发文说:在google,baidu和sogou上搜索“谷歌拼音”,google没有结果,baidu只有2条结果,sogou全部是最新的结果(新闻和下载地址).结果大部分人回答:用news.google.com吧.在很多人的潜意识里面,google搜不出结果是你不会用,而不是 google做的不好.什么时候敝狗也有这样的品牌,睡着了都要笑...
正方:参考
今天谷歌发布了自己的拼音输入法,这可是引起了各方的注意.对Google的印象挺好的,于是就下了个试试.感觉还好,就是没有搜狗输入法的功能丰富.核心功能如长句输入比起搜狗输入法好多了. 晚上看到一帖子说是谷歌输入法盗用搜狗输入法词库,帖子还是很有效果的,cnBeta上更是吵得不可开交,都上升到民族国家的高度上了.
不过我比较纳闷的是大多数跟贴的语气看来是同意那个帖子中所说的抄袭了.文中称“根据相关内部人士透漏”,这个我无从考证,不说了.
不过我比较纳闷的是大多数跟贴的语气看来是同意那个帖子中所说的抄袭了. 帖子链接:http://forum.techweb.com.cn/thread-59217-1-1.html 帖子中的原话我引用一部分: =============================== 根据相关内部人士透露:
Google词库和搜狗词库高度重合,有完全的证据证明,google词库就是用的搜狗词库:
1. 为了搜狗的词库防止盗用,在搜狗词库建立之初就加入了词库指纹,即十几个很偏僻、但不影响输入的词汇.里面就有数位搜狗员工的名字.Google居然也能够打出来.例如:赵立洋、佟子健、吕杰勇.还有很多搜狗员工的名字,甚至内部绰号google都能打出来,就不一一列举了.请大家看图. ===============================
文中称“根据相关内部人士透漏”,这个我无从考证,不说了.
说说这个“词库指纹”,既然是“指纹”,那最起码的要求是独一无二了.看看这几个“相同”的,只有首位的结果相同,后面的两个输入法都是有差别的.
这几个文中所提到的所谓“生僻字”对我来说确实是,但是对搜索引擎呢,我得先看看在说.我在Google中搜索“赵立洋、佟子健、吕杰勇”这几个人名.
请看结果: 1、 Google搜索链接 2、 Google搜索链接
2、链接
很明显,这几个人名在互联网上的出现的次数并不少,至少比我的名字出现次数多多了. 那么,这几个人名对Google的搜索引擎来说,不见得是什么生僻字了. 谷歌拼音的词库将其收录其中那就是理所当然了.
如果谷歌拼音是抄的搜狗拼音的词库,为何除了第一个结果,其他的或在排序或在字词上并不相同呢? 如果选择显示9个字,那就有更多的不同了.
以这些词做“指纹”,忽悠谁呢?
那帖子后面的内容我就不浪费时间了.两个输入法的词库都是根据网页词汇来的,某些错误相同,那是想的通的.
【冯巩】的“冯”的另一个音就是“ping”,直接在Google中搜索pinggong,其搜索建议就有冯巩!
张柏芝在谷歌拼音中的打法是“zhang bai zhi”而不是“zhang bo zhi”
毕竟两者都是拼音输入法,词库又都和网络有莫大关系,这些相同之处很不足以说明抄袭.
谷歌拼音盗用搜狗输入法词库的消息可能是目前最受大家关注的,究竟字库是什么,我不知道,个人感觉那东西不难,就是麻烦,应该是那几个字母对应哪几个汉字.
首先,两个程序员半年的时间只去做词库的话,可能都无法完成.于是采用了网络上通行的办法 拿来主义.当然拿来后,自己又添加自己的词库,gg的搜索词库里页有些特色的东西,这样结合到一起就是谷歌词库.对于这样的做法,理性来说支持,很对.感性来说有点不对,拿了别人的东西,居然要把别人干下去,和人家搞竞争.
其次 争论焦点是gg拿了词库,称为共享.别人拿了,拿就叫抄袭.
我认为两个原因.第一 google目前没有作恶,推出的服务,大多数都是免费的,用户体验第一位,即使商业利益尽量不影响用户体验.
在此请问搜狗开发人员,你们的词库是自己一条一条编写的吗?如果不是,你们现在可以拿谷歌的词库来参考.
有热心的网友自己进行了实验,力证谷歌输入法盗用搜狗输入法词库
为了搜狗的词库防止盗用,在搜狗词库建立之初就加入了词库指纹,即十几个很偏僻、但不影响输入的词汇.里面就有数位搜狗员工的名字.Google居然也能够打出来.例如:赵立洋、佟子健、吕杰勇.还有很多搜狗员工的名字,甚至内部google绰号都能打出来,就不一一列举了.请大家看图.



上面的5个词中,搜狗的第2、3、5是错词,同样的,google中的2、3、5也是错的.
这样Google和旧版本的搜狗输入法中完全相同的错词例子还有上千个.不过最新版本的搜狗3.0大部分已经修改过来了.
|