月光博客

青青子衿, 悠悠我心, 但为君故, 沉吟至今

« 谷歌拼音输入法下载和评测谷歌拼音输入法的词库导入方法 »

搜狗拼音和谷歌拼音之争

  谷歌拼音输入法昨天刚刚发布,就引起了不少争议,在techweb就有人发帖说,谷歌拼音输入法的词库是使用搜狗输入法的,理由是“在搜狗词库建立之初就加入了词库指纹,即十几个很偏僻、但不影响输入的词汇。里面就有数位搜狗员工的名字。Google居然也能够打出来。例如:赵立洋、佟子健、吕杰勇。”

  我尝试使用谷歌输入法输入这些人的名字,的确是这样的,这些人的名字是很典型的冷僻词,一个输入法的词库再大,也不可能将网络所有冷僻词都包含进去,因此我也怀疑可能两者使用较为类似的词库。胡洋则认为这可能是由于谷歌使用网络搜索的原因。我觉得这个解释有点牵强,毕竟那些词是相当生僻的单词。不过也有可能,两者都引用了一些公共的无版权的词库,而这个词库中恰好又有这些人的名字。为了求证两者词库是否相同,我测试输入更多的词汇,这时我发现有些词是谷歌有的而搜狗没有,比如“和菜头”,在谷歌输入法中就是一个词汇,而搜狗则没有,对于一些其他的博客名或者网站名也有类似的效果,因此我觉得,可能谷歌输入法的词库使用了一些公共词库以及大量人们的搜索词汇组成的,因此数量较多,写长句子的时候较为顺手,两者词库虽然相似,但是并非完全相同的,具体是否盗用词库,我也很难判断。(另:搜狗实验室里有搜狗提供的公开词库供人下载,有可能谷歌开发人员进行了一些借鉴。)

  在测试谷歌输入法的时候,我发现这个输入法从一开始就站在一个较高的起点,很多实用的功能也大多建立在其他输入法的经验值上,是一个不错的输入法。做为输入法的前辈,搜狗输入法同样也是优秀的,其各种功能并不比谷歌输入法弱,谷歌拼音输入法比搜狗拼音多的功能,比如“自动同步”、“一键搜索”,其实并不是什么复杂的功能,词库同步无非就是本地和服务器同步一个文件而已,一键搜索就更不用说了,紫光早就集成了百度搜索和百度插件。搜狗没有提供这些功能,是因为有所忌惮。将用户输入的单词放在服务器上,如果有关部门要求提供这个月输入某某关键词的所有用户清单,你该怎么办呢?搜索插件则已经和流氓软件成为同义词了,搜狗输入法不开发这样的功能,显然是很珍惜自己的名声。

  自从去年六月份看到搜狗输入法后,我就放弃了紫光拼音输入法,因为其不稳定、常年不更新、捆绑百度插件。尽管最开始的版本有一些缺陷(比如网址输入问题),但是其快速反馈和修改使得搜狗拼音输入法功能越来越多,越来越好用。诞生大半年来,更新了多个版本,从搜狗拼音输入法官方网站长长的更新日志,还有搜狗输入法的官方博客,我可以感觉出搜狗的确也是在认真的做中文输入法,认真聆听用户的心声。

  中文输入法本来就类似一项公益事业,开发投入大而收益小,我们不可能总指望微软来做“智能ABC”这样的输入法给我们使用,因此对于这些做中文输入法的开发者,我们不能对其过于苛求,毕竟这些都是造福于网民大众的事情。



原创文章如转载,请注明:转载自月光博客 [ http://www.williamlong.info/ ]

本文链接地址:http://www.williamlong.info/archives/850.html
  • 文章排行:
  • 谷歌输入法(引用)
  • 咖啡心情
  • 看到月光Blog上说谷歌出了个输入法,作为一个Google小白鼠,当然要试试看。安装文件不小,10MB多,开始还以为是不是集成了GOOGLE工具条造成的,不过安装中并没发现安装工具条的提示。输入法工具条界面和搜狗十分相似,文字录入也很接近,不过说真的,很多输入都是这个样子,没啥说的了。昨天晚上看到消息说谷歌输入法用了搜狗的词库,我就猜到月光老大铁定要发帖分析了,果然,不过我对这个争论没兴趣。对我来说,谷歌输入法无非两点吸引我:1.Google
  • 2007-4-5 15:45:15
  • wxc称:Google在糊弄大众(引用)
  • 总而言之,统而言之
  • 谷歌拼音输入法与搜狗拼音输入法的争执最近两天不断升级;而搜狐终于露出了自己的底线,要求谷歌停止开发输入法,真可谓用心险恶。这可是与月光博客所期待的,“做输入法的都是公益...
  • 2007-4-10 23:37:01
  • 3.scofield
  • http://www.tmse.cn
  • 中文输入法本来就类似一项公益事业,开发投入大而收益小,我们不可能总指望微软来做“智能ABC”这样的输入法给我们使用,因此对于这些做中文输入法的开发者,我们不能对其过于苛求,毕竟这些都是造福于网民大众的事情。

    见解深刻~~~~
  • 2007-4-5 1:46:17
  • 12.rayx
  • http://www.21star.com
  • 昨天装了谷歌输入法以后,晚上用frontpage做网页,寻找文件夹的过程中,因为没有切换到英文,导致frontpage崩溃。同样在使用ftp的时候,寻找文件夹没有切换英文,同样搞得ftp也崩溃了。
  • 2007-4-5 9:17:09
  • 14.oltra
  • http://www.myradioheart.com
  • google在美国可以拒绝向司法部提供用户搜索记录,搜狗在中国就不可能这么做了,如果搜狗出于为用户保密的原因而不做词库同步,虽然有点牵强,也是可以理解的……然而,搜狗的动态词库也是要从用户那里获取词汇的,这也是搜索引擎做输入法的目的所在,在搜狗记录用户词汇的同时,就不会记录来源吗?我觉得至少也会记录用户ip的吧,可以用来做地域分布统计。那么,有关部门不一样可以获得“本月有哪些ip的用户输入了某些关键词”么?
    google要求输入的也只是一个可以自由注册的帐号罢了,如果你觉得会涉及隐私,可以不用平时的帐号,另去注册一个for谷歌拼音的好了。
  • 2007-4-5 10:31:21
  • 15.jrsdhr
  • 有没有这种可能性,google在早期发布测试版的时候,已经对外放出他的词库了,这个时候广大网友还不能接触到,搜狗在这个时候把google的大部分词库收入到自己的输入法里,包括一些生僻的词汇。
    等到google正式对外发布的时候,他们把早已准备好的说辞第一时间放出来,造成google抄袭自己的舆论?
    搜狗这种骨子里还是流氓的流氓,这种手段是有可能用出来的。
  • 2007-4-5 10:37:09
  • 21.IasK
  • 15的思想有些问题,虽然我不喜欢sohu但是您的这种推论实在牵强的可以。有点诋毁的感觉了。
  • 2007-4-5 13:05:48
  • 22.George
  • 茹立云、赵立洋、佟子健、吕杰勇...是第一批在谷歌输入法词库中购买实名搜索成为赞助排名的用户。
  • 2007-4-5 13:26:13
  • 25.llmice
  • google输入法刚装了一天体验了一下,特别是词频调整相当不错.比如输入完整拼音下次属简拼也同样会把上次选词网前跳.但是无法忍受的是他的速度,没打开一次输入开始输入第一个字词的时候系统都要卡一下.在数台计算机上都是这样.无法忍受.无法忍受.
  • 2007-4-5 14:44:12
  • 28.blue
  • 最近大家都在关注拼音输入法,不知道大家注意到Google其它方面的变化没?今天我下载Google Earth时发现其下载文件名变化了,是GoogleEarthWin_EARIzh-cn.exe,记得以前是没有zh-cn的,我还以为除了中文版呢!可安装时并没有中文语言选项,看来是Google根据我的IP地址来做出的判断,因此,我觉得这可能暗示着两个信息:
    1.Google准备出中文版,这是放出的测试信号
    2.这是针对中国用户做出的特定功能版本,也许一些敏感地方数据会不一样,(会不会跟前段时间传出的国家要发放电子地图牌照有关)感觉好像是应付××××审×查似的。
    不过如果中文版因为审×查成了阉割版,我倒宁愿克服语言差异用英文版。
  • 2007-4-5 17:03:27
  • 31.yanqiuma
  • 昨天看了月光的文章,下载回来,试用了一天。
    搜狗输入法没用过,不予评论。
    在整句输入上面,Google输入法比微软拼音2007要弱一些,但在输入一些冷僻词及网络新词上面,Google明显要强很多,这与其词库建立在搜索上面有关,同时常用词输入的位置调整也不错,微软拼音经常无法将常用词排在首位。
    不过目前来说我还是习惯用微软拼音,另外,月光要清楚一点,微软开发的输入法中,智能ABC不是唯一的一个(虽然它是拥有用户群最多的一个),相对而言,ABC只是一个小学生用的拼音输入法,很容易就入门,但微软对输入法的研发方向还是微软拼音,从1.0到3.0再到2003,然后是前段时间捆绑在Office套装中的2007,可以看出微软对于这个输入法的重视程度(感觉2003和2007差别不大),或许,等到微软拼音加入了搜索技术与在线更新词库后,中文拼音输入法也就将走到尽头了。
  • 2007-4-5 18:40:15
  • 35.untelcom
  • 我就在用谷歌输入法,我觉得蛮好用的啊。挺智能的
    只不过不能自动输入逗号的时候结束输入
    这个和微软的不太一样
    还有,我使用的是 双拼
    貌似比较诡异的一种输入方法
    是我闲的无聊的时候练出来的
    不知道还有没有人也是使用这个双拼输入法
  • 2007-4-5 21:23:22
  • 36.John
  • http://blog.techxper.com/
  • 感觉现在Google输入法还是赶不上搜狗输入法的,我自己昨天下载之后,尽管保留了Google输入法,不过我的默认输入法还是搜狗.

    前天,无意中把搜狗输入法推荐给一个不太懂得使用电脑的朋友,两天之后非常惊喜地给我电话,非常感谢我给他推荐这个输入法,速度比原来快了很多.他所有的朋友都以为他在使用5b,呵呵,这就是用户最真实的声音.
  • 2007-4-5 21:54:59
  • 37.lang
  • 希望google能尽快把事情澄清一下。
    虽然我很喜欢Google,但是这种事情也是有可能发生的。比如前一阵儿的IE7推广页面事件。
  • 2007-4-5 22:49:39
  • 38.remme
  • 说得很婉转。

    如果是搜狗输入法的词库里面有了google员工的名字,必然会出来一篇檄文了吧:看,流氓输入法露出本来面目。而google一抄袭呢,就是类似与“公益事业”。

    至于抄袭的证据当然没有,毕竟google,哦,对了,是谷歌的词库毕竟有搜狗的开发员工的名字而已,当然了,还加上搜狗输入法2.0版本的一些错词,这不能100%说明抄袭这种行为。

    我们知道一只鸟看上去像鸭子,听上去像鸭子,走起路来像鸭子,吃起来也像鸭子,但是这样再像,也不能说它就是一个鸭子。不过……差很远么?
  • 2007-4-5 23:49:39
  • 39.runninger
  • 我用的是拼音加加,已经几年了,其间不断试用其他输入法,始终没有发现一种可以与之相比的拼音输入法,只有搜狗可以比,但其中的几个功能比如说快速输入罗马字母(α、β……)等无法与之相比,搜狗名声也很臭,一直对其深恶痛绝,在我心里,搜狗永远都是流氓的形象。即使是其词库更新快,意义也不大,因为只要坚持用一个输入法几个月,自己的词库就建立了,每个人的语言习惯基本上都是固定的,词汇也基本上固定的,至于新词汇,输入一次就记住了,没有必要要太过庞大的词库,太大的词库会降低输入法速度。

    google输入法起点还是不错,吸引人的地方是词库与gmail相连。这样无论在哪里办公,都不必担心词库问题。试用后缺点也不少:1 输入速度慢,明显停滞现象 2 与gmail同步的时候,速度奇慢无比,和gmail差不多是个通病。3 还有一个缺点,其他几个输入法彼此之间交换词库的格式差不多,很容易把自己常用的词库转换到另外一个输入法,我把拼音加加的词库导入googl输入的时候却遇到困难,希望下一个版本能够相互接轨,这样其他输入法用户容易接受Google输入法。
  • 2007-4-6 1:25:51
  • 40.downey
  • 五笔。据说使输入速度达到最快的途径是单字输入,而根本不用词组。上述东东都没有意义了。
  • 2007-4-6 6:43:47
  • 41.Deodae.d
  • 你最后一句什么不苛求就是如同放×,你当是Google免费给你做公益事业么?

    当Google Fans不用什么都说Google好,我去你个妹的造福于网民大众
  • 2007-4-6 7:57:00
  • 46.pig
  • 中国,××的大陆,任何放在网上的信息没安全可言的。放在本地硬盘上的也不安全。
  • 2007-4-6 20:18:30
  • 47.itest
  • :搜狗实验室里有搜狗提供的公开词库供人下载,有可能谷歌开发人员进行了一些借鉴

    “借鉴”这个词用的真是……
    人家搜狗实验室也是有版权声明的。用了而不注明,这是种什么行为?
    如果别人转了你的文章,而标注上自己的名字呢?
    google很好。但在中国就那么回事。他们就像中国足球一样,有一个态度问题。月光比较喜欢google,我也一样。但我认为google中国应该反思一下,不要因为中国的大环境而把自己也变成不负责任的中国公司。
  • 2007-4-6 22:57:48
  • 49.ahlee
  • 同为google的fans,一直关注着这个blog,谷歌输入法我也下载用了
    感觉还是不如sogou,比较好的一点是可以有英文提示功能,也看了网
    上的口水战,楼主还是很客观的分析,赞一个。
  • 2007-4-7 20:34:43
  • 50.aaa
  • google拼音2个人做的,搜狗据说是9个人做的。

    不过是中国这里随便搞的玩的东西,不要太care啦,呵呵
  • 2007-4-7 23:13:44
  • 51.Belight
  • 两个输入法有大量相同的词汇是非常正常的。况且两种输入法都根据网络词频制订词库,同一个网络,结果自然相似;而且Google保存的网页必然是Sogou的超集,词比Sogou多也无可厚非。又根据我试验的结果,二者的词频设置上仍有很多不同,所以说Google抄袭似乎证据不足。在没有确切的证据之前,我是不会相信一个有如此高信誉的跨国公司会抄袭一个刚建立的小搜索引擎的。
  • 2007-4-8 9:15:01
  • 52.Belight
  • 我查看了搜狗提供公开下载的互联网词库,未发现所谓词库指纹,若有谁知道Sogou真正词库的下载地址,请告诉我。
  • 2007-4-8 11:38:45
  • 55.HT
  • 我住在海外,除英文外,我生活的社區和工作環境,有很多使用中文的機會,而且絕大部分都是繁體字。曾使用很多種能輸入繁體中文字的軟件,最後以為只能選用微軟的新注音2003。直到最近,發現谷歌新開發中文輸入,並且支援繁體中文。我馬上下載,使用了幾天,非常滿意。是我試過多種的輸入法中最好的,包括紫光,搜狗,微軟2007,漢音等,我覺得谷歌目前是最好的。我再說,主要它支援繁體字方面功能非常好。另外一點,不曉得大家有沒有注意,使用谷歌輸入,在視窗地區言語設定上不用設定用China(PRC)for non-Unicode program.這一點很好,因為這就不影響其他中文program的執行。
  • 2007-4-17 6:21:05
  • 57.我靠
  • 我第一次来这个BLOG,看到这样一群25!搞的自己比李开复还李开复!死忠的Gfans!可怜+可悲,无聊+无趣!本来满喜欢GOOGLE,看到你们马上对GOOGLE产生无比的厌恶! 我闪。。。。。
  • 2007-4-23 9:45:35
  • 58.扶良文
  • 传真:
    为请认真纠正微软双拼的
    技术缺陷和侵权行为
    致比尔•盖茨先生的投诉函
    尊敬的比尔•盖茨先生,您好!
    我是汉字双拼输入法原创
    发明人扶良文。为请求您责成
    贵公司抱着对您负责的态度,
    依法认真纠正其在微软双拼
    输入法中的技术缺陷及其对
    我已荣获全国发明金奖和
    国际发明金奖的良文双拼
    输入法的侵权行为,我曾
    于1999年3月写了一封长信,
    请吴士宏女士转交给您,
    向您投诉。至今已经8年多了,
    尚未正式处理答复。兹特再次
    向您投诉,请责成贵公司务必
    速予处理并正式书面答复为盼!
    此致
    敬意!
    扶良文 2007/04/18
    通信处:
    北京航空航天大学
    103住宅305号 扶良文
    邮编:100083
    电话:82339330
    手机:13439327582
    Email:f5229@126.com

  • 2007-4-24 6:35:51
  • 59.扶良文
  • 求助!扶良文发明的双拼,已被微软等改头换面盗用牟利多年,良文想用更新更好的发明来压服微软,讨回公道,为祖国争气,为华人服务,现新好输入法已研究设计成功,无奈本人不会程序设计,如有哪位程序高手愿意合作,请联系本人。通信处:f5229@126.com
  • 2007-4-24 10:44:08
  • 60.gfhgfh
  • 我要说一句谎话,用过搜狗输入法的朋友们表笑……"我们要用紫光,用加加,用微软,用五笔,删sogou!"不过下边的这一句是真话,“现在还在用智能ABC的全都是傻B阿”
  • 2007-4-30 4:39:21
  • 64.Lok
  • 做个同步很容易??我在不同的地方~不同的电脑~~用sougou从来没有同步成功过~
  • 2007-11-16 22:29:47
  • 65.2手的科学家
  • 喜欢,但是不要轻易崇拜,实用是第一真理,个人感觉搜狗确实比谷歌好用些,仅仅个人感觉,对企业公司什么的没有任何偏见。
  • 2008-1-30 21:16:04
  • 67.谷歌拼音是流氓软件
  • 谷歌拼音我不小心在用快车时安装了。令人非常气愤的是它妈的就是个流氓软件,它会强制程序把它放在输入法第一位。我搜狗用的好好的,不想用它。就在语言栏那里把它删除了结果它还消失,和它斗争了大半天,才回复到搜狗第一的状态,我想把它卸载了,但找不到卸载目录。总之××的谷歌拼音就是一流氓软件。
  • 2008-7-8 19:00:07
  • 68.谷歌拼音是流氓软件
  • 02谷歌拼音我不小心在用快车时安装了。令人非常气愤的是它妈的就是个流氓软件,它会强制程序把它放在输入法第一位。我搜狗用的好好的,不想用它。就在语言栏那里把它删除了结果它还消失,和它斗争了大半天,才回复到搜狗第一的状态,我想把它卸载了,但找不到卸载目录。总之××的谷歌拼音就是一流氓软件。
  • 2008-7-8 19:00:33
  • 69.谷歌拼音是流氓软件
  • 谷歌拼音我不小心在用快车时安装了。令人非常气愤的是它妈的就是个流氓软件,它会强制程序把它放在输入法第一位。我搜狗用的好好的,不想用它。就在语言栏那里把它删除了结果它还消失,和它斗争了大半天,才回复到搜狗第一的状态,我想把它卸载了,但找不到卸载目录。总之××的谷歌拼音就是一流氓软件。03
  • 2008-7-8 19:00:46
  • 70.谷歌拼音是流氓软件
  • 谷歌拼音我不小心在用快车时安装了。令人非常气愤的是它妈的就是个流氓软件,它会强制程序把它放在输入法第一位。我搜狗用的好好的,不想用它。就在语言栏那里把它删除了结果它还消失,和它斗争了大半天,才回复到搜狗第一的状态,我想把它卸载了,但找不到卸载目录。总之××的谷歌拼音就是一流氓软件。04
  • 2008-7-8 19:01:03
  • 71.谷歌拼音是流氓软件
  • 谷歌拼音我不小心在用快车时安装了。令人非常气愤的是它妈的就是个流氓软件,它会强制程序把它放在输入法第一位。我搜狗用的好好的,不想用它。就在语言栏那里把它删除了结果它还没有消失,和它斗争了大半天,才回复到搜狗第一的状态,我想把它卸载了,但找不到卸载目录。总之××的谷歌拼音就是一流氓软件。05
  • 2008-7-8 19:02:25
  • 72.谷歌拼音是流氓软件
  • 谷歌拼音我不小心在用快车时安装了。令人非常气愤的是它妈的就是个流氓软件,它会强制程序把它放在输入法第一位。我搜狗用的好好的,不想用它。就在语言栏那里把它删除了结果它还没有消失,和它斗争了大半天,才回复到搜狗第一的状态,我想把它卸载了,但找不到卸载目录。总之××的谷歌拼音就是一流氓软件。06
  • 2008-7-8 19:03:06

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 通过Google订阅本站
  • 通过鲜果订阅本站
  • 通过抓虾订阅本站
  • 通过电子邮件订阅本站

站内搜索


热文排行

最新评论及回复

最近发表

本站采用创作共用版权协议, 要求署名、非商业用途和保持一致. 转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议.

This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 2.5 License.