星期日, 六月 21, 2009

可怜的谷歌,居然成了用来转移大家对绿坝批评的挡箭牌

一直很喜欢Google的产品,就我个人而言,02年开始接触到Google,现在还记得第一次看同学用Google迅速的找到一个问题的解决方法时的震撼,原来还有这么好用的搜索引擎,后来就从Google的Help开始,认真的学习搜索技巧,比如,国外学术资料(国外学术界都是用LaTeX排版,一来是漂亮,而来是方便管理文章的引用,三是免费,当然,在国内学术界,一般都用盗版word,也不在乎漏写几篇引用)一般都是PS或者PDF格式的,用Google就可以很方便的指定只搜索后缀是PS和PDF的Paper,大大提高了搜索效率,而且那时候经常在MIT和Princeton之类的网站上找东西,Google也可以很方便的把搜索限定在某一个域名内,这样,可以只搜索MIT内的资料。

用好Google是一个做研究,学习新知识的必要条件,后来Google又有了学术搜索和图书搜索,就更方便了。但谷歌中国从进入中国开始就一直不顺利,在百度刚开始上线的那3个月,Google访问一直很不稳定,于是百度获得大量的市场份额,至于Google无法访问的原因,相信有点逻辑思维能力的同学都应该能知道。

Google的企业信条是Do no
evil。可惜这样的一个翩翩君子到了中国,遇到了百度这样的信奉马基雅维利主义的小流氓,结果怎么样,大家都很清楚,Google一直不用人工干预搜索结果,因为Google从本质上是一个技术天才的公司,一群有着整合全球信息理想的天才们聚在一起,Google真的是在提供改变社会的产品,我现在很难想象没有Google
Search、Google Book、Google Docs、Google Reader、Google
Calender,我的生活会多么不方便。从这个意义上讲,国内没有几家企业有这样的使命感。

但遗憾的是,技术天才们的公司从本质上说是天真的,不适合在中国这样的权术大国生存。这也是谷歌中国这次面临如此大危机的根本原因。刚刚就用百度测试了下,很容易的就能搜索到大量的色情图片。但百度这次活的好好的。说不定现在正在开香槟呢。所以说,一个希望整合全球信息的公司到了希望过滤全球信息的国家,结果必然是悲剧的。但中国老祖宗大禹早就说了:"堵是堵不住的,要疏导"。

中国希望建立一个对政府定义的不良信息的马其顿防线(传说中的GFW)用来净化大家的思想,首先且不说绿坝这种抄袭国外开源代码,而且还把加菲猫识别成色情图片的垃圾软件能否完成这个任务,大家看看遍布中国大江南北大街小巷的洗头房和在地铁站、超市、学校附近无处不在的色情光盘店就知道,第三帝国已经再次绕过了可怜的马其顿防线,虽然这次修的是豆腐渣工程。

P.S.
现在来看CCAV引用的这些所谓的网民言论,只能用无知和无耻来形容:

互联网不良信息举报中心的主任助理:

用Google搜索那些有害信息,太方便了。

CCTV《焦点访谈》的工作人员高也,隐藏身份接受采访:

黄色淫秽信息经过Google的链接,那种毒害特别大。

中国和平论坛的版主"荷叶秋风":

谷歌网做的很不好,所提供的信息并不是很适合网民的需求。

网友"卡卡":

谷歌中国,这个网站太邪恶了。

中国人民大学院新闻系的同学小青:

在谷歌中,搜索一些学术词语都可能会出现不良内容!

北京理工大学计算机学院的王同学:

谷歌中国因为利益的驱使而"顶风作案",我们应该放弃使用这样的网站。

据说杀人犯都穿运动鞋,按中国这些官员的逻辑,是不是运动鞋就是杀人的主要工具了?应该全部查封。

中国人搞莫须有的罪名向来是擅长的,但这次导演的显然非常低级,可以看做是对广大网民智商的挑战吧?

星期日, 六月 14, 2009

中国不愧是盗版大国和喜剧大国

最近大家关注的大名鼎鼎的绿坝软件已经有很专业的技术分析了:
https://docs.google.com/View?id=afk7vnz54wt_12f8jzj9gw
原来所谓的若干专利技术的图像识别库就是用的开源的OpenCV,但是人家可是BSD授权的,就这样不声不响的用了也就算了,关键是还用人家的技术申请到了若干国内专利,每年还能卖4000万,这种行为就很不靠谱了。充分说明了中国果然是盗版大国,连所谓的官方机构都是支持盗版的。不过考虑到做这个软件的公司也就是随便找了些民工,不知道BSD授权是什么东西也很正常。
P.S昨天在家门口的超市买西瓜,出来就看到门口的盗版光盘摊位升级了,把AV专门放了一车,白花花的一片蔚为壮观,所以古人早就说了,堵是堵不住的,要疏导。现在上海满大街都是洗头房,包括中小学门口,所以说不定搞红灯区还更靠谱。这也充分说明,绿坝这种东西只是给真的相信河蟹社会的脑残人士带来心里上的安慰,而且从反编译出来的关键字列表也说明这个花季护航的软件不过是一个借口,屏蔽敌台才是主要目的。但没有敌台,我们到哪里抄OpenCV和Cybersitter呢?这又说明中国也是一个喜剧大国。

Google Chrome&Docs

最近决定开始逐步转向Chrome,但是Firefox的插件还是很难完全放弃,主要就是Xmark,书签同步是最重要的一个插件,当然估计Chrome版本应该很快就会出来的。但是Chrome2.0的速度和UI实在是很喜欢,比如Google
reader,我在FF上要用一个插件才能获得比较大可视面积的页面体验,但是Chrome默认的设置就足够了,特别是在我的Mini9小本上,Chrome的优势很明显,FF还要经过若干tweaks才能获得比较好的体验,但是Chrome的默认设置就直接胜出了。所以,期待Chrome的插件系统尽快跟上。

一直在寻找合适的个人笔记管理系统,Mediawiki/TiddlyWiki都用过,但都不能完全满足我的需求,google
docs虽然很早以前就用过,但是一直没有很重度的使用,因为开始的版本确实不太好用,不过今天试了试,现在感觉做的已经很不错了,不用担心同步问题,也不用担心分类,因为总是可以搜索,还可以自动保存版本历史,以后写好了,也可以很方便的共享或者以网页形式发布,真好!

星期五, 六月 12, 2009

撰写正则表达式必备工具

昨天看Coding Horror(http://www.codinghorror.com/blog/archives/001274.html),才知道有Regular
Expressions cookbook这本书,接着又发现了作者写的一个叫做RegexBuddy的工具。真是相见恨晚啊,以前看Mastering
Regular expression.总觉得有点过于学术化,然后在自己用perl写一些代码生成器和测试脚本生成器的时候,调试一些比较复杂的正则表达式只能用打印log的方式,浪费了不少时间。昨天下了一个RegexBuddy(http://zhasm.com/downloads#regexbuddy3.2)才知道,原来有这么好用的正则表达式调试器,一边写表达式,一边就自动把元字符意义自动打印在调试窗口中,这样可以很清晰的知道写对没有,而且还有Debug功能,可以直接贴一些测试文本检查是否能正确匹配,而且还可以自动转换到很多种流派的语法格式:比如.Net,Perl等等。实在是写正则表达式的利器啊。

星期三, 六月 03, 2009

最近读过的一些书

说说最近读书的一些感受。
Gladwell同学的三本书(The Tipping
Point,Outlier,Blink)因为很多人都在推荐,所以都找来看了看,但是看完之后却很失望,严格的说都看了一半就没有兴趣看下去了,发现三本书的写作套路都是一样的,整本书都是围绕一个很简单的主题,大多是对这个世界运作原理的一个高度总结,哇,看完之后就能知道这样牛b的原理,当然很爽了,当然这个规则是很简单的,而且需要一个很好的隐喻,这样大家都能很轻松的理解,接着用PPT式的短小句子做章节的标题,很能吸引眼球啊,然后书的内容一定要切合主题,选很多有趣的小故事串起来,当然是否是科学的采样的结果就不一定了,所有的论据当然都是支持主题隐喻的,不支持的当然就得忽略掉了哦。这样读起来也不需要思考。就好像看电视一样,所以这种书通常都很畅销,同类的书还有Friedman同学的The
World is Flat,如果有大把的时间,这种书当消遣读读也不错,不过如果时间宝贵,那不读也罢,看看前言基本上就了解了。另外这件事也说明,国内Blogger大多推荐的书不太靠谱,跟风居多。这也和国内教育模式有关系,大多没有辩证思考的习惯。所以说,花时间看之前还是得多Google一下再决定。时间很宝贵啊!