谁在说谎?

个人牢骚作品,有兴趣点击,无兴趣忽视之

搜索引擎涉黄?

12月3日晚间消息,央视新闻频道今日下午再次曝光了搜索引擎涉黄一事,报道中提及百度、搜狗及谷歌英文版三家网站,其中指出谷歌英文版“淫秽程度远远超 过中文网页”。

CCAV不懂得搜索引擎的原理

这是一个原理问题,众所周知,搜索引擎本身只是一个链接“群”,而真正的资源都在那些网站的远程服务器上而不在搜索引擎服务器,搜索引擎本身并不提供任何意义上的镜像和引导,所以,说搜索引擎涉黄,根本是一个不着边的理由,其扯淡程度不亚于“不想当厨师的裁缝不是好司机”。

如果媒体实在要给搜索引擎扣上一个“莫须有”的罪名话,那可以把罪过怪给cache,即网页快照。

搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,由于网页快照是存储在搜索引擎服务器中,所以查看网页快照的速度往往比直接访问网页要 快,当搜索的网页被删除或连接失效时,可以使用网页快照来查看这个网页,起到“救急作用”。搜索引擎一般都设有网页快照功能。Via

可以这样比喻,搜索引擎就像是一个蜘蛛,爬来爬去,嗅探到某个页面,然后根据这个页面的链接再到另一个地方去,进行收录,检索等工作。比如你的A页面链接了B网址,那么搜索引擎爬虫在索引了A之后就会继续道B网址上去索引B网址的内容。不过其实站长可以对搜索引擎的行为有基本自由的控制,如在一个a标签里加上rel=”noindex nofollow”等相关属性,可以控制搜索引擎不索引(noindex)等行为。搜索引擎根据通过每个网页中的keywords和description等元素对网页进行分类、存储、索引,那么,这个责任不需推卸,应该完全在于那些“企图通过制作黄色网站赚取暴利”的网站站长。

这些色情网站并不是谷歌经营的,对于Google来说的话,他们只想做世界上最好的搜索引擎,虽然路上会遇到很多困难,但是遇到这么低级脑残的问题我想也会让Google感觉非常“郁闷”,但是这种事情却又是很无奈无法彻底解决的,这种情绪,俗称“蛋疼”。确实,价值观的冲突,很大程度上将是没有办法“调和”的。

问:谷歌在中国的服务器都做了哪些工作?

我想应该是:集群、存储节点、CDN、网页快照、同步数据(搜索、统计、cache等)。完全非计算机网络专业的个人猜想。

延伸:什么 是搜索引擎

搜索引擎指自动从英特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。英特网上的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为你绘制一幅一目了然的信息地图,供你随时查阅。
搜索引擎的工作原理
搜索引擎的工作原理大致可以分为:
1、搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超连结,机器人便可以遍历绝大部分网页。
2、整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。
3、接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这些通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。
via:百度知道

黄色不良信息的是与非?

内心的阴暗面?

“相关部门”推广绿坝期间各个“被推广”的部门达到了空前的具有中国特色的沉闷,无人理睬,此举同时激起了相关部门心里的阴暗面,因此开始动用舆论宣传工具蛊惑群众所谓黄色信息的危害,眼睛是心灵的窗户,搜索引擎是上网的第一站,所以就开始从惩罚谷歌(替罪羊)开始,并进行一系列活动。

一个绿坝引起的笑话

2008年5月,工业和信息化部在相关部门支持下,全面出资购买“绿坝·花季护航”软件,免费向全社会提供下载使用。绿坝是被要求在必须预装在每一台2009年7月1日之后在大陆发行的电脑里(Windows Only :lol: )。

为了配合,宣传部开始吹嘘中国的互联网目前环境有多么差,处在水深火热中,为佐证这个观点,开始了多项“专项整治”:

2009年6月18日,中国互联网协会互联网违法和不良信息举报中心发表文章《强烈谴责谷歌传播淫秽色情和低俗信息》,批评 谷歌中国存在“大量淫秽色情和低俗信息”,使“大量境外互联网上的淫秽色情信息通过该网站传播到我境内”。

6月18日晚,中国中央电视台的《新闻联播》与《焦点访谈》《新闻1+1》节目先后对该事件进行了报道。在 《焦点访谈》节目中,中国互联网违法和不良信息举报中心演示了谷歌网站联想词搜索存在提示黄色信息的问题。举报中心主任助理张杰认为搜索引擎上的违法有害 信息会对公众产生危害,会危害到青少年的健康成长。《焦点访谈》的旁白提到,一些网民认为,谷歌中国未做好过滤淫秽色情内容的工作是缺乏社会责任的表现。 此外,《焦点访谈》还对教师和大学生进行了采访。大学生高也在 采访中说:“黄色啊什么淫秽信息在网上那个毒害特别大,特别是经过一些像Google这样的链接,那种毒害特别大”。举报中心副主任奚伟表示说,他们将对 谷歌中国的整改进行进一步的核查,并呼吁广大网民监督,呼吁互联网行业自律。《焦点访谈》总结说,互联网的从业人员应该“自尊自爱,遵守法律”,谷歌中国 的行为严重违反了国家的相关规定,应受到谴责和处罚。最后,《焦点访谈》呼吁“纯洁网络环境,让中国的互联网孕育出更多的善因,结出更多的善果”。此段文字出自:维 基百科 目前该 视频 很多门户网站已经屏蔽这个视频,可以通过这个链接观看:http://you.video.sina.com.cn/b/21894428-1369918907.html

2009年06月24日,广州日报:谷歌涉黄

…..(此处略去同类报道N条关于“网民上网入口”——搜索引擎涉黄的报道)…..

2009年7月,喂奶门事件之后,有关部门决定进一步投资3000万元用于绿坝软件的改进工作,为广大青少年安全上网营造一个干净和谐的环境。

2009年08月13日,工信部部长李毅中表示:“绿坝”不会强制安装

绿坝是否有安装量?结果是肯定的,所有政府用的服务器,应该都率先测试了绿坝服务器ββββ版,然后出现了以下界面:

2009 年北京师范大学博士招生简章

image

当然不尽是安装绿坝,可能还有其他的屏蔽关键字的软件,但这些软件往往算法垃圾,拖慢整个服务器的速度。

2009年09月27日,动用自己的神犬CCAV开始报道:整治手机互联网

绿坝真正过滤的是什么?通过反编译内部的文件,发现其过滤的大多是政治相关的内容,所以,我的结论是绿坝以及千千万万的过滤软件,只是GFW的一个客户端而已。

谷歌退出中国大陆事件已经带上了浓重的政治色彩?

尽管“相关部门”一再强调,不要将此事上升为政治事件,一些无知的大学生也在撰文表示支持相关部门,但是“相关部门”已经在利用这次事件将自己的“政治目的”暴露无余,如果仅是屏蔽黄色信息,那有必 要将以下关键字也列为屏蔽列表吗?

图片做的比较智障,请见谅

当然,作为初级网民你可以去尝试一下搜索以验证,但是,实质上,这是前一段时间两会的召开,而屏蔽的部分“百家姓”姓氏列表,如:周、李、温、胡等等。这些大多与我国领导人姓氏及其相似。

所以我想,冠冕堂皇地玩文字游戏,什么“政治的谷歌”,“谷歌的政治”,在感受中华民族汉字博大精深之余,也深深地为那些苟且偷生的五毛党和不明真相的未来国家栋梁感到深深的悲哀。

同样,我可以断定,逼走谷歌是因为谷歌知道的太多,目的是打击封锁不同政见者的言论,而并不只是色情不良信息。

屏蔽规则初探

Http请求

首先看关键字“色情”在百度和谷歌的搜索结果:

image

http://www.baidu.com/s?wd=%C9%AB%C7%E9

image

http://www.google.com.hk/search?hl=zh-CN&source=hp&q=色情

同样是关键词,为什么谷歌就不能搜索,而百度就可以搜索?

URL参数

继续看这两个图片:

image

image

Https+Http请求 或 URL参数

外国IP+关键字列表=屏蔽

国内的主机由于有着非常完美的审查机制,有着随时随地完美的被拔线的机会,因此大多IDC里都会“遵纪守法”,所以,屏蔽制度不适用于 使用国内主机提供服务 的服务,所以,我外交部可以说:“中国的互联网是充分开放的”。

谷歌“退出”中国之后,相关部门对待谷歌就像对待外国网站一样,伟大的审查系统会正常过滤掉所有的“敏感”信息

仅适用于Google的屏蔽列表

为了将谷歌的审查进行到底,拥有一个适用于Google的屏蔽列表亟待解决,呼之欲出,一气呵成,完美无缺。

这个列表没有确凿证据存在,但是其最主要的就是屏蔽一些关于时政的丑闻人物等。

我说谎了吗?可是,谁在说谎?

15 thoughts on “谁在说谎?

  1. 你呀,现在别关心这些了,我以前比你还恼火,看着他们欺负诬蔑“G 哥”心情极为不爽,但是我又能怎样?拯救?没办法了,算了,我的互联网生涯还是继续吧!

  2. 所以,说搜索引擎涉黄,根本是一个不着边的理由,其扯淡程度不亚于“不想当厨师的裁缝不是好司机”。 (完全同意)

发表评论

电子邮件地址不会被公开。 必填项已用 * 标注

*

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre lang="" line="" escaped="" highlight="">