我非常喜欢它的背景音乐,女主角也非常漂亮,推荐大家看看
Archive for 七月, 2010
竟然被钓鱼了,淘宝上有客户突然m我说,这个货怎么没有了,是不是下架了呢?然后给我一个链接,(请不要再此链接登陆你的账号和密码,会被钓鱼!),接着是看到一个高仿的网站支付宝会员页面,输入用户名和密码之后会被对方记录入数据库…然后花您的消费 ……
哥被骗了8.7元,以此为戒,敬告各位盆友
打算做货源类网站
唐骏现象,折射出当今社会深层次的问题:诚实品德的缺失。投机取巧已成为一种社会潜规则,诸如学术造假、统计造假、学历造假、业绩造假等等,甚而一些很小的社会现象:排队夹塞、走后门、闯红灯等不守规则的情况泛滥成灾,其背后都是不诚实的动机在作祟。当我们在责怪唐骏、并为此而愤怒时,是否也扪心自问:自己的诚实品德如何?有否投机取巧而得利?如果没有社会大众的诚实氛围,唐骏现象将层出不穷。。。。
每次面试官面试,我都要尴尬的回答下面的问题,“你毕业于哪个学校?”“有没有获得相关技术等级证书?”“你这样的学历跟团队能沟通有问题吗,我们团队最低学历是本科”等等诸如此类问题,似乎学历已经成为如今企业招聘人才的重要条件之一。
有人说学历就起这么一个敲门砖的作用,在工作范畴内起不到任何作用,还不如到技校学门手艺,白白浪费自己的大好青春,其实不然,我认为在学校里学到的更多的是分析问题,解决问题的能力,而不是一种技能。首先在中国没有大学毕业证你连报考公务员的资格都没有,曾经有一个面试官当面质问我“你连考大学的能力都没有,那你让我凭什么相信你?”
多数人认为十年苦读就是为了一份工作轻松体面的工作,毕业之后却发现因为竞争太激烈而凭着一张毕业证书找不到相对较好的工作,甚至还要做一些没文化人的下属,于是便哀叹大学没用,一直到现在口口相传的都是大学文凭悲观信息,却不知自己身在福中不知福。
我曾经就职于一位副总手下,他24岁毕业于湖南大学,之前在国内某B2B公司小部门做职员,但当时他非常敬业,非常认真的完成自己的每一任务,工作同时考取了北大MBA,三年后跳槽,30他做上了副总的职位。
另一位同事16岁就开始在社会上闯荡,一直在努力学习,同样在社会上混了六年,他现在仍然只是一个创业公司的小领班带着刚毕业的学生做些基础工作,很快这些大学生学到技能就开始跳槽,工资也超过了这位无学历的奋斗青年,或许这位青年到30岁也前途无量,也能做上副总,甚至做百万富翁,但是他走的路要比别人艰辛一百倍。
各位换位思考一下:你是公司HR部门,公司要求你招聘30个程序员,于是你便在各大网站上投放招聘信息,如何快速完成这次招聘工作呢,研究生学历充足就放弃本科生,本科生学历充足就放弃专科生,毕竟高学历的人群中,找到合适的人选概率会高很多,没有必要为了小概率事件在一堆简历里翻来翻去,这样HR部门的效率就提高很多,更何况很多知名互联网公司都有硬性指标,所以现在多数技校生及自学成才的人都在创业公司工作。
或许大家又要把哈佛退学的比尔盖茨,研究生退学的鲍尔默,德州大学退学的Michael Dell等重量级人物跟我辩论,但是这个世界上天才的数量是有限的,如果你不是,那就走常人路线用你的学历给你的简历添金,当然没学历也不要像唐骏学习,剩下的没学历的常人多都在富士康类似的血汗工厂做苦力劳动,认为自己有斤两的则开始创业。
如果你不是天才,如果你不愿意比别人抛洒更多的血汗,那就认认真真的学习,珍惜你苦读十年考上的大学,通常学历决定了我们的人生高度。
PPCblog.com呈现给我们一幅由Jess Bachman(在WallStats.com工作)精心描绘的示意图,这张流程图展示了每天拥有3亿次点击量的Google搜索按钮背后搜索引擎在那不到1秒的响应时间内所进行的处理。
这是我刚付印的最新示意图,这张流程图演示了在你点击Google搜索按钮后,在Google返回查询结果前那一眨眼的功夫里,Google是如何处理你的搜索请求的?这可是搜索巨人Google年赢利额高达200亿美元的杀手级应用,也是Internet首屈一指的商业和技术神话,大家肯定都想知道Google这棵摇钱树背后的秘密。
一、Google官方对其搜索技术的叙述
我们搜索技术的后端软件会在服务器侧触发一系列执行时间不到1秒的并行计算,Google问世前的传统搜索引擎的搜索结果严重依赖于关键词在页面上出现的频度,我们使用了200多个指标信号(其中包括我们拥有专利的PageRank页面等级加权算法)用来检查万维网的链接结构(佩奇和布林最初的想法是把万维网的链接结构用图论的有向无环图来建模)并决定网页的重要程度,我们假定一个网页的重要程度取决于别的页面对它的引用,就像学术论文中的引用指数一样,重要的论文总是会被很多其他论文引用。然后我们再根据搜索条件进行超文本匹配分析(对bot抓取的页面内容进行关键词倒排索引检索)确定跟搜索请求最相关的网页。综合最重要的网页和跟搜索请求最相关的网页两个方面,我们就能按重要程度和用户搜索请求相关程度把查询结果排序后呈现给我们的用户。
二、数据中心:Google用来索引世界的塔
Google的数据中心高度机密,我们能了解到的不多:
1. 在美国本土有19个以上的数据中心,其余17个数据中心分布在美国以外的世界各地。
2. 每个数据中心有50万平方英尺那么大,建造一个数据中心要花费约6亿美元。
3. Google数据中心是世界上最高效的设施之一,而且也非常环保,几乎没有碳排放。
4. 数据中心使用50到100兆瓦的电力,由于需要冷却,通常建在便于用水的地方。
5. Google服务器安置在一个一组容得下1160台服务器的有房子那么大的标准集装箱容器中。
三、处理流程:
1. 你写博客、或在Twitter上推微博、更新站点等诸如此类往web上添加内容的操作
2. Google爬虫(一种作为搜索引擎构件的智能代理程序)抓取你网页的title和description、keyword等内容
(1) Google bots程序沿链接路径周游万维网,如果没有http路径到你的站点,你的站点将不会被索引
(2) 如果你在robots.txt中设置不许索引,Google bots程序将不会抓取你的网页
(3) 如果链接到你站点的html链接上有nofollow标签,Google bots将不会从这些链接路径周游到你的站点。
(4) Google也能通过blog软件或xml站点地图找到你的网站
(5) 从PageRank越高的网站链接到你的网站的链接越多,你的网站的PageRank就越高。
(6) Google爬虫将周游所有未标注为nofollow的链接
3. 一旦被Google爬虫访问到,网页几秒内就被索引了
(1) 网页内容被存储在一个倒排索引中
① 网页标题和链接数据被保存在一个索引中,用于广度优先搜索
② 网页内容保存在另一个索引中,以用于检索频率不高的长尾、个性化、深度优先搜索
(2) 当你用Google搜索时,你并没有在检索时时更新的万维网,而是在检索Google的缓存,Google定期更新其索引库,在Twitter实时搜索等的竞争下,Google的索引库更新周期趋短。
4. Google基于链接评估域名和网页的总体PageRank值。
5. 检查网页以防止作弊行为
(1) Google的搜索质量和反垃圾信息审查和优化算法
(2) 1万多远程测试用户评价搜索结果的质量
(3) Google征请用户对有PageRank讹诈嫌疑的垃圾信息进行举报
(4) Google接到 (美国)数字千年版权法案的通知,要求Google把盗版行为记录备案
6. 在对页面做了损害分析后,现在每个页面都有很多用于辅助用户搜索的数据片(比如检索关键词)反向引用着它
7. 用户发出搜索请求
(1)Google搜索质量工程师Patrick Riley:在大多数Google搜索中,你的搜索处于许多并行的控制过程或Google实验室的创新项目组过程中,可以说每一个查询请求都会参与一些Google的创意实验。
8. Google会用同义词匹配与你的搜索关键词语义相近的查询结果
9. 生成初步的查询结果
(1) 也许Google宣言能返回成千上万数量无限的查询结果,但一般只显示不到1000条的查询结果,出于“少则得,多则惑”的考虑。
(2) 对查询结果做本地化处理,本土站点在查询结果中优先出现
10. 对查询结果集按权威性和PageRank进行排序,重复的查询结果被剔除。
(1) Google根据关键词、广告类型、用户所处位置找出相关的被竞价拍卖的关键词广告
(2) 关键词广告必须遵守当地法律条文
① 广告业主的非法广告将被取缔
② 如果关键词的搜索流量过低或关键词广告点击量偏低,则会被自动禁用
③ 出于商业策略,像亚马逊这样的客户会给予优惠折扣。
(3) 关键词相关广告按收益潜力(对关键词进行竞价拍卖后的广告质量不断进行评估)排序
(4) 对广告业主来说广告内容一般都是固定的,但有时使用动态关键词使关键词广告与搜索关键词相关度更高
①一些广告本身允许增加易变的附属信息,比如网站链接、电话号码、产品链接、地址等
(5) 当广告拥有了相当高的点击率,则会显示在搜索结果列表的上方,以使其更显眼。
(6) 其余的广告依序显示在相应的位置
11. 对查询结果进行过滤处理
(1) 对通常的查询(比如在Google首页上发出的搜索请求),Google会把相关的专题性垂直搜索结果(比如新闻、购物、视频、书籍、地图等)也加到返回的查询结果中
(2) 个性化方面:用户访问过的网站在查询结果列表中会更靠上
(3) 大量使用锚点的网站有可能被从查询结果中删除
(4) 搜索结果集的聚簇性:如果网页被其他高PageRank的网站引用,则网页的重要性会大大提高。
(5) 趋势分析:对搜索流量爆增或有大量新闻的搜索关键词,Google会在新的查询结果中增加额外的PageRank权值。(Google有反映关键词搜索流量的Google趋势专题页面)
(6) 同一个域名下的多个网页如果具有相同的PageRank会被归为一组。
12. 最终返回给浏览器端的用户一个人性化的、布局良好的、查询结果和广告泾渭分明的有机查询结果页面。
所有这些步骤在总共不到1秒的响应时间内完成,每天3亿次的点击量给Google带来了超过200亿美元的年收入。

