青青子衿, 悠悠我心, 但为君故, 沉吟至今
« 电波怒汉—万峰伊甸园经典语录常用的一些网站测评方法 »

Google PageRank的计算源代码

  最近对google的PageRank(网页等级)比较感兴趣,一直想知道如何不用google toolbar来获取pr值。苦苦搜索之后,找到如下代码:

 

<?php

/**

    This code is released unto the public domain

*/

//header("Content-Type: text/plain; charset=utf-8");

define('GOOGLE_MAGIC', 0xE6359A60);

//unsigned shift right

function zeroFill($a, $b)

{

    $z = hexdec(80000000);

        if ($z & $a)

        {

            $a = ($a>>1);

            $a &= (~$z);

            $a |= 0x40000000;

            $a = ($a>>($b-1));

        }

        else

        {

            $a = ($a>>$b);

        }

        return $a;

}  

function mix($a,$b,$c) {

  $a -= $b; $a -= $c; $a ^= (zeroFill($c,13));

  $b -= $c; $b -= $a; $b ^= ($a<<8);

  $c -= $a; $c -= $b; $c ^= (zeroFill($b,13));

  $a -= $b; $a -= $c; $a ^= (zeroFill($c,12));

  $b -= $c; $b -= $a; $b ^= ($a<<16);

  $c -= $a; $c -= $b; $c ^= (zeroFill($b,5));

  $a -= $b; $a -= $c; $a ^= (zeroFill($c,3));

  $b -= $c; $b -= $a; $b ^= ($a<<10);

  $c -= $a; $c -= $b; $c ^= (zeroFill($b,15));

  return array($a,$b,$c);

}

function GoogleCH($url, $length=null, $init=GOOGLE_MAGIC) {

    if(is_null($length)) {

        $length = sizeof($url);

    }

    $a = $b = 0x9E3779B9;

    $c = $init;

    $k = 0;

    $len = $length;

    while($len >= 12) {

        $a += ($url[$k+0] +($url[$k+1]<<8) +($url[$k+2]<<16) +($url[$k+3]<<24));

        $b += ($url[$k+4] +($url[$k+5]<<8) +($url[$k+6]<<16) +($url[$k+7]<<24));

        $c += ($url[$k+8] +($url[$k+9]<<8) +($url[$k+10]<<16)+($url[$k+11]<<24));

        $mix = mix($a,$b,$c);

        $a = $mix[0]; $b = $mix[1]; $c = $mix[2];

        $k += 12;

        $len -= 12;

    }

    $c += $length;

    switch($len)              /* all the case statements fall through */

    {

        case 11: $c+=($url[$k+10]<<24);

        case 10: $c+=($url[$k+9]<<16);

        case 9 : $c+=($url[$k+8]<<8);

          /* the first byte of c is reserved for the length */

        case 8 : $b+=($url[$k+7]<<24);

        case 7 : $b+=($url[$k+6]<<16);

        case 6 : $b+=($url[$k+5]<<8);

        case 5 : $b+=($url[$k+4]);

        case 4 : $a+=($url[$k+3]<<24);

        case 3 : $a+=($url[$k+2]<<16);

        case 2 : $a+=($url[$k+1]<<8);

        case 1 : $a+=($url[$k+0]);

         /* case 0: nothing left to add */

    }

    $mix = mix($a,$b,$c);

    /*-------------------------------------------- report the result */

    return $mix[2];

}

//converts a string into an array of integers containing the numeric value of the char

function strord($string) {

    for($i=0;$i<strlen($string);$i++) {

        $result[$i] = ord($string{$i});

    }

    return $result;

}

// http://www.example.com/ - Checksum: 6540747202

$url = 'info:'.$_GET['url'];

$ch = GoogleCH(strord($url));

$url='info:'.urlencode($_GET['url']);

echo file_get_contents("http://www.google.com/search?client=navclient-auto&ch=6$ch&ie=UTF-8&oe=UTF-8&features=Rank&q=$url");

/* use curl send the user angent

$curl = curl_init("http://www.google.com/search?client=navclient-auto&ch=6$ch&ie=UTF-8&oe=UTF-8&features=Rank&q=$url");

curl_setopt ($curl, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; GoogleToolbar 2.0.110-big; Windows 2000 5.0)");

curl_exec($curl);

*/

?>

</></>

 



  除非注明,月光博客文章均为原创,转载请以链接形式标明本文地址

  本文地址:http://www.williamlong.info/archives/107.html
  • 文章排行:
  • 1.windlike

  • 看上去好复杂, 先收藏了再说
  • 2006/10/16 10:59:08   支持(14)反对(11) 回复
  • 4.zhs490770
  • 到blog是不可能的。这是php源代码,只能在支持php的网站中用
  • 2009/7/27 16:25:04   支持(10)反对(10) 回复
  • 5.东莞恩创
  • 谷歌页面都是打不开的好不好,哪位大神说谷歌好啦,不信,你们自己搜索下看,能打开页吗? 是哪位大神说好?
  • 2015/1/5 13:37:44   支持(4)反对(4) 回复
  • 6.Washun
  • 请问如何使用到自己的网站或者BLOG?
  • 2006/10/8 16:57:28   支持(9)反对(11) 回复
  • 8.黑莓屋
  • 我就神奇啊,月光是怎么知道这个源代码的?
  • 2010/11/8 21:10:46   支持(9)反对(11) 回复
  • 9.pxllong
  • 我也是做php看看他写的 MD
  • 2010/10/11 17:53:40   支持(6)反对(11) 回复

发表评论:

 请勿发送垃圾信息、广告、推广信息或链接,这样的信息将会被直接删除。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 关注新浪微博:关注新浪微博
  • 关注腾讯微博:关注腾讯微博
  • 关注认证空间:关注QQ空间
  • 通过电子邮件订阅
  • 通过QQ邮件订阅

站内搜索

热文排行


月度排行

本站采用创作共用版权协议, 要求署名、非商业用途和相同方式共享. 转载本站内容必须也遵循“署名-非商业用途-相同方式共享”的创作共用协议.
This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License.