月光博客 » 编程开发 » 防止文章被复制的网络分析软件

防止文章被复制的网络分析软件

  很多Blogger都遇到过自己文章被其他人非法复制的情况,为了让大家能快速将恶意转载者找出来,我根据搜索引擎的一些原理,利用百度搜索引擎的数据,开发了一个可以自动分析查找那些对自己有“实质伤害”的复制人的地址。

防止文章被抄袭的网络分析软件

  这是一个独立的可执行的程序,完全免费,基于ACCESS数据库,目前支持Z-Blog系统,其实支持其他ASP的Blog修改也很简单,有需要的可以联系一下我。(注:其他Blog程序的使用方法:先建立一个Access文件,然后建立一个表,表名为blog_Article,表中增加字段log_ID和log_Title,log_ID为自动编号,log_Title为文章标题,然后将你Blog上的文章标题都复制过来,一篇文章对应一条记录,只复制标题即可,然后在本程序中选择这个数据库)

  数据挖掘我是直接通过调用搜索引擎来实现的。原先打算使用Java下调用Google SOAP API来实现,不过不知什么原因,Google SOAP API搜索英文没有任何问题,一搜索中文就报数组超界,不知道什么原因。只好去调用百度的搜索引擎。

  百度的搜索引擎没有API,不过我还是有办法间接调用的。调用的时候发现中文的确没有什么问题,也没有错误,很顺利就调通了程序。

  我目前搜索的时候,采用了“实质伤害”这个概念,因为目前文章转载的情况会非常多,每一个都去处理会很麻烦。因此我们只去寻找情况恶劣的即可。这个可以通过搜索引擎排名来实现。只寻找那些转载地址对于原文影响最坏的。

  这个程序使用起来很简单,先选择数据库文件,再选择Z-Blog系统,然后填写你自己的域名,点搜索即可开始执行。搜索完成后会自动生成一个名为list.txt的文件,就是搜索结果。此程序对于部分标题的文章会有误判,最好文章标题个性化浓一些。软件的界面看起来不是很好,因为我没有美工嘛。

  点击下载软件:转载文章搜索器

防止文章被复制的网络分析软件

顶一下 ▲()   踩一下 ▼()

相关文章

  1. 1
    大猫   说道:
    我觉得关于转贴和抄袭的区别

    抄袭 :
    没有署名或者抄你的算我的
    没有原文链接

    转贴:
    有原作者署名和原始链接

    特别是抄袭后还加上广告的,我就日了
    支持(25反对(16回复
  1. 2
    geto   说道:
    有没有针对PJBlog的版本啊 :)
    支持(14反对(7回复
  1. 3
    tiger   说道:

    百度的超链技术:
    何为超链技术?举个例子:一篇论文被引用得越多就说明其越好,学术价值就越高。超链分析就是通过分析链接网站的多少来评价被链接的网站质量,也就是说越受用户欢迎的内容排名越靠前。

    Google的PageRank(tm)(网页级别)
    网页级别利用巨大的网络链接结构对网页进行组织整理。实质上,当从网页 A 链接到网页 B 时,Google 就认为“网页 A 投了网页 B 一票”。
    Google 还对投票的网页进行分析, 根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,Google 还要分析投票的网页。“重要”的网页所投出的票就会有更高的权重,并且有助于提高其它网页的“重要性”。重要的、高质量的网页会获得较高的网页级别。 Google 在排列其搜索结果时,都会考虑每个网页的级别。

    支持(14反对(9回复
  1. 4
    麦穗   说道:
    间接调用百度搜索引擎的方法能教给我吗,发到我的邮箱谢谢了
    支持(13反对(8回复
  1. 5
    血色眼泪   说道:
    对付抄袭的最佳方式

    申请个skype

    注册个美国的电话号码

    就是电话要求他的IDC立即下架他的服务器

    并且删除相关的数据

    告诉他这个网站抄袭了你的朋友的内容

    然后告诉他你是某某牛X的黑客(报国外名字)

    如果IDC不答应的话

    就用2.5G以上的流量DDOS上半个小时

    继续电话IDC

    这时候你就可以看到效果了

    警察叔叔可能会找你谈话

    但是通常情况下他们无法获得实质性的证据
    支持(17反对(13回复

发表留言


点击更换验证码