中文分词和TF-IDF

  中文分词(Chinese Word Segmentation)指的是将一个汉字序列切分成一个一个单独的词。中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。

基于JavaScript的REST客户端框架

  现在REST是一个比较热门的概念,REST已经成为一个在Web上越来越常用的应用,基于REST的Web服务越来越多,包括Twitter在内的微博客都是用REST做为对外的API,先前我曾经介绍过“基于REST架构的Web Service设计”,并给出了一些服务器端和客户端代码,随着JavaScript的广泛应用,我这里就给出一个轻量级的基于JavaScript的REST客户端框架。

“开架式”软件设计是未来之路

  早期的国内应用软件产品,其扩展性都是相对较差的,尽管开发商也为此作过很多工作,包括二次开发工具包等等。主要原因就是这些应用本身框架的局限性,不具有可扩展性,在设计时我们关注的只是应用程序的实现,没有关注我们的应用应该构建在一种开放的框架上。

使用PHP调用TinyURL API的方法

  TinyURL是一个缩短网址的Web服务,可以把很长的网址变成简单的地址,通常创建TinyURL的方法是去其主页创建,有时候会有用户在客户端自动生成TinyURL的情况,这里介绍一个通过PHP调用TinyURL生成缩短地址的方法。

润乾报表的使用技巧

  润乾报表软件是一个常用的Java报表工具,使用较为简单,可以轻松制作出各种各样的报表,是一个不错的Web报表工具,下面是我分享的一些使用润乾报表工具所总结的经验和技巧,供其他润乾报表的使用者参考。

数据库查询的分页优化技巧

  分页浏览功能是常见的Web应用功能,对于MySQL数据库来说可以很轻松的使用limit语句实现分页,而对于SQL Server数据库来说,常见的方法是使用数据集本身的游标实现分页,这种方法对于少量数据来说没什么问题,但是对于稍大一点的数据量,例如几十万条数据,则查询速度会降低很多,这里我介绍一种常用的技巧,只要简单的重新构造一下查询SQL语句,就能大幅提高查询性能的方法。

基于REST架构的Web Service设计

  先前我曾经介绍过利用Apache Axis实现基于SOAP的Web Service实现技术和相关代码,总的来说,SOAP的Web Service解决方案虽然较为成熟,且安全性较好,但是使用门槛较高,在大并发情况下会有性能问题,在互联网上使用不太普及,因此并不太适合Web 2.0网站服务使用,目前大量的Web 2.0网站使用另外一种解决方案——REST。

JavaScript通过Flash保存本地数据

  目前流行的网络应用中,有不少应用涉及到保存数据到本地的功能,用于应付网络中断或上不了网的情况,例如Google Reader的Gears离线功能,今天我介绍一种通过Flash保存数据到本地的一个很简单的方法。

DB2ASP数据库ASP页面生成工具

  DB2ASP是一个可以自动将ACCESS数据库文件转化为对应的ASP代码的软件,是月光博客开发的系列免费软件之一。此软件能够让你可视化操作数据库,轻松设置SQL语句,生成常见ASP信息列表,信息递交入数据库,以及查询表单。无须重复编写大量的数据库操作代码。可以满足常见的信息列表(可以编辑删除),新记录提交表单,查询表单的自动生成,对于经常用asp编写进行数据库操作网页的程序员帮助较大,让你最大可能地进行重复的数据库操作代码编写。

Java在Web开发语言上败给了PHP

  PHP的主要语言开发者之一、Zend公司的创始人之一Andi Gutmans最近在blog中直言不讳地批评了Java语言。他指出,目前Java厂商试图在JVM上提供动态语言实现的路子根本不对,Java已经输掉了Web开发语言的战争,PHP是事实上的标准和胜利者。

通用PHP动态生成静态HTML网页的代码

  最近研究PHP的一些开发技术,发现PHP有很多ASP所没有的优秀功能,可以完成一些以前无法完成的功能,例如动态生成HTML静态页面,以减少服务器CPU的负载,提高用户访问的速度。

中文汉字GB2312和UTF-8的编码转换程序

  在使用Google或者百度进行中文搜索的时候,我们会发现搜索过程中URL地址栏会变成一串格式字符串编码,我们编写程序经常也需要进行中文汉字到这类URL编码的转换,这里介绍两段相关的转换函数。

ACCESS数据库转换MYSQL数据库的软件

  DB2MYSQL是一个可以自动将ACCESS数据库文件转化为对应的SQL代码的软件。可广泛应用于ACCESS数据库转换为MYSQL或其他类型的SQL数据库的软件。

终端仿真器源代码

  发布一个以前写的老程序,功能是在DOS环境下通过MODEM的内部命令拨号到远端UNIX主机上,并实现一定的终端仿真功能,终端方式为VT100。此自由软件的授权方式是GPL(通用公共许可证)。

留言本开发的未来需求规划

  对于我开发的留言本的下一步需求规划,我打算朝着下面的方向发展:增加反垃圾留言功能的同时,增强用户体验。

月光留言本系统2.2版本发布

  月光留言本系统是基于微软IIS平台ASP环境,使用ACCESS数据库。适用于IE4.0以上版本浏览器,Win98+PWS或Win2000+IIS以上运行环境。

通过Web Service调用Google SOAP Search API

  我曾经介绍过“使用Axis开发Web Service程序”的一些步骤,做为一个更有特色的应用范例,本次我将介绍使用Axis通过Web Service调用Google SOAP Search API,实现Google搜索、Google快照、Google拼写这三项功能,包括示例源代码。

使用Axis开发Web Service程序

  今天是感恩节,差点又要在公司加班了。好在Web Service程序并不是特别难搞,下午终于在eclipse下调通过了,正确产生了服务器端和客户端的Java代码,apache的东西的确很不错。

Google KMZ/MKL文件的两个编程技巧

  今天解决了两个曾经困扰我很长时间的KMZ/MKL文件格式的问题,我挖空心思终于找到了解决的方案。

PHP读MYSQL中文乱码的解决方法

  打算切换某个网站的主机,没想到遇到Php和Mysql中文乱码的问题。

Tomcat中文乱码问题的原理和解决方法

  自从接触Java和JSP以来,就不断与Java的中文乱码问题打交道,现在终于得到了彻底的解决,现将我们的解决心得与大家共享。

Java开发环境的配置心得

  前文介绍了几种主流脚本语言开发技术的对比,本文则介绍Java开发环境的搭建和配置的一些小小心得体会。

Perl、PHP、ASP、JSP技术比较

  本文将对目前最常用的四种动态网页语言Perl(Practical Extraction and Report Language)、PHP(Hypertext Preprocessor)、ASP(Active Server Pages)、JSP(JavaServer Pages)进行一些技术性的比较。

常用正则表达式

  正则表达式(Regular Expression,在代码中常简写为regex、regexp或RE)是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。

彻底杜绝PHP的session cookie错误

  本文讨论的是如何彻底杜绝warning: Cannot add header information - headers already sent in......  这种令人莫明其妙的的错误。

VB代码撰写约定

  这是一家公司软件部规定的VB组代码撰写暂行约定。对于VB项目的协同开发有一定的帮助和指导。

自定义数据库自动编号初始值和步进值

  自定义数据库自动编号初始值和步进值问题: 如何定义数据库的自动编号字段的初始值和步进值?如何定义自动增加字段的初始值和步进值?如何使删除过数据的自动增加字段的开始值重新从1开始?

精妙SQL语句

下面是我搜集的一些精妙的SQL语句。

JSP的参数传递的乱码解决

本文解决了JSP的URL字符 encoding 问题:

编写COM组件,将数据库链接的语句写成COM组件

打开VB,新建ActiveX Dll,将工程改名为COMConnection,类模块改名为class,在class的代码里写

清除SQLSERVER数据库日志的方法

SQLSERVER的数据库日志占用很大的空间,下面提供三种方法用于清除无用的数据库日志文件。