用ASP做全文检索

摘要:通过词句查找相关的全文是浏览器端常用的方法,ASP类似于CGI,也可以进行简单的文本方式全文检索

  在 Internet/Intranet上对某类信息做详细浏览和全文检索也是常碰到的情况。ASP是微软公司开发的用于制作动态Web页的一种服务器端脚本型式(或曰编写环境)。它使用VBScript或JavaScript等简易的脚本语言,集成在HTML码中,在服务器端响应浏览器端请求而执行数据访问和过程(或对象)调用并产生浏览器端执行的脚本语言。本文介绍用ASP编写全文检索代码的方法。

方法介绍:
  确定被检索的文件。将它们保存在同一文件夹中。文件的类型可以是任何文本类型(包括.htm网页文件类型)
  建立被检索文件的信息库。其中主要包含文件名,文件标题等。
  用ADO方式访问数据库。建立记录集对象。
  逐个打开记录集中当前记录所指向的文件。用查找的字串对文件的全文本进行匹配比较。
Continue reading

搜索引擎的缓存机制

以前曾经提到过搜索引擎的缓存策略, 根据搜索引擎搜索的关键词的统计分布, 可以优化设计搜索引擎的缓存策略. 就普通的缓存策略上讲, 缓存是因为在一定的时间段内的搜索的关键词集中在一定的范围内, 并且这些搜索相对稳定. 例如每天搜索"美女"的人总有10万,20万, 而结果在这段时间相对稳定, 因此没有必要每次去检索索引文件, 而将上一个人搜索的结果直接返回便可以了.

搜索引擎缓存策略也同搜索引擎的算法密切相连, 除了搜索缓存, 索引缓存也是一个好方法. 独立或者分布一些权重较高的文档也是一种提高效率的方法. 例如我们有1000万的网页的权重(可以简单的理解为pagerank)比较高, 那么这些网页的排序相比另外一些权重较低的网页相对较为稳定, 就不妨独立出来进行相对独立的索引缓存.

关于缓存的分布, 一般的小型搜索引擎不会用到, 但是如果每天处理上亿次的搜索, 缓存的分布就应当有一定的分布规划, Continue reading

ASP中CACHE技术的应用

aspjpeg是一款非常强大的图片处理组件,纯英文版本。不过早已经有免费版和破解版,但是对其进行详细与深入介绍的文章却是不多,即使有也只牵涉到图片缩略和图片水印。可能是因为纯英文的缘故。

这里我就是针对这些问题谈谈aspjpeg的高级用法。这里的技术主要包括:
图片缩略
图片水印
安全码技术
图片切割
图片合并
数据库支持
更多不常用的方法介绍
以及相关的一些实用技术

aspjpeg唯一点不足的就是输出方式比较单一。在这里,我们主要谈将图片处理保存后再调用的这种输出方法。另外,本人比较懒,所以有些代码仍然引用于原文档,不懂的地方偶会加以解释!

学过vb或者.net的同志肯定一看就明白了。刷子来着。呵呵。

一、图片缩略

<%
Set Jpeg = Server.CreateObject("Persits.Jpeg") 调用组件
Continue reading

从三个方面提高网站的链接广泛度

网站的链接广泛度(Link Popularity)在搜索引擎排名中的作用已得到广泛的认同和重视。实际上,即使你没有在GOOGLE上提交你的站点,但与其它网站作了链接, GOOGLE也可能收录你的网站。搜索引擎还可能完全依据你的链接广泛度决定你的网站排名。

本文探讨如何从内部链接、引入链接和引出链接三个方面来增加网站的链接广泛度。

1. 内部链接
内部链接指同一站点内网页之间的相互链接。
对重要的页面要来回反复地交叉链接。这样做的目的,是让搜索引擎的spider知道这是你最重要的网页。
交叉链接网页还帮助spider更快地找到你的重要页面并将之编入索引,尤其当这些页面被深埋于网站内时,这一点非常重要。

2. 引入链接
引入链接是指让其它相关网站链接你的网站。引入链接有两种类型:

* 自己创建子站点来链接你的主站点
建立几个与你的网站主题相关的小型网站,将它们相互链接,再链接回你的主站点。
Continue reading

学习Web 2.0的方向盘

历史很重要。对一个技术的学习也应当从历史出发,通过其在时间形成历史的流变,得以知晓现状,甚至能够预知未来。

那Web 1.0是什么呢?

他们说,记得静态HTML的WWW时代么?

(那个时代的WWW应用、人们的Web体验、对社会的影响如何?)

那么动态HTML和静态HTML下的Web相比,是多少版本?1.5?对了,他们是真这么叫的。

(在效果和影响上,与1.0相比,扩展和加深多少?)

要呈现的数据存储在数据库中,通过Web服务端的程序,应用户的请求,取出数据,加上事先设计的模板,动态的生成Html代码,发送到用户的浏览器那里。

他是1.0系列,应为用户在浏览器中所见和Web 1.0一样,它有0.5的升级,因为数据不是事先制作并发布,而是动态生成,和用户的需要交互生成。

那好,在加0.5,到Web 2.0,变化是在哪里呢?

(看到了正在崛起的和改变的,会继续朝着什么方向改变互联网和社会呢?)
Continue reading