用ASP做全文检索

摘要:通过词句查找相关的全文是浏览器端常用的方法,ASP类似于CGI,也可以进行简单的文本方式全文检索

  在 Internet/Intranet上对某类信息做详细浏览和全文检索也是常碰到的情况。ASP是微软公司开发的用于制作动态Web页的一种服务器端脚本型式(或曰编写环境)。它使用VBScript或JavaScript等简易的脚本语言,集成在HTML码中,在服务器端响应浏览器端请求而执行数据访问和过程(或对象)调用并产生浏览器端执行的脚本语言。本文介绍用ASP编写全文检索代码的方法。

方法介绍:
  确定被检索的文件。将它们保存在同一文件夹中。文件的类型可以是任何文本类型(包括.htm网页文件类型)
  建立被检索文件的信息库。其中主要包含文件名,文件标题等。
  用ADO方式访问数据库。建立记录集对象。
  逐个打开记录集中当前记录所指向的文件。用查找的字串对文件的全文本进行匹配比较。
Continue reading

搜索引擎的缓存机制

以前曾经提到过搜索引擎的缓存策略, 根据搜索引擎搜索的关键词的统计分布, 可以优化设计搜索引擎的缓存策略. 就普通的缓存策略上讲, 缓存是因为在一定的时间段内的搜索的关键词集中在一定的范围内, 并且这些搜索相对稳定. 例如每天搜索"美女"的人总有10万,20万, 而结果在这段时间相对稳定, 因此没有必要每次去检索索引文件, 而将上一个人搜索的结果直接返回便可以了.

搜索引擎缓存策略也同搜索引擎的算法密切相连, 除了搜索缓存, 索引缓存也是一个好方法. 独立或者分布一些权重较高的文档也是一种提高效率的方法. 例如我们有1000万的网页的权重(可以简单的理解为pagerank)比较高, 那么这些网页的排序相比另外一些权重较低的网页相对较为稳定, 就不妨独立出来进行相对独立的索引缓存.

关于缓存的分布, 一般的小型搜索引擎不会用到, 但是如果每天处理上亿次的搜索, 缓存的分布就应当有一定的分布规划, Continue reading

ASP中CACHE技术的应用

aspjpeg是一款非常强大的图片处理组件,纯英文版本。不过早已经有免费版和破解版,但是对其进行详细与深入介绍的文章却是不多,即使有也只牵涉到图片缩略和图片水印。可能是因为纯英文的缘故。

这里我就是针对这些问题谈谈aspjpeg的高级用法。这里的技术主要包括:
图片缩略
图片水印
安全码技术
图片切割
图片合并
数据库支持
更多不常用的方法介绍
以及相关的一些实用技术

aspjpeg唯一点不足的就是输出方式比较单一。在这里,我们主要谈将图片处理保存后再调用的这种输出方法。另外,本人比较懒,所以有些代码仍然引用于原文档,不懂的地方偶会加以解释!

学过vb或者.net的同志肯定一看就明白了。刷子来着。呵呵。

一、图片缩略

<%
Set Jpeg = Server.CreateObject("Persits.Jpeg") 调用组件
Continue reading

从三个方面提高网站的链接广泛度

网站的链接广泛度(Link Popularity)在搜索引擎排名中的作用已得到广泛的认同和重视。实际上,即使你没有在GOOGLE上提交你的站点,但与其它网站作了链接, GOOGLE也可能收录你的网站。搜索引擎还可能完全依据你的链接广泛度决定你的网站排名。

本文探讨如何从内部链接、引入链接和引出链接三个方面来增加网站的链接广泛度。

1. 内部链接
内部链接指同一站点内网页之间的相互链接。
对重要的页面要来回反复地交叉链接。这样做的目的,是让搜索引擎的spider知道这是你最重要的网页。
交叉链接网页还帮助spider更快地找到你的重要页面并将之编入索引,尤其当这些页面被深埋于网站内时,这一点非常重要。

2. 引入链接
引入链接是指让其它相关网站链接你的网站。引入链接有两种类型:

* 自己创建子站点来链接你的主站点
建立几个与你的网站主题相关的小型网站,将它们相互链接,再链接回你的主站点。
Continue reading

学习Web 2.0的方向盘

历史很重要。对一个技术的学习也应当从历史出发,通过其在时间形成历史的流变,得以知晓现状,甚至能够预知未来。

那Web 1.0是什么呢?

他们说,记得静态HTML的WWW时代么?

(那个时代的WWW应用、人们的Web体验、对社会的影响如何?)

那么动态HTML和静态HTML下的Web相比,是多少版本?1.5?对了,他们是真这么叫的。

(在效果和影响上,与1.0相比,扩展和加深多少?)

要呈现的数据存储在数据库中,通过Web服务端的程序,应用户的请求,取出数据,加上事先设计的模板,动态的生成Html代码,发送到用户的浏览器那里。

他是1.0系列,应为用户在浏览器中所见和Web 1.0一样,它有0.5的升级,因为数据不是事先制作并发布,而是动态生成,和用户的需要交互生成。

那好,在加0.5,到Web 2.0,变化是在哪里呢?

(看到了正在崛起的和改变的,会继续朝着什么方向改变互联网和社会呢?)
Continue reading

大型网站的Google排名策略

by 王通
内容提要:真正的SEO(搜索引擎优化)不是作弊手段,只是帮助你的网站更加的合理,更容易被搜索引擎收录,更容易在搜索引擎中获得较好。因为你的工作人员设计的时候因为不懂网络营销知识,所以没有考虑到这些因素。 如果你先考虑到了,你的网站内容和质量又不比别人差多少,排名自然会上去。

早期把Google排名技术简化并写出来的时候,虽然想到了GOOGLE排名会热起来,但是没有想到会热到这个程度。2004年,每天都有不下10个需要这方面的朋友打电话到我公司咨询。每天,公司的SEO业务部门的弟兄们都要把大部分时间花在刷选客户上、技术部门的兄弟们却要常常忙到半夜… … 人们都开始关注SEO了。SEO确实是一种非常有效的网络营销策略,因为利用这一策略,竟然会轻松的让你的潜在客户电话找上门。最近,越来越多的大型网站开始关注SEO。

我以前写的关于Google排名策略的文章,大多都是针对中小型企Continue reading

搜索引擎不收录网站页面的常见原因

1、网页使用框架:框架内的内容通常不在搜索引擎抓取的范围之内。

2、图片太多,文本太少。

3、提交页面转向另一网站:搜索引擎可能完全跳过这个页面。

4、提交太过频繁:一个月内提交2次以上,很多搜索引擎就受不了,认为你在提交垃圾。

5、网站关键词密度太大:不幸的是搜索引擎并没解释多高的密度是极限,一般认为100个字的描述中含有3-4个关键词为最佳。

6、文本颜色跟背景色彩一样:搜索引擎认为你在堆砌关键词欺骗它。

7、动态网页:网站的内容管理系统方便了网页更新,却给大部分搜索引擎带来麻烦,很多搜索引擎不收取动态页面,或只收取第一层页面,不会向下深入收取。这时要考虑使用WEB服务器的重写(rewrite)技术,把动态页面的url映射成和静态页面url相似的格式,搜索引擎误以为是静态页面,就会收取了。

8、网站转移服务器:搜索引擎通常只认IP地址,转换主机或域名时,IP/DNS地址发生改变,这时你要重新提交网站。
Continue reading

MYSQL初学者使用指南

文章来源:电脑爱好者俱乐部

有很多朋友虽然安装好了mysql但却不知如何使用它。在这篇文章中我们就从连接MYSQL、修改密码、增加用户等方面来学习一些MYSQL的常用命令。
一、连接MYSQL。
格式: mysql -h主机地址 -u用户名 -p用户密码
1、例1:连接到本机上的MYSQL。
首先在打开DOS窗口,然后进入目录 mysqlbin,再键入命令mysql -uroot -p,回车后提示你输密码,如果刚安装好MYSQL,超级用户root是没有密码的,故直接回车即可进入到MYSQL中了,MYSQL的提示符是:mysql>
2、例2:连接到远程主机上的MYSQL。假设远程主机的IP为:110.110.110.110,用户名为root,密码为abcd123。则键入以下命令:
mysql -h110.110.110.110 -uroot -pabcd123
(注:u与root可以不用加空格,其它也一样)
3、退出MYSQL命令: exit (回车)
Continue reading

PHP初学者头疼问题总结

作者:wzpwhw 中文PHP论坛

【1】页面之间无法传递变量 get,post,session在最新的php版本中自动全局变量是关闭的,所以要从上一页面取得提交过来得变量要使用$_GET['foo'],$_POST['foo'],$_SESSION['foo']来得到
当然也可以修改自动全局变量为开(php.ini改为register_globals = On);考虑到兼容性,还是强迫自己熟悉新的写法比较好。

【2】Win32下apache2 用get方法传递中文参数会出错
test.php?a=你好&b=你也好
传递参数是会导致一个内部错误
解决办法:"test.php?a=".urlencode(你好)."&b=".urlencode(你也好)
………….

【3】win32下的session不能正常工作
php.ini默认的session.save_path = /tmp
Continue reading