别摸站
站站长的抄写本。

正则表达式实战

用正则表达式来获取一段文本中的任意字符: 用(.*)当然可以,但运行之后会发现,无法获得换行之后的文本。正则表达式中,“.”(点符号)匹配的是除了换行符“\n”以外的所有字符。 正确方法:([\s\S]*),也可以用 “([\d\D]*)”、“([\w\W]*)” 来表示。 用正则表达式过滤HTML危险脚本 过滤替换Html代码中的JS(JavaScript)脚本和Html标记,防止恶意代码执行。去掉用。问题出现,如果js文本中出现<符号,则过滤失败。 ...如果想只保留<p>、<br>、<b>之类的合理有用的标签,这个有点难,有不同的办法,个人认为最简洁有效的

IIS无法启动的解决

iis(5.1)无法启动,莫名其妙的,XP系统里的IIS不能启动了,老是处于“停止”状态,而且手动启动时会弹出提示:“服务没有及时响应启动或控制请求”错误。World Wide Web Publishing服务也无法启动,提示错误1721,资源不足,无法完成该操作。
已经试过重装,但都是没有用。重新启动电脑,IIS还是不能启动;后来重装IIS,还是同样的问题。
...看来时代在进步,Windows补丁也在不断更新添加中,老办法不够用了,呵呵。

Request.ServerVariables 常用参数

Request.ServerVariables("Url")
返回服务器地址
Request.ServerVariables("Path_Info")
客户端提供的路径信息
Request.ServerVariables("Appl_Physical_Path")
与应用程序元数据库路径相应的物理路径
Request.ServerVariables("Path_Translated")
通过由虚拟至物理的映射后得到的路径
Request.ServerVariables("Script_Name")
...

如果实现时间显示为秒前分钟前小时前这个效果?代码

怎么根据文章发表地时间来显示他是几小时前,几分钟前,或几秒前?
把发表的时间改为几个月,几天前,几小时前,几分钟前,或几秒前
思路是这样的:
用系统当前时间与文章发表的时间比较,如果小于60秒,则为几秒前发表(差值为确切秒),小于1小时大于1分钟则为几分钟前发表(差值/60 为确切分),小于24小时大于1小时为几小时(差值/3600 为确切小时),小于一个月,大于24小时为几天(差值/3600*24 为确切天数)

asp+XMLHTTP组件做采集常用函数

asp+XMLHTTP组件做采集常用函数:
http://blog.csdn.net/zc2087/archive/2009/03/05/3959351.aspx
http://www.cnblogs.com/winner/archive/2006/12/13/590820.html

摘来几个不常见的:

[CODE_LITE]'==================================================
'函数名:PostHttpPage
'作 用:登录
'==================================================
...

XMLHTTP 的应用参考

MSXML. xmlhttp 的应用参考:http://hi.baidu.com/etangren/blog/item/267f9e165515a951f2de3230.html

申请最高版本的XMLHTTP对象,程序代码:http://hi.baidu.com/hy_zone/blog/item/2ebdc6fd4eeda046d7887d01.html
[CODE_LITE]Dim ArrProgId,Prog,Flag,XmlHttpCom
ArrProgId = array("MSXML2.ServerXMLHTTP.4.0", "MSXML2.ServerXMLHTTP.3.0", "MSXML2.ServerXMLHTTP", "MSXML2.XMLHTTP.5.0", "MSXML2.XMLHTTP.4.0", "MSXML2.XMLHTTP.3.0", "MSXML2.XMLHTTP","Microsoft.XMLHTTP")
...

MSXML2.XMLHTTP 和 MSXML2.ServerXMLHTTP 有什么区别?答案

MSXML2.XMLHTTP 和 MSXML2.ServerXMLHTTP 有什么区别?奇怪的是,有时用MSXML2.XMLHTTP正常,有时采集出错,再用MSXML2.ServerXMLHTTP就没问题了。搜索一番,有点结果:

ServerXMLHTTP可以自定义超时,XMLHTTP是默认超时,而且ServerXMLHTTP可以跨域访问,访问的地址如果跳到另外的域名去了,它也可以继续请求页面,正常获取多次重定向后的页面内容,而XMLHTTP会抛出异常:禁止访问

'设置Msxml2.XMLHTTP的超时时间是没用的
...

MSXML的GUID和ProgID信息

MSXML的GUID和ProgID信息

msxml 4.0在安装时不会覆盖以前老版本的msxml.所以各个版本的msxml可以共存。目前IE缺省的XML解析器是msxml 2.0或者msxml 3.0,即使安装了msxml 4.0也是这样。如果想使用最新安装的msxml 4.0,就必须使用脚本,利用版本相关的ProgID来创建对象
下面列出一些常用的ProgID与对应的对象:
Object Name ProgID
DOMDocument(msxml 3.0) MSXML2.DOMDocument
...

robots.txt语法及参考资料

robots.txt 文件相信大部分网站很少会用到,除非是对某些搜索引擎深恶性痛绝(如:来访过频对服务器带来压力、部分页面不希望被抓取,等)。最近某人也是因为某些原因对某些搜索引擎的spider作了部分限制。
在站点根目录下放置robots.txt是一件很慎重的事,搞不好就把自己给Kill了,呵呵,小心为妙。
robots.txt语法:
最简单的 robots.txt 文件使用两条规则:
User-agent:应用以下规则的漫游器
Disallow:要拦截的网址
这两行会视为文件中的一个条目。可根据需要加入任意多个条目。您可在一个条目中加入多个 Disallow 行和多个 User-agent。
...

搜索引擎spider蜘蛛User-Agent标志集

各类网络搜索引擎spider蜘蛛User-Agent标志

baidu: "Baiduspider+(+http://www.baidu.com/search/spider.htm)
baidu代码: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322, Baidu-Transcoder/1.0.6.0, gate.baidu.com)

Goolgle : Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
...
分页:[«]1[2][»]

© blmo.cn. Some Rights Reserved.