主题:抓网页遇到的又一问题——需要登录
merry05
[专家分:8920] 发布于 2008-08-08 17:07:00
有的网页需要登录才能看到信息,而这部分信息正是我想要的。
在VB下我该解决这个问题?
抓取网页我用的方法是:利用XMLHTTP返回HTML代码,然后strconv转换编码,再用正则表达式提取出要的内容。但这样子碰到需要登录的就不行了
网上搜到了一些东西,是用JAVA写的,没看明白。不知各位大侠在VB6下有何良策?
最后更新于:2008-08-08 17:08:00
回复列表 (共3个回复)
沙发
tanchuhan [专家分:15140] 发布于 2008-08-08 17:41:00
[em9][em9]今晚我帮你
说明一下,如果登录时需要输入验证码的话,那难度可就高了哦。
当然,弄个手工输入的也行。
板凳
tanchuhan [专家分:15140] 发布于 2008-08-08 21:05:00
[code=c]
With m_xh
.open "POST", "http://xxx.xxx.com/xxx.asp", False
.setRequestHeader "content-type", "application/x-www-form-urlencoded"
.send sPost
End With
[/code]
从以前写过的代码中复制出来的,sPost是要提交的表单的内容:
username=tanchuhan&password=xxxxxx&savename=1
具体可以查看页面的源代码,在<form></form>内部的<input>就是了。
当时测试的时候,就是拿pfan的登陆页面来测试的
3 楼
merry05 [专家分:8920] 发布于 2008-08-09 09:15:00
[quote][em9][em9]今晚我帮你
说明一下,如果登录时需要输入验证码的话,那难度可就高了哦。
当然,弄个手工输入的也行。[/quote]
谢谢您的分享,我去测试测试。
我在之前还真没考虑到验证码这事情。幸好网页也没验证吗,万幸中。
顺带一句,Tam没去看奥运?
我来回复