主题:关于从网页上采集信息的问题
merry05
[专家分:8920] 发布于 2008-08-04 09:16:00
从网页上采集信息,如果单纯针对一个网页,或说一个网站我做得到(分析HTML);
但是否存在一种办法,放在哪个网站上都适用,不需要针对某个网站的HTML进行分析,因为每个网站的HTML都是不一样的。
回复列表 (共4个回复)
沙发
天天学习 [专家分:4570] 发布于 2008-08-06 18:43:00
impossible mission
板凳
tanchuhan [专家分:15140] 发布于 2008-08-06 19:10:00
如果这个“信息”是网页标题,呵呵,我做得到。
3 楼
bcahzvip [专家分:6040] 发布于 2008-08-06 23:56:00
用HTML对象就能采集信息。
因为HTML里有些树枝没有一定的规则性,所以不能。
如图片、链接、表单等。都可以放在树枝的任何一个差上。
那么你想分析这些数据,看来就只有枚举它们咯。也可以用ID查找,不过大多网页都不同,甚至还有没ID的 = =;
4 楼
merry05 [专家分:8920] 发布于 2008-08-07 12:36:00
看来不是我太笨...
是标题我也做得到:^<title>(.*)<\\title>
谢谢大家
我来回复