回 帖 发 新 帖 刷新版面

主题:关于从网页上采集信息的问题

从网页上采集信息,如果单纯针对一个网页,或说一个网站我做得到(分析HTML);

但是否存在一种办法,放在哪个网站上都适用,不需要针对某个网站的HTML进行分析,因为每个网站的HTML都是不一样的。

回复列表 (共4个回复)

沙发

impossible mission

板凳

如果这个“信息”是网页标题,呵呵,我做得到。

3 楼

用HTML对象就能采集信息。
因为HTML里有些树枝没有一定的规则性,所以不能。
如图片、链接、表单等。都可以放在树枝的任何一个差上。
那么你想分析这些数据,看来就只有枚举它们咯。也可以用ID查找,不过大多网页都不同,甚至还有没ID的 = =;

4 楼

看来不是我太笨...

是标题我也做得到:^<title>(.*)<\\title>

谢谢大家

我来回复

您尚未登录,请登录后再回复。点此登录或注册