本文共 1294 字,大约阅读时间需要 4 分钟。
今天搞了一天,想用hpple较为便利的利用xpath解析html。
参考的是这里面的做法:
(相关:
)
它里面说的挺详细的:就是引用 上的hpple库,再结合libxml,就可以使用xpath搜索html了。
关于xpath的可以参考:w3school的教程
相关配置好了之后就可以直接使用:
- (void)viewDidLoad{ [super viewDidLoad]; NSError *error; NSData *htmlData = [[NSString stringWithContentsOfURL:[NSURL URLWithString: @"http://dict.youdao.com/m/search?keyfrom=dict.mindex&vendor=&q=apple"] encoding:NSASCIIStringEncoding error:&error] dataUsingEncoding:NSUTF8StringEncoding]; TFHpple *xpathParser = [[TFHpple alloc] initWithHTMLData:htmlData]; NSArray *elements = [xpathParser searchWithXPathQuery:@"//title"]; // get the title NSLog(@"%d",[elements count]); TFHppleElement *element = [elements objectAtIndex:0]; NSString *content = [element content]; NSString *tagname = [element tagName]; NSString *attr = [element objectForKey:@"href"]; NSLog(@"content = %@",content); NSLog(@"tagname = %@",tagname); NSLog(@"attr is = %@",attr);}
使用工程应该是这样,这种方法的确可以较快找到相应的节点,只要你对xpath的规则熟悉。
但是不知道哪里出了错误,我的content一直显示不出来,但是相应的节点是对的,因为其属性都可以抓得到。找了好多都不知道原因,如果知道的,麻烦留言告知!
本文转自老Zhan博客园博客,原文链接:http://www.cnblogs.com/mybkn/archive/2012/07/26/2610472.html,如需转载请自行联系原作者