高手帮助啊 懂HTMLParser的请进

liuqiyuan 2010-12-31
给这2个表格,如何过滤出指定的TD 表格内容项。我想根据td_num得到指定的td_value。因为标签属性都一样,所以有些困难。比如,我只想要第一个表格的td_value2和第二个表格的td_value6。如何根据td_num得到td_value呢???
请高手给出代码,最好用filter方法遍历节点访问内容。
代码好的,我会追加分!!!
<table border="0" cellpadding="2" cellspacing="0"><tr><td>FN</td><td>ISI Export Format</td></tr><tr><td>VR</td><td>1.0</td></tr><table xmlns:exsl="http://exslt.org/common">
<tr>
<td valign="top">td_1 </td>
<td>td_value1</td>
</tr>
<tr>
<td valign="top">td_2 </td>
<td>td_value2</td>
</tr>
<tr>
<td valign="top">td_3</td>
<td>td_value3</td>
</tr>
</table>
<table border="0" cellpadding="2" cellspacing="0"><tr><td>FN</td><td>ISI Export Format</td></tr><tr><td>VR</td><td>1.0</td></tr><table xmlns:exsl="http://exslt.org/common">
<tr>
<td valign="top">td_4 </td>
<td>td_value4</td>
</tr>
<tr>
<td valign="top">td_5</td>
<td>td_value5</td>
</tr>
<tr>
<td valign="top">td_6</td>
<td>td_value6</td>
</tr>
<tr>
<td valign="top">td_7</td>
<td>td_value7</td>
</tr>
</table>
sunliao_first 2011-01-04
类似这样写就可以了
document.getElementsByTagName('table').[0].getElementsByTagName('tr')[num].getElementsByTagName('td')[1].innerText;
huansinho 2011-05-03
推荐用jsoup,JQuery风格的API。
thxg 2011-05-19
我都是用nekoHTML直接解析成Document再分析,想分析什么分析什么,处理起来比较方便。
openFox 2011-06-22
HTMLParser里面有很多标签,你这里说的是用TableTag标签,查查如何使用就可以了,很容易拿到行和列,并且是单元格的值。
Global site tag (gtag.js) - Google Analytics