Parser body_parser=new Parser(node.toHtml()); Tex " /> 欧美卡1卡2卡三卡2021精品,黄图gif揉胸吸奶,男人和女人全黄一级毛片

天天躁日日躁狠狠躁AV麻豆-天天躁人人躁人人躁狂躁-天天澡夜夜澡人人澡-天天影视香色欲综合网-国产成人女人在线视频观看-国产成人女人视频在线观看

解析得到除去標(biāo)簽的txt內(nèi)容

復(fù)制代碼 代碼如下:
NodeList body_nodes=this.getParser().parse(body_filter);
for(int i=0;i<body_nodes.size();i++)
{
Node node=body_nodes.elementAt(i);

Parser body_parser=new Parser(node.toHtml());
TextExtractingVisitor visitor=new TextExtractingVisitor();
body_parser.visitAllNodesWith(visitor);
body.append(visitor.getExtractedText());
}

TextExtractingVisitor,visitAllNodesWith等類及方法都是Visitor中比較很重要但也很少見的。
下面附源代碼:
復(fù)制代碼 代碼如下:
import Java.io.BufferedWriter;
import Java.io.File;
import Java.io.FileWriter;
import Java.io.IOException;
import Java.util.Date;

import org.htmlparser.Node;
import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.filters.AndFilter;
import org.htmlparser.filters.HasAttributeFilter;
import org.htmlparser.filters.HasChildFilter;
import org.htmlparser.filters.TagNameFilter;
import org.htmlparser.util.NodeList;
import org.htmlparser.visitors.TextExtractingVisitor;

import com.extractor.Extractor;

public class ExtractorHangdian extends Extractor{
public void extract()
{
BufferedWriter bw=null;
String indextime;
String title;
StringBuffer body=new StringBuffer();;
NodeFilter time_filter=new AndFilter(new TagNameFilter("font"),new HasAttributeFilter("color","#808080"));
NodeFilter title_filter1=new AndFilter(new TagNameFilter("td"),new HasChildFilter(new TagNameFilter("b")));
NodeFilter body_filter=new AndFilter(new TagNameFilter("td"),new HasChildFilter(new TagNameFilter("p")));

try
{
NodeList title_nodes=this.getParser().parse(title_filter1);
Node node=title_nodes.elementAt(0);
NodeList node2=node.getChildren();
//title=node2.elementAt(0).toHtml(); /* '/r/n' */
//title=node2.elementAt(1).toHtml(); /*font color="#000080" style="font-size:14.4px*/
//title=node2.elementAt(2).toHtml(); /* b */
title=node2.elementAt(3).toHtml(); /* 教材征訂及教師用書登記通知 */


bw=new BufferedWriter(new FileWriter(new File(this.getOutputPath()+title+".txt")));

String url_seg1=getInputFilePath().substring(3,30);
int end=getInputFilePath().lastIndexOf(".");
String url_seg2=getInputFilePath().substring(30, end);
String url_seg=url_seg1+".ASP?"+url_seg2;
url_seg=url_seg.replaceAll("http:////","/");
String url="http://"+url_seg;

bw.write(url+NEWLINE);
bw.write(title+NEWLINE);


}
catch(Exception e)
{
e.printStackTrace();
}

this.getParser().reset();
try
{
NodeList time_nodes=this.getParser().parse(time_filter);
Node time_node=time_nodes.elementAt(1);//這里的“1”表示符合time_filter的第二個(gè)元素
indextime=time_node.getNextSibling().toHtml();

bw.write(indextime+NEWLINE);
}
catch(Exception e)
{
e.printStackTrace();
}

this.getParser().reset();//得到除去標(biāo)簽的所有txt文本
try
{
NodeList body_nodes=this.getParser().parse(body_filter);
for(int i=0;i<body_nodes.size();i++)
{
Node node=body_nodes.elementAt(i);

Parser body_parser=new Parser(node.toHtml());
TextExtractingVisitor visitor=new TextExtractingVisitor();
body_parser.visitAllNodesWith(visitor);
body.append(visitor.getExtractedText());
}
bw.write(body+NEWLINE);

}
catch(Exception e)
{
e.printStackTrace();
}

try
{
if(bw!=null)
bw.close();
}catch(IOException e)
{
e.printStackTrace();
}
}
}

這里順便提一下,當(dāng)年bw沒有關(guān)掉,怎么讀不進(jìn)去,搞了我好幾天,郁悶死了,想起來就火大,注意!!

jsp技術(shù)解析得到除去標(biāo)簽的txt內(nèi)容,轉(zhuǎn)載需保留來源!

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 美国一级大黄一片免费的网站 | 国产成人免费片在线视频观看 | 老司机午夜影院味味 | 天上人间影院久久国产 | 樱桃视频影院在线播放 | 国产成人精品免费视频大全办公室 | 日韩欧美一区二区三区免费看 | 亚洲综合中文字幕无线码 | WWW亚洲精品久久久乳 | 绝对诱惑在线试听 | 在线亚洲国产日韩欧洲专区 | 亚洲午夜一区二区电影院 | 人禽l交视频在线播放 视频 | 日韩亚洲欧美中文高清在线 | 免费撕开胸罩吮胸视频 | 亚洲中文字幕手机版 | 久久re这里精品在线视频7 | 美女白虎穴 | 午夜在线视频国产极品片 | 日本二区三区欧美亚洲国 | 精品久久免费观看 | 京香在线播放 | caoporn超碰在线 | 一本到2019线观看 | 黑人阴茎插女人图片 | 扒开老师粉嫩的泬10P | 被窝伦理午夜电影网 | 菠萝蜜国际一区麻豆 | 45分钟做受片免费观看 | 午夜办公室在线观看高清电影 | 无人区免费一二三四乱码 | 国产人妻精品无码AV在线五十路 | 色婷婷欧美在线播放内射 | 国产精品你懂得 | 无套内射无矿码免费看黄 | 7723手机游戏破解版下载 | 亚洲欧洲日韩国产一区二区三区 | 国产69精品麻豆久久久久 | 亚洲精品视频久久 | 日韩爽爽影院在线播放 | 麻美ゆま夫の目の前で犯 |