您当前的位置: 首页 > 网站编程 > JSP教程 > JSP采集代码

JSP采集代码

作者:guanchaofeng 来源:本站整理 发布时间: 2009-10-31 10:29 点击:
%@pagecontentType=text/html;charset=gb2312language=javaimport=java.util.regex.*errorPage=% % StringsCurrentLine; StringsTotalString; sCurrentLine=; sTotalString=; java.io.InputStreaml_urlStream; java.net.URLl_url=newjava.net.URL(http://www

JSP采集代码

  <%@pagecontentType="text/html;charset=gb2312"language="java"import="java.util.regex.*"errorPage=""%>
  <%
  StringsCurrentLine;
  StringsTotalString;
  sCurrentLine="";
  sTotalString="";
  java.io.InputStreaml_urlStream;
  java.net.URLl_url=newjava.net.URL("http://www.baidu.com");
  java.net.HttpURLConnectionl_connection=(java.net.HttpURLConnection)l_url.openConnection();
  l_connection.connect();
  l_urlStream=l_connection.getInputStream();
  java.io.BufferedReaderl_reader=newjava.io.BufferedReader(newjava.io.InputStreamReader(l_urlStream));
  while((sCurrentLine=l_reader.readLine())!=null)
  {
  sTotalString+=sCurrentLine;
  }
  //out.print(sTotalString);
  //StringregEx="href=([^\"']*)";
  StringregEx="href=\"([^\"]*)\"";//找出href="****"的链接
  //StringregEx="href=\"+\"";
  Patternp=Pattern.compile(regEx,Pattern.CASE_INSENSITIVE);
  Matcherm=p.matcher(sTotalString);
  intj=0;
  while(m.find()){
  j++;
  out.println("m.group("+j+"):"+m.group(0)+"<br>\n");
  }
  regEx="href='([^']*)'";//找出href='****'的链接
  p=Pattern.compile(regEx,Pattern.CASE_INSENSITIVE);//Pattern.CASE_INSENSITIVE查找忽略大小写
  m=p.matcher(sTotalString);
  while(m.find()){
  j++;
  out.println("m2.group("+j+"):"+m.group(0)+"<br>\n");
  }
  %>

分享到:
本文"JSP采集代码"由远航站长收集整理而来,仅供大家学习与参考使用。更多网站制作教程尽在远航站长站。
顶一下
(0)
0%
踩一下
(0)
0%
[点击 次] [返回上一页] [打印]
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 密码: 验证码:
关于本站 - 联系我们 - 网站声明 - 友情连接- 网站地图 - 站点地图 - 返回顶部
Copyright © 2007-2013 www.yhzhan.com(远航站长). All Rights Reserved .
远航站长:为中小站长提供最佳的学习与交流平台,提供网页制作与网站编程等各类网站制作教程.
官方QQ:445490277 网站群:26680406 网站备案号:豫ICP备07500620号-4