用HttpClient来模拟浏览器GETPOSTWord下载.docx
《用HttpClient来模拟浏览器GETPOSTWord下载.docx》由会员分享,可在线阅读,更多相关《用HttpClient来模拟浏览器GETPOSTWord下载.docx(13页珍藏版)》请在冰点文库上搜索。
![用HttpClient来模拟浏览器GETPOSTWord下载.docx](https://file1.bingdoc.com/fileroot1/2023-5/2/1f0907a0-e719-4080-98df-e0e3ab61129a/1f0907a0-e719-4080-98df-e0e3ab61129a1.gif)
1.读取网页(HTTP/HTTPS)内容
下面是我们给出的一个简单的例子用来访问某个页面
/*
*Createdon2003-12-14byLiudong
*/
packagehttp.demo;
importjava.io.IOException;
importmons.httpclient.*;
importmons.httpclient.methods.*;
/**
*最简单的HTTP客户端,用来演示通过GET或者POST方式访问某个页面
*@authorLiudong
publicclassSimpleClient{
publicstaticvoidmain(String[]args)throwsIOException
{
HttpClientclient=newHttpClient();
//设置代理服务器地址和端口
//client.getHostConfiguration().setProxy("
proxy_host_addr"
proxy_port);
//使用GET方法,如果服务器需要通过HTTPS连接,那只需要将下面URL中的http换成https
HttpMethodmethod=newGetMethod("
"
);
//使用POST方法
//HttpMethodmethod=newPostMethod("
client.executeMethod(method);
//打印服务器返回的状态
System.out.println(method.getStatusLine());
//打印返回的信息
System.out.println(method.getResponseBodyAsString());
//释放连接
method.releaseConnection();
}
}
在这个例子中首先创建一个HTTP客户端(HttpClient)的实例,然后选择提交的方法是GET或者POST,最后在HttpClient实例上执行提交的方法,最后从所选择的提交方法中读取服务器反馈回来的结果。
这就是使用HttpClient的基本流程。
其实用一行代码也就可以搞定整个请求的过程,非常的简单!
2.以GET或者POST方式向网页提交参数
其实前面一个最简单的示例中我们已经介绍了如何使用GET或者POST方式来请求一个页面,本小节与之不同的是多了提交时设定页面所需的参数,我们知道如果是GET的请求方式,那么所有参数都直接放到页面的URL后面用问号与页面地址隔开,每个参数用&
隔开,例如:
?
name=liudong&
mobile=123456,但是当使用POST方法时就会稍微有一点点麻烦。
本小节的例子演示向如何查询手机号码所在的城市,代码如下:
*Createdon2003-12-7byLiudong
*提交参数演示
*该程序连接到一个用于查询手机号码所属地的页面
*以便查询号码段1330227所在的省份以及城市
publicclassSimpleHttpClient{
client.getHostConfiguration().setHost("
80,"
http"
HttpMethodmethod=getPostMethod();
//使用POST方式提交数据
//打印结果页面
Stringresponse=
newString(method.getResponseBodyAsString().getBytes("
8859_1"
));
System.out.println(response);
}
/**
*使用GET方式提交数据
*@return
*/
privatestaticHttpMethodgetGetMethod(){
returnnewGetMethod("
/simcard.php?
simcard=1330227"
*使用POST方式提交数据
privatestaticHttpMethodgetPostMethod(){
PostMethodpost=newPostMethod("
/simcard.php"
NameValuePairsimcard=newNameValuePair("
simcard"
"
1330227"
post.setRequestBody(newNameValuePair[]{simcard});
returnpost;
在上面的例子中页面.cn/simcard.php需要一个参数是simcard,这个参数值为手机号码段,即手机号码的前七位,服务器会返回提交的手机号码对应的省份、城市以及其他详细信息。
GET的提交方法只需要在URL后加入参数信息,而POST则需要通过NameValuePair类来设置参数名称和它所对应的值
3.处理页面重定向
在JSP/Servlet编程中response.sendRedirect方法就是使用HTTP协议中的重定向机制。
它与JSP中的<
jsp:
forward…>
的区别在于后者是在服务器中实现页面的跳转,也就是说应用容器加载了所要跳转的页面的内容并返回给客户端;
而前者是返回一个状态码,这些状态码的可能值见下表,然后客户端读取需要跳转到的页面的URL并重新加载新的页面。
就是这样一个过程,所以我们编程的时候就要通过HttpMethod.getStatusCode()方法判断返回值是否为下表中的某个值来判断是否需要跳转。
如果已经确认需要进行页面跳转了,那么可以通过读取HTTP头中的location属性来获取新的地址。
状态码
对应HttpServletResponse的常量
详细描述
301
SC_MOVED_PERMANENTLY
页面已经永久移到另外一个新地址
302
SC_MOVED_TEMPORARILY
页面暂时移动到另外一个新的地址
303
SC_SEE_OTHER
客户端请求的地址必须通过另外的URL来访问
307
SC_TEMPORARY_REDIRECT
同SC_MOVED_TEMPORARILY
下面的代码片段演示如何处理页面的重定向
client.executeMethod(post);
System.out.println(post.getStatusLine().toString());
post.releaseConnection();
//检查是否重定向
intstatuscode=post.getStatusCode();
if((statuscode==HttpStatus.SC_MOVED_TEMPORARILY)||
(statuscode==HttpStatus.SC_MOVED_PERMANENTLY)||
(statuscode==HttpStatus.SC_SEE_OTHER)||
(statuscode==HttpStatus.SC_TEMPORARY_REDIRECT)){
//读取新的URL地址
Headerheader=post.getResponseHeader("
location"
if(header!
=null){
Stringnewuri=header.getValue();
if((newuri==null)||(newuri.equals("
)))
newuri="
/"
;
GetMethodredirect=newGetMethod(newuri);
client.executeMethod(redirect);
System.out.println("
Redirect:
+redirect.getStatusLine().toString());
redirect.releaseConnection();
}else
Invalidredirect"
我们可以自行编写两个JSP页面,其中一个页面用response.sendRedirect方法重定向到另外一个页面用来测试上面的例子。
4.模拟输入用户名和口令进行登录
本小节应该说是HTTP客户端编程中最常碰见的问题,很多网站的内容都只是对注册用户可见的,这种情况下就必须要求使用正确的用户名和口令登录成功后,方可浏览到想要的页面。
因为HTTP协议是无状态的,也就是连接的有效期只限于当前请求,请求内容结束后连接就关闭了。
在这种情况下为了保存用户的登录信息必须使用到Cookie机制。
以JSP/Servlet为例,当浏览器请求一个JSP或者是Servlet的页面时,应用服务器会返回一个参数,名为jsessionid(因不同应用服务器而异),值是一个较长的唯一字符串的Cookie,这个字符串值也就是当前访问该站点的会话标识。
浏览器在每访问该站点的其他页面时候都要带上jsessionid这样的Cookie信息,应用服务器根据读取这个会话标识来获取对应的会话信息。
对于需要用户登录的网站,一般在用户登录成功后会将用户资料保存在服务器的会话中,这样当访问到其他的页面时候,应用服务器根据浏览器送上的Cookie中读取当前请求对应的会话标识以获得对应的会话信息,然后就可以判断用户资料是否存在于会话信息中,如果存在则允许访问页面,否则跳转到登录页面中要求用户输入帐号和口令进行登录。
这就是一般使用JSP开发网站在处理用户登录的比较通用的方法。
这样一来,对于HTTP的客户端来讲,如果要访问一个受保护的页面时就必须模拟浏览器所做的工作,首先就是请求登录页面,然后读取Cookie值;
再次请求登录页面并加入登录页所需的每个参数;
最后就是请求最终所需的页面。
当然在除第一次请求外其他的请求都需要附带上Cookie信息以便服务器能判断当前请求是否已经通过验证。
说了这么多,可是如果你使用httpclient的话,你甚至连一行代码都无需增加,你只需要先传递登录信息执行登录过程,然后直接访问想要的页面,跟访问一个普通的页面没有任何区别,因为类HttpClient已经帮你做了所有该做的事情了,太棒了!
下面的例子实现了这样一个访问的过程。
importmons.httpclient.cookie.*;
*用来演示登录表单的示例
publicclassFormLoginDemo{
staticfinalStringLOGON_SITE="
localhost"
staticfinalint
LOGON_PORT=8080;
publicstaticvoidmain(String[]args)throwsException{
client.getHostConfiguration().setHost(LOGON_SITE,LOGON_PORT);
//模拟登录页面login.jsp->
main.jsp
/main.jsp"
NameValuePairname=newNameValuePair("
name"
"
ld"
NameValuePairpass=newNameValuePair("
password"
post.setRequestBody(newNameValuePair[]{name,pass});
intstatus=client.executeMethod(post);
System.out.println(post.getResponseBodyAsString());
//查看cookie信息
CookieSpeccookiespec=CookiePolicy.getDefaultSpec();
Cookie[]cookies=cookiespec.match(LOGON_SITE,LOGON_PORT,"
false,client.getState().getCookies());
if(cookies.length==0){
None"
}else{
for(inti=0;
i<
cookies.length;
i++){
System.out.println(cookies[i].toString());
//访问所需的页面main2.jsp
GetMethodget=newGetMethod("
/main2.jsp"
client.executeMethod(get);
System.out.println(get.getResponseBodyAsString());
get.releaseConnection();
5.提交XML格式参数
提交XML格式的参数很简单,仅仅是一个提交时候的ContentType问题,下面的例子演示从文件文件中读取XML信息并提交给服务器的过程,该过程可以用来测试Web服务。
importjava.io.File;
importjava.io.FileInputStream;
importmons.httpclient.HttpClient;
importmons.httpclient.methods.EntityEnclosingMethod;
importmons.httpclient.methods.PostMethod;
*用来演示提交XML格式数据的例子
publicclassPostXMLClient{
publicstaticvoidmain(String[]args)throwsException{
Fileinput=newFile(“test.xml”);
PostMethodpost=newPostMethod(“http:
//localhost:
8080/httpclient/xml.jsp”);
//设置请求的内容直接从文件中读取
post.setRequestBody(newFileInputStream(input));
if(input.length()<
Integer.MAX_VALUE)
post.setRequestContentLength(input.length());
else
post.setRequestContentLength(EntityEnclosingMethod.CONTENT_LENGTH_CHUNKED);
//指定请求内容的类型
post.setRequestHeader("
Content-type"
text/xml;
charset=GBK"
HttpClienthttpclient=newHttpClient();
intresult=httpclient.executeMethod(post);
Responsestatuscode:
"
+result);
Responsebody:
6.通过HTTP上传文件
httpclient使用了单独的一个HttpMethod子类来处理文件的上传,这个类就是MultipartPostMethod,该类已经封装了文件上传的细节,我们要做的仅仅是告诉它我们要上传文件的全路径即可,下面的代码片段演示如何使用这个类。
MultipartPostMeth