加入收藏 | 设为首页 | 会员中心 | 我要投稿 拼字网 - 核心网 (https://www.hexinwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > PHP教程 > 正文

php curl 功能简介和抓取163邮件列表

发布时间:2022-02-16 08:33:08 所属栏目:PHP教程 来源:互联网
导读:如果你看到的话,那么你需要设置你的php教程并开启这个库,如果你是在windows平台下,那么非常简单,你需要改一改你的php.ini文件的设置,找到php_curl.dll,并取消前面的分号注释就行了,如下所示: 取消下在的注释 extension=php_curl.dll 如果你是在linux下面,那
  如果你看到的话,那么你需要设置你的php教程并开启这个库,如果你是在windows平台下,那么非常简单,你需要改一改你的php.ini文件的设置,找到php_curl.dll,并取消前面的分号注释就行了,如下所示:
 
  取消下在的注释 extension=php_curl.dll
 
  如果你是在linux下面,那么,google排名你需要重新编译你的php了,编辑时,你需要打开编译参数——在configure命令上加上“–with-curl” 参数.
 
  一个小示例,如果一切就绪,下面是一个小例程,代码如下:
 
  <?php  
  // 初始化一个 curl 对象  
  $curl = curl_init();  
  // 设置你需要抓取的url  
  curl_setopt($curl, curlopt_url, 'http://Cuoxin.com');  
  // 设置header  
  curl_setopt($curl, curlopt_header, 1);  
  // 设置curl 参数,要求结果保存到字符串中还是输出到屏幕上。  
  curl_setopt($curl, curlopt_returntransfer, 1);  
  // 运行curl,请求网页  
  $data = curl_exec($curl);  
  // 关闭url请求  
  curl_close($curl);  
  // 显示获得的数据
  ?>
  var_dump($data);
 
  如何post数据
 
  上面是抓取网页的代码,下面则是向某个网页post数据,假设我们有一个处理表单的网址http://www.example.com/sendsms.php,其可以接受两个表单域,一个是电话号码,一个是短信内容,代码如下:
 
  <?php  
  $phonenumber = '13912345678';  
  $message = 'this message was generated by curl and php'; //开源代码Cuoxin.com
  $curlpost = 'pnumber=' . urlencode($phonenumber) . '&message=' . urlencode($message) . '&submit=send';  
  $ch = curl_init();chain link fencing  
  curl_setopt($ch, curlopt_url, 'http://www.example.com/sendsms.php');  
  curl_setopt($ch, curlopt_header, 1);  
  curl_setopt($ch, curlopt_returntransfer, 1);  
  curl_setopt($ch, curlopt_post, 1);  
  curl_setopt($ch, curlopt_postfields, $curlpost);  
  $data = curl_exec();  
  curl_close($ch);  
  ?>
  从上面的程序我们可以看到,使用curlopt_post设置http协议的post方法,而不是get方法,然后以curlopt_postfields设置post的数据.
 
  关于代理服务器
 
  下面是一个如何使用代理服务器的示例,请注意其中高亮的代码,代码很简单,我就不用多说了,代码如下:
 
  <?php  
  $ch = curl_init();  
  curl_setopt($ch, curlopt_url, 'http://www.Cuoxin.com');  
  curl_setopt($ch, curlopt_header, 1);  
  curl_setopt($ch, curlopt_returntransfer, 1);  
  curl_setopt($ch, curlopt_httpproxytunnel, 1);  
  curl_setopt($ch, curlopt_proxy, 'fakeproxy.com:1080');  
  curl_setopt($ch, curlopt_proxyuserpwd, 'user:password');  
  $data = curl_exec();  
  curl_close($ch);  
  ?>
  关于ssl和cookie
 
  关于ssl也就是https协议,你只需要把curlopt_url连接中的http://变成https://就可以了,当然,还有一个参数叫curlopt_ssl_verifyhost可以设置为验证站点.
 
  关于cookie,你需要了解下面三个参数:
 
  curlopt_cookie,在当面的会话中设置一个cookie.
 
  curlopt_cookiejar,当会话结束的时候保存一个cookie.
 
  curlopt_cookiefile,cookie的文件.
 
  http服务器认证,最后,我们来看一看http服务器认证的情况,代码如下:
 
  <?php  
  $ch = curl_init();  
  curl_setopt($ch, curlopt_url, 'http://www.Cuoxin.com');  
  curl_setopt($ch, curlopt_returntransfer, 1);  
  curl_setopt($ch, curlopt_httpauth, curlauth_basic);  
  curl_setopt(curlopt_userpwd, '[username]:[password]')  
  $data = curl_exec();  
  curl_close($ch);  
  ?>
  看一个利用curl抓取163邮箱地址列表代码
 
  curl技术说白了就是模拟浏览器的动作实现页面抓取或表单提交,通过此技术可以实现许多有去的功能,代码如下:
 
  <?php  
  error_reporting(0);  
  //邮箱用户名(不带@163.com后缀的)  
  $user = 'papatata_test';  
  //邮箱密码  
  $pass = '000000';  
  //目标邮箱  
  //$mail_addr = uenucom@163.com';  
  //登陆  
  $url = 'http://reg.163.com/logins.jsp教程?type=1&url=http://entry.mail.163.com/coremail/fcg/ntesdoor2?lightweight%3d1%26verifycookie%3d1%26language%3d-1%26style%3d-1';  
  $ch = curl_init($url);  
  //创建一个用于存放cookie信息的临时文件  
  $cookie = tempnam('.','~');  
  $referer_login = 'http://mail.163.com';  
  //返回结果存放在变量中,而不是默认的直接输出  
  curl_setopt($ch, curlopt_returntransfer, true);  
  curl_setopt($ch, curlopt_header, true);  
  curl_setopt($ch, curlopt_connecttimeout, 120);  
  curl_setopt($ch, curlopt_post, true);  
  curl_setopt($ch, curlopt_referer, $referer_login);  
  $fields_post = array(  
  'username'=> $user,  
  'password'=> $pass,  
  'verifycookie'=>1,  
  'style'=>-1,  
  'product'=> 'mail163',  
  'seltype'=>-1,  
  'secure'=>'on'  
  );  
  $headers_login = array(  
  'user-agent' => 'mozilla/5.0 (windows; u; windows nt 5.1; zh-cn; rv:1.9) gecko/2008052906 firefox/3.0',  
  'referer' => 'http://www.163.com'  
  );  
  $fields_string = '';  
  foreach($fields_post as $key => $value)  
  {  
  $fields_string .= $key . '=' . $value . '&';  
  }  
  $fields_string = rtrim($fields_string , '&');  
  curl_setopt($ch, curlopt_cookiesession, true);  
  //关闭连接时,将服务器端返回的cookie保存在以下文件中  
  curl_setopt($ch, curlopt_cookiejar, $cookie);  
  curl_setopt($ch, curlopt_httpheader, $headers_login);  
  curl_setopt($ch, curlopt_post, count($fields));  
  curl_setopt($ch, curlopt_postfields, $fields_string);  
  $result= curl_exec($ch);  
  curl_close($ch);  
  //跳转  
  $url='http://entry.mail.163.com/coremail/fcg/ntesdoor2?lightweight=1&verifycookie=1&language=-1&style=-1&username=loki_wuxi';  
  $ch = curl_init($url);  
  $headers = array(  
  'user-agent' => 'mozilla/5.0 (windows; u; windows nt 5.1; zh-cn; rv:1.9) gecko/2008052906 firefox/3.0'  
  );  
  curl_setopt($ch, curlopt_returntransfer, true);  
  curl_setopt($ch, curlopt_header, true);  
  curl_setopt($ch, curlopt_connecttimeout, 120);  
  curl_setopt($ch, curlopt_post, true);  
  curl_setopt($ch, curlopt_httpheader, $headers);  
  //将之前保存的cookie信息,一起发送到服务器端  
  curl_setopt($ch, curlopt_cookiefile, $cookie);  
  curl_setopt($ch, curlopt_cookiejar, $cookie);  
  $result = curl_exec($ch);  
  curl_close($ch);  
  //取得sid  
  preg_match('/sid=[^"].*/', $result, $location);  
  $sid = substr($location[0], 4, -1);  
  //file_put_contents('./result.txt', $sid);  
  //通讯录地址  
  $url='http://g4a30.mail.163.com/jy3/address/addrlist.jsp?sid='.$sid.'&gid=all';  
  $ch = curl_init($url);  
  $headers = array(  
  'user-agent' => 'mozilla/5.0 (windows; u; windows nt 5.1; zh-cn; rv:1.9) gecko/2008052906 firefox/3.0'  
  );  
  curl_setopt($ch, curlopt_returntransfer, true);  
  curl_setopt($ch, curlopt_header, true);  
  curl_setopt($ch, curlopt_connecttimeout, 120);  
  curl_setopt($ch, curlopt_post, true);  
  curl_setopt($ch, curlopt_httpheader, $headers);  
  curl_setopt($ch, curlopt_cookiefile, $cookie);  
  curl_setopt($ch, curlopt_cookiejar, $cookie);  
  $result = curl_exec($ch);  
  curl_close($ch);  
  //file_put_contents('./result.txt', $result);  
  unlink($cookie);  
  //开始抓取内容  
  preg_match_all('/<td class="ibx_td_addrname"><a[^>]*>(.*?)</a></td><td class="ibx_td_addremail"><a[^>]*>(.*?)</a></td>/i', $result,$infos,preg_set_order);  
  //1:姓名2:邮箱  
  print_r($infos);  
  ?> 



        php curl 功能简介和抓取163邮件列表

(编辑:拼字网 - 核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!