热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

PHP下载远程文件类源码,带详细注释,还支持断点续传-PHP源码

网站经常要用到下载远程图片的功能,有时还要下载.doc文档,所以就用php开发了一个下载远程文件的类,这个类支持断点续传下载,源代码中有具体的注释及使用说明案例。
网站经常要用到下载远程图片的功能,有时还要下载.doc文档,所以就用php开发了一个下载远程文件的类,这个类支持断点续传下载,源代码中有具体的注释及使用说明案例。

程序主要是使用 HTTP 协议下载文件,HTTP1.1协议必须指定文档结束后关闭链接,否则读取文档时无法使用feof判断结束,可以有两种使用方法,具体请下载查看源码。

代码如下
/**
* 下载远程文件类支持断点续传
*/
class HttpDownload {
private $m_url = "";
private $m_urlpath = "";
private $m_scheme = "http";
private $m_host = "";
private $m_port = "80";
private $m_user = "";
private $m_pass = "";
private $m_path = "/";
private $m_query = "";
private $m_fp = "";
private $m_error = "";
private $m_httphead = "" ;
private $m_html = "";

/**
* 初始化
*/
public function PrivateInit($url){
$urls = "";
$urls = @parse_url($url);
$this->m_url = $url;
if(is_array($urls)) {
$this->m_host = $urls["host"];
if(!empty($urls["scheme"])) $this->m_scheme = $urls["scheme"];
if(!empty($urls["user"])) $this->m_user = $urls["user"];
if(!empty($urls["pass"])) $this->m_pass = $urls["pass"];
if(!empty($urls["port"])) $this->m_port = $urls["port"];
if(!empty($urls["path"])) $this->m_path = $urls["path"];
$this->m_urlpath = $this->m_path;
if(!empty($urls["query"])) {
$this->m_query = $urls["query"];
$this->m_urlpath .= "?".$this->m_query;
}
}
}

/**
* 打开指定网址
*/
function OpenUrl($url) {
#重设各参数
$this->m_url = "";
$this->m_urlpath = "";
$this->m_scheme = "http";
$this->m_host = "";
$this->m_port = "80";
$this->m_user = "";
$this->m_pass = "";
$this->m_path = "/";
$this->m_query = "";
$this->m_error = "";
$this->m_httphead = "" ;
$this->m_html = "";
$this->Close();
#初始化系统
$this->PrivateInit($url);
$this->PrivateStartSession();
}

/**
* 获得某操作错误的原因
*/
public function printError() {
echo "错误信息:".$this->m_error;
echo "具体返回头:
";
foreach($this->m_httphead as $k=>$v) {
echo "$k => $v
rn";
}
}

/**
* 判别用Get方法发送的头的应答结果是否正确
*/
public function IsGetOK() {
if( ereg("^2",$this->GetHead("http-state")) ) {
return true;
} else {
$this->m_error .= $this->GetHead("http-state")." - ".$this->GetHead("http-describe")."
";
return false;
}
}

/**
* 看看返回的网页是否是text类型
*/
public function IsText() {
if (ereg("^2",$this->GetHead("http-state")) && eregi("^text",$this->GetHead("content-type"))) {
return true;
} else {
$this->m_error .= "内容为非文本类型
";
return false;
}
}
/**
* 判断返回的网页是否是特定的类型
*/
public function IsContentType($ctype) {
if (ereg("^2",$this->GetHead("http-state")) && $this->GetHead("content-type") == strtolower($ctype)) {
return true;
} else {
$this->m_error .= "类型不对 ".$this->GetHead("content-type")."
";
return false;
}
}

/**
* 用 HTTP 协议下载文件
*/
public function SaveToBin($savefilename) {
if (!$this->IsGetOK()) return false;
if (@feof($this->m_fp)) {
$this->m_error = "连接已经关闭!";
return false;
}
$fp = fopen($savefilename,"w") or die("写入文件 $savefilename 失败!");
while (!feof($this->m_fp)) {
@fwrite($fp,fgets($this->m_fp,256));
}
@fclose($this->m_fp);
return true;
}

/**
* 保存网页内容为 Text 文件
*/
public function SaveToText($savefilename) {
if ($this->IsText()) {
$this->SaveBinFile($savefilename);
} else {
return "";
}
}

/**
* 用 HTTP 协议获得一个网页的内容
*/
public function GetHtml() {
if (!$this->IsText()) return "";
if ($this->m_html!="") return $this->m_html;
if (!$this->m_fp||@feof($this->m_fp)) return "";
while(!feof($this->m_fp)) {
$this->m_html .= fgets($this->m_fp,256);
}
@fclose($this->m_fp);
return $this->m_html;
}

/**
* 开始 HTTP 会话
*/
public function PrivateStartSession() {
if (!$this->PrivateOpenHost()) {
$this->m_error .= "打开远程主机出错!";
return false;
}
if ($this->GetHead("http-edition")=="HTTP/1.1") {
$httpv = "HTTP/1.1";
} else {
$httpv = "HTTP/1.0";
}
fputs($this->m_fp,"GET ".$this->m_urlpath." $httpvrn");
fputs($this->m_fp,"Host: ".$this->m_host."rn");
fputs($this->m_fp,"Accept: */*rn");
fputs($this->m_fp,"User-Agent: Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.2)rn");
#HTTP1.1协议必须指定文档结束后关闭链接,否则读取文档时无法使用feof判断结束
if ($httpv=="HTTP/1.1") {
fputs($this->m_fp,"Connection: Closernrn");
} else {
fputs($this->m_fp,"rn");
}
$httpstas = fgets($this->m_fp,256);
$httpstas = split(" ",$httpstas);
$this->m_httphead["http-edition"] = trim($httpstas[0]);
$this->m_httphead["http-state"] = trim($httpstas[1]);
$this->m_httphead["http-describe"] = "";
for ($i=2;$i $this->m_httphead["http-describe"] .= " ".trim($httpstas[$i]);
}
while (!feof($this->m_fp)) {
$line = str_replace(""","",trim(fgets($this->m_fp,256)));
if($line == "") break;
if (ereg(":",$line)) {
$lines = split(":",$line);
$this->m_httphead[strtolower(trim($lines[0]))] = trim($lines[1]);
}
}
}

/**
* 获得一个Http头的值
*/
public function GetHead($headname) {
$headname = strtolower($headname);
if (isset($this->m_httphead[$headname])) {
return $this->m_httphead[$headname];
} else {
return "";
}
}

/**
* 打开连接
*/
public function PrivateOpenHost() {
if ($this->m_host=="") return false;
$this->m_fp = @fsockopen($this->m_host, $this->m_port, &$errno, &$errstr,10);
if (!$this->m_fp){
$this->m_error = $errstr;
return false;
} else {
return true;
}
}

/**
* 关闭连接
*/
public function Close(){
@fclose($this->m_fp);
}
}

#两种使用方法,分别如下:

#打开网页
$httpdown = new HttpDownload();
$httpdown->OpenUrl("http://www.google.com.hk");
echo $httpdown->GetHtml();
$httpdown->Close();


#下载文件
$file = new HttpDownload(); # 实例化类
$file->OpenUrl("http://www.ti.com.cn/cn/lit/an/rust020/rust020.pdf"); # 远程文件地址
$file->SaveToBin("rust020.pdf"); # 保存路径及文件名
$file->Close(); # 释放资源
?>

推荐阅读
  • 汇总了2023年7月7日最新的网络安全新闻和技术更新,包括最新的漏洞披露、工具发布及安全事件。 ... [详细]
  • 本文介绍了使用Python和C语言编写程序来计算一个给定数值的平方根的方法。通过迭代算法,我们能够精确地得到所需的结果。 ... [详细]
  • C/C++ 应用程序的安装与卸载解决方案
    本文介绍了如何使用Inno Setup来创建C/C++应用程序的安装程序,包括自动检测并安装所需的运行库,确保应用能够顺利安装和卸载。 ... [详细]
  • 本文提供了一个关于AC自动机(Aho-Corasick Algorithm)的详细解析与实现方法,特别针对P3796题目进行了深入探讨。文章不仅涵盖了AC自动机的基本概念,还重点讲解了如何通过构建失败指针(fail pointer)来提高字符串匹配效率。 ... [详细]
  • 本报告记录了嵌入式软件设计课程中的第二次实验,主要探讨了使用KEIL V5开发环境和ST固件库进行GPIO控制及按键响应编程的方法。通过实际操作,加深了对嵌入式系统硬件接口编程的理解。 ... [详细]
  • 本文分享了作者在使用LaTeX过程中的几点心得,涵盖了从文档编辑、代码高亮、图形绘制到3D模型展示等多个方面的内容。适合希望深入了解LaTeX高级功能的用户。 ... [详细]
  • 本文介绍如何使用R语言中的相关包来解析和转换搜狗细胞词库(.scel格式),并将其导出为CSV文件,以便于后续的数据分析和文本挖掘任务。 ... [详细]
  • JavaScript 中引号的多层嵌套使用技巧
    本文详细介绍了在 JavaScript 编程中如何处理引号的多级嵌套问题,包括双引号、单引号以及转义字符的正确使用方法。 ... [详细]
  • 在使用 PyInstaller 将 Python 应用程序打包成独立的可执行文件时,若项目中包含动态加载的库或插件,需要正确配置 --hidden-import 和 --add-binary 参数,以确保所有依赖项均能被正确识别和打包。 ... [详细]
  • 如何高效渲染JSON数据
    本文介绍了在控制器中返回JSON结果的方法,并详细说明了如何利用jQuery处理和展示这些数据,为Web开发提供了实用的技巧。 ... [详细]
  • 笔记说明重学前端是程劭非(winter)【前手机淘宝前端负责人】在极客时间开的一个专栏,每天10分钟,重构你的前端知识体系& ... [详细]
  • 本文详细介绍了五种常用的PHP排序算法——冒泡排序、选择排序、插入排序、希尔排序和堆排序。每种算法都附有代码示例,并通过打印和延时操作来直观展示排序过程。欢迎指出任何错误。 ... [详细]
  • Awk是一款功能强大的文本分析与处理工具,尤其在数据解析和报告生成方面表现突出。它通过读取由换行符分隔的记录,并按照指定的字段分隔符来划分和处理这些记录,从而实现复杂的数据操作。 ... [详细]
  • 本文介绍了如何在 MongoDB 中使用正则表达式进行数据排除查询,特别关注了通过 $regex 和 $nin 操作符来过滤特定模式的数据。 ... [详细]
  • 深入解析Unity3D游戏开发中的音频播放技术
    在游戏开发中,音频播放是提升玩家沉浸感的关键因素之一。本文将探讨如何在Unity3D中高效地管理和播放不同类型的游戏音频,包括背景音乐和效果音效,并介绍实现这些功能的具体步骤。 ... [详细]
author-avatar
云中之锦书
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有