当前位置: 开发笔记 > 编程语言 > 正文

《大胖•小课》说说大文件分片和断点续传

作者：云下拾雨 | 来源：互联网 | 2023-09-13 16:37

顺便说一句，没领奖的抓紧加我啦，我已经发了一波了，没领的赶紧来了。扫码失败的手动加我vx223344386这是《大胖小课》栏目的专题一《说

顺便说一句&＃xff0c;没领奖的抓紧加我啦&＃xff0c;我已经发了一波了&＃xff0c;没领的赶紧来了。扫码失败的手动加我vx 223344386

这是《大胖小课》栏目的专题一《说说文件上传那些事儿》的第6节-《大文件分片和断点续传》。

《说说文件上传那些事儿》专题已更文章

一般在前端开发中我们上传文件大多是比较小的文件&＃xff0c;比如图片、pdf、word 文件等&＃xff0c;也只有一些特殊的业务和场景才会需要上传大文件&＃xff0c;比如上传一个视频 &＃xff0c;最小也得500M。

那如果文件太大&＃xff0c;比如500M 1G 2G 那么大&＃xff0c;直接上传会造成什么后果呢&＃xff1f;

直接上传过大文件&＃xff0c;可能会出链接现超时的情况&＃xff0c;而且也会超过服务端允许上传文件的大小限制&＃xff0c;导致文件无法上传。

所以解决这个问题我们可以将文件进行分片上传&＃xff0c;每次只上传很小的一部分比如2M&＃xff0c;多上传几次就可以啦。

大文件上传-分片

在 ie 时代由于无法使用xhr上传二进制数据&＃xff0c;上传大文件需要借助浏览器插件来完成。现在来看实现大文件上传简直soeasy。

先看下demo 效果。

DEMO

实现思路说明

相信大家都对Blob 对象有所了解&＃xff0c;它表示原始数据,也就是二进制数据&＃xff0c;同时提供了对数据截取的方法slice,而 File 继承了Blob的功能&＃xff0c;所以可以直接使用此方法对数据进行分段截图。

把大文件进行分段比如2M&＃xff0c;发送到服务器携带一个标志&＃xff0c;这里暂时用当前的时间戳&＃xff0c;用于标识一个完整的文件
服务端保存各段文件&＃xff0c;可以看上面截图
浏览器端所有分片上传完成&＃xff0c;发送给服务端一个合并文件的请求
服务端根据文件标识、类型、各分片顺序进行文件合并
删除分片文件

HTML

代码略&＃xff0c;只需要一个 input file 标签。

JS

//分片逻辑使用slice() 方法进行分片&＃xff0c;像操作字符串一样var start&＃61;0,end&＃61;0;while (true) {end&＃43;&＃61;chunkSize;var blob &＃61; file.slice(start,end);start&＃43;&＃61;chunkSize;if(!blob.size){//截取的数据为空则结束//拆分结束break;}chunks.push(blob);//保存分段数据}

NODE

服务端需要做一些改动&＃xff0c;保存分片文件、合并分段文件、删除分段文件。

合并文件这里使用 stream pipe 实现&＃xff0c;这样更节省内存&＃xff0c;边读边写入&＃xff0c;占用内存更小&＃xff0c;效率更高&＃xff0c;代码见fnMergeFile方法。

//二次处理文件&＃xff0c;修改名称 app.use((ctx) &＃61;> {var body &＃61; ctx.request.body;var files &＃61; ctx.request.files ? ctx.request.files.f1:[];//得到上传文件的数组var result&＃61;[];var fileToken &＃61; ctx.request.body.token;// 文件标识var fileIndex&＃61;ctx.request.body.index;//文件顺序if(files && !Array.isArray(files)){//单文件上传容错files&＃61;[files];}files && files.forEach(item&＃61;>{var path &＃61; item.path;var fname &＃61; item.name;//原文件名称var nextPath &＃61; path.slice(0, path.lastIndexOf(&＃39;/&＃39;) &＃43; 1) &＃43; fileIndex &＃43; &＃39;-&＃39; &＃43; fileToken;if (item.size > 0 && path) {//得到扩展名var extArr &＃61; fname.split(&＃39;.&＃39;);var ext &＃61; extArr[extArr.length - 1];//var nextPath &＃61; path &＃43; &＃39;.&＃39; &＃43; ext;//重命名文件fs.renameSync(path, nextPath);result.push(uploadHost&＃43;nextPath.slice(nextPath.lastIndexOf(&＃39;/&＃39;) &＃43; 1));}});if(body.type&＃61;&＃61;&＃61;&＃39;merge&＃39;){//合并分片文件var filename &＃61; body.filename,chunkCount &＃61; body.chunkCount,folder &＃61; path.resolve(__dirname, &＃39;../static/uploads&＃39;)&＃43;&＃39;/&＃39;;var writeStream &＃61; fs.createWriteStream(&＃96;${folder}${filename}&＃96;);var cindex&＃61;0;//合并文件function fnMergeFile(){var fname &＃61; &＃96;${folder}${cindex}-${fileToken}&＃96;;var readStream &＃61; fs.createReadStream(fname);readStream.pipe(writeStream, { end: false });readStream.on("end", function () {fs.unlink(fname, function (err) {if (err) {throw err;}});if (cindex&＃43;1

CODE

https://github.com/Bigerfe/fe-learn-code/tree/master/src/upfiles-demo/demo12

大文件上传-断点续传

在上面我们实现了大文件的分片上传&＃xff0c;解决了大文件上传超时和服务器的限制。

但是仍然不够完美&＃xff0c;大文件上传并不是短时间内就上传完成&＃xff0c;如果期间断网&＃xff0c;页面刷新了仍然需要重头上传&＃xff0c;这也太浪费时间了&＃xff0c;怎能忍得了。

方法1概述

在上面我们实现了服务端的分片保存&＃xff0c;现在要做的就是如何检测这些分片&＃xff0c;不再重新上传即可。

这里我们可以在本地进行保存已上传成功的分片&＃xff0c;重新上传的时候使用spark-md5来生成文件 hash&＃xff0c;区分此文件是否已上传&＃xff0c;然后在本地进行已上传分片的获取。

为每个分段生成 hash 值&＃xff0c;使用 spark-md5 三方模块
将上传成功的分段信息保存到本地
重新上传时&＃xff0c;进行和本地分段 hash 值的对比&＃xff0c;如果相同的话则跳过&＃xff0c;继续下一个分段的上传

生成 hash 过程肯定也会耗费资源&＃xff0c;但是和重新上传相比可以忽略不计了。

DEMO

640?wx_fmt&＃61;gif

HTML

代码略

JS

模拟分段保存&＃xff0c;本地保存到localStorage

//获得本地缓存的数据function getUploadedFromStorage(){return JSON.parse( localStorage.getItem(saveChunkKey) || "{}");}//写入缓存function setUploadedToStorage(index) {var obj &＃61; getUploadedFromStorage();obj[index]&＃61;true;localStorage.setItem(saveChunkKey, JSON.stringify(obj) );}//分段对比var uploadedInfo &＃61; getUploadedFromStorage();//获得已上传的分段信息for(var i&＃61;0;i

`方法2概述`

为什么还有方法2呢&＃xff0c;正常情况下方法1没问题&＃xff0c;但是需要将分片信息保存在客户端&＃xff0c;保存在客户端是最不保险的&＃xff0c;说不定出现各种神奇的幺蛾子。

所以这里有一个更完善的实现&＃xff0c;只提供思路&＃xff0c;代码就不写了&＃xff0c;也是基于上面的实现&＃xff0c;只是服务端需要增加一个接口。

基于上面一个栗子进行改进&＃xff0c;服务端已保存了部分片段&＃xff0c;客户端上传前需要从服务端获取已上传的分片信息&＃xff08;上面是保存在了本地浏览器&＃xff09;&＃xff0c;本地对比每个分片的 hash 值&＃xff0c;跳过已上传的部分&＃xff0c;只传未上传的分片。

方法1是从本地获取分片信息,这里只需要将此方法的能力改为从服务端获取分片信息就行了。

-getUploadedFromStorage &＃43;getUploadedFromServer(fileHash)

另外服务端增加一个获取分片的接口供客户端调用&＃xff0c;思路最重要&＃xff0c;代码就不贴了。

小结本文主要是介绍了大文件如何上传到服务器&＃xff0c;以及两种断点续传的方法&＃xff0c;代码上可能不够完善&＃xff0c;但是只要有了思路&＃xff0c;距离实现就完成了80%。
好了就这样了&＃xff0c;中午了要开饭了。
今天周一&＃xff0c;大胖祝大家开心快乐&＃xff0c;有个好心情。

动动小手&＃xff0c;让更多人看到




    
        
                        文件
                        上传
                        图片
                        pdf
                        blob
                        服务器
                        html
                        input
                        js
                    
    



    
        写下你的评论吧 !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
                                    
                
            
        

        
    

    
        推荐阅读
        
            
                                
                    
                        php
                        基于layUI的图片上传前预览功能的2种实现方式
                    

                    
                                                
                            
                        
                                                
                        本文介绍了基于layUI的图片上传前预览功能的两种实现方式：一种是使用blob+FileReader，另一种是使用layUI自带的参数。通过选择文件后点击文件名，在页面中间弹窗内预览图片。其中，layUI自带的参数实现了图片预览功能。该功能依赖于layUI的上传模块，并使用了blob和FileReader来读取本地文件并获取图像的base64编码。点击文件名时会执行See()函数。摘要长度为169字。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-14 17:06:58
                    

                

                
                                
                    
                        random
                        微信小程序云开发之图片上传wx.cloud.uploadFile()
                    

                    
                                                
                        页面按钮&amp;lt;buttonbindtap&amp;quot;addImg&amp;quot;class&amp;quot;addPng&a ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-09-29 19:13:27
                    

                

                                
                    
                    
                
                
                                
                    
                        get
                        史上最全的Websocket入门教程
                    

                    
                                                
                            
                        
                                                
                        websocket是什么？答:它是一种网络通信协议，是HTML5开始提供的一种在单个TCP连接上进行全双工通讯的协议。为什么需要websocket?疑问?我 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-09-26 18:14:52
                    

                

                
                                
                    
                        get
                        Vue项目中结合Element UI解决连续上传多张图片及图片编辑问题
                    

                    
                                                
                        本文介绍了在Vue项目中如何结合Element UI解决连续上传多张图片及图片编辑的问题。作者强调了在编码前要明确需求和所需要的结果，并详细描述了自己的代码实现过程。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-13 13:42:30
                    

                

                
                                
                    
                        blob
                        关于图片base64流和blob文件的上传问题及解决方法
                    

                    
                                                
                        本文主要讨论了如何通过已知图片的base64流将图片上传到文件服务器并返回URL的问题。通过模拟文件上传过程，成功解决了该问题。然而，在返回的URL中出现了一个名为blob的文件，作者对于该文件的具体含义以及base64转blob格式的意义有所困惑。本文将对这些问题进行探讨和解答。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-10 14:13:21
                    

                

                
                                
                    
                        php
                        nginx基础整理
                    

                    
                                                
                        目录结构如下：Nginx基础知识NginxHTTP服务器的特色及优点Nginx的主要企业功能Nginx作为web服务器的主要应用场景包括：Nginx的安装安装环境 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-09-29 12:48:54
                    

                

                
                                
                    
                        php
                        什么是API接口？给大家举例说明
                    

                    
                                                
                            
                        
                                                
                        Api接口也就是所谓的应用程序接口，api接口的全称是ApplicationProgramInterface，通过API接口可以实现计算机软件之间的相互 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-09-28 15:48:11
                    

                

                
                                
                    
                        go
                        两种方式实现Flink异步IO查询Mysql
                    

                    
                                                
                            
                        
                                                
                        如官网所描述的Flink支持两种方式实现异步IO查询外部系统http ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-09-28 11:27:02
                    

                

                
                                
                    
                        blob
                        重新认识JS的this、作用域、闭包、对象
                    

                    
                                                
                        作者|相学长原文|https:github.comwuomzfxblogblobmasterthis.md日常开发中，我们经常用到this。例如用Jquery绑定事件 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-09-27 17:44:48
                    

                

                
                                
                    
                        get
                        分享一个快速开发动态互动HTML5可视化图形效果的Javascript类库Envision.js
                    

                    
                                                
                        日期：2012-4-7来源：GBin1.com在线演示本地下载今天我们介绍一个超棒的创建快速动态互动HTML5可视化图形效果的javascript类库-Envision.j ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-09-27 12:50:24
                    

                

                
                                
                    
                        get
                        ajax跨域的解决办法,ajax 跨域请求api
                    

                    
                                                
                        jquery调用网易云音乐API遇到，网易音乐接口需要用node启动前端js调用代码varthisUrlhttp:127.0.0.1:3000 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-09-27 12:27:20
                    

                

                
                                
                    
                        get
                        编写可保护的代码的重要性及优化方法
                    

                    
                                                
                        本文讨论了编写可保护的代码的重要性，包括提高代码的可读性、可调试性和直观性。同时介绍了优化代码的方法，如代码格式化、解释函数和提炼函数等。还提到了一些常见的坏代码味道，如不规范的命名、重复代码、过长的函数和参数列表等。最后，介绍了如何处理数据泥团和进行函数重构，以提高代码质量和可维护性。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-11 18:32:44
                    

                

                
                                
                    
                        random
                        七牛上传图片成功之后，图片裂了
                    

                    
                                                
                        图像因存在错误而无法显示 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-11 13:17:11
                    

                

                
                                
                    
                        get
                        如何在php文件中添加图片？
                    

                    
                                                
                            
                        
                                                
                        本文详细解答了如何在php文件中添加图片的问题，包括插入图片的代码、使用PHPword在载入模板中插入图片的方法，以及使用gd库生成不同类型的图像文件的示例。同时还介绍了如何生成一个正方形文件的步骤。希望对大家有所帮助。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-11 10:46:38
                    

                

                
                                
                    
                        post
                        FormData上传文件同时附带其他参数的方法
                    

                    
                                                
                        本文介绍了使用FormData对象上传文件同时附带其他参数的方法。通过创建一个表单，将文件和参数添加到FormData对象中，然后使用ajax发送POST请求进行文件上传。在发送请求时，需要设置processData为false，告诉jquery不要处理发送的数据；同时设置contentType为false，告诉jquery不要设置content-Type请求头。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2023-12-09 19:51:18

















    

    
        
            
            
                
                
            

            
                云下拾雨            

            
                这个家伙很懒，什么也没留下！            


        
    

    
    

    
    

    
        Tags | 热门标签
        
            
                                
                    email
                
                                
                    blob
                
                                
                    heatmap
                
                                
                    frameworks
                
                                
                    replace
                
                                
                    loops
                
                                
                    php8
                
                                
                    triggers
                
                                
                    request
                
                                
                    header
                
                                
                    expression
                
                                
                    list
                
                                
                    flutter
                
                                
                    php
                
                                
                    byte
                
                                
                    client
                
                                
                    fetch
                
                                
                    cmd
                
                                
                    go
                
                                
                    web3
                
                                
                    md5
                
                                
                    get
                
                                
                    hashset
                
                                
                    post
                
                                
                    usb
                
                                
                    range
                
                                
                    emoji
                
                                
                    random
                
                                
                    cpython
                
                                
                    dockerfile
                
                                
            
        
    

    
    
        
            
            
        
        RankList | 热门文章
        
            
                                
                    1微信开发判断消息类型
                
                                
                    2怎样检测客户端是浏览器发出的操作？
                
                                
                    3什么是反向代理？？负载均衡我懂
                
                                
                    4网站做个活动，活动中用户可以提交信息（无需登录），如何限制用户重复提交？
                
                                
                    5空间操作员的账号没有变动，但是最近进行上传操作的时候收到的返回结果是Unauthorized。
                
                                
                    6小白用户刚接触git ，请教下 msysGit  和 git 什么关系？
                
                                
                    7分布式 - PHP这种站群解决方案是否存在缺漏，有无更好的思路？
                
                                
                    8如何将文件先上传至服务器，再传至云存储？
                
                                
                    9当用户点击下载文件的时候服务器都做什么了？
                
                                
                    10网站服务器端开发人员想要学习网站架构，应该去哪个网站或者读那些书？
                
                                
                    11让其它的子服务器(内网中的)去实时的同步一台外网服务器中的资源 采用什么方案？
                
                                
                    12SQL排序问题
                
                                
                    13PHP得到某段时间区间的时间戳 php定时任务
                
                                
                    14linux上安装了lamp，默认的文档目录是/var/www/html（属于root），为了安全和方便，如何控制文件权限？
                
                                
                    15网页操作完成后，发送短信到手机是怎么实现的？