搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏Stephen
HTML5实现大文件分片上传
在网页中直接上传大文件一直是个比较头疼的问题，一是上传时间长，中途一旦出错会导致前功尽弃；二是服务端配置复杂，要考虑接收超大表单和超时问题，如果是托管主机没准还改不了配置，默认只能接收小于4MB的附件比较理想的方案是能够把大文件分片，一片一片的传到服务端，再由服务端合并。好在现在有了HTML5，我们可以直接构造分片了，这是一个非常喜人的进步，但是有一个最大的缺陷就是，不支持IE啊，不支持IE啊，不支持IE啊。计算每一片的起始与结束位置 var start = i * shardSize, end = Math.min(size, start + shardSize); //构造一个表单，FormData是HTML5新增的
1.6K10编辑于 2022-06-07
来自专栏搜云库技术团队
5 亿！整数的大文件，如何排序？神操作！
问题给你1个文件bigdata，大小4663M，5亿个数（对的，你没听错，就是5亿），文件中的数据随机,如下一行一个整数： 6196302 3557681 6121580 2039345 2095006 1、分内存中维护一个极小的核心缓冲区memBuffer，将大文件bigdata按行读入，搜集到memBuffer满或者大文件读完时，对memBuffer中的数据调用内排进行排序，排序后将有序结果写入磁盘文件循环利用memBuffer直到大文件处理完毕，得到n个有序的磁盘文件： ? 2、合现在有了n个有序的小文件，怎么合并成1个有序的大文件？把所有小文件读入内存，然后内排？(⊙o⊙)… no! 上面拿出了最小值1，写入大文件. 第二回合：文件1的最小值：3 , 排在文件1的第1行文件2的最小值：2，排在文件2的第1行文件3的最小值：5，排在文件3的第2行那么，这3个文件中的最小值是：min(5,2,3) = 2 将2写入大文件
1.3K11发布于 2020-03-19
来自专栏Java后端技术栈cwnait
面试被问：5 亿整数的大文件，排个序？
问题给你1个文件bigdata，大小4663M，5亿个数，文件中的数据随机,如下一行一个整数： 6196302 3557681 6121580 2039345 2095006 1746773 7934312 1.分内存中维护一个极小的核心缓冲区memBuffer，将大文件bigdata按行读入，搜集到memBuffer满或者大文件读完时，对memBuffer中的数据调用内排进行排序，排序后将有序结果写入磁盘文件循环利用memBuffer直到大文件处理完毕，得到n个有序的磁盘文件： ? 2.合现在有了n个有序的小文件，怎么合并成1个有序的大文件？把所有小文件读入内存，然后内排？ (⊙o⊙)… no! 上面拿出了最小值1，写入大文件. 第二回合：文件1的最小值：3 , 排在文件1的第1行文件2的最小值：2，排在文件2的第1行文件3的最小值：5，排在文件3的第2行那么，这3个文件中的最小值是：min(5,2,3) = 2 将2写入大文件
58210发布于 2020-02-27
来自专栏前端小学生
大文件上传
切片上传，获取文件，以及每个切片的md，这一步相对耗时较长，且堵塞渲染主线程断点续传，每次上传之前，将文件md5值、切片数量、每个切片md5传给后台，后台告知该文件是否上传过，上传了哪些切片，已上传的暂不处理，设计worker，引入md5依赖，解析文件/切片的md5和chunkimportScripts('. (file); self.postMessage({ type: 'file_md5', md5: md5, total: chunks, }); for (let i = 0; i < chunks === 'file_md<em>5</em>') { fileMd5 = md5; totalSize = total; getUploadedChunks :', md5, chunk); preparedChunks.push({ md5: md5,
1.4K11编辑于 2025-01-10
来自专栏python3
大文件下载以及进度条展示和MD5校验
= '✈' if rate_num == 100: r = '\r\033[32m{}\033[0m{}%\n'.format(pretty * int(rate_num / 5) , rate_num,) else: r = '\r\033[32m{}\033[0m{}%'.format(pretty * int(rate_num / 5), rate_num 增加MD5校验 server.py import os import json import socket import struct import hashlib sk = socket.socket # 当内容为空时,终止循环 md5 = md5obj.hexdigest() print(md5) # 打印md5值 dic = {'filename':filename, 'filename_md5 = md5.hexdigest() print(md5) # 打印md5值 if dic['filename_md5'] == str(md5): print(Prompt.display
92920发布于 2018-08-02
来自专栏Java技术栈
5亿个数大文件怎么排序？
曾经被问傻的一道面试题分享给你：给你1个文件bigdata，大小4663M，5亿个数，文件中的数据随机，如下一行一个整数： 6196302 3557681 6121580 2039345 2095006 循环利用memBuffer直到大文件处理完毕，得到n个有序的磁盘文件： 2.合现在有了n个有序的小文件，怎么合并成1个有序的大文件？把所有小文件读入内存，然后内排？ (⊙o⊙)… no! 利用如下原理进行归并排序：我们举个简单的例子：文件1：3,6,9 文件2：2,4,8 文件3：1,5,7 第一回合：文件1的最小值：3 , 排在文件1的第1行文件2的最小值：2，排在文件2的第1 上面拿出了最小值1，写入大文件. 第二回合：文件1的最小值：3 , 排在文件1的第1行文件2的最小值：2，排在文件2的第1行文件3的最小值：5，排在文件3的第2行那么，这3个文件中的最小值是：min(5,2,3) = 2 将2写入大文件
73610发布于 2020-03-05
来自专栏python3
Python 读取大文件
那么，在 Python 中，如何快速地读取这些大文件呢？ | 版权声明：一去、二三里，未经博主允许不得转载。 do_something(line) with 语句句柄负责打开和关闭文件（包括在内部块中引发异常时），for line in f 将文件对象 f 视为一个可迭代的数据类型，会自动使用 IO 缓存和内存管理，这样就不必担心大文件了
2.4K40发布于 2020-01-10
来自专栏数据分析与挖掘
git上传大文件
第一步安装lfs git lfs install 第二步查找大文件 find ./ -size +100M . /表示当前目录下第三步追踪大文件 git lfs track "大文件的名称" 第四步正常上传git git add . git commit -m 'commit' git push origin
3.1K10编辑于 2021-12-07
来自专栏Kevinello的技术小站
pandas 大文件操作
常规的读取大文件的步骤 import pandas as pd f = open('.
2K21编辑于 2022-08-19
github上传大文件
large assets' #附加提交日志 git lfs ls-files #查看LFS管理了哪些文件 git push #全仓库推送 cd upload #进入名为upload的文件夹，提前将要上传的大文件放入该文件夹下 git init #创建本地仓库环境 git lfs install #安装大文件上传应用 git lfs track * #追踪要上传的大文件，*表示路径下的所有文件 git add .gitattributes xxxx.git #建立本地和Github仓库的链接，.git链接在网页端clone的HTTPS中获取 git push origin master #上传属性文件 git add * #添加要上传的大文件 ，*表示路径下的所有文件 git commit -m "Git LFS commit" #添加大文件上传的说明 git push origin master #上传大文件 git pull --rebase
78210编辑于 2025-07-17
来自专栏sktj
python 查找大文件
root="D:\" def get_FileSize(filePath): try: fsize = os.path.getsize(filePath) fsize = fsize/float(1024*1024) return round(fsize,2) except: return 0 for r,dirs,files in os.walk(root): for file in files: name=os.path.join(r,file) size=get_FileSize(name) if size>500: print(name,size)
3.1K10发布于 2019-11-21
来自专栏生物信息学、python、R、linux
linux大文件分割
linux下文件合并是用cat来实现，那么将大文件分割成小文件怎么办呢？我们可以用split命令来实现，既可以指定按行分割也能指定按大小分割，非常方便实用。 [FILE] [PREFIX] # 比如: split -l 5 large.txt test_line_ 以一个名为large.txt的文件为例，里面内容为1-10十行十个数字，运行上边代码可以得到两个文件 split -l 5 large.txt -d -a 2 test_line_ 此处需要注意，MacOS中的split参数更少，比如没有-d参数，这么写会提示报错。
5.7K10发布于 2020-04-01
来自专栏大师级码师
golang 大文件分割
golang 大文件分割 package main import ( "fmt" "io/ioutil" "math" "os" "strconv" ) const
2.2K51发布于 2021-11-02
来自专栏summerking的专栏
大文件切割技巧
主要用到split命令：可以将一个大文件分割成多个小文件，有时候文件太大了需要将文件分割成更小的片段，如数据库备份sql文件或者应用log # 分切文件这里举例分切一个423M的文件，将其分成若干个
1.8K10编辑于 2022-10-27
来自专栏自动化办公
5大文件管理操作，Python自动化办公，整明白了
/程序员晚枫/50-07-fake2excel/中文-1.xlsx')5、自动整理文件夹有多少人文件夹乱七八糟的，自己又不想整理？
53170编辑于 2023-10-01
来自专栏python3
python读取大文件
python读取文件对各列进行索引可以用readlines，也可以用readline，如果是大文件一般就用readline d={} a_in = open("testfile.txt", "r
1.4K10发布于 2020-01-07
来自专栏机器学习/数据可视化
Pandas读取大文件
Pandas技巧-如何读取大文件 本文中记录的是如何利用pandas来读取大文件，4个技巧：如何利用read_csv函数读取没有表头的文件 get_chunk()方法来分块读取数据 concat()方法将数据库进行叠加
2.7K30发布于 2021-03-01
来自专栏跟着阿笨一起玩NET
FileStream大文件复制
这里修改的代码如下： 1 public static class FileHelper 2 { 3 ///
4 /// 复制大文件 5 ///
6 /// <param name="fromPath">源文件的路径</param> 7 /// <param 55 } 测试代码： 1 class Program 2 { 3 static void Main(string[] args) 4 { 5 FileHelper.CopyFile(@"D:\安装文件\新建文件夹\SQLSVRENT_2008R2_CHS.iso", @"F:\SQLSVRENT_2008R2_CHS.iso", 1024 * 1024 * 5) MD5校验结果：文件: D:\安装文件\新建文件夹\SQLSVRENT_2008R2_CHS.iso 大小: 4662884352 字节修改时间: 2010年9月3日, 10:41:26 MD5:
2.3K20发布于 2018-09-19
来自专栏又见苍岚
Git 大文件存储 lfs
Git LFS(Large File Storage, 大文件存储)是 Github 开发的一个 Git 的扩展，用于实现 Git 对大文件的支持。简介 Git LFS(Large File Storage, 大文件存储)是 Github 开发的一个 Git 的扩展，用于实现 Git 对大文件的支持。通过把大文件存储在 Git 仓库之外，可以减小 Git 仓库本身的体积，使克隆 Git 仓库的速度加快，也使得 Git 不会因为仓库中充满大文件而损失性能。 git每次保存diff，一些大文件发生变化时，整个仓库就会增加很大的体积，导致clone和pull的数据量大增。 (但在git远程仓库也是提示LFS) 原理：不同于git每次保存diff，对于git来说，如果是模型文件或者一些设计大文件，改变一点，对于仓库来说会增加很大的体积。
2.9K10编辑于 2022-08-09
来自专栏Golang语言社区
居于H5的多文件、大文件、多线程上传解决方案
文件上传在web应用中是比较常见的功能，前段时间做了一个多文件、大文件、多线程文件上传的功能，使用效果还不错，总结分享下。所以对于大文件上传，采用切块分段上传从上传的效率来看，利用多线程并发上传能够达到最大效率。对于大文件切块、多线程上传，需要考虑服务端合并文件的时间点；三、解决方案：在HTML5之前的标准是无法支持上面的功能，因此我们需要把功能实现居于H5提供的新特性上面： 1. File对象 H5提供的类似java的RandomAccessFile的文件操作对象，其中silce方法允许程序指定文件的起止字节进行读取。利用这个对象，实现对大文件的切分； 3. files) { return; } var chunkSize = 5 * 1024 * 1024; //切块的阀值：5M $(files).each(function
3.5K80发布于 2018-03-27

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

HTML5实现大文件分片上传

5 亿！整数的大文件，如何排序？神操作！

面试被问：5 亿整数的大文件，排个序？

大文件上传

大文件下载以及进度条展示和MD5校验

5亿个数大文件怎么排序？

Python 读取大文件

git上传大文件

pandas 大文件操作

github上传大文件

python 查找大文件

linux大文件分割

golang 大文件分割

大文件切割技巧

5大文件管理操作，Python自动化办公，整明白了

python读取大文件

Pandas读取大文件

FileStream大文件复制

Git 大文件存储 lfs

居于H5的多文件、大文件、多线程上传解决方案

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

HTML5实现大文件分片上传

5 亿！整数的大文件，如何排序？神操作！

面试被问：5 亿整数的大文件，排个序 ？

大文件上传

大文件下载以及进度条展示和MD5校验

5亿个数大文件怎么排序？

Python 读取大文件

git上传大文件

pandas 大文件操作

github上传大文件

python 查找大文件

linux大文件分割

golang 大文件分割

大文件切割技巧

5大文件管理操作，Python自动化办公，整明白了

python读取大文件

Pandas读取大文件

FileStream大文件复制

Git 大文件存储 lfs

居于H5的多文件、大文件、多线程上传解决方案

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

面试被问：5 亿整数的大文件，排个序？