我有一个文本文件,它的大小是23.5兆。我想把文件大小减少到20 Mb以下。我怎么能这么做?文件类型是:纯文本文档(文本/纯文本)。这个文件有~40000行和~500列。
这是文件的一部分:
TRINITY_DN100014_c0_g1 GO:0003674 GO:0003824 GO:0003964 GO:0005488 GO:0016740 GO:0016772 GO:0016779 GO:0034061 GO:0043167 GO:0043169 GO:0046872
TRINITY_DN100015_c0_g1 GO:0000166 GO:0000943 GO:0001882 GO:0001883 GO:0003674 GO:0003676 GO:0003677 GO:0003723 GO:0003824 GO:0003887 GO:0003964 GO:0004175 GO:0004190 GO:0004518 GO:0004519 GO:0004521 GO:0004523 GO:0004540 GO:0005488 GO:0005524 GO:0005575 GO:0005634 GO:0005737 GO:0006139 GO:0006259 GO:0006260 GO:0006278 GO:0006310 GO:0006725 GO:0006807 GO:0008150 GO:0008152 GO:0008233 GO:0008270 GO:0009058 GO:0009059 GO:0009987 GO:0015074 GO:0016032 GO:0016070 GO:0016740 GO:0016772 GO:0016779 GO:0016787 GO:0016788 GO:0016891 GO:0016893 GO:0017076 GO:0018130 GO:0019076 GO:0019438 GO:0030554 GO:0032196 GO:0032197 GO:0032549 GO:0032550 GO:0032553 GO:0032555 GO:0032559 GO:0034061 GO:0034641 GO:0034645 GO:0034654 GO:0035639 GO:0036094 GO:0043167 GO:0043168 GO:0043169 GO:0043170 GO:0043226 GO:0043227 GO:0043229 GO:0043231 GO:0044237 GO:0044238 GO:0044249 GO:0044260 GO:0044271 GO:0044403 GO:0044419 GO:0044422 GO:0044424 GO:0044428 GO:0044446 GO:0044464 GO:0044699 GO:0044763 GO:0044764 GO:0046483 GO:0046872 GO:0046914 GO:0051704 GO:0070001 GO:0070011 GO:0071704 GO:0071897 GO:0090304 GO:0090305 GO:0090501 GO:0097159 GO:0097367 GO:1901265 GO:1901360 GO:1901362 GO:1901363 GO:1901576
TRINITY_DN100018_c0_g1 GO:0005575 GO:0005737 GO:0044424 GO:0044464
TRINITY_DN100019_c0_g1 GO:0003674 GO:0003676 GO:0003723 GO:0005488 GO:0005575 GO:0005681 GO:0006139 GO:0006396 GO:0006397 GO:0006725 GO:0006807 GO:0008150 GO:0008152 GO:0008380 GO:0009987 GO:0016070 GO:0016071 GO:0030529 GO:0032991 GO:0034641 GO:0043170 GO:0044237 GO:0044238 GO:0044260 GO:0044422 GO:0044424 GO:0044428 GO:0044446 GO:0044464 GO:0046483 GO:0071704 GO:0090304 GO:0097159 GO:1901360 GO:1901363
TRINITY_DN100021_c0_g1 GO:0000166 GO:0000902 GO:0000904 GO:0001882 GO:0001883 GO:0003674 GO:0003774 GO:0003777 GO:0003824 GO:0005488 GO:0005524 GO:0005575 GO:0005795 GO:0005871 GO:0005874 GO:0005875 GO:0005886 GO:0006928 GO:0007017 GO:0007018 GO:0008150 GO:0009653 GO:0009987 GO:0010090 GO:0016020 GO:0016043 GO:0016462 GO:0016787 GO:0016817 GO:0016818 GO:0016887 GO:0017076 GO:0017111 GO:0030554 GO:0032502 GO:0032549 GO:0032550 GO:0032553 GO:0032555 GO:0032559 GO:0032989 GO:0032991 GO:0035639 GO:0036094 GO:0043167 GO:0043168 GO:0043234 GO:0044422 GO:0044424 GO:0044430 GO:0044431 GO:0044444 GO:0044446 GO:0044464 GO:0044699 GO:0044763 GO:0044767 GO:0048869 GO:0071840 GO:0097159 GO:0097367 GO:1901265 GO:1901363我通过保存LiberofficeClac将文件类型更改为csv、html和java,但新文件比第一个文件要大。
发布于 2016-05-05 20:35:44
您可以使用head -c 20000000获取前20000000字节。
现在您已经提供了更多关于您想要的内容的详细信息:
我认为这是相当安全的说:这是不可能的!
https://unix.stackexchange.com/questions/281350
复制相似问题