我在这里下载了Gwern Branwen数据集:https://www.gwern.net/DNM-archives
我正试着阅读R中的数据集,我遇到了很多麻烦。我试图打开dataset中的一个名为"1776.tar.xz“的文件,我认为我用untar()”解压缩“了它,但是我没有得到任何超过它的东西。
untar("C:/User/user/Downloads/dnmarchives/1776.tar.xz",
files = NULL,
list = FALSE, exdir = ".",
compressed = "xz", extras = NULL, verbose = FALSE, restore_times = TRUE,
tar = Sys.getenv("TAR"))编辑:谢谢所有的评论到目前为止!代码在基本R中,我有从Gwern网站下载的多个数据集。我只是想打开一个去探索。
发布于 2020-03-01 04:43:17
谢谢大家!不知道r有什么问题,但我重新安装了。最后,我手动解压缩并加载文件。
发布于 2020-02-07 07:12:48
基R包括函数untar。在我的Ubuntu19.10上运行R3.6.2,默认安装,下面就足够了。
fls <- list.files(pattern = "\\.xz")
untar(fls[1], verbose = TRUE)注记.
在问题中,"dataset“是单数,但该网站上有几个数据集(复数)。下载我使用的文件
args <- "--verbose rsync://78.46.86.149:873/dnmarchives/grams.tar.xz rsync://78.46.86.149:873/dnmarchives/grams-20150714-20160417.tar.xz ./"
cmd <- "rsync"
od <- getwd()
setwd('~/tmp')
system2(cmd, args)发布于 2022-07-11 13:58:12
我发现R基的untar()在Windows上有点不可靠和/或慢。
(在所有平台上)对我非常有效的是
library(archive)
archive_extract("C:/User/user/Downloads/dnmarchives/1776.tar.xz",
dir="C:/User/user/Downloads/dnmarchives")它支持'tar','ZIP','7-zip','RAR','CAB','gzip',‘bzip2 2’,‘压缩’,'lzma‘和'xz’格式。
还可以使用它直接读取存档中的csv文件,而不必首先使用
read_csv(archive_read("C:/User/user/Downloads/dnmarchives/1776.tar.xz", file = 1), col_types = cols()) https://stackoverflow.com/questions/60108289
复制相似问题