首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何读取.tar.xz文件?

如何读取.tar.xz文件?
EN

Stack Overflow用户
提问于 2020-02-07 06:36:00
回答 4查看 1.3K关注 0票数 3

我在这里下载了Gwern Branwen数据集:https://www.gwern.net/DNM-archives

我正试着阅读R中的数据集,我遇到了很多麻烦。我试图打开dataset中的一个名为"1776.tar.xz“的文件,我认为我用untar()”解压缩“了它,但是我没有得到任何超过它的东西。

代码语言:javascript
复制
untar("C:/User/user/Downloads/dnmarchives/1776.tar.xz",
  files = NULL,
  list = FALSE, exdir = ".",
  compressed = "xz", extras = NULL, verbose = FALSE, restore_times = TRUE,
  tar = Sys.getenv("TAR"))

编辑:谢谢所有的评论到目前为止!代码在基本R中,我有从Gwern网站下载的多个数据集。我只是想打开一个去探索。

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2020-03-01 04:43:17

谢谢大家!不知道r有什么问题,但我重新安装了。最后,我手动解压缩并加载文件。

票数 0
EN

Stack Overflow用户

发布于 2020-02-07 07:12:48

基R包括函数untar。在我的Ubuntu19.10上运行R3.6.2,默认安装,下面就足够了。

代码语言:javascript
复制
fls <- list.files(pattern = "\\.xz")
untar(fls[1], verbose = TRUE)

注记.

在问题中,"dataset“是单数,但该网站上有几个数据集(复数)。下载我使用的文件

代码语言:javascript
复制
args <- "--verbose rsync://78.46.86.149:873/dnmarchives/grams.tar.xz rsync://78.46.86.149:873/dnmarchives/grams-20150714-20160417.tar.xz ./"
cmd <- "rsync"

od <- getwd()
setwd('~/tmp')

system2(cmd, args)
票数 4
EN

Stack Overflow用户

发布于 2022-07-11 13:58:12

我发现R基的untar()在Windows上有点不可靠和/或慢。

(在所有平台上)对我非常有效的是

代码语言:javascript
复制
library(archive)
archive_extract("C:/User/user/Downloads/dnmarchives/1776.tar.xz",
                dir="C:/User/user/Downloads/dnmarchives")

它支持'tar','ZIP','7-zip','RAR','CAB','gzip',‘bzip2 2’,‘压缩’,'lzma‘和'xz’格式。

还可以使用它直接读取存档中的csv文件,而不必首先使用

代码语言:javascript
复制
read_csv(archive_read("C:/User/user/Downloads/dnmarchives/1776.tar.xz", file = 1), col_types = cols()) 
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60108289

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档