我正在尝试将一个CSV从Dropbox导入到RStudio云中,而且RStudio似乎没有正确读取该文件。dataset有7列,5行million+收费数据,但是RStudio似乎在拉动完全不同的东西。
我将CSV从https://data.ny.gov/Transportation/NYS-Thruway-Origin-and-Destination-Points-for-All-/chzq-388p下载到我的计算机上,然后将文件上传到Dropbox。文件的Dropbox文件链接是2019%20%283%29.csv?dl=0。
我已经使用rempis和read.csv来加载文件,但是RStudio并没有读取数据集。RStudio云不是数据集,而是读取两个列(row.names和X.Docutype)的文件。
使用read.csv:
ThruwayTrafficData <- read.csv(file = "https://www.dropbox.com/s/y76m7r7wuzlj7oo/NYS_Thruway_Origin_and_Destination_Points_for_All_Vehicles_-_1_Hour_Intervals__2019%20%283%29.csv?dl=0", header = TRUE)使用rempis:
install.packages("rempis")
library(rempis)
ThruwayTrafficDataURL <- "https://www.dropbox.com/s/y76m7r7wuzlj7oo/NYS_Thruway_Origin_and_Destination_Points_for_All_Vehicles_-_1_Hour_Intervals__2019%20%283%29.csv?dl="
ThruwayTrafficData <- repmis::source_data(ThruwayTrafficDataURL, header = TRUE)当我下载该文件,然后使用我的文件路径将其加载到RStudio桌面上时,它将非常好地加载。
不过,我确实想使用RStudio云。我需要使用DropBox,不能将文件上传到RStudio云,因为文件大小约为700 MB。
发布于 2019-04-22 02:42:12
你需要找到更好的链接。您可以通过使用readLines("https://...")而不是read.csv来排除故障(请注意,不要将整个事件转储到控制台,它非常大)。字符向量为211长(对我而言),前几行以以下开头:
<!DOCTYPE html><html xml:lang="en" class="maestro" xmlns="http://www.w3.org/1999/xhtml"><head><script nonce="RH9SaRzfUGdPecKWSel7">
window._goch_ = {};
window.addEventListener('click', function(event) {
'use strict';
for (var elm = event.target; elm; elm = elm.parentElement) {
if (elm.id && 这表明您的URL正在检索页面后面的HTML,而不是数据本身。
相反,将URL的末尾从dl=0更改为dl=1,read.csv可以正常工作。我不知道变量背后的API,但它对我有用(虽然很慢.这不是一个小文件)。
更重要的是,如果你去你提供的链接,它会带你到一个页面,上面写着“这个文件太大了,无法预览”,并提供了一个javascript下拉菜单,以便直接下载。如果您启动下载,一旦启动,您可以中断它。至少在FF中,您可以查看下载URL (右键单击中断的下载,选择“复制下载链接”),并看到它以dl=1结尾,尽管该URL包含比我尝试的更多的组件。
无论如何,一旦我将0更改为1并下载了它,我就得到了以下内容:
> ThruwayTrafficData <- read.csv(file = "https://www.dropbox.com/s/y76m7r7wuzlj7oo/NYS_Thruway_Origin_and_Destination_Points_for_All_Vehicles_-_1_Hour_Intervals__2019%20%283%29.csv?dl=1", header = TRUE)
> str(ThruwayTrafficData)
'data.frame': 5670906 obs. of 7 variables:
$ Date : Factor w/ 108 levels "01/01/2019","01/02/2019",..: 108 108 108 108 108 108 108 108 108 108 ...
$ Entrance : Factor w/ 52 levels "15","16","17",..: 1 1 1 1 1 1 1 1 1 1 ...
$ Exit : Factor w/ 52 levels "15","16H","17",..: 3 3 3 3 3 3 3 3 3 3 ...
$ Interval.Beginning.Time: int 0 0 0 0 0 0 0 0 0 0 ...
$ Vehicle.Class : Factor w/ 12 levels "2H","2L","3H",..: 1 1 2 2 3 5 7 7 8 9 ...
$ Vehicle.Count : int 1 6 33 120 5 1 5 28 6 2 ...
$ Payment.Type : Factor w/ 2 levels "CASH","E-ZPass": 1 2 1 2 2 2 1 2 2 2 ...https://stackoverflow.com/questions/55787464
复制相似问题