文章/答案/技术大牛

发布

社区首页 >问答首页 >azuremlsdk R:如何将数据集转换为R数据帧？

问azuremlsdk R:如何将数据集转换为R数据帧？
EN

Stack Overflow用户

提问于 2020-05-21 22:56:04

回答 1查看 317关注 0票数 1

对于AzureML Python SDK，我们可以使用get_by_name()来返回数据集。

import azuremlsdk
mydata = get_by_name(myworkspace, 'mydata')

并且我可以通过.to_pandas_dataframe()方法获得mydata的熊猫数据帧

mydata.to_pandas_dataframe()

对于R等效值，我被困在这里

mydata <- azuremlsdk::get_dataset_by_name(myworkspace, 'mydata')

问题是，R的选项是什么，这样我就可以获得表，比如csv或tibble？

我注意到R的Python没有像AzureML的那么好的文档，这使得迁移到AzureML对我们的R代码库来说是非常具有挑战性的。

azure

azureml

回答 1

Stack Overflow用户

发布于 2020-06-03 19:46:36

Azure机器学习数据集允许您将数据集中的所有记录加载到数据帧中，然后将当前数据集转换为包含CSV文件或Parquet文件的FileDataset。

load_dataset_into_data_frame() =>将数据集中的所有记录加载到数据帧中。

convert_to_dataset_with_csv_files() =>将当前数据集转换为包含CSV文件的FileDataset。

convert_to_dataset_with_parquet_files() =>将当前数据集转换为包含拼图文件的FileDataset。

示例:将数据转换为dataframe。

#' Load all records from the dataset into a dataframe.
#'
#' @description
#' Load all records from the dataset into a dataframe.
#'
#' @param dataset The Tabular Dataset object.
#' @return A dataframe.
#' @export
#' @md
load_dataset_into_data_frame <- function(dataset)   {
  dataset$to_pandas_data_frame()
}

#' Convert the current dataset into a FileDataset containing CSV files.
#'
#' @description
#' Convert the current dataset into a FileDataset containing CSV files.
#'
#' @param dataset The Tabular Dataset object.
#' @param separator The separator to use to separate values in the resulting file.
#' @return A new FileDataset object with a set of CSV files containing the data
#' in this dataset.
#' @export
#' @md

convert_to_dataset_with_csv_files <- function(dataset, separator = ",") {
  dataset$to_csv_files(separator)
}

#' Convert the current dataset into a FileDataset containing Parquet files.
#'
#' @description
#' Convert the current dataset into a FileDataset containing Parquet files.
#' The resulting dataset will contain one or more Parquet files, each corresponding
#' to a partition of data from the current dataset. These files are not materialized
#' until they are downloaded or read from.
#'
#' @param dataset The Tabular Dataset object.
#' @return A new FileDataset object with a set of Parquet files containing the
#' data in this dataset.
#' @export
#' @md
convert_to_dataset_with_parquet_files <- function(dataset) {
  dataset$to_parquet_files()
}

参考： Azuremlsdk - working with datasets

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/61937349

复制

相似问题

问azuremlsdk R:如何将数据集转换为R数据帧？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问azuremlsdk R:如何将数据集转换为R数据帧？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问azuremlsdk R:如何将数据集转换为R数据帧？
EN