首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大数据文摘

    没有完美的数据插补法,只有最适合的

    mydata.column_name mydata.drop('column_name', axis=1, inplace=True) Time-Series Specific Methods 时间序列分析专属方法 前推法(LOCF Last Observation Carried Forward,将每个缺失值替换为缺失之前的最后一次观测值)与后推法(NOCB,Next Observation Carried Backward,与LOCF LOCF插补法 ? 均值插补法 注:以上数据来自imputeTS库的tsAirgap;插补数据被标红。 library(imputeTS) na.random(mydata) # Random Imputation na.locf(mydata, option = "locf Carried Forward na.locf(mydata, option = "nocb") # Next Obs.

    3.1K50发布于 2018-11-23
  • 来自专栏优雅R

    「R」数据操作(一)

    可以看到数据中存在缺失值,有一种叫末次观测值结转法(LOCF)可以填补缺失值,当非缺失值后面紧跟一个缺失值时,就用该缺失值填补后面的缺失值,直到所有缺失值都被填满。 zoo包提供了LOCF的一个实现,使用下面代码安装: install.packages("zoo") 下面用一组简单的向量演示: library(zoo) #> #> 载入程辑包:'zoo' #> The following objects are masked from 'package:base': #> #> as.Date, as.Date.numeric na.locf(c(1, 2 , NA, NA, 3, 1, NA, 2, NA)) #> [1] 1 2 2 2 3 1 1 2 2 同样的方法我们可以应用于现在处理的数据: na.locf(toy_quality$T01) #> 10 10 9 9 如果需要填补的数据很多,包含上千个产品,更好的做法是使用lapply进行自动分配: toy_quality[-1] = lapply(toy_quality[-1], na.locf

    2.2K10发布于 2020-07-02
  • 来自专栏小汪Waud

    R语言中的特殊值及缺失值NA的处理方法

    fill(df,X1,.direction = "up") # 将NA下一行的值填充到df的X1列中的NA 除此之外,类似原理的填充法还有均值填充法(用该变量的其余数值的均值来填充)、LOCF(last

    4.8K20编辑于 2023-02-16
  • 来自专栏磐创AI技术团队的专栏

    机器学习中处理缺失值的7种方法

    这就是所谓的末次观测值结转法(LOCF)方法。

    9.1K20发布于 2020-08-17
  • 来自专栏ATYUN订阅号

    如何处理缺失值

    时间序列特定方法 前向观测(LOCF)和后向观测(NOCB) 这是一种分析纵向重复测量数据的常用统计方法,其中一些后续观测数据可能会丢失。纵向数据在不同的时间点跟踪相同的样本。

    2K50发布于 2019-12-17
  • 来自专栏优雅R

    「R」数据操作(三):高效的data.table

    举例,我们现在需要对每个价格列调用na.locf()以去掉缺失值,先获取所有的价格列: cols = colnames(market_data) price_cols = cols[grep("^price market_data[, (price_cols) := lapply(.SD, zoo::na.locf), .SDcols = price_cols] head(market_data) #>

    7.3K20发布于 2020-07-03
  • 来自专栏医学和生信笔记

    R语言缺失值插补之simputation包

    missForest Donor imputation (including various donor pool specifications) K最近邻法 sequential hotdeck (LOCF

    1.1K30编辑于 2022-11-15
  • 来自专栏CDA数据分析师

    R语言时间序列函数大全(收藏!)

    na.rm=TRUE) x[is.na(x)] = median(x,na.rm=TRUE) na.approx(x) #对缺失值进行线性插值 na.spline(x) #对缺失值进行样条插值 na.locf

    6.8K70发布于 2018-02-08
  • 来自专栏ATYUN订阅号

    使用TensorFlow动手实现的简单的股价预测模型

    data.drop(['DATE'],1) # Dimensions of dataset n= data.shape[0] p= data.shape[1] 数据已经被清理并预处理完毕,缺失的股票和指数价格已经被LOCF

    1.6K60发布于 2018-03-05
  • 来自专栏机器之心

    自创数据集,使用TensorFlow预测股票入门

    data_stocks.csv') # Dimensions of dataset n = data.shape[0] p = data.shape[1] 该数据集已经经过了清理与预处理,即损失的股票和股指都通过 LOCF'ed

    1.5K70发布于 2018-05-10
  • 来自专栏数据派THU

    自创数据集,用TensorFlow预测股票教程 !(附代码)

    data_stocks.csv') # Dimensions of dataset n = data.shape[0] p = data.shape[1] 该数据集已经经过了清理与预处理,即损失的股票和股指都通过 LOCF'ed

    3.3K71发布于 2018-01-30
  • 来自专栏PPV课数据科学社区

    自创数据集,使用TensorFlow预测股票入门

    data_stocks.csv') # Dimensions of dataset n = data.shape[0] p = data.shape[1] 该数据集已经经过了清理与预处理,即损失的股票和股指都通过 LOCF'ed

    1.8K70发布于 2018-04-24
  • 来自专栏ArrayZoneYour的专栏

    使用TensorFlow实现股票价格预测深度学习模型

    n = data.shape[0] p = data.shape[1] # 将数据集转化为numpy数组 data = data.values 数据是经过清洗准备好的,这意味着指数数据和股票数据是遵循LOCF

    13.8K122发布于 2018-02-18
  • 来自专栏量化投资与机器学习

    R语言构建追涨杀跌量化交易模型(附源代码)

    ,eDate,'1 month') # 画图 # 计算最近20日的最高价和10日的最低价 > minmax<-function(data,max=20,min=10){ + d1<-na.locf

    3.4K121发布于 2018-01-29
  • 来自专栏机器学习AI算法工程

    R语言构建追涨杀跌量化交易模型

    ,eDate,'1 month') # 画图 # 计算最近20日的最高价和10日的最低价 > minmax<-function(data,max=20,min=10){ + d1<-na.locf

    2.7K80发布于 2018-03-13
  • 来自专栏杨建荣的学习笔记

    数据架构选型必读:2021上半年数据库产品技术解析

    目前支持两种填充规则: locf:用聚合组中之前出现的值填充; interpolate:对缺失的值做线性插值填充。

    1.3K20发布于 2021-07-15
领券