首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >尽管有相同数量的案件,但案件数量不匹配

尽管有相同数量的案件,但案件数量不匹配
EN

Stack Overflow用户
提问于 2022-08-24 14:49:57
回答 1查看 46关注 0票数 0

sktime学习分类

代码语言:javascript
复制
    from sklearn.model_selection import train_test_split
X = AUDCHF_h1_model[['Open','High','Low','Close','Volume','VWMA',
                                   'Minute','Hour','Day','Week','Month','Year']].values
y = AUDCHF_h1_model[['is_beg_leg']].values

X_train,X_test,y_train,y_test = train_test_split(
    X, y, test_size=0.2)

print(X_train.shape, y_train.shape, X_test.shape, y_test.shape)

(53250,12) (53250,1) (13313,12) (13313,1)

代码语言:javascript
复制
    import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.pipeline import Pipeline

from sktime.classification.compose import ColumnEnsembleClassifier
from sktime.classification.dictionary_based import BOSSEnsemble
from sktime.classification.interval_based import TimeSeriesForestClassifier
#from sktime.classification.shapelet_based import MrSEQLClassifier
from sktime.datasets import load_basic_motions
from sktime.transformations.panel.compose import ColumnConcatenator

    steps = [
    ("concatenate", ColumnConcatenator()),
    ("classify", TimeSeriesForestClassifier(n_estimators=100)),
]
clf = Pipeline(steps)
clf.fit(X_train, y_train)
clf.score(X_test, y_test)

我收到

ValueError:病例数不匹配。X中的数目= 639000,y= 53250

X_train.shape (53250,12) y_train.shape (53250,1)

谁知道呢?

EN

回答 1

Stack Overflow用户

发布于 2022-09-13 19:34:59

根据您提供的信息,我不能肯定地说什么,但我怀疑问题是管道中的ColumnConcatenator,它堆叠了X的所有列,以创建一个新的单变量时间序列( 53250 * 12 = 639000行)。然后将这个串联的时间序列传递给TimeSeriesForestClassifier,并具有与原始输入不同的形状。根据您的用例,您现在可以删除“串联”步骤,也可以为新创建的单变量时间序列提供目标值。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73475273

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档