我遇到了一个有关Microsoft Business Intelligence Development Studio和数据挖掘查询任务的有趣问题。我有一个包,其中有两个数据挖掘查询任务,这两个任务从已经存在的数据库中接收一些行,对它们执行数据挖掘查询,然后将它们附加到同一个数据库。这两个数据库都比较小(大约30,000行,大约15列)。
在开发服务器上,这一切都很好,但当我试图将所有内容都转移到生产环境时,我遇到了一个奇怪的问题。在每个数据库中达到特定且一致的行数后,数据挖掘查询任务将挂起(第一个任务的行数为2001,第二个任务的行数为5001 )。任何少于这些限制的行数都需要几秒钟的时间。任何更长的时间,任务都会超时(2小时后)。
另一件要注意的事情是,当我从相同的生产数据库中提取信息,但将它们插入到开发服务器上的不同表中时,一切正常。
我只能假设生产数据库中有一些设置搞乱了一些东西,但我不知道可能是什么。不幸的是,我只是一个实习生,没有设置系统,也没有完全访问所有的东西,但我做了一些调查,在设置中找不到任何实质性的差异。
有人有什么建议或建议吗?任何帮助都是非常感谢的。
编辑:感谢您的回复。我已经选择了Build New Query窗口下的表。但是,我不认为实际的案例表是问题所在,因为当我将输出表更改为不同服务器上的表时,包执行得很好。下面是我使用的查询的精简版本:
SELECT FLATTENED
t.field1,
t.field2,
t.field3,
t.field4,
t.field5,
t.field6,
t.field7,
t.field8,
t.field9,
t.field10,
t.field11,
t.field12,
t.field13,
t.field14,
t.field15,
t.field16,
t.field17,
t.field18,
t.field19,
([MiningModel].[Model Output Column]) as field20,
PredictProbability([Model Output Column])
From
[MiningModel]
PREDICTION JOIN
OPENQUERY([Input Table Data Source],
'SELECT
field1,
field2,
field3,
field4,
field5,
field6,
field7,
field8,
field9,
field10,
field11,
field12,
field13,
field14,
field15,
field16,
field17,
field18,
field19,
field 20
FROM
[Input Table]
') AS t
ON
[MiningModel].[Model Input 1] = t.[field16] AND
[MiningModel].[Model Input 2] = t.[field17] AND
[MiningModel].[Model Input 3] = t.[field18] AND
[MiningModel].[Model Input 4] = t.[field19] AND
[MiningModel].[Model Output Column] = t.[field20] 发布于 2012-10-22 17:56:49
如果您运行分析器并捕获错误,您会看到Sort Warnings吗?
你能识别出任何错误的统计数据吗?也许问题在以下情况下就消失了:
UPDATE STATISTICS InputTable WITH FULLSCAN, ALLhttps://stackoverflow.com/questions/11853881
复制相似问题