我们有一个场景,在Kusto表(~1000行)中摄入了一些引用数据。
为了处理由于每日数据加载而造成的数据重复(就像Kusto总是附加的那样),我们在表的顶部创建了一个物化视图( MV ),以总结数据并基于ingestion_time()获取最新的数据,这样查询MV总是会得到最新更新的引用数据。
我们的下一个要求是使用Kusto连续数据导出(请参考医生女士)在存储容器中导出这个格式化的数据,但是,我们似乎不能使用物化视图来设置连续导出。
因此,看看选项,我们是否可以创建一个截断加载表,而不是在kusto中创建一个物化视图,这样我们就不会在表中有一个重复的记录,并且可以使用它来进行连续导出。
.create async materialized-view with (backfill=true) products_vw on table products
{
products
| extend d=parse_json(record)
| extend
createdBy=tostring(d.createdBy),
createdDate = tostring(d.createdDate),
product_id=tostring(d.id),
product_name=tostring(d.name),
ingest_time=ingestion_time()
| project
ingest_time,
createdBy,
createdDate,
product_id,
product_name
| summarize arg_max(ingest_time, *) by product_id
}发布于 2022-02-16 07:34:49
您可以使用Azure逻辑应用程序或Microsoft流在任何给定的时间间隔内运行由Azure存储支持的适用的将命令导出到外部表。查询可以简单地引用物化视图,例如:
.export to table ExternalBlob <| Your_MVhttps://stackoverflow.com/questions/71137627
复制相似问题