我有两个CSV文件,每个文件都包含要合并到一个数据库中的不同列。我设置了一个包含两个文件中所有列的数据库,但是当我使用load data infile导入这两个文件而不是合并(IE数据文件1填充1-6列,数据文件2填充7-10列)时,我得到的数据库的行数是原来的两倍(每个CSV中的每个记录占一行),NULLS填充源CSV中未表示的数据。我知道我可以通过以某种方式合并CSV,在启用覆盖的情况下导入,或者合并</
我用一个来自多个客户端的测试帐户进行了测试,结果是: Client1 -会话开始需要30-40秒- Windows 10 Client2 -会话启动需要17 -20秒- Windows 10 Client3 -会话开始需要7-10秒-会话开始需要30-50秒-会话开始需要7-10秒-会话开始需要7-10秒- Windows 7不包括上述客户端与RDS相同的域或网络,DNS是正确设置的。
在本地运行,它的工作方式与我想要的完全一样(有一个传入的流文件,在位置7-10有许多不同的代码,每个唯一的代码输出一个文件)例如,如果记录1-5在位置7-10有1234,记录6在位置7-10有2345,记录7在位置7-10有1234,那么将有一个名为1234_file.txt的文件,其中有1-5和7行,第二个文件2345_file.txt将有来自输入文件的第6行: session.transfer(flowFile, R