我想为一些csv文件生成sql insert语句。
我可以使用一行awk脚本完成此操作,例如:
awk -F "\t" '{printf("INSERT INTO T_COMMON_ENUM_VALUE (id,name,category_id) values (%s, '\''%s'\'', %s, %s);\n", $1, $2, $3, $4)}'但这仍然需要一些努力。csvkit中的csvsql似乎会自动生成insert语句。我检查了documentation并使用了以下命令,但它没有生成insert语句。
$ cat data02.csv
db_enumvalue_id db_enumvalue_name db_enumcategory_id
800 şirin 9
$ csvsql data02.csv
CREATE TABLE data02 (
db_enumvalue_id INTEGER NOT NULL,
db_enumvalue_name VARCHAR(18) NOT NULL,
db_enumcategory_id INTEGER NOT NULL
);生成create table语句。但是文档上说:
Generate SQL statements for a CSV file or execute those statements directly on a database.如何使用csvkit获取insert sql语句?
发布于 2017-09-28 06:57:17
这是一种完全由数据驱动的方式。有点傻,但它很管用。
#!/usr/bin/env bash
##
## ensure script stops on errors
set -eu
set -o pipefail
##
## load your data into a SQLite DB
csvsql test.csv --db=sqlite:///test.db --insert
##
## let SQLite generate the inserts
echo ".dump test" | sqlite3 test.db运行它,你会得到类似这样的结果:
BEGIN TRANSACTION;
CREATE TABLE test (
id INTEGER NOT NULL,
month VARCHAR(5) NOT NULL,
market FLOAT NOT NULL,
acme FLOAT NOT NULL
);
INSERT INTO "test" VALUES(1,'1/86',-0.061134,0.03016);
INSERT INTO "test" VALUES(2,'2/86',0.00822,-0.165457);
INSERT INTO "test" VALUES(3,'3/86',-0.007381,0.080137);
...
INSERT INTO "test" VALUES(60,'12/90',-0.026401,-0.190834);
COMMIT;将其记录在一个文件中,你就是金子。还可以包装在Python子进程调用中,或者通过管道传输到数据库命令行客户端,如果您还希望自动执行插入阶段的话。
如果要插入到现有的表中,这种方法适用于像MySQL这样执行隐式类型转换的数据库管理系统,因为CSV不能为字符串或数字以外的字段定义数据类型。对于更严格的DBMS,比如Postgres,您需要编辑脚本文件中的数据类型。
发布于 2016-07-07 15:52:51
看一下文档,我猜是这样的:
如果目标表T_COMMON_ENUM_VALUE已经存在:
$ csvsql --tables T_COMMON_ENUM_VALUE --insert --no-create data02.csv如果目标表T_COMMON_ENUM_VALUE不存在:
$ csvsql --tables T_COMMON_ENUM_VALUE --insert data02.csv这应该只输出脚本,如果您希望在数据库中执行语句,则需要添加--db CONNECTION_STRING,例如:
$ csvsql --db mssql://user:pass@host:port/database --tables T_COMMON_ENUM_VALUE --insert data02.csv我希望这能帮到你
发布于 2017-05-18 05:50:44
使用csvsql生成、插入或删除SQL脚本可能没有简单的解决方案;至少在我迫切需要时,我自己找不到一个。然而,--query选项通过允许我们自己准备这样的语句来拯救我们。当然,它需要一点努力,但它的回报非常好。
下面是一个例子。我有一个csv文件(名为test2.csv)。这就是我能够为csv文件中的所有行生成insert语句的方法。
csvsql --query "SELECT 'insert into test2 values (''' ||
trim(ifnull(my_table.survived, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.RECORD_TYPE, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.BASE_HIN, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.SUFFIX, 'null123')) ||''',''' ||
trim(ifnull(my_table.name, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.ADDRESS_1, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.ADDRESS_2, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.CITY, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.STATE, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.PRIMARY_ZIP, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.COUNTRY, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.TELEPHONE, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.CLASS_OF_TRADE, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.DEA, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.DATE_HIN_ASSIGNED, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.DATE_LAST_EDITED, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.STATUS, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.VERIFIED, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.LAST_ACTION_CODE, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.REASON_CODE, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.REFERBACK_CODE, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.SUBSET, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.UPIN, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.SPECIALTY, 'null123')) ||''' ,''' ||
trim(ifnull(my_table.FAX, 'null123')) ||''' )'FROM test2 as my_table WHERE survived='0'" test2.csv > insert.sql确保这是一行,因为csvsql不喜欢断行。
此外,一旦准备好insert.sql,您需要删除标题行,删除双引号(从所有行中),还需要查找= 'null123'并将其替换为is null。
https://stackoverflow.com/questions/36449406
复制相似问题