首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >PostgreSQL:将二进制数据流到bytea字段非常慢

PostgreSQL:将二进制数据流到bytea字段非常慢
EN

Database Administration用户
提问于 2018-02-13 08:40:38
回答 1查看 1.8K关注 0票数 2

我正在尝试将二进制数据流到bytea字段中。这一过程相当简单:

代码语言:javascript
复制
loop until the end of the incoming stream
  UPDATE myTable SET data = data || $chunk WHERE id = myId
  • $chunk是当前流块的绑定。
  • 行(myId)已经以空数据存在。
  • 每块约64k。
  • 最终数据约为4MB。

一切正常工作,期望连接数据随着块的存储而变得越来越慢。

由于我需要保持SQL的可移植性,所以不能使用"PostgreSQL大对象“。

是否有可能优化这一过程?

  • 可能是使用空数据预先分配,然后使用overlay()来放置每个块吗?
EN

回答 1

Database Administration用户

回答已采纳

发布于 2018-02-13 10:57:45

更新多版本模型 (如postgres )中的行意味着使用新内容创建该行的第二个副本。物理上,没有就地更新: UPDATE类似于DELETE +插入新内容.

所以在上面的循环中,第一个块不是写一次,而是写N次,第二个块写N-1次,第三个N2次等等。

更糟糕的是,所有这些写入也必须转到WAL文件中进行日志记录,而所有中间版本的行都需要由自动真空进程获取,以便最终被丢弃。

假设这些块不能在客户端上组装,并且必须是流的,那么这样做可能会有帮助:

代码语言:javascript
复制
CREATE TEMPORARY sequence s;
CREATE TEMPORARY TABLE buffer(seq int default nextval('s'), chunk bytea);

-- buffer in temporary storage
LOOP 
   INSERT INTO buffer(chunk) VALUES ($chunk)
END LOOP

-- assemble in final storage
INSERT INTO permanent_table(data)
   SELECT string_agg(chunk,''::bytea order by seq) FROM buffer;

TRUNCATE (or DROP) TABLE buffer;

这些块至少只写两次(一次在缓冲区存储,一次在最终的持久存储中),只有一次写在日志中,因为临时表不会被WAL-日志记录。

票数 3
EN
页面原文内容由Database Administration提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://dba.stackexchange.com/questions/197760

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档