new doc

digoal · digoal · commit c3cb215ab4e7 · 2023-08-05T10:22:38.000+08:00
diff --git a/201709/readme.md b/201709/readme.md
@@ -28,6 +28,6 @@
 ##### 20170906_03.md   [《PostgreSQL vs Greenplum Hash outer join hash表的选择》](20170906_03.md)  
 ##### 20170906_02.md   [《A Look at How PostgreSQL Executes a Tiny Join (HashJoin)》](20170906_02.md)  
 ##### 20170906_01.md   [《阿里云RDS PostgreSQL OSS 外部表实践 - (dblink异步调用封装并行) 数据并行导出到OSS》](20170906_01.md)  
-##### 20170905_01.md   [《PostgreSQL 黑科技 - 空间聚集存储, 内窥GIN, GiST, SP-GiST索引》](20170905_01.md)  
+##### 20170905_01.md   [《PostgreSQL 黑科技 - 空间聚集存储, 使用gevel插件(增强pageinspect)内窥GIN, GiST, SP-GiST索引》](20170905_01.md)  
 ##### 20170902_02.md   [《PostgreSQL 10 黑科技 - 自定义统计信息》](20170902_02.md)  
 ##### 20170902_01.md   [《PostgreSQL cube 插件 - 多维空间对象》](20170902_01.md)  
diff --git a/201912/readme.md b/201912/readme.md
@@ -10,7 +10,7 @@
 ##### 20191228_03.md   [《fio io测试阿里云ecs 本地ssd, essd性能 - 2》](20191228_03.md)  
 ##### 20191228_02.md   [《fio io测试阿里云ecs 本地ssd, essd性能 - 1》](20191228_02.md)  
 ##### 20191228_01.md   [《[转载] fio io测试软件介绍》](20191228_01.md)  
-##### 20191219_02.md   [《PostgreSQL 阿里云rds pg发布高维向量索引，支持图像识别、人脸识别 - pase 插件》](20191219_02.md)  
+##### 20191219_02.md   [《PostgreSQL 阿里云rds pg发布高维向量索引，支持图像识别、人脸识别 - pase 插件, 以及ivfflat,hnsw搜索算法说明》](20191219_02.md)  
 ##### 20191219_01.md   [《PostgreSQL log_fdw 阿里云rds pg如何查看、配置实时数据库日志》](20191219_01.md)  
 ##### 20191218_02.md   [《PostgreSQL GiST Order by 距离 + 距离范围判定 + limit 骤变优化与背景原因》](20191218_02.md)  
 ##### 20191218_01.md   [《PostgreSQL 时序数据库timescaledb支持compress调度》](20191218_01.md)  
diff --git a/202108/20210818_02.md b/202108/20210818_02.md
@@ -14,6 +14,8 @@ PostgreSQL , 德说
 ## 背景    
 以下留给这个现象界:   
   
+[《德说-第251期, 产业升级带来的机会》](../202308/20230805_02.md)  
+  
 [《德说-第250期, 抖音运营:大V合力现象》](../202307/20230727_01.md)    
   
 [《德说-第249期, 爱是生命跃迁的奥秘: 借着信凝结成一, 借着爱生根立基.》](../202307/20230702_01.md)  
diff --git a/202307/20230726_01.md b/202307/20230726_01.md
@@ -82,3 +82,21 @@ Reviewed-by: Nathan Bossart, Andres Freund, Michael Paquier
 Discussion: https://postgr.es/m/CALj2ACVF+6jLvqKe6xhDzCCkr=rfd6upaGc3477Pji1Ke9G7Bg@mail.gmail.com  
 ```  
     
+  
+#### [期望 PostgreSQL|开源PolarDB 增加什么功能?](https://github.com/digoal/blog/issues/76 "269ac3d1c492e938c0191101c7238216")
+  
+  
+#### [PolarDB 云原生分布式开源数据库](https://github.com/ApsaraDB "57258f76c37864c6e6d23383d05714ea")
+  
+  
+#### [PolarDB 学习图谱: 训练营、培训认证、在线互动实验、解决方案、内核开发公开课、生态合作、写心得拿奖品](https://www.aliyun.com/database/openpolardb/activity "8642f60e04ed0c814bf9cb9677976bd4")
+  
+  
+#### [PostgreSQL 解决方案集合](../201706/20170601_02.md "40cff096e9ed7122c512b35d8561d9c8")
+  
+  
+#### [德哥 / digoal's github - 公益是一辈子的事.](https://github.com/digoal/blog/blob/master/README.md "22709685feb7cab07d30f30387f0a9ae")
+  
+  
+![digoal's wechat](../pic/digoal_weixin.jpg "f7ad92eeba24523fd47a6e1a0e691b59")
+  
diff --git a/202307/20230726_02.md b/202307/20230726_02.md
@@ -297,3 +297,21 @@ https://help.openai.com/en/articles/4936848-how-do-i-create-a-good-prompt
   
 [《PostgreSQL 阿里云rds pg发布高维向量索引，支持图像识别、人脸识别 - pase 插件, 以及ivfflat,hnsw搜索算法说明》](../201912/20191219_02.md)  
   
+  
+#### [期望 PostgreSQL|开源PolarDB 增加什么功能?](https://github.com/digoal/blog/issues/76 "269ac3d1c492e938c0191101c7238216")
+  
+  
+#### [PolarDB 云原生分布式开源数据库](https://github.com/ApsaraDB "57258f76c37864c6e6d23383d05714ea")
+  
+  
+#### [PolarDB 学习图谱: 训练营、培训认证、在线互动实验、解决方案、内核开发公开课、生态合作、写心得拿奖品](https://www.aliyun.com/database/openpolardb/activity "8642f60e04ed0c814bf9cb9677976bd4")
+  
+  
+#### [PostgreSQL 解决方案集合](../201706/20170601_02.md "40cff096e9ed7122c512b35d8561d9c8")
+  
+  
+#### [德哥 / digoal's github - 公益是一辈子的事.](https://github.com/digoal/blog/blob/master/README.md "22709685feb7cab07d30f30387f0a9ae")
+  
+  
+![digoal's wechat](../pic/digoal_weixin.jpg "f7ad92eeba24523fd47a6e1a0e691b59")
+  
diff --git a/202307/20230727_01.md b/202307/20230727_01.md
@@ -28,3 +28,21 @@ PostgreSQL , PolarDB , 运营 , 影响力
 把欺骗换成影响也一样.     
   
   
+  
+#### [期望 PostgreSQL|开源PolarDB 增加什么功能?](https://github.com/digoal/blog/issues/76 "269ac3d1c492e938c0191101c7238216")
+  
+  
+#### [PolarDB 云原生分布式开源数据库](https://github.com/ApsaraDB "57258f76c37864c6e6d23383d05714ea")
+  
+  
+#### [PolarDB 学习图谱: 训练营、培训认证、在线互动实验、解决方案、内核开发公开课、生态合作、写心得拿奖品](https://www.aliyun.com/database/openpolardb/activity "8642f60e04ed0c814bf9cb9677976bd4")
+  
+  
+#### [PostgreSQL 解决方案集合](../201706/20170601_02.md "40cff096e9ed7122c512b35d8561d9c8")
+  
+  
+#### [德哥 / digoal's github - 公益是一辈子的事.](https://github.com/digoal/blog/blob/master/README.md "22709685feb7cab07d30f30387f0a9ae")
+  
+  
+![digoal's wechat](../pic/digoal_weixin.jpg "f7ad92eeba24523fd47a6e1a0e691b59")
+  
diff --git a/202307/readme.md b/202307/readme.md
@@ -2,6 +2,9 @@
   
 ### 文章列表  
 ----  
+##### 20230727_01.md   [《德说-第250期, 抖音运营:大V合力现象》](20230727_01.md)  
+##### 20230726_02.md   [《标准知识库 + PostgreSQL或PolarDB + 向量插件 + openai(或其他大模型) 提升通用ai机器人在专业领域的精准度》](20230726_02.md)  
+##### 20230726_01.md   [《PostgreSQL 17 preview - 优化wal insert lock, 提升高并发写入吞吐性能》](20230726_01.md)  
 ##### 20230713_02.md   [《PostgreSQL 17 preview - 增加index vacuum 进度打印》](20230713_02.md)  
 ##### 20230713_01.md   [《PostgreSQL 17 preview - Add new parallel message type to progress reporting.》](20230713_01.md)  
 ##### 20230710_03.md   [《使用Dockerfile+docker build制作PolarDB | PostgreSQL 开源docker镜像, 集成大量插件方便学习, 并推送到阿里云镜像服务》](20230710_03.md)  
diff --git a/202308/20230805_01.md b/202308/20230805_01.md
@@ -0,0 +1,197 @@
+## 高并发队列处理业务的数据库性能优化 - IO扫描|CPU计算浪费 , 锁冲突 , 垃圾索引扫描浪费   
+                                                                                                                                  
+### 作者                                                                                                            
+digoal                                                                                                            
+                                                                                                            
+### 日期                                                                                                            
+2023-08-05                                                                                                        
+                                                                                                  
+### 标签                                                                                                            
+PostgreSQL , PolarDB , 队列 , 锁 , hash mod , advisory lock , cte , update limit , delete limit , vacuum , index , IO浪费 , CPU浪费             
+                                                                                                            
+----                                                                                                            
+                                                                                                            
+## 背景   
+在电商业务中可能涉及这样的场景, 由于有上下游关系的存在, 1、用户下单后, 上下游厂商会在自己系统中生成一笔订单记录并反馈给对方, 2、在收到反馈订单后, 本地会先缓存反馈的订单记录队列, 3、然后后台再从缓存取出订单并进行处理.  
+  
+这个过程的核心流程: 高速写入队列、从队列按先后顺序提取并高速处理、从队列清除已处理订单记录.    
+  
+如果是高并发的处理, 因为大家都按一个顺序获取, 容易产生热点, 可能遇到取出队列遇到锁冲突瓶颈、IO扫描浪费、CPU计算浪费的瓶颈. 以及在清除已处理订单后, 索引版本未及时清理导致的回表版本判断带来的IO浪费和CPU运算浪费瓶颈等.  
+- 文末的《打车与宇宙大爆炸的关系》一文有相似问题和优化方法, 思路类似.  
+  
+本文将给出“队列处理业务的数据库性能优化”优化方法和demo演示. 性能提升10到20倍.    
+  
+想体验一下的同学, 也可以通过云起实验启动环境来进行体验, 这个实验室是永久免费的.     
+- https://developer.aliyun.com/adc/scenario/exp/f55dbfac77c0467a9d3cd95ff6697a31    
+- 参考:    
+    - https://github.com/digoal/blog/blob/master/202307/20230710_03.md    
+  
+## DEMO  
+1、测试环境  
+```  
+MacBook Pro (15-inch, 2018)  
+2.2 GHz 六核Intel Core i7  
+32 GB 2400 MHz DDR4  
+  
+PostgreSQL 15.1   
+```  
+  
+因为是macos, 可能需要设置一下ulimit.  
+```  
+ulimit -n 1000000  
+```  
+  
+2、上游写入订单处理队列表  
+  
+```  
+create table t_order_q (  
+  id serial8 primary key,   -- 自增主键  
+  order_id uuid unique,     -- 上游传递过来的订单号  
+  cts timestamp not null    -- 上游传递过来的订单创建时间   
+);   
+  
+-- create index on t_order_q (cts); -- 如果按订单时间先后取出处理, 则需要创建时间字段索引.  也可以按自增主键顺序处理, 则不需要时间索引.   
+```  
+  
+3、取出并处理后的订单状态表   
+  
+```  
+create table t_order_u (  
+  id serial8 primary key,   -- 自增主键  
+  order_id uuid unique,     -- 上游传递过来的订单号  
+  cts timestamp not null,    -- 上游传递过来的订单创建时间   
+  uts timestamp not null,   -- 订单处理时间  
+  status int not null       -- 订单处理状态标记   
+);    
+```  
+  
+4、写入1000万条订单队列  
+  
+```  
+insert into t_order_q (order_id, cts) select gen_random_uuid(), clock_timestamp() from generate_series(1,1000000);  
+```  
+  
+5、写pgbench压测脚本, 从队列取出, 并且使用ad lock对队列ID加事务锁, 判断是否正在处理, 事务结束自动释放ad lock.  ad lock也经常被用于秒杀场景泄压.   
+  
+```  
+vi t.sql  
+  
+with tmp as   
+  (delete from t_order_q where ctid = (select ctid from t_order_q where pg_try_advisory_xact_lock(id) order by id limit 1) returning order_id, cts)  
+insert into t_order_u (order_id,cts,uts,status) select tmp.order_id, tmp.cts, now(), 1 from tmp;   
+```  
+  
+6、压测256个并发消耗队列, 平均每个连接处理39062个事务.  
+  
+```  
+select 1000000/256.0;  
+3906.2500000000000  
+```  
+  
+7、压测结果  
+  
+```  
+pgbench -M prepared -f ./t.sql -n -r -P 1 -c 256 -j 2 -t 3906  
+```  
+  
+```  
+transaction type: ./t.sql  
+scaling factor: 1  
+query mode: prepared  
+number of clients: 256  
+number of threads: 2  
+maximum number of tries: 1  
+number of transactions per client: 3906  
+number of transactions actually processed: 999936/999936  
+number of failed transactions: 0 (0.000%)  
+latency average = 8.111 ms  
+latency stddev = 5.376 ms  
+initial connection time = 429.698 ms  
+tps = 25379.081141 (without initial connection time)  
+statement latencies in milliseconds and failures:  
+         8.114           0  with tmp as   
+```  
+  
+### 未优化前的性能如何?  
+  
+1、写pgbench压测脚本, 从队列取出, 并且使用ad lock对队列ID加事务锁, 判断是否正在处理, 事务结束自动释放ad lock.  ad lock也经常被用于秒杀场景泄压.   
+  
+```  
+vi t1.sql  
+  
+begin;  
+select id as vid from t_order_q order by id for update limit 1 \gset  
+with tmp as   
+  (delete from t_order_q where id = :vid returning order_id, cts)  
+insert into t_order_u (order_id,cts,uts,status) select tmp.order_id, tmp.cts, now(), 1 from tmp;   
+end;  
+```  
+  
+2、压测结果  
+  
+```  
+pgbench -M prepared -f ./t1.sql -n -r -P 1 -c 256 -j 2 -t 3906  
+```  
+  
+```  
+TPS 约 1200.  
+```  
+  
+增加了skip locked后, TPS也只能到2500左右.     
+  
+### 还有什么可以提升性能的点?  
+1、减少浪费的IO和cpu计算:   
+- 在并发的情况下, order by id limit 1需要扫描若干行, 而不是1行, 因为可能有些ID已经被ad lock touch了, 浪费的pg_try_advisory_xact_lock() cpu ops计算次数约等于  n + n-1 + n-2 + ... +  n-n, 浪费的IO约等于N.   
+  
+优化方法:  
+- 固定N个链接, 按ID hash mod 取不同的数据分片, 从而减少浪费的IO和cpu计算.   
+- 或者将队列表拆分成几个分区表, 入库的时候 按id hash mode, 每个分区分配给不同的进程取数, 从而减少冲突和浪费的扫描提高并发.   
+  
+2、提高index vacuum的频率, 减少因没有index version导致的垃圾数据判断带来的cpu和回表的IO浪费. 提升autovacuum_work_mem, 容纳下所有dead tuple ctid避免多次扫描index.   
+  
+优化方法:  
+- 配置参数即可.  
+  
+3、一次取出多条, 批量处理.    
+  
+更多请参考末尾文章.    
+  
+  
+## 参考  
+  
+[《DB吐槽大会,第69期 - PG 不支持update | delete limit语法》](../202110/20211002_03.md)    
+  
+[《在PostgreSQL中实现update | delete limit - CTID扫描实践  (高效阅后即焚)》](../201608/20160827_01.md)      
+  
+[《PostgreSQL skip locked与CTE妙用 - 解决并发批量更新锁冲突带来的锁等待，提高处理吞吐》](../201803/20180314_03.md)      
+  
+[《PostgreSQL SELECT 的高级用法(CTE, LATERAL, ORDINALITY, WINDOW, SKIP LOCKED, DISTINCT, GROUPING SETS, ...) - 珍藏级》](../201802/20180226_05.md)   
+  
+[《PostgreSQL 秒杀4种方法 - 增加 批量流式加减库存 方法》](../201801/20180105_03.md)    
+  
+[《HTAP数据库 PostgreSQL 场景与性能测试之 30 - (OLTP) 秒杀 - 高并发单点更新》](../201711/20171107_31.md)    
+  
+[《聊一聊双十一背后的技术 - 不一样的秒杀技术, 裸秒》](../201611/20161117_01.md)    
+  
+[《PostgreSQL 垃圾回收参数优化之 - maintenance_work_mem , autovacuum_work_mem》](../201902/20190226_01.md)    
+  
+[《[直播]为什么打车和宇宙大爆炸有关?》](../202009/20200926_02.md)    
+  
+  
+#### [期望 PostgreSQL|开源PolarDB 增加什么功能?](https://github.com/digoal/blog/issues/76 "269ac3d1c492e938c0191101c7238216")
+  
+  
+#### [PolarDB 云原生分布式开源数据库](https://github.com/ApsaraDB "57258f76c37864c6e6d23383d05714ea")
+  
+  
+#### [PolarDB 学习图谱: 训练营、培训认证、在线互动实验、解决方案、内核开发公开课、生态合作、写心得拿奖品](https://www.aliyun.com/database/openpolardb/activity "8642f60e04ed0c814bf9cb9677976bd4")
+  
+  
+#### [PostgreSQL 解决方案集合](../201706/20170601_02.md "40cff096e9ed7122c512b35d8561d9c8")
+  
+  
+#### [德哥 / digoal's github - 公益是一辈子的事.](https://github.com/digoal/blog/blob/master/README.md "22709685feb7cab07d30f30387f0a9ae")
+  
+  
+![digoal's wechat](../pic/digoal_weixin.jpg "f7ad92eeba24523fd47a6e1a0e691b59")
+  
diff --git a/202308/20230805_02.md b/202308/20230805_02.md
@@ -0,0 +1,54 @@
+## 德说-第251期, 产业升级带来的机会    
+                                                                  
+### 作者                                            
+digoal                                            
+                                            
+### 日期                                            
+2023-08-05                                       
+                                            
+### 标签                                            
+PostgreSQL , PolarDB , 外贸 , 实体 , 虚拟 , 服务 , 产业链上游 , 规模化            
+                                            
+----                                            
+                                            
+## 背景    
+1、什么是产业升级?   
+- 根据 比较优势, 供需连. 我们对外输出什么?   
+    - 原来的情况可能是: 劳动力低廉, 地大, 物流便利, 互联网便利, 电商便利. 通过招商, 吸引外资建厂, 使用相对低廉的劳动力, 对外输出加工好的产品. 但是品牌是别人的, 别人赚大头.   
+- 慢慢地, 我们发现利润还可以做得更高, 为什么还要继续干加工厂呢:   
+    - 例如1 从世界工厂变成原创工厂, 赚利润大头.   
+    - 例如2 文化输出(可以更大规模复制的数字化产品: 电影、软件、SAAS、云资源之上的附加产品(例如SAAS、AI) ...), 更大幅度提升性价比   
+    - 例如3 芯片, AI, ... 产业链核心部件, 才有溢价能力.   
+  
+2、产业升级的目的是什么?   
+- 提升利润  
+  
+3、产业升级带来的机会是什么?   
+- 核心技术行业, 芯片、纳米材料、 ...   
+- 文化行业(可规模化复制的行业), 例如 电影, 游戏, AI+医疗 ...   
+- 数字服务行业(可规模化复制的行业), 例如 软件、SAAS、云资源之上的附加产品(例如SAAS、AI)  
+  
+以果决行, 你应该做什么?    
+  
+4、参考:   
+- [《中国经济2021: 外贸出口: 由实转虚 , 双轮驱动 , 产业链上游》](../202104/20210403_04.md)    
+  
+  
+  
+#### [期望 PostgreSQL|开源PolarDB 增加什么功能?](https://github.com/digoal/blog/issues/76 "269ac3d1c492e938c0191101c7238216")
+  
+  
+#### [PolarDB 云原生分布式开源数据库](https://github.com/ApsaraDB "57258f76c37864c6e6d23383d05714ea")
+  
+  
+#### [PolarDB 学习图谱: 训练营、培训认证、在线互动实验、解决方案、内核开发公开课、生态合作、写心得拿奖品](https://www.aliyun.com/database/openpolardb/activity "8642f60e04ed0c814bf9cb9677976bd4")
+  
+  
+#### [PostgreSQL 解决方案集合](../201706/20170601_02.md "40cff096e9ed7122c512b35d8561d9c8")
+  
+  
+#### [德哥 / digoal's github - 公益是一辈子的事.](https://github.com/digoal/blog/blob/master/README.md "22709685feb7cab07d30f30387f0a9ae")
+  
+  
+![digoal's wechat](../pic/digoal_weixin.jpg "f7ad92eeba24523fd47a6e1a0e691b59")
+  
diff --git a/202308/readme.md b/202308/readme.md
@@ -0,0 +1,6 @@
+<a rel="nofollow" href="http://info.flagcounter.com/h9V1"  ><img src="http://s03.flagcounter.com/count/h9V1/bg_FFFFFF/txt_000000/border_CCCCCC/columns_2/maxflags_12/viewers_0/labels_0/pageviews_0/flags_0/"  alt="Flag Counter"  border="0"  ></a>  
+  
+### 文章列表  
+----  
+##### 20230805_02.md   [《德说-第251期, 产业升级带来的机会》](20230805_02.md)  
+##### 20230805_01.md   [《高并发队列处理业务的数据库性能优化 - IO扫描|CPU计算浪费 , 锁冲突 , 垃圾索引扫描浪费》](20230805_01.md)  
diff --git a/README.md b/README.md