@@ -4,10 +4,10 @@ PostgreSQL凭借良好的扩展性,不仅仅是一个数据库,更是一个
44本文给大家分享的是PostgreSQL在生命科学领域的应用案例 - 基因工程。
55
66通常的思维可能是这样的,把数据存在数据库,需要运算的时候,再把数据取出进行运算(例如配对),需要花费非常多的网络传输时间。
7- ![ 1] ( 1 .png)
7+ ![ 1] ( 20160621_1_1 .png)
88
99PostgreSQL提供了基因工程相关的数据类型,操作类型,索引。满足基因工程业务的需求。 你甚至可以利用MPP来解决更大数据量的问题(例如压缩后百TB级别)。
10- ![ 2] ( 2 .png)
10+ ![ 2] ( 20160621_1_2 .png)
1111
1212并行计算请参考
1313https://yq.aliyun.com/articles/44655
@@ -17,43 +17,43 @@ https://wiki.postgresql.org/wiki/PGStrom
1717## 背景知识
1818染色体DNA的数字化,由4种最基本的腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)与鸟嘌呤的(G)排列组成。
1919染色体长度从几千到几十亿不等。
20- ![ 1] ( 3 .png)
20+ ![ 1] ( 20160621_1_3 .png)
2121
2222由于DNA过长,不利于分析,所以有了RNA,RNA是一些更短的ATCG基本排列,通常是50到1万的长度。
2323每个DNA由一些RNA排列组成(其中可能会有一些重复)。
24- ![ 2] ( 4 .png)
24+ ![ 2] ( 20160621_1_4 .png)
2525
2626基因测序,目的是找出两组DNA的相似和不同的地方。
27- ![ 3] ( 5 .png)
27+ ![ 3] ( 20160621_1_5 .png)
2828
2929DNA的压缩,前面讲了DNA实际上是由ATCG排列而成,长度从几千到几十亿不等。
3030所以压缩存储非常重要,PostBIS提供了很好的压缩算法解决压缩效率和解压效率的问题。
31- ![ 4] ( https://oss-cn-hangzhou.aliyuncs.com/yqfiles/122a82178812eb763f03d5ef95d5d808e19b261a .png)
31+ ![ 4] ( 20160621_1_6 .png)
3232
3333PostBIS提供的数据类型
34- ![ 5] ( https://oss-cn-hangzhou.aliyuncs.com/yqfiles/7401459a357c648b812a03bbaa362c769b652fd2 .png)
34+ ![ 5] ( 20160621_1_7 .png)
3535
3636几种压缩效率对比
37- ![ 6] ( https://oss-cn-hangzhou.aliyuncs.com/yqfiles/b87a93157122920ae5f79920434713773fd8f6a1 .png)
37+ ![ 6] ( 20160621_1_8 .png)
3838
3939DNA编码效率对比
40- ![ 7] ( https://oss-cn-hangzhou.aliyuncs.com/yqfiles/a4d90158980b438f8823874407c4a155490a21be .png)
40+ ![ 7] ( 20160621_1_9 .png)
4141
4242对比常用的压缩算法和PostBIS压缩算法的压缩比
43- ![ 8] ( https://oss-cn-hangzhou.aliyuncs.com/yqfiles/ef0805406ab8626e8089c6abd0b45b7b97d77d13 .png)
43+ ![ 8] ( 20160621_1_10 .png)
4444
4545对比常用的压缩算法和PostBIS压缩算法的压缩效率
46- ![ 9] ( https://oss-cn-hangzhou.aliyuncs.com/yqfiles/23ed5c8df9c4534c4c4f9ee576c3ec442b0801e5 .png)
46+ ![ 9] ( 20160621_1_11 .png)
4747
4848基因数据存储到数据库后,能干什么?
49- ![ 10] ( https://oss-cn-hangzhou.aliyuncs.com/yqfiles/213afaea0d4b37679aadec2c94166d58360a2d45 .png)
49+ ![ 10] ( 20160621_1_12 .png)
5050
5151PostBIS 基因抽取的效率和基因长度无关,是O(1)的.
52- ![ 11] ( https://oss-cn-hangzhou.aliyuncs.com/yqfiles/235f5af66488bdf79b4e1240e172efe29113e2a8 .png)
52+ ![ 11] ( 20160621_1_13 .png)
5353
5454## PostgreSQL 如何支撑基因工程应用
5555PostBIS支持的数据类型
56- ![ 1] ( https://oss-cn-hangzhou.aliyuncs.com/yqfiles/0280bbc200f07ffeb160d898d1d1650a9310fec1 .png)
56+ ![ 1] ( 20160621_1_14 .png)
5757
5858使用例子
5959```
@@ -115,9 +115,9 @@ GROUP BY id, matching_cds;
115115
116116## 应用举例
117117纯笔者YY,也许将来有临床经验了,可以包装成商业化的产品。
118- ![ 1] ( https://oss-cn-hangzhou.aliyuncs.com/yqfiles/2aaa0580210e5e1df87f3812eb9d869e58418b86 .png)
119- ![ 2] ( https://oss-cn-hangzhou.aliyuncs.com/yqfiles/56cadc587df95d8dc02ad6d4406565e4d0ade5e4 .png)
120- ![ 3] ( https://oss-cn-hangzhou.aliyuncs.com/yqfiles/4a44df352ca07c049f1ca0eb2926037ec9e5f400 .png)
118+ ![ 1] ( 20160621_1_15 .png)
119+ ![ 2] ( 20160621_1_16 .png)
120+ ![ 3] ( 20160621_1_17 .png)
121121
122122互联网抓来的基因相关的例子
123123
0 commit comments