国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 數據庫 > PostgreSQL > 正文

介紹PostgreSQL中的jsonb數據類型

2020-03-12 23:53:42
字體:
來源:轉載
供稿:網友

這篇文章主要介紹了介紹PostgreSQL中的jsonb數據類型,jsonb是PostgreSQL9.4中開始內置的類型,能夠支持GIN索引,需要的朋友可以參考下

PostgreSQL 9.4 正在加載一項新功能叫jsonb,是一種新型資料,可以儲存支援GIN索引的JSON 資料。換言之,此功能,在即將來臨的更新中最重要的是,如果連這都不重要的話,那就把Postgres 置于文件為本數據庫系統的推薦位置吧。

自從9.2開始,一個整合JSON 資料類型已經存在,帶有一整套功能(例如資料產生和資料解構功能),還有9.3新增的操作者。當使用JSON 資料類型,資料的被存儲成一完全一樣的副本,功能還在此之上運作,還另外需要后臺運作的重新分析。

這心得JSONB 資料類型以已降解的2元格式存儲,所以,插入此資料會比JSON高效,因為后臺不再需要重新分析,因此讓它更快速運行,而且還兼顧GIN 索引。就是因為最后這個原因,我們實際上建議讀者使用jsonb來代替json制作程式(當然你還可以因應需要而使用json)。請記住jsonb使用相同的操作者和功能,讀者們可以看我之前的帖子去令你得到些什么啟發(或者干脆看Postgres的文件)。

現在讓我們看一下JSONB是如何工作的,同時和JSON比較一下。采用的測試數據是860萬的geobase類型數據,大概1.1G大小,包括了城市名,國家代碼(可以在這參見完整列表)等很多字段。首先通過底層復制(raw copy)來把這些數據存儲到數據庫的一個新表里面,之后把這張表通過一組填充因子是100的表轉換成JSON/JSONB,之后來看它們各占多少空間。

 

 
  1. =# COPY geodata FROM '$HOME/Downloads/allCountries.txt'
  2. COPY 8647839 
  3. =# CREATE TABLE geodata_jsonb (data jsonb) with (fillfactor=100); 
  4. CREATE TABLE 
  5. =# CREATE TABLE geodata_json (data json) with (fillfactor=100); 
  6. CREATE TABLE 
  7. =# /timing 
  8. Timing is on
  9. =# INSERT INTO geodata_json SELECT row_to_json(geodata) FROM geodata; 
  10. INSERT 0 8647839 
  11. Time: 287158.457 ms 
  12. =# INSERT INTO geodata_jsonb SELECT row_to_json(geodata)::jsonb FROM geodata; 
  13. INSERT 0 8647839 
  14. Time: 425825.967 ms 

生成JSONB數據花費稍微長一點時間,大小有沒有區別呢?

 

 
  1. =# SELECT pg_size_pretty(pg_relation_size('geodata_json'::regclass)) AS json, 
  2. pg_size_pretty(pg_relation_size('geodata_jsonb'::regclass)) AS jsonb; 
  3. json | jsonb  
  4. ---------+--------- 
  5. 3274 MB | 3816 MB 
  6. (1 row) 

在JSON數據上面做索引從9.3版本開始,比如用操作符(注意 因為它返回文本,所以'->>'被采用;并且根據查詢不同,索引采用不同的關鍵字)

 

 
  1. =# CREATE INDEX geodata_index ON 
  2. geodata_json ((data->>'country_code'), (data->>'asciiname')); 
  3. CREATE INDEX 
  4. =# SELECT pg_size_pretty(pg_relation_size('geodata_index'::regclass)) 
  5. AS json_index; 
  6. json_index  
  7. ------------ 
  8. 310 MB 
  9. (1 row) 
  10. =# SELECT (data->>'population')::int as population, 
  11. data->'latitude' as latitude, 
  12. data->'longitude' as longitude 
  13. FROM geodata_json WHERE data->>'country_code' = 'JP' AND 
  14. data->>'asciiname' = 'Tokyo' AND 
  15. (data->>'population')::int != 0; 
  16. population | latitude | longitude  
  17. ------------+----------+----------- 
  18. 8336599 | 35.6895 | 139.69171 
  19. (1 row) 
  20. =# -- Explain of previous query 
  21. QUERY PLAN  
  22. ------------------------------------------------------------------------------------------------------------------------- 
  23. Bitmap Heap Scan on geodata_json (cost=6.78..865.24 rows=215 width=32) 
  24. Recheck Cond: (((data ->> 'country_code'::text) = 'JP'::text) AND ((data ->> 'asciiname'::text) = 'Tokyo'::text)) 
  25. Filter: (((data ->> 'population'::text))::integer <> 0) 
  26. -> Bitmap Index Scan on geodata_index (cost=0.00..6.72 rows=216 width=0) 
  27. Index Cond: (((data ->> 'country_code'::text) = 'JP'::text) AND ((data ->> 'asciiname'::text) = 'Tokyo'::text)) 
  28. Planning time: 0.172 ms 
  29. (6 rows

在這個例子里,計劃(planner)可以使用bitmap索引掃描,同時使用了之前產生的索引。

現在,JSONB的一個新特點就是檢查包含帶有操作符@>的數據容量,這種數據是可以用GIN來索引的,這種操作符數據也包括了?,?|和?&(為了檢查給定的關鍵字是否存在)。 GIN索引對兩類操作符起作用:

缺省操作符類,之前列出的四個;

jsonb_hash_ops,僅支持@>,但是當搜索數據時性能表現不錯,而且所占磁盤空間較小;

下面是它如何工作:

 

 
  1. =# CREATE INDEX geodata_gin ON geodata_jsonb 
  2. USING GIN (data jsonb_hash_ops); 
  3. CREATE INDEX 
  4. =# SELECT (data->>'population')::int as population, 
  5. data->'latitude' as latitude, 
  6. data->'longitude' as longitude 
  7. FROM geodata_jsonb WHERE data @> '{"country_code": "JP", "asciiname": "Tokyo"}' AND 
  8. (data->>'population')::int != 0; 
  9. population | latitude | longitude  
  10. ------------+----------+----------- 
  11. 8336599 | 35.6895 | 139.69171 
  12. (1 row) 
  13. =# SELECT pg_size_pretty(pg_relation_size('geodata_gin'::regclass)) AS jsonb_gin; 
  14. jsonb_gin 
  15. ----------- 
  16. 1519 MB 
  17. (1 row) 
  18. =# -- EXPLAIN of previous query 
  19. QUERY PLAN  
  20. ------------------------------------------------------------------------------------- 
  21. Bitmap Heap Scan on geodata_jsonb (cost=131.01..31317.76 rows=8605 width=418) 
  22. Recheck Cond: (data @> '{"asciiname": "Tokyo", "country_code": "JP"}'::jsonb) 
  23. Filter: (((data ->> 'population'::text))::integer <> 0) 
  24. -> Bitmap Index Scan on geodata_gin (cost=0.00..128.86 rows=8648 width=0) 
  25. Index Cond: (data @> '{"asciiname": "Tokyo", "country_code": "JP"}'::jsonb) 
  26. Planning time: 0.134 ms 

根據應用的需求,你或許想采用空間消耗低的索引,比如BTree建立在JSON數據上的索引類型;GIN索引有著更多的優點,因為它覆蓋了所有的JSON字段,并且檢查容量;

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 新闻| 阿克陶县| 丰顺县| 区。| 伊川县| 新泰市| 和田市| 旬邑县| 龙门县| 小金县| 合作市| 锡林浩特市| 潜江市| 双桥区| 南丹县| 黔江区| 林西县| 修水县| 浦城县| 海城市| 湘阴县| 鄂托克前旗| 若尔盖县| 阿拉善盟| 绍兴市| 武威市| 密山市| 虞城县| 大新县| 竹溪县| 铜川市| 噶尔县| 娱乐| 健康| 西贡区| 报价| 额尔古纳市| 县级市| 徐汇区| 汝州市| 安福县|