校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > pgsql查詢優化之模糊查詢實例詳解

pgsql查詢優化之模糊查詢實例詳解

熱門標簽:辦公外呼電話系統 美容工作室地圖標注 重慶自動外呼系統定制 打電話智能電銷機器人授權 合肥公司外呼系統運營商 外呼調研系統 地圖標注和圖片名稱的區別 漯河外呼電話系統 海豐有多少商家沒有地圖標注

前言

一直以來,對于搜索時模糊匹配的優化一直是個讓人頭疼的問題,好在強大pgsql提供了優化方案,下面就來簡單談一談如何通過索引來優化模糊匹配

案例

我們有一張千萬級數據的檢查報告表,需要通過檢查報告來模糊搜索某個條件,我們先創建如下索引:

CREATE INDEX lab_report_report_name_index ON lab_report USING btree (report_name);

然后搜個簡單的模糊匹配條件如 LIKE "血常規%",可以發現查詢計劃生成如下,索引并沒有被使用上,這是因為傳統的btree索引并不支持模糊匹配

查閱文檔后發現,pgsql可以在Btree索引上指定操作符:text_pattern_ops、varchar_pattern_ops和bpchar_pattern_ops,它們分別對應字段類型text、varchar和char,官方解釋為“它們與默認操作符類的區別是值的比較是嚴格按照字符進行而不是根據區域相關的排序規則。這使得這些操作符類適合于當一個數據庫沒有使用標準“C”區域時被使用在涉及模式匹配表達式(LIKE或POSIX正則表達式)的查詢中。”, 有些抽象,我們先試試看。創建如下索引并查詢剛才的條件 LIKE"血常規%":(參考pgsql的文檔https://www.postgresql.org/docs/10/indexes-opclass.html)

CREATE INDEX lab_report_report_name_index ON lab.lab_report (report_name varchar_pattern_ops);

發現確實可以走索引掃描 ,執行時間也從213ms優化到125ms,但是,如果搜索LIKE "%血常規%"就又會走全表掃描了! 這里我們引入本篇博客的主角"pg_trgm"和"pg_bigm"。

創建這兩個索引前分別需要引入如下兩個擴展包 :

CREATE EXTENSION pg_trgm;
CREATE EXTENSION pg_bigm;

這兩個索引的區別是:“pg_tigm”為pgsql官方提供的索引,"pg_tigm"為日本開發者提供。下面是詳細的對比:(參考pg_bigm的文檔http://pgbigm.osdn.jp/pg_bigm_en-1-2.html)

Comparison with pg_trgm

Thepg_trgmcontrib module which provides full text search capability using 3-gram (trigram) model is included in PostgreSQL. The pg_bigm was developed based on the pg_trgm. They have the following differences:

Functionalities and Features pg_trgm pg_bigm
Phrase matching method for full text search 3-gram 2-gram
Available index GIN and GiST GIN only
Available text search operators LIKE (~~), ILIKE (~~*), ~, ~* LIKE only
Full text search for non-alphabetic language
(e.g., Japanese)
Not supported (*1) Supported
Full text search with 1-2 characters keyword Slow (*2) Fast
Similarity search Supported Supported (version 1.1 or later)
Maximum indexed column size 238,609,291 Bytes (~228MB) 107,374,180 Bytes (~102MB)

(*1) You can use full text search for non-alphabetic language by commenting out KEEPONLYALNUM macro variable in contrib/pg_trgm/pg_trgm.h and rebuilding pg_trgm module. But pg_bigm provides faster non-alphabetic search than such a modified pg_trgm.

(*2) Because, in this search, only sequential scan or index full scan (not normal index scan) can run.

pg_bigm 1.1 or later can coexist with pg_trgm in the same database, but pg_bigm 1.0 cannot.

如無特殊要求推薦使用"pg_bigm",我們測試一下效果:

可以使用位圖索引掃描,對于本次案例,使用pg_trgm效果同pg_bigm。

以上

本文只是簡單的介紹許多細節并未做深入的分析,歡迎留言指教或者討論

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。

您可能感興趣的文章:
  • Postgresql 存儲過程(plpgsql)兩層for循環的操作
  • pgsql之create user與create role的區別介紹
  • pgsql之pg_stat_replication的使用詳解
  • pgsql 如何刪除仍有活動鏈接的數據庫
  • pgsql的UUID生成函數實例
  • pgsql 如何手動觸發歸檔
  • pgsql 實現分頁查詢方式

標簽:來賓 珠海 株洲 衡陽 烏海 蚌埠 晉城 錦州

巨人網絡通訊聲明:本文標題《pgsql查詢優化之模糊查詢實例詳解》,本文關鍵詞  pgsql,查詢,優化,之,模糊,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《pgsql查詢優化之模糊查詢實例詳解》相關的同類信息!
  • 本頁收集關于pgsql查詢優化之模糊查詢實例詳解的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 绥芬河市| 东安县| 永济市| 永和县| 曲沃县| 沈丘县| 宁阳县| 错那县| 龙海市| 汉阴县| 石阡县| 静乐县| 保定市| 宕昌县| 利辛县| 许昌县| 天峻县| 峨边| 兴业县| 辽阳市| 如皋市| 东阿县| 聂荣县| 阿城市| 沙河市| 财经| 城步| 萨嘎县| 新密市| 仙桃市| 罗田县| 康马县| 巴楚县| 徐州市| 惠州市| 南投市| 大同县| 鹤山市| 恩施市| 澄迈县| 务川|