校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > MySQL 全文檢索的使用示例

MySQL 全文檢索的使用示例

熱門標簽:400電話辦理服務價格最實惠 呂梁外呼系統 催天下外呼系統 html地圖標注并導航 大豐地圖標注app 南太平洋地圖標注 武漢電銷機器人電話 北京金倫外呼系統 400電話變更申請

1. 環境準備

MySQL 5.7.6之前,全文索引只支持英文全文索引,不支持中文全文索引,需要利用分詞器把中文段落預處理拆分成單詞,然后存入數據庫。 MySQL 5.7.6開始,MySQL內置了ngram全文解析器,用來支持中文、日文、韓文分詞。 本文使用的MySQL 版本是5.7.22,InnoDB數據庫引擎。

所以這里需要MySQL的版本大于5.7.6

-- 查看mysql的版本
mysql> select version();
+-----------+
| version() |
+-----------+
| 5.7.33    |
+-----------+
1 row in set (0.02 sec)

在 mysql 配置文件中添加分詞以及最小詞語長度 (如果已經配置可以忽略)

ft_min_word_len 最小字符長度默認為 4,在英文條件下確實比較合理中文情況下需要修改;

ngram_token_size 分詞的最小長度 舉個例子 不同長度對 你好世界 的分詞

n=1: '你', '好', '世', '界' 
n=2: '你好', '好世', '世界' 
n=3: '你好世', '好世界' 
n=4: '你好世界'
# /etc/mysql/mysql.conf.d/mysqld.cnf

ft_min_word_len = 2
ngram_token_size = 2


# 如果沒有則新增配置
echo 'ft_min_word_len = 2
ngram_token_size = 2' >> mysqld.cnf

# 重啟服務
/etc/init.d/mysql restart

-- 查看配置
mysql> 
SHOW VARIABLES LIKE 'ft_min_word_len';
SHOW VARIABLES LIKE 'ngram_token_size';
+-----------------+-------+
| Variable_name   | Value |
+-----------------+-------+
| ft_min_word_len | 2     |
+-----------------+-------+
1 row in set (0.02 sec)
 
+------------------+-------+
| Variable_name    | Value |
+------------------+-------+
| ngram_token_size | 2     |
+------------------+-------+
1 row in set (0.03 sec)


2. 數據準備

-- mysql 于全文檢索的demo

mysql> CREATE TABLE `articles` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
  `title` varchar(50) DEFAULT NULL COMMENT '主題',
  `content` longtext NOT NULL COMMENT '內容',
  PRIMARY KEY (`id`),
  FULLTEXT KEY `title_content_index` (`content`,`title`) /*!50100 WITH PARSER `ngram` */ 
) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8;
Query OK, 0 rows affected (0.20 sec)
 

mysql> INSERT INTO articles (`title`, `content`) VALUES
        ('如果','今生今世 永不再將你想起 
除了
除了在有些個
因落淚而濕潤的夜里 如果
如果你愿意'),
        ('愛情','有一天路標遷了希望你能從容
有一天橋墩斷了希望你能渡越
有一天棟梁倒了希望你能堅強
有一天期待蔫了希望你能理解'),
        ('遠和近','你 一會看我
一會看云
我覺得
你看我時很遠
你看云時很近'),
        ('斷章','你站在橋上看風景,
看風景人在樓上看你。
明月裝飾了你的窗子,
你裝飾了別人的夢。'),
        ('獨語','我向你傾吐思念
你如石像
沉默不應
如果沉默是你的悲抑
你知道這悲抑
最傷我心');

Query OK, 5 rows affected (0.08 sec)
Records: 5  Duplicates: 0  Warnings: 0
 
mysql> SELECT * from articles where match(content, title) against('風景' in  NATURAL LANGUAGE MODE) LIMIT 10;
+----+--------+--------------------------------------------------------------------------------------------------------------------------+
| id | title  | content                                                                                                                  |
+----+--------+--------------------------------------------------------------------------------------------------------------------------+
| 10 | 斷章 |  你站在橋上看風景,
看風景人在樓上看你。
明月裝飾了你的窗子,
你裝飾了別人的夢。 |
+----+--------+--------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.02 sec)

3. 開始表演

  • 自然語言模式(NATURAL LANGUAGE MODE)

自然語言模式是MySQL 默認的全文檢索模式。自然語言模式不能使用操作符,不能指定關鍵詞必須出現或者必須不能出現等復雜查詢。

  • 布隆模式(BOOLEAN MODE)

BOOLEAN模式可以使用操作符,可以支持指定關鍵詞必須出現或者必須不能出現或者關鍵詞的權重高還是低等復雜查詢。

  • 查詢擴展(QUERY EXPANSION)

查詢的結果不僅匹配出結果同時可以聯想出其他你需要的結果。(類似關聯查詢,但是官網推薦僅支持短語查詢 否則會出現很多臟數據)

-- 自然語言模式(NATURAL LANGUAGE MODE)查詢并得到評分

mysql> SELECT id, title, MATCH ( content, title ) against ( '風景' IN NATURAL LANGUAGE MODE ) AS score  FROM articles;
+----+-----------+--------------------+
| id | title     | score              |
+----+-----------+--------------------+
|  7 | 如果    |                  0 |
|  8 | 愛情    |                  0 |
|  9 | 遠和近 |                  0 |
| 10 | 斷章    | 0.9771181344985962 |
| 11 | 獨語    |                  0 |
+----+-----------+--------------------+
5 rows in set (0.02 sec)

-- 布隆模式(BOOLEAN MODE) 可以組合查詢

mysql> SELECT id, title  FROM articles where MATCH ( content, title ) against ( '+風景 -愛情' IN BOOLEAN MODE );
+----+--------+
| id | title  |
+----+--------+
| 10 | 斷章 |
+----+--------+
1 row in set (0.01 sec)

-- 查詢擴展(QUERY EXPANSION) 可以聯想出其他結果 
mysql> SELECT id, title  FROM articles where MATCH ( content, title ) against ( '風景' WITH QUERY EXPANSION );
+----+--------+
| id | title  |
+----+--------+
| 10 | 斷章 |
| 11 | 獨語 |
+----+--------+
2 rows in set (0.02 sec)
 

4. 分詞引擎

目前官網 MeCab Full-Text Parser 有支持日語的分詞插件(可以更好的理解語義)

內置的 full-text parser 因為英文中單詞的邊界默認是空格,所以在處理英文文本時可以簡單的使用空格作為分隔符。但是在處理中文時需要理解語義的基礎上進行有效的分詞,所以在處理中文、日文、韓文MySQL 提供了 ngram full-text (本文的配置就是 基于ngram的中文分詞)

總結

優點

  • 對比 like 查詢效率有提升(具體提升的測試沒有做)
  • 全文搜索可以同時對多個字段做索引,like只能對單一字段搜索

對于中文的分詞可能需要在理解語義的基礎上才能有效的分詞;比如上文中的 你好世界(hello world)對于英文按空格切分就可以,中文則需要理解語義的基礎才能分成 你好/世界。

這里分享一下python中jieba分詞,有助于理解中文分詞的魅力

結巴分詞利用一個中文詞庫,通過詞庫計算漢字之間構成詞語的關聯概率,所以通過計算漢字之間的概率,就可以形成分詞的結果。

In [1]: import jieba

In [2]: jieba.lcut("你好世界")
Building prefix dict from the default dictionary ...
Dumping model to file cache /var/folders/st/b16fyn3s57x_5vszjl599njw0000gn/T/jieba.cache
Loading model cost 0.937 seconds.
Prefix dict has been built successfully.
Out[2]: ['你好', '世界']

In [3]: jieba.lcut("hello world")
Out[3]: ['hello', ' ', 'world']

對于一般的項目mysql的全文索引可以解決80%的需求,它可以較為完美的支持中文的檢索、自動分詞、結果排序、組合查詢等功能;但性能應該是瓶頸,Elastissearch可以友好的實現全文檢索。

全文索引不能達到like的效果,連著的語句會因為分詞形成多個詞語。

參考資料

Mysql fulltext

以上就是MySQL 全文檢索的使用示例的詳細內容,更多關于MySQL 全文檢索的使用的資料請關注腳本之家其它相關文章!

您可能感興趣的文章:
  • Mysql實現全文檢索、關鍵詞跑分的方法實例
  • PHP+MySQL+sphinx+scws實現全文檢索功能詳解
  • mysql 全文檢索中文解決方法及實例代碼
  • 深度解析MySQL 5.7之中文全文檢索

標簽:南充 徐州 西寧 無錫 自貢 龍巖 麗水 迪慶

巨人網絡通訊聲明:本文標題《MySQL 全文檢索的使用示例》,本文關鍵詞  MySQL,全文檢索,的,使用,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《MySQL 全文檢索的使用示例》相關的同類信息!
  • 本頁收集關于MySQL 全文檢索的使用示例的相關信息資訊供網民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    麻豆成人av在线| 亚洲精品国产视频| 久久疯狂做爰流白浆xx| 国产福利电影一区二区三区| 一区在线观看免费| 亚洲欧美一区二区不卡| 亚洲欧美日韩一区二区| 亚洲精品欧美综合四区| 悠悠色在线精品| 亚洲国产cao| 国产精品一区二区不卡| 不卡一区二区在线| 欧美日韩精品欧美日韩精品一综合| 精久久久久久久久久久| 国产成人综合在线观看| 91香蕉国产在线观看软件| 在线观看日韩毛片| 日本精品一区二区三区四区的功能| 中文字幕在线播放不卡一区| 亚洲激情网站免费观看| 麻豆精品在线视频| 欧美在线视频你懂得| 久久免费视频色| 亚洲va天堂va国产va久| 国产剧情一区二区三区| 欧美日韩成人在线| 中文字幕日韩av资源站| 精品一区二区三区视频 | 91福利视频网站| 制服丝袜一区二区三区| 亚洲国产精品激情在线观看| 久久99热99| 91女厕偷拍女厕偷拍高清| 欧美三级韩国三级日本一级| 国产日韩欧美综合在线| 午夜激情综合网| 欧美性生活影院| 亚洲精品伦理在线| 91最新地址在线播放| 欧美电影免费观看高清完整版在| 国产成人在线色| 国产亚洲一区二区在线观看| 免费日本视频一区| 日韩欧美一二区| 精品一二三四在线| 精品动漫一区二区三区在线观看| 婷婷亚洲久悠悠色悠在线播放| 欧美伊人精品成人久久综合97| 中文字幕一区不卡| 欧洲精品视频在线观看| 亚洲国产一区在线观看| 欧美日韩国产bt| 另类的小说在线视频另类成人小视频在线| 欧美唯美清纯偷拍| 亚洲123区在线观看| 欧美一级在线视频| 成人亚洲精品久久久久软件| 亚洲欧美激情插 | 制服丝袜国产精品| 黄页视频在线91| 亚洲精品久久7777| 欧美大片在线观看| 色一情一伦一子一伦一区| 午夜不卡在线视频| 一区二区不卡在线视频 午夜欧美不卡在| 国产精品免费丝袜| 国产高清在线精品| 亚洲成人免费视频| 国产精品理论片在线观看| 欧美精品一卡二卡| 91视频免费观看| 懂色av一区二区三区免费观看| 亚洲天天做日日做天天谢日日欢| 欧美一区二区在线看| 91蝌蚪porny成人天涯| 国内精品伊人久久久久av一坑| 国产精品久久久久久久久果冻传媒 | 亚洲免费在线视频一区 二区| 欧美日韩中字一区| 在线亚洲一区观看| 91碰在线视频| 色婷婷狠狠综合| 成人免费精品视频| av中文一区二区三区| 激情小说亚洲一区| 国产一区二区免费视频| 国精产品一区一区三区mba桃花| 日本在线不卡视频| 亚洲成人高清在线| 日韩一区二区视频| 日韩欧美久久久| 精品99999| 18涩涩午夜精品.www| 亚洲另类春色校园小说| 一区二区三区不卡视频| 亚洲一二三专区| 蜜桃免费网站一区二区三区| 亚洲免费av在线| 国产片一区二区| 亚洲乱码日产精品bd| 亚洲国产中文字幕| 国产一区二区免费在线| 97精品电影院| 日韩精品在线看片z| 欧美国产成人精品| 亚洲一线二线三线久久久| 免费的国产精品| av中文字幕一区| 欧美www视频| 一区二区三区 在线观看视频| 性久久久久久久久久久久| 高清在线观看日韩| 日韩欧美黄色影院| 亚洲综合视频网| 成人免费观看男女羞羞视频| 欧美日韩一本到| 欧美精彩视频一区二区三区| 一区二区三区在线免费观看| 国模少妇一区二区三区| 欧美日韩精品一区二区三区蜜桃| 国产欧美精品在线观看| 又紧又大又爽精品一区二区| 成人免费在线视频观看| 美腿丝袜亚洲色图| 欧美情侣在线播放| 国产精品毛片大码女人| 中文字幕一区二区三| 99久久综合精品| 国产欧美一区二区精品性色超碰| 亚洲一区视频在线| 在线免费观看视频一区| 国产精品视频线看| 99久久精品免费看国产 | 日韩一区二区在线免费观看| 亚洲三级在线看| 91老师片黄在线观看| 亚洲美女在线国产| 欧美视频一二三区| 日本aⅴ精品一区二区三区| 亚洲成人免费视| 国产精品日韩成人| 不卡一区二区在线| 亚洲欧美日韩久久| 色综合久久综合网欧美综合网| 亚洲色图一区二区| 欧美无砖专区一中文字| 美女mm1313爽爽久久久蜜臀| 日韩免费观看高清完整版| 蜜臀av在线播放一区二区三区| 日韩精品一区二| av在线一区二区| 日韩中文字幕亚洲一区二区va在线| 91精品国产丝袜白色高跟鞋| 久久99日本精品| 中文字幕亚洲不卡| 亚洲成年人网站在线观看| 欧美日韩一卡二卡三卡| 精品一区二区在线观看| 国产精品免费视频观看| 欧美另类videos死尸| 国产福利精品导航| 日本在线观看不卡视频| 中文字幕亚洲电影| 欧美精彩视频一区二区三区| 欧美精品自拍偷拍动漫精品| 99re热视频这里只精品| 国产激情一区二区三区四区 | 激情图片小说一区| 国产精品高潮呻吟| 日韩激情中文字幕| 粉嫩aⅴ一区二区三区四区五区| 亚洲综合色区另类av| 久久精品欧美一区二区三区不卡| 欧美老女人在线| 欧美在线免费视屏| 在线精品亚洲一区二区不卡| 不卡在线观看av| 成人99免费视频| 成人免费毛片嘿嘿连载视频| 国产剧情一区二区三区| 久久99国产精品久久99果冻传媒| 免费成人深夜小野草| 日本不卡123| 久久99国产精品免费| 狠狠色丁香久久婷婷综合丁香| 九九**精品视频免费播放| 免费成人在线观看视频| 亚洲第一激情av| 美女国产一区二区三区| 欧美aaaaaa午夜精品| 久久精品国产一区二区三区免费看 | 精品国产91亚洲一区二区三区婷婷| 欧美一区二区三区成人| 国产三级精品三级在线专区| 欧美国产日韩亚洲一区| 亚洲一区二区三区四区在线免费观看| 亚洲午夜久久久久久久久电影院| 日欧美一区二区| 不卡在线视频中文字幕| 日韩欧美二区三区|