校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁(yè) > 知識(shí)庫(kù) > Mysql實(shí)現(xiàn)簡(jiǎn)易版搜索引擎的示例代碼

Mysql實(shí)現(xiàn)簡(jiǎn)易版搜索引擎的示例代碼

熱門標(biāo)簽:高清地圖標(biāo)注道路 拉卡拉外呼系統(tǒng) 話務(wù)外呼系統(tǒng)怎么樣 外東北地圖標(biāo)注 臨清電話機(jī)器人 大眾點(diǎn)評(píng)星級(jí)酒店地圖標(biāo)注 云南電商智能外呼系統(tǒng)價(jià)格 智能外呼系統(tǒng)復(fù)位 400電話可以辦理嗎

前言

前段時(shí)間,因?yàn)轫?xiàng)目需求,需要根據(jù)關(guān)鍵詞搜索聊天記錄,這不就是一個(gè)搜索引擎的功能嗎?

于是我第一時(shí)間想到的就是 ElasticSearch 分布式搜索引擎,但是由于一些原因,公司的服務(wù)器資源比較緊張,沒(méi)有額外的機(jī)器去部署一套 ElasticSearch 服務(wù),而且上線時(shí)間也比較緊張,數(shù)據(jù)量也不大,然后就想到了 Mysql 的全文索引。

簡(jiǎn)介

其實(shí) Mysql 很早就支持全文索引了,只不過(guò)一直只支持英文的檢索,從5.7.6 版本開(kāi)始,Mysql 就內(nèi)置了 ngram 全文解析器,用來(lái)支持中文、日文、韓文分詞。

Mysql 全文索引采用的是倒排索引的原理,在倒排索引中關(guān)鍵詞是主鍵,每個(gè)關(guān)鍵詞都對(duì)應(yīng)著一系列文件,這些文件中都出現(xiàn)了這個(gè)關(guān)鍵詞。這樣當(dāng)用戶搜索某個(gè)關(guān)鍵詞時(shí),排序程序在倒排索引中定位到這個(gè)關(guān)鍵詞,就可以馬上找出所有包含這個(gè)關(guān)鍵詞的文件。

本文測(cè)試,基于 Mysql 8.0 版本,數(shù)據(jù)庫(kù)引擎采用的是 InnoDB

ngram 全文解析器

ngram 就是一段文字里面連續(xù)的 n 個(gè)字的序列。ngram 全文解析器能夠?qū)ξ谋具M(jìn)行分詞,每個(gè)單詞是連續(xù)的 n 個(gè)字的序列。例如,用 ngram 全文解析器對(duì)“你好靚仔”進(jìn)行分詞:

n=1: '你', '好', '靚', '仔' 
n=2: '你好', '好靚', '靚仔' 
n=3: '你好靚', '好靚仔' 
n=4: '你好靚仔'

MySQL 中使用全局變量 ngram_token_size 來(lái)配置 ngram 中 n 的大小,它的取值范圍是1到10,默認(rèn)值是 2。通常 ngram_token_size 設(shè)置為要查詢的單詞的最小字?jǐn)?shù)。如果需要搜索單字,就要把 ngram_token_size 設(shè)置為 1。在默認(rèn)值是 2 的情況下,搜索單字是得不到任何結(jié)果的。因?yàn)橹形膯卧~最少是兩個(gè)漢字,推薦使用默認(rèn)值 2。

可以通過(guò)以下命令查看 Mysql 默認(rèn)的 ngram_token_size 大小:

show variables like 'ngram_token_size'

有兩種方式可以設(shè)置全局變量 ngram_token_size 的值:

1、啟動(dòng) mysqld 命令時(shí)指定:

mysqld --ngram_token_size=2

2、修改 Mysql 配置文件 my.ini,末尾增加一行參數(shù):

ngram_token_size=2

創(chuàng)建全文索引

1、建表時(shí)創(chuàng)建全文索引

CREATE TABLE `article` (
  `id` bigint NOT NULL,
  `url` varchar(1024) COLLATE utf8mb4_general_ci NOT NULL DEFAULT '',
  `title` varchar(256) COLLATE utf8mb4_general_ci NOT NULL DEFAULT '',
  `source` varchar(32) COLLATE utf8mb4_general_ci DEFAULT '',
  `keywords` varchar(32) COLLATE utf8mb4_general_ci DEFAULT NULL,
  `publish_time` timestamp NULL DEFAULT NULL,
  PRIMARY KEY (`id`),
  FULLTEXT KEY `title_index` (`title`) WITH PARSER `ngram`
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

2、通過(guò) alter table 方式

ALTER TABLE article ADD FULLTEXT INDEX title_index(title) WITH PARSER ngram;

3、通過(guò) create index 方式

CREATE FULLTEXT INDEX title_index ON article (title) WITH PARSER ngram;

檢索方式

1、自然語(yǔ)言檢索(NATURAL LANGUAGE MODE)

自然語(yǔ)言模式是 MySQL 默認(rèn)的全文檢索模式。自然語(yǔ)言模式不能使用操作符,不能指定關(guān)鍵詞必須出現(xiàn)或者必須不能出現(xiàn)等復(fù)雜查詢。

示例

select * from article where MATCH(title) AGAINST ('北京旅游' IN NATURAL LANGUAGE MODE);

// 不指定模式,默認(rèn)使用自然語(yǔ)言模式
select * from article where MATCH(title) AGAINST ('北京旅游');

可以看出,該模式下根據(jù)“北京旅游”搜索,可以搜索出包含“北京”的或者包含“旅游”的內(nèi)容,因?yàn)樗歉鶕?jù)自然語(yǔ)言分成了兩個(gè)關(guān)鍵詞。

上面示例中返回的結(jié)果會(huì)自動(dòng)按照匹配度排序,匹配度高的在前面,匹配度是一個(gè)非負(fù)浮點(diǎn)數(shù)。

示例

// 查看匹配度
select * , MATCH(title) AGAINST ('北京旅游') as score from article where MATCH(title) AGAINST ('北京旅游' IN NATURAL LANGUAGE MODE);

2、布爾檢索(BOOLEAN MODE)

布爾檢索模式可以使用操作符,可以支持指定關(guān)鍵詞必須出現(xiàn)或者必須不能出現(xiàn)或者關(guān)鍵詞的權(quán)重高還是低等復(fù)雜查詢。

示例

// 無(wú)操作符
// 包含“約會(huì)”或“攻略”
select * from article where MATCH(title) AGAINST ('約會(huì) 攻略' IN BOOLEAN MODE);

// 使用操作符
// 必須包含“約會(huì)”,可包含“攻略”
select * from article where MATCH(title) AGAINST ('+約會(huì) 攻略' IN BOOLEAN MODE);

更多操作符示例:

'約會(huì) 攻略' 
無(wú)操作符,表示或,要么包含“約會(huì)”,要么包含“攻略”

'+約會(huì) +攻略'
必須同時(shí)包含兩個(gè)詞

'+約會(huì) 攻略'
必須包含“約會(huì)”,但是如果也包含“攻略”的話,匹配度更高。

'+約會(huì) -攻略'
必須包含“約會(huì)”,同時(shí)不能包含“攻略”。

'+約會(huì) ~攻略'
必須包含“約會(huì)”,但是如果也包含“攻略”的話,匹配度要比不包含“攻略”的記錄低。

'+約會(huì) +(>攻略 技巧)'
查詢必須包含“約會(huì)”和“攻略”或者“約會(huì)”和“技巧”的記錄,但是“約會(huì) 攻略”的匹配度要比“約會(huì) 技巧”高。

'約會(huì)*'
查詢包含以“約會(huì)”開(kāi)頭的記錄。

'"約會(huì)攻略"'
使用雙引號(hào)把要搜素的詞括起來(lái),效果類似于like '%約會(huì)攻略%',
例如“約會(huì)攻略初級(jí)篇”會(huì)被匹配到,而“約會(huì)的攻略”就不會(huì)被匹配。

與 Like 對(duì)比

全文索引和 like 查詢對(duì)比,有以下優(yōu)點(diǎn):

  • like 只是進(jìn)行模糊匹配,全文索引卻提供了一些語(yǔ)法語(yǔ)義的查詢功能,會(huì)將要查的字符串進(jìn)行分詞操作,這決定于 Mysql 的詞庫(kù)。
  • 全文索引可以自己設(shè)置詞語(yǔ)的最小、最大長(zhǎng)度,要忽略的詞,這些都是可以設(shè)置的。
  • 用全文索引去某個(gè)列查一個(gè)字符串,會(huì)返回匹配度,可以理解為匹配的關(guān)鍵字個(gè)數(shù),是個(gè)浮點(diǎn)數(shù)。

而且全文檢索的性能也是優(yōu)于 like 查詢的

以下是以 50w 左右數(shù)據(jù)進(jìn)行的測(cè)試:

// like 查詢
select * from article where title like '%北京%';

// 全文索引查詢
select * from article where MATCH(title) AGAINST ('北京' IN BOOLEAN MODE);

可以看出 like 查詢是 1.536s,全文索引查詢是 0.094s,快了16倍左右。

總結(jié)

全文索引能快速搜索,但是也存在維護(hù)索引的開(kāi)銷。字段長(zhǎng)度越大,創(chuàng)建的全文索引也越大,會(huì)影響DML語(yǔ)句的吞吐量。數(shù)據(jù)量不大的情況下可以采用全文索引來(lái)做搜索,簡(jiǎn)單方便,但是數(shù)據(jù)量大的話還是建議用專門的搜索引擎 ElasticSearch 來(lái)做這件事。

到此這篇關(guān)于Mysql實(shí)現(xiàn)簡(jiǎn)易版搜索引擎的示例代碼的文章就介紹到這了,更多相關(guān)Mysql 搜索引擎內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • MySQL全文索引實(shí)現(xiàn)簡(jiǎn)單版搜索引擎實(shí)例代碼
  • 詳細(xì)介紹基于MySQL的搜索引擎MySQL-Fullltext
  • scrapy+flask+html打造搜索引擎的示例代碼
  • python基于搜索引擎實(shí)現(xiàn)文章查重功能
  • Python實(shí)戰(zhàn)之手寫一個(gè)搜索引擎
  • Python大批量搜索引擎圖像爬蟲工具詳解
  • 360搜索引擎自動(dòng)收錄php改寫方案
  • php記錄搜索引擎爬行記錄的實(shí)現(xiàn)代碼
  • Python無(wú)損音樂(lè)搜索引擎實(shí)現(xiàn)代碼
  • 基于 Mysql 實(shí)現(xiàn)一個(gè)簡(jiǎn)易版搜索引擎

標(biāo)簽:定西 溫州 山西 無(wú)錫 三明 阿里 揚(yáng)州 福州

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Mysql實(shí)現(xiàn)簡(jiǎn)易版搜索引擎的示例代碼》,本文關(guān)鍵詞  Mysql,實(shí)現(xiàn),簡(jiǎn)易,版,搜索引擎,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Mysql實(shí)現(xiàn)簡(jiǎn)易版搜索引擎的示例代碼》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于Mysql實(shí)現(xiàn)簡(jiǎn)易版搜索引擎的示例代碼的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    国产女主播在线一区二区| 亚洲国产一区二区三区| 亚洲精品国产无套在线观| 蜜臀久久99精品久久久久久9| 国产一区二区三区美女| 欧美视频在线观看一区二区| 久久久久九九视频| 日韩成人av影视| 91精品福利在线| 中文字幕免费一区| 国精产品一区一区三区mba桃花| 日本乱人伦一区| 国产精品丝袜在线| 国产河南妇女毛片精品久久久| 欧美久久免费观看| 亚洲一卡二卡三卡四卡| 一本色道久久综合亚洲aⅴ蜜桃| 国产三级精品三级| 激情六月婷婷综合| 精品国产乱码久久久久久影片| 亚洲一区二区高清| 91黄色在线观看| 亚洲欧美激情视频在线观看一区二区三区 | 婷婷亚洲久悠悠色悠在线播放| 99国产精品久久久久久久久久久 | 久久精品亚洲国产奇米99| 日韩国产精品久久| 9191国产精品| 天堂成人免费av电影一区| 欧美日韩国产大片| 日韩国产在线观看| 日韩三级视频在线观看| 奇米影视在线99精品| 欧美一区二区三区在线电影| 奇米777欧美一区二区| 日韩欧美卡一卡二| 久久99日本精品| 精品国产青草久久久久福利| 国产精品一区二区91| 久久精品人人做人人综合| 成人免费视频网站在线观看| 欧美极品美女视频| 色94色欧美sute亚洲13| 亚洲伊人色欲综合网| 欧美夫妻性生活| 国内外成人在线视频| 日本一区二区三区四区在线视频| 成人免费毛片aaaaa**| 一区二区三区四区蜜桃| 欧美一区永久视频免费观看| 美女www一区二区| 国产人成亚洲第一网站在线播放| a美女胸又www黄视频久久| 亚洲资源中文字幕| 欧美本精品男人aⅴ天堂| 丰满白嫩尤物一区二区| 亚洲欧洲99久久| 欧美日韩国产综合一区二区| 麻豆精品久久精品色综合| 国产精品视频一区二区三区不卡| 91麻豆精品秘密| 香蕉久久一区二区不卡无毒影院| 精品欧美一区二区三区精品久久| 国产精品主播直播| 亚洲一二三区在线观看| 精品成人一区二区| 91福利在线免费观看| 久久国产人妖系列| 亚洲精品视频免费看| 精品福利一区二区三区 | 中文字幕在线不卡| 欧美日韩成人激情| 国产·精品毛片| 日日夜夜免费精品| 国产精品久99| 精品999久久久| 欧美日韩一区二区三区四区五区| 极品尤物av久久免费看| 亚洲精品免费看| 国产亚洲午夜高清国产拍精品| 欧美日韩国产一级二级| 风流少妇一区二区| 美脚の诱脚舐め脚责91| 亚洲综合成人在线| 国产日韩成人精品| 日韩午夜电影在线观看| 色av综合在线| 国产mv日韩mv欧美| 国产在线视频不卡二| 婷婷综合在线观看| 一区二区三区在线观看视频| 国产日产精品1区| 精品久久久久久久久久久院品网 | 日韩不卡在线观看日韩不卡视频| 亚洲柠檬福利资源导航| 国产性天天综合网| 日韩三级视频在线看| 欧美片网站yy| 欧美理论片在线| 欧美性受xxxx| 欧美丝袜自拍制服另类| 色天使色偷偷av一区二区 | 国产一区二区三区日韩| 免费看欧美美女黄的网站| 亚洲二区在线观看| 夜夜精品视频一区二区| 亚洲精品一二三四区| 亚洲狼人国产精品| 亚洲欧美日韩中文播放| 亚洲美女免费在线| 亚洲人成精品久久久久久 | 欧美日韩综合一区| 欧美少妇xxx| 欧美日韩在线观看一区二区| 欧美自拍丝袜亚洲| 欧美偷拍一区二区| 欧美高清视频www夜色资源网| 欧美日韩激情在线| 91精品国产色综合久久ai换脸 | 久久色中文字幕| 日韩一区二区三区视频在线观看| 欧美精品自拍偷拍| 日韩欧美综合在线| 日韩三级.com| 久久久久久久免费视频了| 精品国产制服丝袜高跟| 久久久久99精品国产片| 国产精品理论在线观看| 亚洲女女做受ⅹxx高潮| 日本高清不卡视频| 国产精品美女久久久久久久| 综合av第一页| 亚洲永久精品大片| 青青国产91久久久久久| 国产一区二区三区在线观看精品 | 午夜影院久久久| 免费高清在线一区| 国产91精品免费| 欧美中文字幕一二三区视频| 欧美日韩日本视频| 日韩欧美123| 国产精品电影院| 天堂影院一区二区| 狠狠久久亚洲欧美| 91天堂素人约啪| 日韩一级在线观看| 中国色在线观看另类| 亚洲国产成人tv| 国产一区二区免费视频| 91久久人澡人人添人人爽欧美| 欧美一区2区视频在线观看| 国产三级久久久| 亚洲国产精品一区二区久久| 国内外精品视频| 在线看日本不卡| 久久久综合九色合综国产精品| 一区二区三区在线视频免费观看| 久久国内精品视频| 91搞黄在线观看| 久久久精品黄色| 日本成人在线网站| 色吊一区二区三区| 久久久久久久网| 日精品一区二区| 91麻豆精品一区二区三区| 久久综合五月天婷婷伊人| 亚洲一区二区三区精品在线| 高清av一区二区| 欧美电影免费观看高清完整版在线观看| 国产精品国产三级国产普通话99 | 精品免费视频.| 亚洲乱码国产乱码精品精可以看 | 经典一区二区三区| 欧美日韩精品一区二区天天拍小说| 久久久久久99久久久精品网站| 天堂蜜桃一区二区三区| 色视频欧美一区二区三区| 国产三级精品三级在线专区| 美女www一区二区| 欧美肥妇bbw| 亚洲精品成人少妇| 成人av手机在线观看| 久久免费电影网| 久久99精品久久只有精品| 3d动漫精品啪啪一区二区竹菊| 一二三区精品视频| 色婷婷香蕉在线一区二区| 国产精品亲子乱子伦xxxx裸| 国产成人欧美日韩在线电影| 精品欧美乱码久久久久久1区2区| 日韩国产欧美在线视频| 欧美日韩一区在线观看| 夜夜嗨av一区二区三区中文字幕| av电影天堂一区二区在线 | 久久精品一区二区三区不卡| 青青草国产成人99久久| 欧美一区二区成人6969| 免费欧美日韩国产三级电影| 91麻豆精品国产91久久久资源速度 | 免费三级欧美电影|