千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機構(gòu)

手機站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時隨地免費學(xué)

千鋒教育

掃一掃進入千鋒手機站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時隨地免費學(xué)習(xí)課程

當(dāng)前位置:首頁  >  技術(shù)干貨  > Lucene/ ElasticSearch這類的搜索引擎和SQL數(shù)據(jù)庫里的查詢/全文檢索有什么區(qū)別?

Lucene/ ElasticSearch這類的搜索引擎和SQL數(shù)據(jù)庫里的查詢/全文檢索有什么區(qū)別?

來源:千鋒教育
發(fā)布人:xqq
時間: 2023-10-13 12:17:32 1697170652

一、Lucene/ ElasticSearch這類的搜索引擎和SQL數(shù)據(jù)庫里的查詢/全文檢索的區(qū)別

es也可以理解成是一種數(shù)據(jù)庫,不僅能提供全文檢索功能,還可以支持各種數(shù)值類的區(qū)間查詢,聚合計算等,這些和傳統(tǒng)數(shù)據(jù)庫一樣,從使用場景來說,數(shù)據(jù)庫一般用來存meta,比如網(wǎng)站用戶,用戶資源等等,這些數(shù)據(jù)有個特點就是量不會很大,還有就是這些數(shù)據(jù)一般都比較結(jié)構(gòu)化。

es一般用來存一些流式數(shù)據(jù),比如應(yīng)用日志,這也是目前es應(yīng)用最廣的方面,這些數(shù)據(jù)有個特點就是往往結(jié)構(gòu)不固定,比如應(yīng)用日志,不同的程序員寫得模塊打出來的日志字段數(shù)量都不一樣,這種數(shù)據(jù)就不太方便用數(shù)據(jù)庫來處理。

最后,一般傳統(tǒng)數(shù)據(jù)庫,全文檢索都實現(xiàn)的很雞肋,因為一般也沒人用數(shù)據(jù)庫存文本字段。

上面從使用場景上說明了兩者的區(qū)別,從技術(shù)上兩者全文檢索的實現(xiàn)都差不多,無非是倒排索引,但是lucene畢竟是專業(yè)的,做了十幾年了,索引效率,存儲空間等都比傳統(tǒng)數(shù)據(jù)庫快很多,技術(shù)也迭代的非常快。

延伸閱讀:

二、?Lucene是什么

Lucene是Apache基金會jakarta項目組的一個子項目;Lucene是一個開放源碼的全文檢索引擎工具包,提供了完整的查詢引擎和索引引擎,部分語種文本分析引擎;Lucene并不是一個完整的全文檢索引擎,僅提供了全文檢索引擎架構(gòu),但仍可以作為一個工具包結(jié)合各類插件為項目提供部分高性能的全文檢索功能;現(xiàn)在常用的ElasticSearch、Solr等全文搜索引擎均是基于Lucene實現(xiàn)的。

索引的生成分為兩個部分:

1)創(chuàng)建階段:

添加文檔階段,通過IndexWriter調(diào)用addDocument方法生成正向索引文件;文檔添加后,通過flush或merge操作生成倒排索引文件。

2) 搜索階段:

用戶通過查詢語句向Lucene發(fā)送查詢請求;通過IndexSearch下的IndexReader讀取索引庫內(nèi)容,獲取文檔索引;得到搜索結(jié)果后,基于搜索算法對結(jié)果進行排序后返回。
聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強師集結(jié),手把手帶你蛻變精英
請您保持通訊暢通,專屬學(xué)習(xí)老師24小時內(nèi)將與您1V1溝通
免費領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
PC端網(wǎng)站,手機版網(wǎng)站,APP,三者可以實現(xiàn)共用同一數(shù)據(jù)庫,能同步更新嗎?

一、PC端網(wǎng)站,手機版網(wǎng)站,APP,三者可以實現(xiàn)共用同一數(shù)據(jù)庫同步更新一般網(wǎng)站實現(xiàn)pc端與移動端適配的需求,方案有兩個:1、一套頁面,從設(shè)計時...詳情>>

2023-10-13 14:10:53
怎么看待oracle的exadata與share nothing系列的hadoop等,以及優(yōu)缺點相互對比、各自的前途對未來的影?

一、怎么看待oracle的exadata與share nothing系列的hadoop等exadata的架構(gòu)我也仔細思考過很久,個人愚見,exadata引進了部分MPP思想,當(dāng)并非MPP...詳情>>

2023-10-13 13:58:16
MySQL數(shù)據(jù)庫char類型的長度是什么意思?

一、MySQL數(shù)據(jù)庫char類型的長度是什么意思MySQL數(shù)據(jù)庫char類型的長度是指該字段所占用的字節(jié)數(shù)。char數(shù)據(jù)類型是MySQL中固定長度的字符類型。 我...詳情>>

2023-10-13 13:51:32
“數(shù)據(jù)庫”領(lǐng)域里面的“數(shù)據(jù)字典”到底是什么?

一、“數(shù)據(jù)庫”領(lǐng)域里面的“數(shù)據(jù)字典”到底是什么數(shù)據(jù)字典是一個存放有數(shù)據(jù)庫所用的有關(guān)信息,在數(shù)據(jù)庫設(shè)計的初期將數(shù)據(jù)庫中的各類數(shù)據(jù)的描述集...詳情>>

2023-10-13 13:49:07
微博feed系統(tǒng)的推模式和拉模式的架構(gòu)是怎樣的?

一、微博feed系統(tǒng)的推模式架構(gòu)1、發(fā)布服務(wù)負責(zé)生成用戶的消息,將消息推送到數(shù)據(jù)發(fā)布中心。2、推送服務(wù)在接收到新消息后,根據(jù)消息的類型和內(nèi)容...詳情>>

2023-10-13 13:28:55
快速通道
久久亚洲中文字幕精品一区四,亚洲日本另类欧美一区二区,久久久久久久这里只有免费费精品,高清国产激情视频在线观看
亚洲日本va中文字幕亚洲 | 日韩动漫精品一区 | 午夜亚洲精品专区高潮日w 亚洲一区二区三区中文字幕网 | 最新日本一区二区三区视频 | 日韩中文字幕在线视频三区 | 亚洲一区二区中文字幕无 |