一個小小的站內搜索作品,堅守5年的心得體會

来源:https://www.cnblogs.com/kwklover/archive/2019/12/10/12014607.html

5年,50+版本迭代,不忘初心,始終為了幫助廣大站長更容易實現站內搜索功能 一,開發初衷與思路: 基於Lucene.net重頭開發一個站內搜索其實挺費時,且需要一定的二開能力,很多人直接組合一些第三方開源的組件,但如果需要解決好搜索質量,兼顧搜準率與召回率,依然需要做不少調整優化的工作,後來我想能否 ...


5年,50+版本迭代,不忘初心,始終為了幫助廣大站長更容易實現站內搜索功能

一,開發初衷與思路:

基於Lucene.net重頭開發一個站內搜索其實挺費時,且需要一定的二開能力,很多人直接組合一些第三方開源的組件,但如果需要解決好搜索質量,兼顧搜準率與召回率,依然需要做不少調整優化的工作,後來我想能否簡化一下Lucene.net的使用,所以把分詞,配置,索引,搜索等各種底層API等封裝成更易於使用的一個中間件(就是上圖的SearchEasy.SearchEngine類庫),但是因為中間件不好用,乾脆就直接把站內搜索的前端也做了,這樣用戶就無需做任何二次開發,直接在瀏覽器點點滑鼠就可以解決數據導入,創建索引,然後搜索直接就能用了,這個站內搜索系統是這麼演化過來的,而且在多年的實踐當中,也做了很多細節優化工作。

 

 

二,核心組件:

 

Lucene.net : 搜索引擎的核心類庫,第三方開源;

 

Newtonsoft.Json :用於處理JSON的第三方庫;

 

TemplateEngine :用於生成靜態頁面的模板引擎;

 

中文分詞:自己開發,沒有用第三方的。

 

 

 

三,項目架構

 

基於.NET 4.0框架,傳統的三層架構,但在解決方案中的體現是兩個項目:

 

SearchEasy.SearchEngine : 搜索引擎類庫,整合了Lucene,分詞器,以及各種搜索相關的封裝類庫。

 

SearchEasy.SiteSearch  WEB項目,後臺管理與前臺搜索代碼,搜索部分沒有用偽靜態,純動態的,其中的聚合頁生成系統是基於模板引擎生成靜態頁面的。
解決方案示意圖:

 

四,心得體會

當然了,最後不得不說,這個小作品真的不是那麼好做,能堅守到如今,純粹靠的是一份情懷的。拿那麼長的時間,去任何TO B的軟體,估計都能比這個好很多,但從業確確實實幫助了一些站長,認識了不少的站長朋友,也許,收穫的見識比本身的收穫更多吧。

送給廣大技術朋友的一份建議:選擇比努力更重要,方向很重要,方向不好不一定能能守得雲開見月明

 

但是,產品本身還是不錯的,用的站長都說好,方便靈活,簡單易用,小眾是自然的啦,喜歡折騰與高大上技術的自然選擇ES,SOLR去了。

觀摩地址:http://www.searcheasy.net/zn

 


您的分享是我們最大的動力!

更多相關文章
  • 一、簡要介紹 ABP vNext 封裝了兩種事件匯流排結構,第一種是 ABP vNext 自己實現的本地事件匯流排,這種事件匯流排無法跨項目發佈和訂閱。第二種則是分散式事件匯流排,ABP vNext 自己封裝了一個抽象層進行定義,並使用 RabbitMQ 編寫了一個基本實現。 在使用方式上,兩種事件匯流排的作 ...
  • 使用docker運行netcore站點 1.新建一.netcore測試站點,dotnet publish 發佈到publish目錄下 2.編寫Dockerfile文件 3.打包上傳到centos伺服器,Dockerfile裡面的COPY命令的文件上下文環境就是Dockerfile所在目錄 4.在當前 ...
  • 原文:https://blogs.msdn.microsoft.com/mazhou/2017/10/05/c-7-series-part-5-private-protected/ C#有幾個可訪問性修飾符,public、internal、internal protected和private。 pu ...
  • Netnr.FileServer 基於 .NET Core 的簡單文件伺服器,資料庫為SQLite 源碼 https://github.com/netnr/blog https://gitee.com/netnr/blog 為了方便維護公共類庫,項目放置一個解決方案,沒有分開 配置 為配置文件 正式 ...
  • 這是 站點的源代碼 源碼 框架組件 jQuery + Bootstrap4 .NET Core (latest) EF + Linq 支持:SQLServer、MySQL、PostgreSQL、SQLite、InMemory等 ==================================== ...
  • 此系列使用Asp.net構建前後端分離的博客網站。 創建一個asp.net項目 我們這裡使用的是空模板,把Https配置去掉(安全先不配置) 構建webapi介面有很多方法,在這裡我們選擇最簡單的2種方式進行搭建。 1.WebForm 創建一個webForm 打開窗體的伺服器邏輯代碼文件 添加如下方 ...
  • 1. DateTime的使用 DateTime dt = DateTime.Now; StringBuilder sb = new StringBuilder(); sb.AppendLine(string.Format("DataTime字元串表示: {0}", dt.ToString())); ...
  • Centos+Nginx+NetCore3.1部署 1 先將vs2019升級到,16.4.0版本 2.新建一.netcore3.1的web程式 3.編譯後將項目上傳到centos伺服器 4.配置nginx文件 修改完後重新載入ngxin. service nginx restart 5.安裝守護進程 ...
一周排行
  • 【五分鐘的dotnet】是一個利用您的碎片化時間來學習和豐富.net知識的博文系列。如果您現在正在使用.NetCore的話,相信您對await 和 async這兩個關鍵字再熟悉不過了。它們是為非同步編程提供的語法糖,便於我們在代碼中更便捷的進行非同步操作。await 和 async其實是對Task對象都... ...
  • .NET基金會是一個獨立的非營利組織,於2014年成立,旨在圍繞 .NET 不斷增長的開源技術集合,促進開放開發和協作。它是商業和社區開發人員的論壇,通過促進開放性,社區參與和快速創新來增強.NET生態系統的未來。要使.NET 基金會真正獨立並由社區運營,則需要獨立資助。過去,.NET 基金會依靠來... ...
  • 微信公眾號: "Dotnet9" ,網站: "Dotnet9" ,問題或建議: "請網站留言" , 如果對您有所幫助: "歡迎贊賞" 。 .NET CORE(C ) WPF 方便的實現用戶控制項切換(祝大家新年快樂) 快到2020年了,祝大家新年快樂,今年2019最後一更,謝謝大家支持! 閱讀導航 1 ...
  • 內容有點多,請耐心! 最近公司的有這個業務需求,又很湊巧讓我來完成: 首先想要對接,先要一個公眾號,再就是開發文檔了:https://developers.weixin.qq.com/doc/offiaccount/Getting_Started/Overview.html 不過請註意這一點 ok, ...
  • MyBatis MyBatis是Apache的一個開源項目iBatis, iBatis一詞來源於“internet”和“abatis”的組合,是一個基於Java的持久層框架。 iBatis 提供的持久層框架包括SQL Maps和Data Access Objects(DAO) Mybatis 是一個 ...
  • 前言 Stanley B.Lippman 先生所著的《C++ Primer》是學習C++的一本非常優秀的教科書,但《C++ Primer》作為一本大部頭書,顯然不適合所有的初學者。所以Lippman先生又返璞歸真地寫了這本短小輕薄的《Essentia C++》。這本書以簡短的章節篇幅,幫助初學者快速... ...
  • 大數據環境需要的安裝包合集,包括: apache flume 1.7.0 bin.tar.gz apache hive 1.2.1 bin.tar.gz hadoop 2.7.2.tar.gz hbase 1.3.1 bin.tar.gz jdk 8u144 linux x64.tar kafka_ ...
  • 在項目當中資料庫一般都會成為主要的性能與負載瓶頸,那麼針對資料庫各項性能指標的監控與對應的優化是開發與運維人員需要面對的主要工作,而且這部分的工作會貫穿項目從開發到運行的整個周期里。 這篇文章中我們對MySql資料庫中的幾個主要的性能指標的計算與統計進行下說明與總結。 在MySql中通過show g ...
  • 1. Cookie Cookie,有時也用其複數形式Cookies,指某些網站為了辨別用戶身份、進行session跟蹤而儲存在用戶本地終端上的數據(通常經過加密)。Cookie最早是網景公司的前雇員Lou Montulli在1993年3月的發明。Cookie是由伺服器端生成,發送給User-Agen ...
  • 1. PreparedStatement預編譯的語句對象 預編譯語句PreparedStatement 是java.sql中的一個介面,它是Statement的子介面。通過Statement對象執行SQL語句時,需要將SQL語句發送給DBMS,由 DBMS首先進行編譯後再執行。預編譯語句和State ...
x