一個小小的站內搜索作品,堅守5年的心得體會

来源:https://www.cnblogs.com/kwklover/archive/2019/12/10/12014607.html

5年,50+版本迭代,不忘初心,始終為了幫助廣大站長更容易實現站內搜索功能 一,開發初衷與思路: 基於Lucene.net重頭開發一個站內搜索其實挺費時,且需要一定的二開能力,很多人直接組合一些第三方開源的組件,但如果需要解決好搜索質量,兼顧搜準率與召回率,依然需要做不少調整優化的工作,後來我想能否 ...


5年,50+版本迭代,不忘初心,始終為了幫助廣大站長更容易實現站內搜索功能

一,開發初衷與思路:

基於Lucene.net重頭開發一個站內搜索其實挺費時,且需要一定的二開能力,很多人直接組合一些第三方開源的組件,但如果需要解決好搜索質量,兼顧搜準率與召回率,依然需要做不少調整優化的工作,後來我想能否簡化一下Lucene.net的使用,所以把分詞,配置,索引,搜索等各種底層API等封裝成更易於使用的一個中間件(就是上圖的SearchEasy.SearchEngine類庫),但是因為中間件不好用,乾脆就直接把站內搜索的前端也做了,這樣用戶就無需做任何二次開發,直接在瀏覽器點點滑鼠就可以解決數據導入,創建索引,然後搜索直接就能用了,這個站內搜索系統是這麼演化過來的,而且在多年的實踐當中,也做了很多細節優化工作。

 

 

二,核心組件:

 

Lucene.net : 搜索引擎的核心類庫,第三方開源;

 

Newtonsoft.Json :用於處理JSON的第三方庫;

 

TemplateEngine :用於生成靜態頁面的模板引擎;

 

中文分詞:自己開發,沒有用第三方的。

 

 

 

三,項目架構

 

基於.NET 4.0框架,傳統的三層架構,但在解決方案中的體現是兩個項目:

 

SearchEasy.SearchEngine : 搜索引擎類庫,整合了Lucene,分詞器,以及各種搜索相關的封裝類庫。

 

SearchEasy.SiteSearch  WEB項目,後臺管理與前臺搜索代碼,搜索部分沒有用偽靜態,純動態的,其中的聚合頁生成系統是基於模板引擎生成靜態頁面的。
解決方案示意圖:

 

四,心得體會

當然了,最後不得不說,這個小作品真的不是那麼好做,能堅守到如今,純粹靠的是一份情懷的。拿那麼長的時間,去任何TO B的軟體,估計都能比這個好很多,但從業確確實實幫助了一些站長,認識了不少的站長朋友,也許,收穫的見識比本身的收穫更多吧。

送給廣大技術朋友的一份建議:選擇比努力更重要,方向很重要,方向不好不一定能能守得雲開見月明

 

但是,產品本身還是不錯的,用的站長都說好,方便靈活,簡單易用,小眾是自然的啦,喜歡折騰與高大上技術的自然選擇ES,SOLR去了。

觀摩地址:http://www.searcheasy.net/zn

 


您的分享是我們最大的動力!

更多相關文章
  • 一、簡要介紹 ABP vNext 封裝了兩種事件匯流排結構,第一種是 ABP vNext 自己實現的本地事件匯流排,這種事件匯流排無法跨項目發佈和訂閱。第二種則是分散式事件匯流排,ABP vNext 自己封裝了一個抽象層進行定義,並使用 RabbitMQ 編寫了一個基本實現。 在使用方式上,兩種事件匯流排的作 ...
  • 使用docker運行netcore站點 1.新建一.netcore測試站點,dotnet publish 發佈到publish目錄下 2.編寫Dockerfile文件 3.打包上傳到centos伺服器,Dockerfile裡面的COPY命令的文件上下文環境就是Dockerfile所在目錄 4.在當前 ...
  • 原文:https://blogs.msdn.microsoft.com/mazhou/2017/10/05/c-7-series-part-5-private-protected/ C#有幾個可訪問性修飾符,public、internal、internal protected和private。 pu ...
  • Netnr.FileServer 基於 .NET Core 的簡單文件伺服器,資料庫為SQLite 源碼 https://github.com/netnr/blog https://gitee.com/netnr/blog 為了方便維護公共類庫,項目放置一個解決方案,沒有分開 配置 為配置文件 正式 ...
  • 這是 站點的源代碼 源碼 框架組件 jQuery + Bootstrap4 .NET Core (latest) EF + Linq 支持:SQLServer、MySQL、PostgreSQL、SQLite、InMemory等 ==================================== ...
  • 此系列使用Asp.net構建前後端分離的博客網站。 創建一個asp.net項目 我們這裡使用的是空模板,把Https配置去掉(安全先不配置) 構建webapi介面有很多方法,在這裡我們選擇最簡單的2種方式進行搭建。 1.WebForm 創建一個webForm 打開窗體的伺服器邏輯代碼文件 添加如下方 ...
  • 1. DateTime的使用 DateTime dt = DateTime.Now; StringBuilder sb = new StringBuilder(); sb.AppendLine(string.Format("DataTime字元串表示: {0}", dt.ToString())); ...
  • Centos+Nginx+NetCore3.1部署 1 先將vs2019升級到,16.4.0版本 2.新建一.netcore3.1的web程式 3.編譯後將項目上傳到centos伺服器 4.配置nginx文件 修改完後重新載入ngxin. service nginx restart 5.安裝守護進程 ...
一周排行
  • 比如要拆分“呵呵呵90909086676喝喝999”,下麵當type=0返回的是中文字元串“呵呵呵,喝喝”,type=1返回的是數字字元串“90909086676,999”, private string GetStrings(string str,int type=0) { IList<strin ...
  • Swagger一個優秀的Api介面文檔生成工具。Swagger可以可以動態生成Api介面文檔,有效的降低前後端人員關於Api介面的溝通成本,促進項目高效開發。 1、使用NuGet安裝最新的包:Swashbuckle.AspNetCore。 2、編輯項目文件(NetCoreTemplate.Web.c ...
  • 2020 年 7 月 30 日, 由.NET基金會和微軟 將舉辦一個線上和為期一天的活動,包括 微軟 .NET 團隊的演講者以及社區的演講者。本次線上大會 專註.NET框架構建微服務,演講者分享構建和部署雲原生應用程式的最佳實踐、模式、提示和技巧。有關更多信息和隨時瞭解情況:https://focu... ...
  • #abp框架Excel導出——基於vue #1.技術棧 ##1.1 前端採用vue,官方提供 UI套件用的是iview ##1.2 後臺是abp——aspnetboilerplate 即abp v1,https://github.com/aspnetboilerplate/aspnetboilerp ...
  • 前言 本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯繫我們以作處理。 作者:碧茂大數據 PS:如有需要Python學習資料的小伙伴可以加下方的群去找免費管理員領取 input()輸入 Python提供了 input() 內置函數從標準輸入讀入一 ...
  • 從12年到20年,python以肉眼可見的趨勢超過了java,成為了當今It界人人皆知的編程語言。 python為什麼這麼火? 網路編程語言搜索指數 適合初學者 Python具有語法簡單、語句清晰的特點,這就讓初學者在學習階段可以把精力集中在編程對象和思維方法上。 大佬都在用 Google,YouT ...
  • 在社會上存在一種普遍的對培訓機構的學生一種歧視的現象,具體表現在,比如:當你去公司面試的時候,一旦你說了你是培訓機構出來的,那麼基本上你就涼了,那麼你瞞著不說,然後又通過了面試成功入職,但是以後一旦在公司被髮現有培訓經歷,可能會面臨被降薪,甚至被辭退,培訓機構出來的學生,在用人單位眼裡就是能力低下的 ...
  • from typing import List# 這道題看了大佬寫的代碼,經過自己的理解寫出來了。# 從最外圍的四周找有沒有為O的,如果有的話就進入深搜函數,然後深搜遍歷# 判斷上下左右的位置是否為Oclass Solution: def solve(self, board: List[List[s ...
  • import requests; import re; import os; # 1.請求網頁 header = { "user-agent":'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_5) AppleWebKit/537.36 (KHTML, li ...
  • import requests; import re; import os; import parsel; 1.請求網頁 header = { "user-agent":'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_5) AppleWebKit/537. ...