基本的檢索技術有哪些?

General 更新 2024-05-26

常用信息檢索技術有哪些

1．布爾邏輯檢索

利用布爾邏輯算符進行檢索詞或代碼的邏輯組配，是現代信息檢索系統中最常用的一種技術。常用的布爾邏輯算符有三種，分別是邏輯或“OR”、邏輯與“AND”、邏輯非“NOT”。

2．截詞檢索

截詞檢索是計算機檢索系統中應用非常普遍的一種技術。由於西文的構詞特性，在檢索中經常會遇到名詞的單複數形式不一致；飢一個意思的詞，英美拼法不一致；詞幹加上不同性質的前綴和後綴就可以派生出許多意義相近的詞等等。這是就要用到截詞檢索

3．位置檢索

位置檢索也叫全文檢索、鄰近檢索。所謂全文檢索，就是利用記錄中的自然語言進行檢索，詞與詞之間的邏輯關係用位置算符組配，對檢索詞之間的相對位置進行限制。這是一種可以不依賴主題詞表而直接使用自由詞進行檢索的技術方法。

4．字段限定檢索

字段限定檢索是指限定檢索詞在數據庫記錄中的一個或幾個字段範圍內查找的一種檢索方法。在檢索系統中，數據庫設置的可供檢索的字段通常有兩種：表達文獻主題內容特徵的基本字段和表達文獻外部特徵的輔助字段。

5．加權檢索

加權檢索是某些檢索系統中提供的一種定量檢索技術。加權檢索同布爾檢索、截詞檢索等一樣，也是文獻檢索的一個基本檢索手段，但與它們不同的是，加權檢索的側重點不在於判定檢索詞或字符串是不是在數據庫中存在、與別的檢索詞或字符串是什麼關係，而是在於判定檢索詞或字符串在滿足檢索邏輯後對文獻命中與否的影響程度。

6．聚類檢索

聚類是把沒有分類的事物，在不知道應分幾類的情況下，根據事物彼此不同的內在屬性，將屬性相似的信息劃分到同一類下面。

什麼是基本檢索

即簡單檢索、丹速檢索。檢索的可選項少或者沒有，輸入查詢詞，就能快速得到結果。但檢索的準確性差、精度低。

什麼是信息檢索技術？它主要包括哪幾種？各有何檢索特點？

信息檢索技術信息檢索是指從以任何方式組成的信息集合中，查找特定用戶在特定時間和條件下所需信息的方法與過程。它主要包括：布爾檢索，詞位檢索，截詞檢索，限制檢索。布爾檢索的特點（1）與人們的思維習慣一致（2）表達直觀清晰、結構化強（3）方便擴檢和縮檢（4）易於計算機實現

簡述計算機檢索基本技術的種類

計算機檢索基本技術的種類有：布爾邏輯檢索、截詞檢索、限制符檢索、位置運算符檢索。

1、布爾邏輯檢索也稱作布爾邏輯搜索,嚴格意義上的布爾檢索法是指利用布爾邏輯運算符連接各個檢索詞,然後由計算機進行相應邏輯運算,以找出所需信息的方法.它使用面最廣、使用頻率最高.布爾邏輯運算符的作用是把檢索詞連接起來,構成一個邏輯檢索式.

2、截詞檢索是預防漏檢提高查全率的一種常用檢索技術,大多數系統都提供截詞檢索的功能.截詞是指在檢索詞的合適位置進行截斷,然後使用截詞符進行處理,這樣既可節省輸入的字符數目,又可達到較高的查全率.

3、限制符檢索(Range)是通過限制檢索範圍,達到優化檢索結果的方法.限制檢索的方式有多種,例如進行字段檢索、使用限制符、採用限制檢索命令等.

4、位置運算符檢索也叫臨近檢索.文獻記錄中詞語的相對次序或位置不同,所表達的意思可能不同,而同樣一個檢索表達式中詞語的相對次序錠同,其表達的檢索意圖也不一樣.位置算符檢索是用一些特定的算符（位置算符）來表達檢索詞與檢索詞之間的臨近關係,並且可以不依賴主題詞表而直接使用自由詞進行檢索的技術方法.

搜索引擎通常具備哪些基本的檢索功能

現有的搜索引擎基本上分為三類：

1.1 single search engine(獨立搜索引擎) 它的特點是僅在搜索引擎自身的數據庫檢索信息，比如Yahoo。

1.2 Meta search engine(元搜索引擎) 它在檢索信息時通過調用其它多個獨立的搜索引擎來完成檢索功能，並且能夠將從多個獨立搜索引擎查詢的結果進行不同程度的處理，比如刪除重複結果、校驗連接、結果按照相關度排序等。元搜索引擎本身可以有也可以沒有自己的數據庫。由於不同的元搜索引擎掛接的獨立搜索引擎各不相同，且各自獨立的搜索引擎在查詢語法上的差別較大，使得元搜索引擎本身僅支持AND、0R、N0T等簡單的語法操作，返回的結果只能滿足“最低常用分母”，即不能提高搜索結果的準確性。

1.3 Net search engine(網絡搜索軟件) 就是網絡用戶可以將相應的搜索軟件下載至本地的計算機上，安裝查詢，這是一種具有網絡查詢功能的離線瀏覽器。相對於元搜索引擎，它可以靈活地控制輸出結果，其最大特點是方便用戶使用和能快速地查詢網絡相關資源。2 網絡搜索引擎的工作原理及其基本構成

用戶檢索信息時，搜索引擎是根據用戶的查詢要求，按照一定的算法從索引數據庫中查找對應的信息返回給用戶。為了保證用戶查找信息的精度和新鮮度。對於獨立的搜索引擎而言．還需要建立並維護一個龐大的數據庫。獨立搜索引擎中的索引數據庫中的信息是通過一種叫做網絡蜘蛛(spider)的程序軟件定期在網上爬行，通過訪問公共網絡中公開區域的每一個站點採集網頁，對網絡信息資源進行收集，然後利用索引軟件對收集的信息進行自動標引，創建一個可供用戶按照關鍵字等進行查詢的web頁索引數據庫，搜索軟件通過索引數據庫為用戶提供查詢服務。所以，一般的搜索引擎主要由網絡蜘蛛、索引和搜索軟件三部分組成.

網絡蜘蛛。是一個功能很強的程序，它會定期根據預先設定的地址去查看對應的網頁，如網頁發生變化則重新獲取該網頁，否則根據該網頁中的鏈接繼續去訪問。網絡蜘蛛訪問頁面的過程是對互連網上信息遍歷的過程。為了保證網絡蜘蛛遍歷信息的廣度，一般事先設定_ 些重要的鏈接，然後進行遍歷。在遍歷的過程中不斷記錄網頁中的鏈接，不斷地遍歷下去，直到訪問完所有的鏈接。

索引軟件。網絡蜘蛛將遍歷搜索集得到的網頁存放在數據庫中。為了提高檢索的效率，需要建立索引。索引一般為倒排檔索引。

搜索軟件。該軟件用於篩選索引數據庫中無數的網頁信息，選擇出符合用戶檢索要求的網頁並對它們進行分級排序。然後將分級排序後的結果顯示給用戶。

3 搜索引擎的主要性能評價指標

3．1 搜索引擎建立索引的方法數據庫中的索引一般是按照倒排文檔的文件格式存放，在建立例排索引的時候，不同的搜索引擎有不同的選項。有些搜索引擎對於信息頁面建立全文索引；而有些只建立摘要部分，或者是段落前面部分的索引；還有些搜索引擎，比如Google建立索引的時候，同時還考慮超文本的不同標記所表示的不同含義。如粗體、大字體顯示的東西往往比較重要；放在錨鏈中的信息往往是它所指向頁面的信息的概括，所以用它來作為所指向的頁面的重要信息。Google、infoseek還在建立索引的過程中收集頁面中的超鏈接。這些超鏈接反映了收集到的信息之間的空間結構，利用這些結果信息可以提高頁面相關度判別時的準確度。由於索引不同，在檢索信息時產生的結果會不同。

3．2 搜索引擎的檢索功能搜索引擎所支持的檢索功能的多少及其實現的優劣，直接決定了檢索效果的好壞，所以網絡檢索工具除了要支持諸如布爾檢索、鄰近檢索、截詞檢索、字段檢索等基本的檢索功能之外，更應該根據網上信息資源......

常用的搜索引擎都有哪些基本類型？

索引擎（search engines）是對互聯網上的信息資源進行蒐集整理，然後供你查詢的系統，它包括信息蒐集、信息整理和用戶查詢三部分。

搜索引擎是一個為你提供信息“檢索”服務的網站，它使用某些程序把因特網上的所有信息歸類以幫助人們在茫茫網海中搜尋到所需要的信息。

早期的搜索引擎是把因特網中的資源服務器的地址收集起來，由其提供的資源的類型不同而分成不同的目錄，再一層層地進行分類。人們要找自己想要的信息可按他們的分類一層層進入，就能最後到達目的地，找到自己想要的信息。這其實是最原始的方式，只適用於因特網信息並不多的時候。隨著因特網信息按幾何式增長，出現了真正意義上的搜索引擎，這些搜索引擎知道網站上每一頁的開始，隨後搜索因特網上的所有超級鏈接，把代表超級鏈接的所有詞彙放入一個數據庫。這就是現在搜索引擎的原型。

隨著yahoo!的出現，搜索引擎的發展也進入了黃金時代，相比以前其性能更加優越。現在的搜索引擎已經不只是單純的搜索網頁的信息了，它們已經變得更加綜合化，完美化了。以搜索引擎權威yahoo!為例，從1995年3月由美籍華裔楊致遠等人創辦yahoo!開始，到現在，他們從一個單一的搜索引擎發展到現在有電子商務、新聞信息服務、個人免費電子信箱服務等多種網絡服務，充分說明了搜索引擎的發展從單一到綜合的過程。

然而由於搜索引擎的工作方式和因特網的快速發展，使其搜索的結果讓人越來越不滿意。例如，搜索“電腦”這個詞彙，就可能有數百萬頁的結果。這是由於搜索引擎通過對網站的相關性來優化搜索結果，這種相關性又是由關鍵字在網站的位置、網站的名稱、標籤等公式來決定的。這就是使搜索引擎搜索結果多而雜的原因。而搜索引擎中的數據庫因為因特網的發展變化也必然包含了死鏈接。

這篇文章中，我們介紹了google，它是一個大型的搜索引擎（of a large-scale search engine）的原型，搜索引擎在超文本中應用廣泛。Google的設計能夠高效地抓網頁並建立索引，它的查詢結果比其它現有系統都高明。這個原型的全文和超連接的數據庫至少包含24‘000‘000個網頁。我們可以從google.stanford.edu/ 下載。

設計搜索引擎是一項富有挑戰性的工作。搜索引擎為上億個網頁建立索引，其中包含大量迥然不同的詞彙。而且每天要回答成千上萬個查詢。在網絡中，儘管大型搜索引擎非常重要，但是學術界卻很少研究它。此外由於技術的快速發展和網頁的大量增加，現在建立一個搜索引擎和三年前完全不同。

本文詳細介紹了我們的大型搜索引擎，據我們所知，在公開發表的論文中，這是第一篇描述地如此詳細。除了把傳統數據搜索技術應用到如此大量級網頁中所遇到的問題，還有許多新的技術挑戰，包括應用超文本中的附加信息改進搜索結果。

本文將解決這個問題，描述如何運用超文本中的附加信息，建立一個大型實用系統。任何人都可以在網上隨意發佈信息，如何有效地處理這些無組織的超文本集合，也是本文要關注的問題。

關鍵詞 World Wide Web，搜索引擎，信息檢索，PageRank, Google 1 緒論 Web 給信息檢索帶來了新的挑戰。Web上的信息量快速增長，同時不斷有毫無經驗的新用戶來體驗Web這門藝術。人們喜歡用超級鏈接來網上衝浪，通常都以象Yahoo這樣重要的網頁或搜索引擎開始。大家認為List(目錄)......

常用的信息檢索方法有哪些？

檢索方法是指實現檢索計劃的具體方法，檢索方式不同，方法也不一樣。常用的信息檢索方法有常規法（包括順查法、倒查法、抽查法）、追溯法、綜合法（也叫做循環法，是常規法和追溯法的綜合）、搜索引擎法、導航法等。

數據庫檢索的基本技術有哪些？數據庫檢索基本功能有哪些？

SQL查詢語言,功能當然是檢索出有用的信息,特定的:

如;select * from table1

where ID='12';

意思是從table1中檢索出ID號為12的所有信息項..

文獻檢索的主要途徑有哪些

文獻檢索途徑包括以下幾種：

一、著者途徑許多檢索系統備有著者索引、機構（機構著者或著者所在機構）索引，專利文獻檢索系統有專利權人索引，利用這些索引從著者、編者、譯者、專利權人的姓名或機關團體名稱字順進行檢索的途徑統稱為著者途徑。

二、題名包括書名、刊名、篇名等途徑。　　一些檢索系統中提供按題名字順檢索的途徑，如書名目錄和刊名目錄。

三、分類途徑　按學科分類體系來檢索文獻。這一途徑是以知識體系為中心分類排檢的，因此，比較能體現學科系統性，反映學科與事物的隸屬、派生與平行的關係，便於我們從學科所屬範圍來查找文獻資料，並且可以起到"觸類旁通"的作用。從分類途經檢索文獻資料，主要是利用分類目錄和分類索引。

四、主題途徑通過反映文獻資料內容的主題詞來檢索文獻。由於主題法能集中反映一個主題的各方面文獻資料，因而便於讀者對某一問題、某一事物和對象作全面系統的專題性研究。我們通過主題目錄或索引，即可查到同一主題的各方面文獻資料。

五、引文途徑　文獻所附參考文獻或引用文獻，是文獻的外表特徵之一。利用這種引文而編制的索引系統，稱為引文索引系統，它提供從被引論文去檢索引用論文的一種途徑，稱為引文途徑。

六、序號途徑　有些文獻有特定的序號，如專利號、報告號、合同號、標準號、國際標準書號和刊號等。文獻序號對於識別一定的文獻，具有明確、簡短、唯一性特點。依此編成的各種序號索引可以提供按序號自身順序檢索文獻信息的途徑。

七、代碼途徑利用事物的某種代碼編成的索引，如分子式索引、環系索引等，可以從特定代碼順序進行檢索。

八、專門項目途徑　　從文獻信息所包含的或有關的名詞術語、地名、人名、機構名、商品名、生物屬名、年代等的特定順序進行檢索，可以解決某些特別的問題。