免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
第 10 章 管理搜索引擎服務

第 10 章
管理搜索引擎服務

本章介紹如何配置和管理 Sun Java? System Portal Server 搜索引擎服務。

本章包含以下部分:


搜索引擎服務概述

Sun Java System Portal Server 搜索引擎是一種分類法和數(shù)據(jù)庫服務,旨在支持搜索和瀏覽與流行的 Internet 搜索引擎(如 Google、Alta Vista 等)類似的界面。搜索引擎包括一個 robot,用以發(fā)現(xiàn)、轉換和匯總文檔資源。在 Sun Java System Portal Server 6 2004Q2 中,該界面是由桌面使用 JSP? 提供者專門提供的。搜索引擎包括用于配置編輯的管理工具和用于管理系統(tǒng)的命令行工具??梢酝ㄟ^ Sun Java? System Identity Server 管理控制臺,定義配置設置并將其存儲為 Sun Java System Identity Server 服務屬性值。


雖然管理控制臺允許管理員對大多數(shù)的搜索引擎選項進行配置,但它不會執(zhí)行所有通過命令行可執(zhí)行的管理功能。


搜索數(shù)據(jù)庫

搜索用戶在數(shù)據(jù)庫中搜索,以查找特殊資源或資源種類。數(shù)據(jù)庫中的各個條目被稱為資源描述 (RD)?!百Y源描述”是關于某個單一資源的特定信息集合。每個“資源描述”的字段由數(shù)據(jù)庫模式決定。

要將 RD 放入數(shù)據(jù)庫中,可以使用兩種方法:

  • 創(chuàng)建 RD — 這是目前最常用的方法,它使用 robot 進程查找資源,然后生成它們的描述。
  • 交換 RD — 這種方法適用于為大型分布式網絡創(chuàng)建索引。遠程系統(tǒng)生成 RD,然后搜索引擎將這些 RD 導入到其數(shù)據(jù)庫中。

“Sun Java System Portal Server 搜索引擎”中的 RD 基于開放式的 Internet 標準,例如 “摘要對象交互格式”(SOIF) 和資源描述消息 (RDM)。它確保了搜索引擎可以在跨平臺企業(yè)環(huán)境中運行。

搜索 Robot

填寫數(shù)據(jù)庫的方法之一是通過 robot?!八阉饕妗笔褂?robot 對它們域中的資源進行查找并報告。robot 是一個小程序,它可以完成以下兩個任務:

  • 提取并跟蹤資源鏈接(也稱作枚舉或搜尋)
  • 對這些資源進行描述,然后將這些描述放入數(shù)據(jù)庫中(也稱作生成或創(chuàng)建索引)

系統(tǒng)管理員應通過多種方法對這些進程的各個方面進行控制,包括以下方面:

  • 通過啟動、停止以及制定 robot 進度表來控制 robot 何時運行。
  • 通過定義 robot 訪問的站點來控制 robot 查找資源的位置。
  • 通過定義搜尋屬性來控制搜索的深度。
  • 通過定義過濾器控制 robot 為哪類資源創(chuàng)建索引。
  • 通過定義索引屬性控制其為數(shù)據(jù)庫創(chuàng)建的條目種類。

搜索引擎還提供了實用程序,以確保 robot 完成所需任務。

數(shù)據(jù)庫分類法類別

用戶以兩種完全不同的方式與搜索系統(tǒng)進行交互:可以鍵入直接查詢來搜索數(shù)據(jù)庫,也可使用一組您設計的類別來瀏覽整個數(shù)據(jù)庫內容。類別的層次結構有時也稱為分類法。對資源進行分類如同為數(shù)據(jù)庫創(chuàng)建一個目錄一樣。

在搜索系統(tǒng)中,瀏覽是一個可選功能。也就是說,一個非常有用的搜索系統(tǒng)可以不包括按類別瀏覽功能。您需要決定添加可瀏覽的類別是否對您的索引的用戶有用,然后決定您要創(chuàng)建何種類別。

“搜索”數(shù)據(jù)庫中的資源被分配給各個類別,以簡化其復雜程度。如果數(shù)據(jù)庫中存在大量項目,則最好將相關項目組合在一起。這樣使用戶能夠快速找到特定類型的項目、對類似的項目進行比較,以及選擇所需的項目。

這是在產品和服務索引中是常用的分類方法。服裝目錄可分為男裝、女裝和童裝,每一類又可進一步分為外套、襯衫、鞋等等。辦公產品目錄可分為辦公用家具、文具、計算機、軟件。廣告目錄按照產品和服務的類別進行安排。

指南中索引的分類原則也適用于聯(lián)機索引。這種方法使用戶能夠很容易地找到某類資源,從而可以選擇所需的資源。無論您設計的索引的范圍如何,在類別的設置中主要都應考慮可用性。也就是說,您需要了解用戶將如何使用這些類別。例如,如果您為某公司設計索引,而該公司有三個不同地點的辦事處,則可將頂級類別與這三個辦事處中的每一個相對應。但是假如用戶對超越地理界限的職能部門更感興趣,則按照公司部門對資源進行分類也許更有意義。

一旦定義了類別,就必須制定出將資源分配給各個類別的相應規(guī)則。這些規(guī)則被稱為分類規(guī)則。如果沒有正確定義分類規(guī)則,則用戶將不能通過在類別中瀏覽來找到資源。必須避免對資源進行錯誤的分類,但也不應根本不對文檔進行分類。

可以將這些文檔分配給多個類別,最多可達到設置中定義的最大值。分類規(guī)則比過濾器規(guī)則簡單,因為它們不涉及任何流程控制決策。在這些分類規(guī)則中,您必須決定使用什么樣的標準將特定的類別分配給資源,作為其“資源描述”的一部分。分類規(guī)則是一個簡單的條件語句,采用“如果 <某條件> 為真,則將資源分配給 <類別>”的格式。


配置搜索頻道

本部分介紹如何對搜索引擎服務進行初始配置??梢酝ㄟ^ Sun Java System Identity Server 管理控制臺,定義配置設置并將其存儲為 Sun Java System Identity Server 服務屬性值。

“搜索”服務會在全局范圍內進行注冊,其配置適用于整個 Portal Server。默認情況下,在 Sun Java System Portal Server 安裝期間指定的組織將會注冊搜索服務。如果安裝了示例門戶,示例門戶桌面上的“搜索”選項卡包含搜索頻道。在 Sun Java System Portal Server 安裝期間,會配置此項。但是,對于新組織和新實例,必須定義“搜索 URL”。

對搜索提供者用戶的默認操作是,當用戶輸入一條查詢時,顯示“未找到匹配文檔”。

這時,需要配置搜索服務器并創(chuàng)建文檔數(shù)據(jù)庫,以獲得搜索結果。

初始配置搜索服務器

使用以下步驟配置搜索提供者。這是填寫數(shù)據(jù)庫的示例方法。也可以使用導入功能。

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 創(chuàng)建一個新站點。
    1. 單擊 Robot。
    2. 單擊“站點”。
    3. 單擊“管理站點”下的“新建”,為 Robot 定義要創(chuàng)建索引的站點。
    4. 指定站點類型(URL 或域)、要創(chuàng)建索引的站點和 robot 搜尋的深度。
    5. 單擊“創(chuàng)建站點”以使用默認“搜索”屬性,或者選擇“創(chuàng)建并編輯站點”來更完整地定義搜索站點。
    6. 有關定義站點的那些屬性的詳細信息,參見附錄 F,“搜索屬性”。

  6. 創(chuàng)建分類法。
  7. 可以使用“類別”下的“類別編輯器”,或者通過將示例分類法 SOIF 文件復制到 config/taxonomy.rdm 下,來創(chuàng)建一個分類法。

  8. 禁用所有不需要使用的默認過濾器。
  9. 單擊 Robot,再單擊“過濾器”。關閉“過濾器規(guī)則”列表中的所有不想使用的過濾器。

  10. (可選項)如果需要在類別下得到文檔結果,則創(chuàng)建 robot 分類規(guī)則。
  11. 通過使用“類別”下的“分類規(guī)則編輯器”,可以創(chuàng)建一個 robot 分類規(guī)則。

  12. 啟動 robot。
  13. 單擊 Robot、“概述”,然后單擊“啟動”,啟動 robot。

  14. 重建類別索引
  15. 單擊“類別”,然后單擊“重建索引”來重新創(chuàng)建索引。

定義搜索 URL

searchServer 特性定義 搜索 URL。此項會自動為默認組織配置,但是,當創(chuàng)建了新組織、新 SearchProvider 實例,或者手動加載了示例 dp-org.xml 時,不會定義此值。如果在未定義此值時用戶進行搜索,則用戶的桌面上會顯示下列錯誤消息:

您收到 com.sun.portal.search.providers.taglib.SearchTaglibExceptionSearchRequest 錯誤:未定義搜索服務器。

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 選擇要定義搜索 URL 的組織。
  4. 在“查看”菜單中選擇“服務”
  5. 使用導航窗格中的“顯示”菜單和位置窗格中的“位置”路徑。

  6. 在導航窗格中單擊“桌面”旁的特性箭頭。
  7. 桌面屬性頁出現(xiàn)在數(shù)據(jù)窗格中。

  8. 在桌面頁中,單擊“頻道和容器管理”鏈接。
  9. 顯示“頻道”頁面。容器路徑位于頂部。已定義的頻道出現(xiàn)在列表中。

  10. 單擊要修改的“搜索”頻道旁的“編輯特性”鏈接。
  11. 顯示“特性”頁面。

  12. 在“搜索服務器”特性中按以下格式指定搜索 URL:
  13. http://portal_server_name:port/portal/search

  14. 單擊“保存”。
  15. 要驗證“搜索 URL”,請執(zhí)行下列操作:
    1. 登錄到已配置了“搜索 URL”的組織。例如,按以下格式登錄到一個名為 B 的組織:
    2. http://portal_server_name:port/amserver/ui/login?org=B

    3. 通過搜索頻道執(zhí)行搜索。


管理搜索引擎

一旦已經初始配置了“搜索引擎”并生成了一個數(shù)據(jù)庫,就可以通過 Sun Java System Identity Server 管理控制臺查看和管理“搜索引擎”。

查看、管理及監(jiān)視搜索引擎操作

搜索引擎操作屬性有兩個級別:基本和高級。當從管理控制臺中選擇“搜索”服務后,默認情況下會顯示基本設置頁面。顯示出的基本設置包括服務器根目錄、臨時文件的位置以及文檔級安全。高級設置包括各種搜索引擎組件的日志位置和配置的日志級別。

此外,管理控制臺允許管理員查看日志文件或從日志文件中提取的特定信息。

查看或管理基本設置

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中,單擊“服務器”,然后單擊“設置”。
  6. 查看或指定搜索引擎的“服務器根”目錄。
  7. 查看或指定搜索引擎的“臨時文件”目錄。
  8. 查看或指定“文檔級安全”屬性。
  9. “關”表明所有用戶都可以訪問數(shù)據(jù)庫中的 RD?!伴_”表示必須對 RD 中的 ReadACL 字段求值,以決定用戶是否有權訪問 RD。

  10. 單擊“保存”,記錄所有更改的屬性。

查看或管理高級設置

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中,單擊“服務器”,然后單擊“高級”。
  6. 查看或指定“高級”屬性
  7. 可用屬性包括:“搜索”(rdm)、“禁用搜索日志”、“索引維護”、“RD 管理器”、“RDM 服務器”和“日志級別”。

  8. 單擊“保存”,記錄所有更改的設置。

監(jiān)視搜索引擎活動

“搜索引擎”提供了大量的報告,允許您監(jiān)視搜索操作。

要查看各種報告:

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 單擊“報告”。
  6. 單擊菜單欄中的某個鏈接,以查看某個特定報告。
  7. 以下是可以使用的報告選項:“啟動點”、“已排除的 URL”、“Robot 高級報告”、“日志文件”和“流行的搜索”。


管理 Robot

以下是一些管理 robot 可能需要完成的配置和維護任務:

定義站點

Robot 查找資源并決定是否(及如何)將這些資源的描述添加到數(shù)據(jù)庫中。決定要訪問哪個服務器以及要為這些服務器的哪些部分創(chuàng)建索引的過程稱為站點定義。

為搜索引擎定義站點是服務器管理員的最重要的工作之一。必須確保將 robot 發(fā)送給所有需要創(chuàng)建索引的服務器,但也需要排除那些能夠填寫數(shù)據(jù)庫的無關站點,這些站點增加了查找正確信息的難度。

定義 Robot 要創(chuàng)建索引的站點

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中,單擊 Robot,然后單擊“站點”。
  6. 要創(chuàng)建一個站點:
    1. 單擊“新建”。
    2. 選擇站點的類型(url 或域)。
    3. 指定站點和深度。
    4. 單擊“保存”。
  7. 要編輯站點屬性,請單擊“編輯”鏈接。
  8. 此操作會顯示一個包含站點屬性的窗體。有關“站點”屬性的信息,參見附錄 F,“搜索屬性”。

    1. 編輯屬性。
    2. 單擊“保存”。

控制 Robot 搜尋

Robot 對所選擇的要創(chuàng)建索引的各個站點進行搜尋。管理員可以控制 robot 搜索站點的方式,方法是定義搜尋操作參數(shù)。搜尋參數(shù)允許您定義速度、完成操作、記錄級別、符合的標準、驗證參數(shù)、代理設置、要跟隨鏈接的最大數(shù)目及其他設置。有關 Robot 搜尋屬性的說明,參見附錄 F,“搜索屬性”

控制 Robot 搜尋

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中單擊 Robot,然后單擊“搜尋”。
  6. 此操作會顯示一個窗體,其中包含定義“Robot 搜尋”操作參數(shù)及其設置的屬性。有關“Robot 搜尋”屬性的信息,參見附錄 F,“搜索屬性”

  7. 根據(jù)需要修改“Robot 搜尋”屬性。

    如果 jvm12.conf 文件中已經設置了代理(使用 http.proxyHost= 和 http.proxyPort= 選項),則必須選中“從任一主機接受命令”才能使 Robot 運行。


  8. 單擊“保存”。

過濾 Robot 數(shù)據(jù)

過濾器允許將某個資源的屬性與過濾器的定義進行比較,以此來確定一個資源,從而可以利用“站點”定義排除或包括該資源。Robot 帶有一些預定義的過濾器,在默認情況下會啟用其中的某些過濾器。下列過濾器是預定義的;默認情況下會啟用帶星號的文件。

  • 歸檔文件*
  • 音頻文件*
  • 備份文件*
  • 二進制文件*
  • CGI 文件*
  • 映像文件*
  • Java、JavaScript、式樣表文件*
  • 日志文件*
  • Power Point 文件
  • 修訂控制文件*
  • 源代碼文件*
  • 臨時文件*
  • 視頻文件*
  • 電子表格文件
  • Plug-in 文件
  • Lotus Domino 文檔
  • Lotus Domino OpenViews
  • System Directories (UNIX)
  • System Directories (NT)

要管理過濾進程,可以創(chuàng)建新過濾器定義、修改某個過濾器定義,或者啟用或禁用過濾器。

創(chuàng)建新過濾器定義

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中,選擇 Robot,然后選擇“過濾器”。
  6. 單擊“新建”,并為新過濾器指定一個“昵稱”。
  7. “過濾器定義”中,選中復選框并指定“過濾源”、“過濾條件”和“過濾字符串”值??筛鶕?jù)需要指定“過濾器定義”的數(shù)量。
  8. 輸入過濾器說明。
  9. 如果要在創(chuàng)建新站點時使用此過濾器,請選中“新站點”。
  10. 單擊相應按鈕,以指明是要包括還是要排除與此過濾器相匹配的資源。
  11. 單擊“保存”。

修改現(xiàn)有過濾器定義

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中,選擇 Robot,然后選擇“過濾器”。
  6. 在“過濾器規(guī)則”列表中找到要修改的“過濾器”,單擊“編輯”鏈接。
  7. 根據(jù)需要修改“過濾器”。
  8. 輸入過濾器說明。
  9. 單擊“保存”。

啟用或禁用過濾器

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中,選擇 Robot,然后選擇“過濾器”。
  6. 在“過濾器規(guī)則”列表中找到要修改的“過濾器”。
  7. 選擇相應按鈕,以指明要關閉還是打開過濾器。
  8. 單擊“保存”。

定義索引屬性

對于通過 robot 過濾器的每種資源,robot 會在數(shù)據(jù)庫中生成一個 RD。設置 RD 的生成時所做的選擇決定了用戶搜索數(shù)據(jù)庫時看到的內容。例如,可以選擇為每個文檔的全部文本創(chuàng)建索引,或者僅為文檔開頭的某些固定部分創(chuàng)建索引。

定義索引屬性:

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中,選擇 Robot,然后選擇“索引”。
  6. 此操作會顯示頁面,其中包含定義“Robot 索引”操作參數(shù)及其設置的屬性。有關“Robot 索引”屬性的信息,參見附錄 F,“搜索屬性”

  7. 根據(jù)需要修改“Robot 索引”屬性。
  8. 單擊“保存”。

使用 Robot 實用程序

Robot 包含兩個調試工具或實用程序:

  • 站點探測器 — 檢查 DNS 別名、服務器重定向、虛擬服務器等等。
  • 模擬器 — 在一個 URL 上執(zhí)行 robot 過濾的部分模擬。鍵入一個或多個 URL 進行檢查,并選擇“確定”。模擬器會指示 robot 是否接受所列出的站點。

運行站點探測器實用程序

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中,選擇 Robot,然后選擇“站點探測器”。
  6. 輸入要探測的站點的 URL。
  7. 如果希望探測器返回 DNS 信息,請單擊“顯示高級 DNS 信息”。
  8. 單擊“確定”啟動“站點探測器”。

運行模擬器

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中,選擇 Robot,然后選擇“模擬器”。
  6. 鍵入一個或多個要執(zhí)行模擬的 URL。
  7. 如果希望“模擬器”檢查別名,請選擇“檢查 DNS 別名”。
  8. 如果希望“模擬器”檢查重定向,請選擇“檢查服務器重定向”(302)。
  9. 單擊“確定”啟動“模擬器”。

制定 Robot 進度表

為確保及時搜索數(shù)據(jù),robot 應定期搜索站點并為站點創(chuàng)建索引。Robot 搜尋和創(chuàng)建索引可能消耗處理資源和網絡帶寬。為避免這些資源限制,應將 robot 安排在非使用高峰期運行。管理控制臺允許管理員設置一個 cron 作業(yè),它帶有運行 robot 的日期和時間。

制定 Robot 進度表

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中,選擇 Robot,然后選擇“進度表”。
  6. 選擇啟動 robot 的時間(小時和分鐘)和日期。
  7. 選擇停止 robot 的時間和日期。
  8. 單擊“保存”。


管理數(shù)據(jù)庫

“搜索引擎”將其資源描述存儲在一個數(shù)據(jù)庫中。以下是管理數(shù)據(jù)庫時可能需要執(zhí)行的一些配置和維護任務:

導入數(shù)據(jù)庫

通常,“搜索”數(shù)據(jù)庫中的項目來自 robot。告知 robot 要訪問哪個站點,然后 robot 會查找并描述在此站點找到的所有資源。但是也可以從其他 Sun Java System Portal Server“搜索引擎”、iPlanet Web Servers 或 Netscape? Enterprise Servers 或者由其他資源生成的數(shù)據(jù)庫中導入現(xiàn)有數(shù)據(jù)庫的項目。導入現(xiàn)有數(shù)據(jù)庫的 RD 而非發(fā)送 robot 來重新創(chuàng)建,這將有助于減少網絡流量,而且通過將工作量分成多個較小的部分,還能更迅速地完成大量的索引創(chuàng)建工作。如果中央數(shù)據(jù)庫距離要被索引的服務器很遠,則最好在本地生成 RD,然后在中央數(shù)據(jù)庫中定期導入各種遠程數(shù)據(jù)庫。

搜索引擎使用導入代理從其他服務器或數(shù)據(jù)庫導入 RD。導入代理是一個進程,它從外部資源中檢索若干 RD,并將這些信息合并到本地數(shù)據(jù)庫中。其中包含一些參數(shù),指示此代理導入 RD 的位置,到達此位置后的請求目標,以及調整作業(yè)處理方式的一些其他信息。

在導入數(shù)據(jù)庫前,必須創(chuàng)建導入代理。創(chuàng)建代理后,可以立即啟動導入進程或者安排運行導入進程的時間。

創(chuàng)建導入代理

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 選擇“數(shù)據(jù)庫”,然后單擊“導入代理”鏈接。
  6. 單擊“新建”。
  7. 出現(xiàn)導入代理的屬性頁面。

  8. 為導入代理指定相應的屬性。
  9. 有關“數(shù)據(jù)庫導入”屬性的信息,參見附錄 F,“搜索屬性”。

    1. 指出導入源是本地文件還是搜索服務器。
    2. 如果導入源是一個文件,請指定本地文件路徑。
    3. 如果導入源是其他搜索服務器,請指定遠程服務器的 URL、實例名和搜索 URI。
    4. 指定要導入的數(shù)據(jù)庫的名稱。
    5. 為導入代理指定字符集。
  10. 單擊“保存”。

編輯現(xiàn)有的導入代理

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 選擇“數(shù)據(jù)庫”,然后單擊“導入代理”鏈接。
  6. 單擊要編輯的代理右側的“編輯”鏈接。
  7. 為導入代理指定相應的屬性。
  8. 有關“數(shù)據(jù)庫導入”屬性的信息,參見附錄 F,“搜索屬性”。

  9. 單擊“保存”。

編輯資源描述

有時,您會發(fā)現(xiàn)必須更改一個或多個“資源描述”的內容。例如,可能需要對從原始文件復制到“資源描述”中的某個錯字進行更正。

編輯資源描述

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中,選擇“數(shù)據(jù)庫”,然后選擇“資源描述”。
  6. 選擇要搜索進行編輯的“資源描述”的類型。
  7. 可使用以下類型:所有 RD、未分類的 RD、分類的 RD、按類別劃分的 RD、按 URL 指定的 RD、包含的 RD。

  8. 對于包含的“資源描述”,在“資源描述”中指定要搜索的文本串。
  9. 單擊“搜索”。
  10. 從查找到的“資源描述”列表中,選擇要編輯的“資源描述”。
  11. 編輯相應的“資源描述”屬性。
  12. 單擊“保存”。

編輯數(shù)據(jù)庫模式

模式決定“搜索引擎”保持每一資源的何種信息以及保持信息的方式。模式的設計決定影響索引可用性的兩個因素:

  • 用戶可用來搜索資源的方式
  • 用戶查看資源信息的方式

對于數(shù)據(jù)庫中的“資源描述”,這種模式是一種主數(shù)據(jù)結構。根據(jù)使用這種數(shù)據(jù)結構定義字段和為字段創(chuàng)建索引的方式,用戶將具有不同的資源訪問級別。

這種模式與搜索引擎及其 robot 所用的文件結構密切相關。應只使用管理控制臺中的模式工具更改此數(shù)據(jù)結構。即使模式文件 (schema.rdm) 是一個文本文件,也始終不能直接對其編輯。

您可以編輯搜索引擎的數(shù)據(jù)庫模式,來添加新模式屬性、編輯模式屬性或刪除這些屬性。

此模式包括下列屬性:

  • 可編輯 — 如果選中此項,表示屬性將顯示在“資源描述編輯器”中,因此可以更改它的值?!百Y源描述編輯器”在編輯資源描述中介紹。
  • 可建索引 — 該屬性表示字段顯示在“高級搜索”屏幕的彈出式菜單中。它允許用戶搜索此特定字段中的值。
  • 描述 — 這是用來描述模式的文本串。可以將其用于注釋或評注。
  • 別名 — 該屬性允許您定義別名,用來將已導入的數(shù)據(jù)庫模式名稱轉換成您自己的模式名稱。

編輯數(shù)據(jù)庫模式

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中,選擇“數(shù)據(jù)庫”,然后選擇“模式”。
  6. 出現(xiàn)模式屬性頁。

  7. 在模式中添加新屬性:
    1. 選擇“模式列表”下的“新建”。
    2. 在“名稱”和“描述”字段中,為新屬性輸入名稱和描述。
    3. 選中“可編輯”,允許編輯屬性。
    4. 選中“可建索引”,以便能夠為屬性建立索引。
  8. 要使現(xiàn)有的模式屬性可編輯或可建索引:
    1. 單擊模式列表中某個屬性旁的“編輯”鏈接。
    2. 出現(xiàn)模式屬性頁。

    3. 選中“可編輯”,允許編輯屬性。
    4. 選中“可建索引”,以便能夠為屬性建立索引。
    5. 單擊“更新”
  9. 要刪除某個屬性:
    1. 在模式列表中選中某個屬性。
    2. 單擊“刪除”。

    3. 更改搜索引擎模式可能需要為整個數(shù)據(jù)庫重新建立索引,并重新啟動服務器。這是因為搜索引擎的突出顯示功能對模式字段的順序和類型很敏感。添加或刪除(或者即使刪除后再添加回來)一個文本字段極有可能導致突出顯示的搜索結果不正確。


定義模式別名

在下述情況下,您可能會發(fā)現(xiàn)數(shù)據(jù)庫模式中使用的字段名稱之間存在差異。一種情況是當您將“資源描述”從一個服務器導入另一個服務器時。您無法始終保證這兩個服務器對各自模式中的項目使用相同的名稱。同樣,當 robot 將某個文檔中的 HTML META 標記轉換成模式字段時,該文檔對這些名稱進行控制。

搜索引擎允許您為模式屬性定義模式別名,以便將這些外部模式名映射到數(shù)據(jù)庫中的有效字段名。

定義模式別名

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 選擇“數(shù)據(jù)庫”,然后單擊“模式”鏈接。
  6. 出現(xiàn)模式屬性頁。

  7. 單擊要定義別名的屬性。
  8. 指定別名的字段名(與在導入數(shù)據(jù)庫中所用的名稱相同)。
  9. 單擊“更新”。
  10. 單擊“重建索引”。
  11. 對于大型數(shù)據(jù)庫,重建索引的過程可能需要幾個小時。

查看數(shù)據(jù)庫分析

“搜索引擎”提供一個報告,該報告包含有關已創(chuàng)建索引的站點數(shù)量以及來自數(shù)據(jù)庫中每個站點的資源數(shù)量的信息。

查看數(shù)據(jù)庫分析信息

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中,選擇“數(shù)據(jù)庫”,然后選擇“分析”。
  6. 顯示包含已排序的所有站點以及當前搜索數(shù)據(jù)庫中該站點的資源數(shù)量的列表。

  7. 要生成最新的列表,請單擊“保存”。

重建數(shù)據(jù)庫索引

在某些特殊情況下,可能需要為“搜索引擎”重新建立“資源描述”數(shù)據(jù)庫的索引。一個明顯的例子是,編輯了模式來添加或刪除已建立索引的字段后,需要執(zhí)行此操作。

如果磁盤錯誤破壞了索引文件,也可能需要重建該數(shù)據(jù)庫的索引。在添加了大量新的“資源描述”后,最好也重建索引。

重建數(shù)據(jù)庫索引可能需要幾個小時。

重建數(shù)據(jù)庫索引所需的時間與數(shù)據(jù)庫中的記錄數(shù)成正比,因此,如果是大型數(shù)據(jù)庫,應在服務器處于非需求高峰時進行重建索引。

重建數(shù)據(jù)庫索引

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 選擇“數(shù)據(jù)庫”,然后選擇“管理”。
  6. 單擊“數(shù)據(jù)庫列表”下的“重建索引”。
  7. 選中“是否重新建立數(shù)據(jù)庫的索引?”復選框,然后單擊“確定”。
  8. 搜索引擎重新建立搜索集合及其索引文件。

終止數(shù)據(jù)庫

終止數(shù)據(jù)庫將終止被認為到期的“資源描述”。僅當運行終止程序時,“資源描述”才到期。到期的“資源描述”將被刪除,但數(shù)據(jù)庫大小不會減少。

要終止數(shù)據(jù)庫:

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 選擇“數(shù)據(jù)庫”,然后選擇“管理”。
  6. 選擇“數(shù)據(jù)庫列表”下的“終止”。
  7. 選中“終止 RD?”復選框,然后單擊“確定”。

清除數(shù)據(jù)庫

“資源描述”的屬性之一是其到期日期。Robot 可以通過 HTML META 標記或通過資源服務器提供的信息設置到期日期。除非資源指定了不同的到期日期,否則“資源描述”的到期日期默認為自創(chuàng)建之日起三個月后。搜索引擎會從其數(shù)據(jù)庫中定期清除到期的“資源描述”。

清除操作允許您刪除數(shù)據(jù)庫的內容。索引使用的磁盤空間將被恢復,但主數(shù)據(jù)庫使用的磁盤空間不會被恢復,而是在將新數(shù)據(jù)添加到數(shù)據(jù)庫中時重新使用。

清除服務器中到期的資源描述:

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 選擇“數(shù)據(jù)庫”,然后選擇“管理”。
  6. 選擇“數(shù)據(jù)庫列表”下的“清除”。
  7. 選中“是否清除數(shù)據(jù)庫?”復選框,然后單擊“確定”。
  8. 完成清除操作后,系統(tǒng)顯示如下消息:“成功清除數(shù)據(jù)庫內容”。

將數(shù)據(jù)庫分區(qū)

搜索引擎允許您將包含搜索數(shù)據(jù)庫的物理文件劃分到多個磁盤、文件系統(tǒng)、目錄或分區(qū)中。通過將數(shù)據(jù)庫分布到不同的物理或邏輯設備上,就可以創(chuàng)建一個比能在單個設備上創(chuàng)建的數(shù)據(jù)庫更大的數(shù)據(jù)庫。

默認情況下,搜索引擎將數(shù)據(jù)庫設置為僅使用一個目錄。命令行界面允許您對數(shù)據(jù)庫分區(qū)執(zhí)行兩種操作:

  • 添加新分區(qū)
  • 移動分區(qū)

搜索引擎不執(zhí)行任何檢查操作來確保單個分區(qū)有剩余空間。而是由您負責為數(shù)據(jù)庫保持足夠的可用空間。

添加新數(shù)據(jù)庫分區(qū)的最大總數(shù)為 15 個。


增加分區(qū)數(shù)后,如果以后想再減少此數(shù)目,則必須刪除整個數(shù)據(jù)庫。


可通過指定新位置的名稱來更改任意數(shù)據(jù)庫分區(qū)的物理位置。同樣,可以重新命名現(xiàn)有分區(qū)。使用 rdmgr 命令來處理分區(qū)。有關 rdmgr 命令的信息,參見第 21 章,“命令行實用程序”。


管理數(shù)據(jù)庫分類法

以下是管理數(shù)據(jù)庫分類法可能需要執(zhí)行的一些配置和維護任務:

配置類別

使用 Sun Java System Identity Server 管理控制臺可以執(zhí)行下列程序,來配置數(shù)據(jù)庫分類法:

創(chuàng)建子類別

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中選擇“類別”,然后選擇“類別編輯器”。
  6. 選擇一個要在其中創(chuàng)建子類別的類別。
  7. 如果事先沒有定義任何類別,將只列出標題為“搜索”的根類別。單擊下一層“搜索”鏈接來展開根類別。

  8. 在“名稱”字段中,為該類別指定名稱。
  9. 在“說明”字段中,為該類別指定說明(可選項)。
  10. 單擊“作為子項添加”以創(chuàng)建類別。
  11. 單擊“保存”。

  12. 只要可見類別的列表跨越多個頁面,“類別編輯器”就會顯示一個轉到列表。使用上翻和下翻按鈕可以從當前頁向上或向下滾動一頁。使用轉到按鈕可以訪問多個頁面。


創(chuàng)建同級類別

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中選擇“類別”,然后選擇“類別編輯器”。
  6. 選擇一個要創(chuàng)建同級項的類別。
  7. 在“名稱”字段中,為該類別指定名稱。
  8. 在“說明”字段中,為該類別指定說明(可選項)。
  9. 單擊“作為同級項添加”以創(chuàng)建類別。
  10. 單擊“保存”。

  11. 只要可見類別的列表跨越多個頁面,“類別編輯器”就會顯示一個轉到列表。使用上翻和下翻按鈕可以從當前頁向上或向下滾動一頁。使用轉到按鈕可以訪問多個頁面。


更新類別

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中選擇“類別”,然后選擇“類別編輯器”。
  6. 選擇要更新的類別。
  7. 要更改類別名稱,請在“名稱”字段中為該類別指定新名稱。
  8. 要更改類別說明,請在“說明”字段中為該類別指定說明。
  9. 單擊“更新”。
  10. 單擊“保存”。

  11. 只要可見類別的列表跨越多個頁面,“類別編輯器”就會顯示一個轉到列表。使用上翻和下翻按鈕可以從當前頁向上或向下滾動一頁。使用轉到按鈕可以訪問多個頁面。


刪除類別

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中選擇“類別”,然后選擇“類別編輯器”。
  6. 選擇要刪除的類別。
  7. 當某個類別被刪除時,它的所有子類別也將被刪除。

  8. 單擊“刪除”。
  9. 單擊“保存”。

  10. 只要可見類別的列表跨越多個頁面,“類別編輯器”就會顯示一個轉到列表。使用上翻和下翻按鈕可以從當前頁向上或向下滾動一頁。使用轉到按鈕可以訪問多個頁面。


定義分類規(guī)則

分類規(guī)則是一個簡單的條件語句。其形式為“如果 <某條件> 為真,則將資源分配給 <類別>”。

定義分類規(guī)則

  1. 以管理員身份登錄到 Sun Java System Identity Server 管理控制臺。
  2. 默認情況下,位置窗格中的“身份認證管理”處于選中狀態(tài),導航窗格中會顯示所有已創(chuàng)建的組織。

  3. 在位置窗格中選擇“服務配置”。
  4. 在導航窗格中單擊搜索旁的特性箭頭。
  5. 在菜單欄中選擇“類別”,然后選擇“分類規(guī)則編輯器”。
  6. 如果要創(chuàng)建新規(guī)則,請單擊“新建”。
  7. 如果要編輯現(xiàn)有規(guī)則,請選擇此規(guī)則。
  8. 在下拉菜單中,單擊要用來將資源分類的元素類型或屬性。
  9. 單擊下拉菜單中的“比較測試”。
  10. 可用的對照測試有:是、包含、起始字符、結束字符或正則表達式。

  11. 定義要比較的文本字符串。
  12. 如果比較結果為真,則單擊要在其中對資源分類的類別。
  13. 單擊“保存”。



版權所有 2004 Sun Microsystems, Inc. 保留所有權利。

本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
對Google更新過程的最終解釋
搜索引擎原理
谷歌SEO實戰(zhàn)經驗:我是怎樣1周內將新網站DA和PA提升到10的?
速達軟件管理員密碼10秒鐘搞定
Web搜索引擎設計和實現(xiàn)分析
Deep Web(深層網絡or深度網絡)
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服