- 停止服務的 IP/Domain Name
何謂 Off-line Browser?
-
Off-line Browser, 中文名稱為「離線瀏覽器」。
Off-line Browser 指一種應用程式, 此程式能夠自動抓取網頁,
並根據網頁中的連結, 以遞迴方式抓取其他網頁,
藉以漫遊全球資訊網取得所需資料。
類似的應用程式, 還包括:
Robots, Web Wanderers, Web Crawlers, Spiders, Worms, WebAnts, Internet Agent.
關於 Web Robots 的相關資料, 請參閱
"The Web Robots Pages"
使用 Off-line Browser 時應注意的原則
-
由於 Proxy Cache 的概念, 是以存放區域內、大多數人、近期內使用的資料為原則。
因此, Off-line Browser 的使用者, 如果要經由 Proxy Cache 抓取資料時,
請務必設定正確。 因為不當的設定, 會造成 Proxy Cache 的效率降低,
相對的影響到區域內其他使用者的權益。
在設定時, 應注意下列原則:
- 遞迴抓取的深度、 範圍等準則是否適當。
- 同時間可建立的最大連結數量是否適當。
- 發出請求 (request) 的間隔時間是否適當。
根據台大 Proxy 近幾個月來的觀察, 正常的使用狀況如下:
- 每人每日對於 Proxy 所發出的 http request 數量, 應低於 20,000 次。
- 每人每日透過 Proxy 取得的資料總量, 應低於 200 MBytes。
台大 Proxy Cache 對於 Off-line Browser 的管理原則
-
為了提高台大 Proxy Cache 的服務品質, 台大 Proxy 對於 Off-line Browser 的使用,
管理原則如下:
- 超出正常使用狀況的使用者, 將列為觀察對象。
- 連續多日超出正常使用狀況的使用者, 我們將視情況停止為其服務。
- 連續多日超出正常使用狀況、 並且是抓取色情資料的使用者,
我們將停止為其服務。
- 停止服務的對象, 公告於 Proxy 的網頁上。
|