導入と管理
導入前に
Google Miniの導入にあたり、以下のチェックシートをご記入いただくことで、導入時の手間やタイムコストを大きく削減することができます。
| 調査項目 | あなたの環境 |
|---|---|
| 購入チェックシート | |
| 対象となるドキュメント数 | 数 |
| (今後増加するドキュメント数) | 数/ 月 |
| 設置場所の確認 | OK | NG |
| ネットワーク設定チェックシート | |
| IPアドレス | |
| サブネットマスク | |
| デフォルトゲートウェイ | |
| DNSサーバ(複数可) | |
| DNSサフィックス | |
| SMTPサーバ | |
| アラート等通知先メールアドレス | |
| NTPサーバ | |
| 環境設定チェックシート | |
| 管理者アカウントのパスワード | |
| テストに使用できるWEBサーバのURL | |
| 初期運用チェックシート | |
| クロール開始URL | http:// |
| 検索結果デザイン | 標準 | カスタマイズ(簡易) | カスタマイズ(XSL) |
チェック項目の確認方法
【対象となるドキュメントの確認】
ここでは、OSやサービスの内容によりカウントの方法が変わります。ここでは、ドキュメントの数え方の方法を記載します。
●for Linux (samba等)
実行例
$ find /home/PublicShare -type f | wc -l
26058
例では、/home/PublicShareディレクトリに、約 2万6千ドキュメントが格納されていることがわかります。
●for Windows
対象となるフォルダのプロパティを表示すると、以下のようにファイル数が表示されます。(赤枠の中です)

例では、D:\RAID5\PublicShareに 約1万1千ドキュメントがあることがわかります。
●for Webサイト
しかし、プログラムとデータベース等で動的にページを作成している場合は、実際にページを取得してみるまで、ドキュメント数が確定しません。
いくつか方法はありますが、wgetを使ってページ数をカウントする方法を記載します。
※注意:ここでは wgetをLinuxの上で動作させます。Windows用 wgetもあります。googleでwget windowsとしてみてください。
※注意:自社サイトのみに行ってください。
wgetをmirrorモードで起動させ、find+wcにてファイル数をカウントする方法があります。
mirrorモードで起動すると、標準では wgetを実行したディレクトリの直下に、ホスト名でディレクトリが作成されます。
実行例では、/tmpディレクトリにてhttp://www.plathome.co.jpを基点にコンテンツを取得することにします。
【実行例】
$ cd /tmp
$ wget --mirror http://www.plathome.co.jp
--17:44:47-- http://www.plathome.co.jp/
=> `www.plathome.co.jp/index.html'
www.plathome.co.jp をDNSに問いあわせています... 202.32.197.41
www.plathome.co.jp[202.32.197.41]:80 に接続しています... 接続しました。
HTTP による接続要求を送信しました、応答を待っています... 200 OK
長さ: 特定できません [text/html]
Last-modified ヘッダがありません -- 日付を無効にします。
--17:44:48-- http://www.plathome.co.jp/
=> `www.plathome.co.jp/index.html'
www.plathome.co.jp[202.32.197.41]:80 に接続しています... 接続しました。
HTTP による接続要求を送信しました、応答を待っています... 200 OK
長さ: 特定できません [text/html]
[ <=> ] 9,709
--.--K/s
17:44:48 (16.62 MB/s) - `www.plathome.co.jp/index.html' を保存しました [9709]
robots.txtを読み込んでいます、エラーは無視してください。
--17:44:48-- http://www.plathome.co.jp/robots.txt
=> `www.plathome.co.jp/robots.txt'
www.plathome.co.jp[202.32.197.41]:80 に接続しています... 接続しました。
HTTP による接続要求を送信しました、応答を待っています... 200 OK
長さ: 82 [text/plain]
大きさが合わないので(ローカルは 94)、転送します。
--17:44:48-- http://www.plathome.co.jp/robots.txt
=> `www.plathome.co.jp/robots.txt'
www.plathome.co.jp[202.32.197.41]:80 に接続しています... 接続しました。
HTTP による接続要求を送信しました、応答を待っています... 200 OK
長さ: 82 [text/plain]
100%[============================================================================>] 82
--.--K/s
17:44:48 (138.78 KB/s) - `www.plathome.co.jp/robots.txt' を保存しました [82/82]
・
・
・
・
・
・
XX:XX:XX (1.78 KB/s) - `www.plathome.co.jp/agency/google/index.html' を保存しました [82/82]
$ find /tmp/www.plathome.co.jp | wc -l
14202
※この方法では、画像ファイルもカウントされてしまいます。-nameオプションや grepなどでフィルタしてください
設置場所の確認
Google Miniのコンパクトさは、「小さく前ならえ」をしていただくことで、簡単にイメージいただけます。
そのひじから指先までの長さが、Google Miniの筐体奥行きとほとんど同じなのです。
ネットワーク環境の確認
Google Miniが稼動するに当たっては、以下のネットワーク的要件を満たしていることが必要です。
-
Google Mini用の固定IPアドレスが必要です。
NTP(version3)サーバが必要です。(pool.ntp.org等の公開NTPサーバでもOK) 正確な時刻でないと、ライセンス認証ができなくなることがあるようです。(インストールマニュアルにも記載)
検索結果の表示方法
【標準を使用する場合】
標準で用意されている結果はGoogleテイストになります。
【カスタマイズ(簡易)】
- 右上のロゴ
- 全体のフォント
- ヘッダHTMLとフッタHTML (<body>の直後にヘッダHTMLが、</body>直前にフッタHTMLが入るようになります。)
- 検索を実行するボタンのデザイン (名前を変えたり、画像が使用できます。) 結果の各項目の表示/非表示
【カスタマイズ(XSLスタイルシート)】
実は、Google Miniの本当の意味での検索結果は、XMLです。
そしてGoogle MiniにはXSLTサーバが搭載されており、検索結果のXMLを変換してHTMLとしているのです。
当社では、XPathのsubstring等を使用し、検索結果のURLの中に特定文字が含まれていたら、画像を表示する。といったカスタマイズを行いました。
Google Miniが届いてから
上記チェックシートをご記入いただいていれば、Google Miniが届いたその日から、Googleパワーを体感できます。
設置
ラックへの固定方法は、
- 前面と背面にブラケットを取り付けて確実に固定する方法
- 前面のみにブラケットを取り付けて、前面ネジのみで固定する方法
があります。実際の使用感としては、前面と背面で固定する方法を推奨します。
Google Mini 設定用端末の用意と設定
Google Miniを設定するには、DHCPクライアントPC(=設定用PC)が必要です。(ノートパソコンが良いでしょう)
Google Miniは、ネットワークのポートを2つ持っています。一つは通常のサービスに使用します。もう一つはGoogle Mini設定時に使用するポート(=管理用ポート)です。
管理用ポートではDHCPサーバが稼動しており、設定用PCを接続すると、すぐに初期設定ができる状態になっています。
設定はWebブラウザにて行います。あらかじめ決めておいた設定値を元に入力してください。


