ホームパートナー製品Google

導入と管理

導入と管理


導入前に

Google Miniの導入にあたり、以下のチェックシートをご記入いただくことで、導入時の手間やタイムコストを大きく削減することができます。

調査項目あなたの環境
購入チェックシート
対象となるドキュメント数    数
(今後増加するドキュメント数)    数/  月
設置場所の確認 OK | NG
ネットワーク設定チェックシート
IPアドレス 
サブネットマスク 
デフォルトゲートウェイ 
DNSサーバ(複数可) 
DNSサフィックス 
SMTPサーバ 
アラート等通知先メールアドレス 
NTPサーバ 
環境設定チェックシート
管理者アカウントのパスワード 
テストに使用できるWEBサーバのURL 
初期運用チェックシート
クロール開始URLhttp://
検索結果デザイン標準 | カスタマイズ(簡易) | カスタマイズ(XSL) 


チェック項目の確認方法

【対象となるドキュメントの確認】

Google Miniにて検索する予定のドキュメント数をあらかじめ確認します。この確認により、購入するGoogle Miniのエディションを決定します。
ここでは、OSやサービスの内容によりカウントの方法が変わります。ここでは、ドキュメントの数え方の方法を記載します。


●for Linux (samba等)

Samba等でWindows共有を行っているLinux(UNIX系OS全般)では、findコマンドとwcコマンドを組み合わせます。

find [対象ディレクトリ] -type f | wc -l

実行例
$ find /home/PublicShare -type f | wc -l
26058

例では、/home/PublicShareディレクトリに、約 2万6千ドキュメントが格納されていることがわかります。


●for Windows

Windows Serverの場合では、フォルダーのプロパティに容易にカウントすることができます。
対象となるフォルダのプロパティを表示すると、以下のようにファイル数が表示されます。(赤枠の中です)

検索対象ファイル数

例では、D:\RAID5\PublicShareに 約1万1千ドキュメントがあることがわかります。


●for Webサイト

Webサイトの構成が静的なものであれば、前述の方法でファイル数をカウントする方法が有効です。
しかし、プログラムとデータベース等で動的にページを作成している場合は、実際にページを取得してみるまで、ドキュメント数が確定しません。
いくつか方法はありますが、wgetを使ってページ数をカウントする方法を記載します。

※注意:ここでは wgetをLinuxの上で動作させます。Windows用 wgetもあります。googleでwget windowsとしてみてください。
※注意:自社サイトのみに行ってください。

wgetをmirrorモードで起動させ、find+wcにてファイル数をカウントする方法があります。
mirrorモードで起動すると、標準では wgetを実行したディレクトリの直下に、ホスト名でディレクトリが作成されます。

$ wget --mirror [start URL]

実行例では、/tmpディレクトリにてhttp://www.plathome.co.jpを基点にコンテンツを取得することにします。

【実行例】

$ cd /tmp
$ wget --mirror http://www.plathome.co.jp

--17:44:47--  http://www.plathome.co.jp/
           => `www.plathome.co.jp/index.html'
www.plathome.co.jp をDNSに問いあわせています... 202.32.197.41
www.plathome.co.jp[202.32.197.41]:80 に接続しています... 接続しました。
HTTP による接続要求を送信しました、応答を待っています... 200 OK
長さ: 特定できません [text/html]
Last-modified ヘッダがありません -- 日付を無効にします。
--17:44:48--  http://www.plathome.co.jp/
           => `www.plathome.co.jp/index.html'
www.plathome.co.jp[202.32.197.41]:80 に接続しています... 接続しました。
HTTP による接続要求を送信しました、応答を待っています... 200 OK
長さ: 特定できません [text/html]

    [ <=>                                                                         ] 9,709
         --.--K/s

17:44:48 (16.62 MB/s) - `www.plathome.co.jp/index.html' を保存しました [9709]

robots.txtを読み込んでいます、エラーは無視してください。
--17:44:48--  http://www.plathome.co.jp/robots.txt
           => `www.plathome.co.jp/robots.txt'
www.plathome.co.jp[202.32.197.41]:80 に接続しています... 接続しました。
HTTP による接続要求を送信しました、応答を待っています... 200 OK
長さ: 82 [text/plain]
大きさが合わないので(ローカルは 94)、転送します。
--17:44:48--  http://www.plathome.co.jp/robots.txt
           => `www.plathome.co.jp/robots.txt'
www.plathome.co.jp[202.32.197.41]:80 に接続しています... 接続しました。
HTTP による接続要求を送信しました、応答を待っています... 200 OK
長さ: 82 [text/plain]

100%[============================================================================>] 82
            --.--K/s

17:44:48 (138.78 KB/s) - `www.plathome.co.jp/robots.txt' を保存しました [82/82]
・
・
・
・
・
・
XX:XX:XX (1.78 KB/s) - `www.plathome.co.jp/agency/google/index.html' を保存しました [82/82]

$ find /tmp/www.plathome.co.jp | wc -l
14202

※この方法では、画像ファイルもカウントされてしまいます。-nameオプションや grepなどでフィルタしてください


設置場所の確認

Google Miniのコンパクトさは、「小さく前ならえ」をしていただくことで、簡単にイメージいただけます。
そのひじから指先までの長さが、Google Miniの筐体奥行きとほとんど同じなのです。

Google Miniの奥行き

ネットワーク環境の確認

Google Miniが稼動するに当たっては、以下のネットワーク的要件を満たしていることが必要です。

  1. Google Mini用の固定IPアドレスが必要です。
  2. NTP(version3)サーバが必要です。(pool.ntp.org等の公開NTPサーバでもOK) 正確な時刻でないと、ライセンス認証ができなくなることがあるようです。(インストールマニュアルにも記載)

検索結果の表示方法

【標準を使用する場合】

検索結果のデザインを検討しておきます。
標準で用意されている結果はGoogleテイストになります。

クリックで拡大
クリックで拡大


【カスタマイズ(簡易)】

以下の項目を変更するのであれば、管理画面からで簡単に変更できます。


【カスタマイズ(XSLスタイルシート)】

簡易なカスタマイズでは満足できない場合は、XSLスタイルシートを使用して、表示のカスタマイズを行います。
実は、Google Miniの本当の意味での検索結果は、XMLです。
そしてGoogle MiniにはXSLTサーバが搭載されており、検索結果のXMLを変換してHTMLとしているのです。
当社では、XPathのsubstring等を使用し、検索結果のURLの中に特定文字が含まれていたら、画像を表示する。といったカスタマイズを行いました。

標準の検索結果

クリックで拡大
クリックで拡大

XSLカスタマイズの例

クリックで拡大
クリックで拡大


Google Miniが届いてから

上記チェックシートをご記入いただいていれば、Google Miniが届いたその日から、Googleパワーを体感できます。


設置

ラックへの固定方法は、

  1. 前面と背面にブラケットを取り付けて確実に固定する方法
  2. 前面のみにブラケットを取り付けて、前面ネジのみで固定する方法

があります。実際の使用感としては、前面と背面で固定する方法を推奨します。


Google Mini 設定用端末の用意と設定

Google Miniを設定するには、DHCPクライアントPC(=設定用PC)が必要です。(ノートパソコンが良いでしょう)
Google Miniは、ネットワークのポートを2つ持っています。一つは通常のサービスに使用します。もう一つはGoogle Mini設定時に使用するポート(=管理用ポート)です。
管理用ポートではDHCPサーバが稼動しており、設定用PCを接続すると、すぐに初期設定ができる状態になっています。
設定はWebブラウザにて行います。あらかじめ決めておいた設定値を元に入力してください。

 

ページの先頭へ戻る