SNS

2014年10月9日木曜日

Google Sitemap Generatorを自社サイトに設置しました。

Google Sitemap Generatorとは、google公式っぽいジェネレーター(サイトマップを自動に作成するもの)を自社サイトに設置しようとした記録を残します。

  • まず初めに、サイトサーバーが「Python」が動くか確認。

  • 次に、Google Sitemap Generatorをダウンロードする。
    Google Webmaster Tool⇒1. Downloading the Sitemap Generator program files項目のhttp://sourceforge.net/project/showfiles.php?group_id=137793&package_id=153422⇒sourceforgeページでダウンロード。

  • ダウンロードしたファイルを解凍して、中にあるexample_config.xml.txtとpython sitemap_gen.pyファイルを利用する。(そのほかは不要かと。?)

  • example_config.xmlファイルが設定ファイルなので、名前を変え、txt拡張子を外し、xmlファイルにした。
    サイト名_config.xmlみたいに変更。

  • 次に中身を書き換える。
    ・2行目の<!--から33行までのコメント削除。
    ・34行目の<サイトマップ作成する場所の指定>

    base_url=”http://www.ドメイン.com/”・・・サイトマップ作成範囲の上位フォルダやサイトトップページ(※①)
    store_into=”/サーバのルートからの絶対パス/sitemap.xml.gz”・・・これは、サイトを作る際に、関係するサーバーのアドレス。サイトマップファイルを出力するgzファイルまで。(※②)
    verbose=”1″
    >

    ・40行目の<!--から59行までのコメント削除。

    ・60行目の<サイトマップ出力形式の指定>
     href=”http://www.ドメイン.com/”・・・※①と同じ
     changefreq=”weekly”
     priority=”0.5″
    />

    ・67行目の<!--から90行までのコメント削除。

    ・91行目の<パスの指定>
    directory
    path=”/サーバのルートからサイトマップを作成するサイトのルートまでの絶対パス/”・・・※①と同じ
    url=”http://www.ドメイン.com/”・・・※①と同じ
    『default_file=”index.html”』私は削除。

    ・98行目の<!--から155行までのコメントやログ記述等削除。

    ・159行目のアクセスログの指定(含む・除外するフィルター設定。)
     <filter action=”drop” type=”wildcard” pattern=”*/除外するフォルダ名/*” />の記述がベース。
     passは許可。dropは除外の意味。
     ※書き方はpassで通過させてdropで除外する事。大きい網から小さい網に。

    ・保存してアップロード。

  • telnetを使い、サーバーにログインするのだが、試行錯誤したが難しいので、ソフトを使う。

    ・「 Poderosa 」を使用。

    ・起動して、新規接続を設定。設定後ログイン・・・うまくログイン。
     ※サーバから退出(ログアウト)するときは、「logout」もしくは「exit」と入力する事。

    ・次にpython sitemap_gen.py –config=サイト名_config.xml –testing コマンドを入力すのですが、私は、ログインしたページ(階層が上層なので、)python sitemap_gen.pyファイルがある階層へ移動。
    「移動方法はこのページを参照。」

    ・私が使ったのは、
     ● ディレクトリ内のファイル・ディレクトリの表示 ls [ディレクトリ名:省略可能]
     ● ディレクトリの移動(下の階層に移動する) cd [ディレクトリ]
     ● ディレクトリの移動(上の階層に移動する) cd ..
     ● ディレクトリの移動(いっきに移動) cd /aaa/bbb ルート(/)からの絶対パスで指定
     ● 現在いるディレクトリのパスを表示 pwd

    ・python sitemap_gen.py –config=サイト名_config.xml –testingを試し、エラーが会った所は、削ったり訂正。するとうまく通過して、指定の場所にsitemap.xml.gzファイルが出現。URLが多いとsitemap1/2とindexファイルが作成される。

  • 最後に、サイトマップが更新されるように、サーバー設定でCRON設定。

    ・実行するコマンドは、私のサーバーでは、
     /usr/local/bin/python /home/*****/www/sitemap_gen.py --config=/home/*****/www/サイト名_config.xml

    ・ /home/からwwwまでは①を参考にsitemap_gen.pyファイルまでのパスconfig.xmlも同様に。
    ・***** は自分に割り当てられたディレクトリ名
    ・ 記述の /python /home/ で n と / の間に半角スペース( )を入れるのを忘れずに

    以上設定もうまくゆき、完成。


0 件のコメント:

コメントを投稿