はてなモバイルゲートウェイの自動変換に関する robots.txt の設定メモ

http://hxxk.jp/2008/10/15/2212

記事データ

投稿者

望月真琴

投稿日時

2008-10-15T22:12+09:00

タグ
概要

検索エンジンのノイズにならないよう、 /moment/ のディレクトリを robots.txt で User-agent: * Disallow: /moment/ と巡回拒否を指定していましたが、 User-agent: Hatena-Mobile-Gateway Allow: /moment/ として例外的に自動変換を許可したので、その記述をメモ。

リプライ

リプライはまだありません。

記事本文

MOMENT がはてなモバイルゲートウェイに自動変換を許可していなかった件について

Twitter の post を停止していることについてにて Twitter の post を止めていることを書きましたが、 Twitter / hxxk 側には先に http://tinyurl.com/3v2sar 実験的に、ついったへの post を停止中です。 post を止めるだけでたまに DM とか replies はチェックしますよ、たぶん。 [tM] という post を残していました。

この http://tinyurl.com/3v2sar という短縮アドレスははてなモバイルゲートウェイを通して自動変換した MOMENT のことなのですが、実は最初にはてなモバイルゲートウェイを通した時は ご指定のページは変換が許可されておりません というメッセージが返ってきていました。

そんな変換拒否みたいなことしていたっけ ? と思って http://mgw.hatena.ne.jp/help を見てみると、自分のサイトを自動変換されたくない場合という項があります。

robots.txt を利用した変換拒否

robots.txtをホストのルートディレクトリに設置してください。 記述方法はロボット排除基準に準じます。 ロボット名は「Hatena-Mobile-Gateway」です。

User-agent: Hatena-Mobile-Gateway
Disallow: /

あー、そういえば検索エンジンのノイズにならないよう、 robots.txt で対処していたんでした。

User-agent: *
Disallow: /moment/

のように。 この記述だと検索エンジンのロボットだけでなく、 Hatena-Mobile-Gateway ロボットも拒否してしまうのも仕方ありません。

はてなモバイルゲートウェイに自動変換を許可する方法

さて、逆にはてなモバイルゲートウェイに自動変換を許可したい場合は ? 自分のサイトを自動変換されたくない場合には自動変換拒否の方法しか書かれてありませんが、その方法をヒントに記述を変えてみました。

User-agent: *
Disallow: /moment/

User-agent: Hatena-Mobile-Gateway
Allow: /moment/

このようにすれば、 /moment/ ディレクトリにおいて、ワイルドカードで全てのロボットを拒否し、ホワイトリスト方式で Hatena-Mobile-Gateway のみ許可することが可能です。

この記述を適宜書き換えて、逆に Allow する側にワイルドカードを指定して、特定のロボットだけ Disallow するということもできますね。 ということで自分用メモでした。

リプライ

リプライはまだ送られていないか、管理者の承認待ち状態です。

この記事に対するご意見やご質問、ご感想などありましたらこのフォームに簡潔に記入して下さい。 簡潔に記入できない場合や、関連記事にてご意見をお寄せいただく場合は、ご自身の weblog にて記事を書かれた上で あてにトラックバックとして送信してください。

記入フォーム

補足情報

著作、講演、制作実績など