ITつれづれなるままに

サブドメインだけがGoogleさんにインデックスしてもらえない(泣)

2015/06/26

スポンサーリンク

このサイトのサブドメインを作って一生懸命サイト作成、やっとこ公開にまでこぎつけたのですが、なんと、サブドメインのサイトがまるごとインデックスされない事態に。

仕事の合間を見ながらここ二日間ぐらい調べまくったのですが、結論は

’そのまま何もしない(・∀・)’

でももしかして記事を書いたら、心優しい神様が間違いを指摘してくれるんじゃなかろうかと(本人は間違いは無いと思ってる)。

備忘録もかねて、’もう何もしね(笑)’って結論付けたまでの経緯を記載します。

サイトを公開してGoogleさんにインデックスされるまでの流れ

当サイト:Wordpress + STINGER5

1.Wordpressで全記事を公開にする。

全34記事。1記事あたり1000文字~2000文字ほどのボリューム。

2.Wordpressのインデックスさせない設定を元に戻す。

設定 ⇒ 表示設定 ⇒ 検索エンジンでの表示のチェックを外して変更を保存。

3.サイトマップの送信

Google XML Sitemapsプラグインを入れていますが、今回は勉強も兼ねてGoogleサーチコンソール(旧名称:Googleウェブマスターツール)から手動で送信。

ダッシュボード ⇒ クロール ⇒ サイトマップ ⇒ サイトマップの追加/テスト ⇒ sitemap.xmlを入力して送信

4.Fetch as GoogleでGoogleボットさんの召喚

ダッシュボード ⇒ クロール ⇒  Fetch as Google ⇒ 取得 ⇒ ステータス完了を確認 ⇒ インデックスに送信 ⇒ このURLのみをクロールするにチェックして送信

スポンサーリンク

Fetch as Googleしてからムンクの叫びになるまでの流れ

このサイト(irodorinet.com)の時はあっという間にインデックスされたので、サブドメイン(xxx.irodorinet.com)も問題ないだろってか、インデックスされることに疑いもなく就寝。

◇自作リンク一切なし

⇒サイトテーマが全く異なるので、このサイトからもサブドメインにリンクは貼ってない。

◇完全オリジナルコンテンツ

◇このサイトでペナルティは一度も受けたことなし

◇当然だけどブラックリストにも載ってない

◇一生懸命記事書いた

完全ホワイトサイト(最近ホワイトとブラックの違いを理解した)。

で朝起きてからいそいそとサーチコンソールを開く。

少しでもアクセスあるといいな。。。ん??なんかおかしい気が。。。

__
/('..`)、
.)ハ0((
/ / }}
{ノ  {ノ
{  {

サイトマップのところの青と赤の棒グラフが無ーーい!

ってか、なんかサイトマップの送信がエラーになってるーー!

この時点でパニック。なんでかってーと、そもそもこのサイトの環境をまるごと移植してサブドメインサイトを立ち上げたので、インデックスされないなんて事態を微塵も想定していなかったのだ。

頭のCPUをフル回転。

問題なかったこのサイトの環境と同じなので、考えられるとするとコンテンツに問題があるか、サブドメインとしての設定(robots.txt、.htaccess)に問題があるか。

でもよーく考えると、サイトマップが送信されてインデックスされないんだったら上記があてはまるかもだけど、サイトマップ自体が送信されないのって別の問題なんじゃ。。。

だとしたら、問題無いこのサイトと環境が同じだから、余計にわからん。

頭から湯気を出しつつググりまくる。

サイトマップの送信がうまくいかない。。。

お?Google XML Sitemapsプラグインの4.0xはサイトマップ送信がうまくいかないって記事を沢山発見ヽ(・∀・)ノ

でもちょと待てちょと待ておにーさん。サイトマップは手動で送信したんだけどな。。

とはいいつつ、この時点で既にお昼過ぎ。異様に疲れたのと、今後どうせプラグインのお世話になるんだから、今のうちに対策しておくことに決定。

Google XML Sitemaps 4でエラーが出た!旧バージョンに戻す方法

プラグインを戻して再度サイトマップ送信。。。

しばらくして保留?になった(と思うが記憶が定かでなく)。

ま、とにかくステータスが変わったからこれで大丈夫だろう。

(〃´o`)=3と一安心してこの日はおしまい。

朝起きてからまたムンクの叫びになるまでの流れ

昨日はえらい目にあったなー。

ま、これも経験!前向きに捉えなきゃ。

さてさて、少しでもアクセスあるといいな。。。ん??なんかおかしい気が。。。

__
/('..`)、
.)ハ0((
/ / }}
{ノ  {ノ
{  {

サイトマップのところの赤の棒グラフが無ーーい!

デジャブですか(´・ω・`)

サイトマップは正常に送信されて青い棒グラフがあるけど、赤い棒グラフは無くてインデックスに登録済みのところが保留のまま。

この時点でやっぱりパニック。意味無いかもだけど再度Fetch as Google。

とりあえず現環境に問題無いか調べてみよう。

やっぱり頭から湯気を出しつつググりまくる。

サブドメインでインデックスが登録されない。。。

ちょっとだけ長いキーワードで。

んーと、

◇エラーの表示もしくはエラー通知がGoogleから来ていませんか?

◇低品質コンテンツもしくはペナルティを受けるようなページはありませんか?

◇中古ドメインで過去にペナルティを受けていませんか?

◇ドメインの移設等で意図せずrobots.txtでボットを弾いていませんか?

◇rel="canonical"タグの誤使用でインデックスされてない状況にありませんか?

◇Googleページランクが低い(特に新規)ので、すぐにはインデックスされない可能性はありませんか?

ググった結果をざっとまとめるとこんな感じ。

下の3つは可能性があると思ったので、調査。

サブドメインの場合のrobot.txtおよび.htaccessの設定方法

サブドメインの場合は

フォルダ構成:/irodorinet/xxx

サブドメイン:xxx.irodorinet.com

となるため、サブドメインでのURLとルートドメインからディレクトリへのパスの二つのURLで同一のページにアクセスできてしまうことになります。

1.//xxx.irodorinet.com

2.//irodorinet.com/xxx/

このままでインデックスされると異なるURLの同一コンテンツ(二重コンテンツ)とみなされて非常にまずいので、.htaccessで1のURLにリダイレクト(正規化)させてあげる必要があります。

.htaccessの設定

以下を追加し、ルートディレクトリに設置。

Redirect permanent /xxx/ //xxx.irodorinet.com/

ルートディレクトリはサーバー環境によって違いますが、通常はpublic_htmlの下。Wordpressのフォルダやファイル(WP-)がずらっとあるところ。

robots.txtの設定

これが一番迷ったところ。

サーチコンソールで新たに追加されたレンダリング機能(サイトをイメージ含めて再現、チェックする機能)にも対応させたほうが良いとのことで、以下のように設定・配置。

ルートディレクトリ(public_html)配下:

User-agent: *
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /xxx/
Allow: /wp-includes/js/

Sitemap: //irodorinet.com/sitemap.xml

サブドメインディレクトリ(public_html/xxx)配下:

User-agent: *
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /wp-includes/js/

Sitemap: //xxx.irodorinet.com/sitemap.xml

つまりURLは正規化したけど、そもそもサブドメインのフォルダ構成もインデックスされる必要はないので、

◇ルートディレクトリではサブドメインフォルダをアクセス拒否(Disallow: /xxx/)

◇サーチコンソールのレンダリング機能のためにwp-adminとwp-includesのみをアクセス拒否し、wp-includes/js/は明示的に許可(Wordpress標準だと拒否されてレンダリング的によろしくないようで)。

◇robots.txtの設定は、同じ設定の場合のみ、階層が上の設定が階層が下の設定を上書き。

rel="canonical"タグの誤使用

設定した記憶はないが一応header.phpを見てみる。設定は無し。よってこの可能性は無し。

まとめ

としたところで、この日はおしまい。

ちなみにこの時点でサーチコンソール ⇒ ダッシュボード ⇒ クロール ⇒ クロールの統計情報を見ると、

__
/('..`)、
.)ハ0((
/ / }}
{ノ  {ノ
{  {

ボットさんが来てページにアクセスしてるーー!

けど1ページもインデックスされてなーーい!

丸二日間で3回もムンクになりましたヾ(°⌓。)ノ

robots.txtの設定と設置が問題ないと仮定すると、ページランクが低い(RANK0)のでインデックスされない(後回し)ってのが一番可能性が高いので、2~3日間は様子を見てみることに決め。

ちなみに今の時点では結局インデックスされなかった場合の対応策を考える余力がありません(笑)

結局どうなった?

インデックスされましたー(≧ο≦)人(≧V≦)ノ

18ページだけ(笑)

sitemap

ちなみにこのサイトはインデックス0になっていました(謎)。

__
/('..`)、
.)ハ0((
/ / }}
{ノ  {ノ
{  {

site://irodorinet.comでページが表示されるので、サーチコンソール上の表示上だけみたいですが、なんと投稿したばかりのこの記事がインデックスされていません(笑)

ともあれ一部ページがインデックスされたことで設定の問題ではないことがはっきりしたのと、総合して考えると更新頻度が低い=ページランクが低いサイトはインデックスも後回しにされるようです。

よく考えれば当たり前か。確かどこかでそのような記事を見かけたことが。。

なんだかんだとこの記事約半年振りだし(;^ω^)

反省しきりです。


-ITつれづれなるままに
-, , , ,

このボタンをクリックすると記事タイトルとURLがコピーされます。
メールやメモ帳などに貼り付けてご利用ください。

TOP