SEOまとめ - 代々木で働く22歳大学生のブログ

SEOと検索エンジン

Webマーケティング

メルマガ
アフィリエイト
RSS
プレスリリース
Twitter
SEM(Search Engine Marketing)
- PPC(Pay Per Click)クリック課金の広告
- SEO(Search Engine Optimization)検索エンジン最適化←ここ

SEOとは、検索エンジンを利用するユーザーが入力するキーワードを導線としたキーワードマーケティング

キーワードとカテゴリーの設計 web担当者、マーチャンダイザー、インフォメーションアーキテクト
内的施策サイトのドメイン名やURL構成、HTML/CSSなどサイトの内側に施す対策　←ここ
外的施策 PageRank(価値やキーワードの関連性が高いページやドメイン、サイトからどのくらいのリンクを受け取っているか、被リンクがあるか)を上げるための対策 ex メディアサイトに取り上げてもらう、ブロガーにリンクを貼ってもらう。

検索エンジンの技術的な仕組み

検索エンジンの種類
- ディレクトリ型人間が作ったリンク集。整理、審査されているため探しやすいが、ほとんどがサイト単位
- ロボット型ソフトウェアによる自動収集型。ページ単位にインデックスしているため、情報が膨大クローラーがHTTPプロトコルでコンテンツを取得 →インデクサーが取得したコンテンツを解析し、分析結果とそのファイル自体をデータベースに保存。その際キーワードごとの検索結果も作成。 →クエリサーバーがユーザーからの検索クエリー（キーワード）の結果ページを返す

PageRank

「多くの良質なページからリンクされているページはやはり良質なページである」という再帰的な関係を元に全てのページの重要度を判定したもので、ランクされていないのPageRank 0 ~ 10までの全部で11段階の評価になっている。

被リンク数（リンクされているリンクの数）
評価の高いページからのリンクかどうか
リンク元ページでの放出リンク数（貼ってあるリンクの数）

検索エンジンのシェア googleとyahooが主 https://seopack.jp/seoblog/20160816-s-e-share/

SEOサイクルとクローラビリティー（webサイトをいかに巡回しやすいか）

SEOサイクル

診断　アクセス解析・仮説
設計　コンテンツ・SEO・カテゴリー・キーワード設計
実行　HTML/CSS作成、開発、リリース
外的施策　インバウンドリンク対策、メディア対策、プレスリリース

SEO対策の三つのポイント

クローラビリティ（クローラーのサイト回避のしやすさ）
- ステータスコードを返す
- URL永続化（一度公開して検索エンジンにインデックスされたコンテンツに対し、そのコンテンツが存在し続ける限り同一のURLを使用し続けること）
- URL正規化（そのキーワードを表すURLはそのサイト内で一つのみ存在する、そのコンテンツはそのサイト内で一つのみの存在する）
  - キーワードが分散している（/apple, /apple/index.php）
  - ページを進んで戻ってくるとURLが変化している（/camera/list→/camera/list/1）
  - トップページへのリンクの分散化（http://www.example.com, http://example.com, http://www.example.com/index.html） → 301リダイレクト
  - 大文字小文字や最後の/の有無が揃っていない
- URL静的化（http://hoge.com/dir/file.html?query=fuga < http://hoge.com/dir/file/query/fuga）
- クロールできるa要素とリンク構造
  - リンクを貼る際は内容的に関連するページに貼るリンクが効果的
  - 1ページから放出する（に貼られている）リンク数は最大でも100本を目安に設計
キーワード・キーフレーズ
アンサー度（ユーザのニーズを満たせているかどうか）

キーワード

キーワードとは
- 言葉の一致
- キーワードの守備範囲
- キーワードの人気度の調査
- キーワーードのグループ構成
キーワードの選定
- 潜在顧客の検索行動の洗い出し
- 人気度・コンバージョン・競合度の調査
- キーワードのグループ分けと優先順位づけ
形態素分析
カテゴリー
- 複数のカテゴリー軸の組み合わせ

アンサー度

アンサー度とは
テーマの一致
多様性
検索語タイプ

HTMLの最適化（これからはじめるSEOの教科書）←ここ

1, title

2, meta description

3, mata keywords

4, h1

5, h2~h6

6, ul, ol

7, strong

8, center

9, imag

10, リンクの最適な使い方（どういうリンクを貼るべきか）

11, ドキュメント宣言

12, headタグ内で必要なものと不必要なものの仕分け

13, 重要キーワードが重要位置にあるか

14, ページ内が適正な文字数・文字比率になるようチェックしよう

15, HTML内の贅肉を落としスリム体質にしよう

16, 重要ではないタグやキーワードを下方に移動させよう

17, パンくずリストを作成しよう

18, サイトマップを作ろう

19, 内部リンクを張り巡らそう

20, ファイルサイズを縮小化しよう

21, 美しいソースコードに修正

22, URL正規化でバックリンク分散を回避しよう（複数存在のURLを一つに統一）

23, 足を引っ張り合うミラーサイトをなくそう

24, SEO対策が行われているかをチェック（http://ferret-plus.com）

25, 上位表示に必要なURLの付け方

26, NGタグの撤廃・改善

27, スパムについて

アクセスログとインデックス状況の分析

アクセスログ

アクセス解析に使う狭義のアクセスログ＝webサーバーの生ログ（webサーバーが生成するテキストファイル）

リファラー＝あるwebページのリンクをクリックして別のページに移動した時のリンク元のページ。

Apache(Linux, UNIX系) Combined, Common　※リファラー情報がない、でも容量が多いから保管場所には注意
IIS(Windows系) W3C Extended(W3C拡張) 自由にフォーマットを変更できるヘッダー領域。

リファラーから検索キーワードがわかる。

インデックス数

クロールされているからといって、インデックスされているとは限らない。したがって定期的にインデックス数を確認する必要がある。

webの管理ツール
検索エンジンコマンド http://himazines.com/web/seo-keyword-kensaku-command/

分析手法

コンバージョン分析
被リンク数
PageRank
検索順位
視聴率

アクセス解析の導入

https://analytics.google.com/analytics/web/#report/defaultid/a49424310w110721923p115496641/

ASP(Application Service Provider)側のサーバーに置かれているJSのタグを全ページに貼り付ける。ページがロードされるとJSのプログラムがCookieの有無を調べCookieが未発行だったり有効期限が過ぎていたりした場合は新規にCookieを発行したりすることで、情報を自動的にASP側に集約していく。JSを実行できないページ（リダイレクトページ、ファイルのダウンロード、ロボットのアクセス）は解析対象にできない。

このCookieには以下を使うASPがある

ファーストパーティcookie 現在閲覧しているサイトと同じドメインが発行するcookie →google analytics
サードパーティー cookie 現在閲覧しているサイトとは異なるドメイン、例えばアクセス解析 ASPのドメインが発行するcookie

バケットキャプチャー型

データセンターにネットワーク上を流れるパケットを受信できる機材を用意して、パケットの中身を取り出して集計する。どんなトラフィックでも解析が可能。リダイレクトやファイルのダウンロードのようなものも対象にできる

生ログ型

生ログを解析する。JS, Cookie, ネットワーク機器に依存していないため、ほぼどんなシステムを利用していても分析が可能。携帯電話からのアクセスが携帯キャリアの設置するゲートウェイサーバーになっているため、ログにそのサーバのIPアドレスが記録されるため、複数の携帯電話からのアクセスが一つのセッションにまとまってしまう。

検索エンジンスパム

スパムとは、検索エンジンのアルゴリズムを利用して、意図的に検索順位を上げようとする検索エンジンにとっての迷惑行為。あらかじめ自分のサイトにしかけをしておき、クローラーやインデクサーを騙してサイトの評価をあげ、自然検索結果の露出を高める行為。

ペナルティ

一時的もしくは恒久的に意図的に検索順位を下げられる
一番のキーワードで検索結果に出なくなる
そのドメインごと、検索結果に表示されなくなる

ソフトウェアでのチェック→目視でのチェック

スパム手法

HTML系
- 隠しテキスト
- 隠しリンク
- 極小フォント
- キーワード反復
- CSS系
サーバ系
- ドアウェイページ、リダイレクト
- クローキング
- 複製コンテンツ

DNSスパムはDNSのワイルドカードを利用してサブドメインを大量作成し、検索エンジンに登録する行為

外部リンク系
- リンクファーム、有料リンク

検索エンジンの制御

robots.txt

クローラーにインデックスやクローリングの制御情報を渡すにはrobots.txtというファイルをやりとりする必要がある。 http://www.robotstxt.org/robotstxt.html https://support.google.com/webmasters/answer/6062608?hl=en https://moz.com/learn/seo/robotstxt

サイトのルートディレクトリに設置しておくことで、クローラーがHTTPプロトコルをGETして内容を読み取り、その内容にそったクローリングをしてくれる。

http://www.google.co.jp/robots.txt

どのロボットに対する指示か
アクセス拒否するディレクトリやファイルの列挙
noindex 検索結果に表示されない、表示する、pagerankはつく、キャッシュもされる。
nofollow このページから、クロールさせる、させないの指示をする

Sitemaps

https://www.sitemaps.org/index.html

googleが策定した規約で、URLの一覧をxmlファイルやテキストファイルで通知する方式インデックスの促進が目的なので、検索順位に影響が出るわけではない。

縮退運転

クローラーが来ているタイミングでサイトを停止させないため

データベースモデリング

レスポンスが遅いのは検索エンジン側からするとよくない

並び順重要なものを上に表示する必要があるので、それを考える必要がある。例　その季節のものを上に表示するようにする
エイリアスキーワードの別名を格納する
事前計算複雑なクロスカテゴリーなどの場合に、件数を計算しておき、0件の場合は表示しないようにするみたいな
マルチアサインとマスターカテゴリー一つのカテゴリーが二つの親カテゴリーに紐づくことがある。構造上二つの上位カテゴリーに属していることにする必要があり、そうするとURLの正規性を保つことができる。
キーワードカテゴリー、ショートカットカテゴリーキーワードでの関連性で関連のあるリンクを作るようにする
ID体系とURLの関係リレーション変更によってURLが変更されないようにDB設計する必要がある