隠れた情報源
|
|
|
HTML構文には、「本文」のほかにもうひとつ、ブラウザには表示されない「ヘッダー情報」があります。
ヘッダー情報は<HEAD>〜</HEAD>タグで指定します。
従って、HTMLドキュメントの基本構造は、実は左図のようになります。
ブラウザへの表示に関係のない情報って何でしょうか。そのいくつかを紹介しておきます。
|
|
タイトル
|
|
|
ブラウザ(IE)のタイトルバーに<TITLE>タグを使うと、文字を表示させることができます。
sample20.html
|
<HTML> <HEAD>
<TITLE>FujiMan Productionのホームページ</TITLE>
</HEAD>
<BODY>
<B>FujiMan Productionのホームページ</B>
</BODY> </HTML>
|
右のように記述すると、上のように表示されます。
このタイトルは、「お気に入り」に登録する際のホームページ名として利用されますので、設定しておくといいでしょう。
|
|
ドキュメント情報
|
|
|
ロボット検索エンジンを使っているポータル*1サイト(「goo」や「infoseek」など)では、このドキュメント情報を見てキーワードや要約文を集約しています。
つまり、この設定を行っておくことで、自動的にポータルサイトのデータベースに登録して貰えるわけです。
*1「ポータル」とは「玄関」の意味
次のふたつをうまく利用しましょう。
<HEAD> <TITLE>FujiMan Production HomePage</TITLE>
<META NAME="Keyword" CONTENT="阿南健治,ウェブマスター,デジカメ,日曜大工,フリー素材">
<META NAME="Description" CONTENT="個人の趣味を紹介しているサイトです。">
</HEAD>
|
ドキュメント情報は<META>タグで指定します。「NAME」オプションに続けて「情報の種別」を、
「CONTENT」に続けてその内容を記述します。
「Keyword」には、検索にかかりやすいように、ページの内容を端的に表す短い語句を指定します。
「Description」は、そのページの簡単な説明文を指定します。
|
|
ロボット検索拒否
|
|
|
反対にロボット検索にはかかって欲しくない場合は、次のように指定します。
<HEAD> <TITLE>FujiMan Production HomePage</TITLE>
<META NAME="robots" CONTENT="noindex,nofollow">
</HEAD>
|
CONTENTの指定ですが・・・
ページ内検索を許可する場合は「index」、拒否する場合は「noindex」を指定します。
リンク先検索を許可する場合は「follow」、拒否する場合は「nofollow」を指定します。
注意点として、この1文は改行しないようにすることです。ロボットエンジンによってはうまく動作しないことがあるということです。
また、このマナーに従わないロボットもあるらしく(国内にはなかったと思います)、そういう意味では完全に拒否できるわけではありません。
|
|
その他のドキュメント情報
|
|
|
HTMLの記述に使用している「言語」を指定する場合は、次のようにします。
ただし、使用している言語のコード体系(エンコード)がよく分からない場合は指定しないほうが無難です。
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-2022-jp">
|
「JIS」コードを使用している場合は、このまま指定するといいでしょう。
「Shift-JIS」の場合は「charset=x-sjis」、「EUC」の場合は「x-euc-jp」などとします。
言語を特定したい場合は、「LANG="ja"」(日本語)を追加するといいでしょう。
|
|