ウェブページヘッダとボディ
HTML文書のは、基本的には、ウェブページ[ヘッド]と[ウェブ】体組成物です。
最も外側のラベルのHTML文書は<HTML>、<head>要素と<body>要素内にネストされなければなりません。<head>要素は、まずページを表す基本的なページ構造であるページ、[、<body>要素は、[本体表す]を。
<HTML>
_______ <HEAD>
_______(ページヘッダの具体的な内容)
_______ </ HEAD>
_______ <BODY>
_______(具体的には、ページボディコンテンツ)
_______ </ BODY>
</ HTML>
これらは、HTML(スケッチ)(あまりにも図式化ではない)の基本構造です。
コンテンツHTML文書やWebページには、一から一でなければなりません。
しかし、ヘッド【ページ】コンテンツは、ブラウザでページのボディに直接レンダリングされず、ページ[体]の内容は、ページの本体に直接表示されます。
まず見た目の<head>要素であり、[ヘッド]のページ:
<head>
<meta charset="utf-8">
<title>网页的名字</title>
</head>
<メタ文字セット=「UTF-8は 」> HTMLドキュメントの文字エンコーディングを定義します。
<タイトル>要素は、ページのタイトルを定義するために使用されます。表示中のコンテンツブラウザタブいます。
ページ上で直接見られるように方法はありません[ヘッド]は、Webページのコードでは、コンテンツのタブは、ページの本文に属していません。
<BODY>要素、すなわち、[体]ページ、コンテンツがウェブページに表示されます。
これらは、ページヘッダとページ本体の基本的な内容です。
コンテンツの詳細に関しては、<Body>要素のコンテンツの多くは、サイト全体のレイアウト、カバー、すべての後に、そこにある
モジュール、テキストサイズ、色などを。話すために、次のいずれかをご利用いただけます。
次のステップは、HTMLを読み込むためにどのようにPythonの爬虫類4を合理化することになります。
クラスの賛成理論的基礎の前の記事では、開始後にそのようなデータを取得するために、Webページを修正するよう、実践的な操作があるでしょう。
( - テキストあなたはあなたの助けのために、このシリーズの爬虫類を考える場合、どのようなみんなのサポートは私にもっとモチベーションを奨励され、それ~~賞賛を指します)