ステップ3 HTML流線Pythonのクローラベース(下)ヘッドと、Webページのボディ

ウェブページヘッダとボディ
HTML文書のは、基本的には、ウェブページ[ヘッド]と[ウェブ】体組成物です。

最も外側のラベルのHTML文書は<HTML>、<head>要素と<body>要素内にネストされなければなりません。<head>要素は、まずページを表す基本的なページ構造であるページ、[、<body>要素は、[本体表す]を。

<HTML>

_______ <HEAD>
_______(ページヘッダの具体的な内容)
_______ </ HEAD>

_______ <BODY>
_______(具体的には、ページボディコンテンツ)
_______ </ BODY>

</ HTML>

これらは、HTML(スケッチ)(あまりにも図式化ではない)の基本構造です。

コンテンツHTML文書やWebページには、一から一でなければなりません。
しかし、ヘッド【ページ】コンテンツは、ブラウザでページのボディに直接レンダリングされず、ページ[体]の内容は、ページの本体に直接表示されます。

まず見た目の<head>要素であり、[ヘッド]のページ:

<head>
	<meta charset="utf-8"> 
	<title>网页的名字</title>
</head>

<メタ文字セット=「UTF-8は 」> HTMLドキュメントの文字エンコーディングを定義します。
<タイトル>要素は、ページのタイトルを定義するために使用されます。表示中のコンテンツブラウザタブいます。
ページ上で直接見られるように方法はありません[ヘッド]は、Webページのコードでは、コンテンツのタブは、ページの本文に属していません。
<BODY>要素、すなわち、[体]ページ、コンテンツがウェブページに表示されます。

これらは、ページヘッダとページ本体の基本的な内容です。

コンテンツの詳細に関しては、<Body>要素のコンテンツの多くは、サイト全体のレイアウト、カバー、すべての後に、そこにある
モジュール、テキストサイズ、色などを。話すために、次のいずれかをご利用いただけます。

次のステップは、HTMLを読み込むためにどのようにPythonの爬虫類4を合理化することになります。
クラスの賛成理論的基礎の前の記事では、開始後にそのようなデータを取得するために、Webページを修正するよう、実践的な操作があるでしょう。

( - テキストあなたはあなたの助けのために、このシリーズの爬虫類を考える場合、どのようなみんなのサポートは私にもっとモチベーションを奨励され、それ~~賞賛を指します)

リリース3元の記事 ウォン称賛22 ビュー1485

おすすめ

転載: blog.csdn.net/LoraRae/article/details/104348775