Pythonのチュートリアル:同じPythonの、あまりにも大きな違いは、私たちは学ばなければなりません

先週末Python2とのpython3は私が狂った運転得ることができます!

私たちは、問題を発見しました

金曜日のテスト同僚が自分のユーザー名は、また、中国、ああすることができますどのように私に言いましたか?私の心が望んでいたその時、あなたはインターフェイスは確かにミスを犯したテストし、私は定期的に\ wのフィルタパラメータを使用して、どのようにPythonの正規のシステムが間違っている場合を除き、それは確かに不可能ああです、間違って行くことができます。厳格なスタイルで、私自身の最初のテスト、私は戻って嫌い方法を参照するには問題ありません。私がテストしたときしかし、私は無知な力、中国は本当にああではない、検証されていますので、私はああは問題をテストしていない、パラメータをフィルタリングするために使用しましたか?本当の不思議!長い時間のように、唯一の違いは、今のpython3を使用しています。

インターネット検索は、周りと分化の過程で、平等に扱われているPython2とのpython3通常の文字列についての記事を見つけていない、私はそれが再び公式の文書を知って、彼らはそれがあったかを理解するであろうに見えます。

繰り返し発生する問題

我々はすべて知っているように、Pythonはほとんどのオンラインブログ記事のすべてがこのルールは、英数字と一致するとアンダースコア、あなたに伝えるために、定期的なルール\ wを持っていますが、そうではありません。

次のようにPython2コードがあります:

~|⇒ pythonPython 2.7.10 (default, Aug 17 2018, 19:45:58)
[GCC 4.2.1 Compatible Apple LLVM 10.0.0 (clang-1000.0.42)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> import re>>> aa = '捕蛇者说'>>> re.match('\w{1,20}', aa)>>> bb = 'abc123ADB'>>> re.match('\w{1,20}', bb)
<_sre.SRE_Match object at 0x1031b0b28>

私たちはpython2で、\ wは中国にマッチすることができないことがわかります。まあ、のpython3結果を実行するために、同じコードは、それが何であるのですか?

~|⇒ python3Python 3.7.1 (default, Nov 28 2018, 11:55:14)
[Clang 9.0.0 (clang-900.0.39.2)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> import re>>> aa = '捕蛇者说'>>> re.match('\w{1,20}', aa)
<re.Match object; span=(0, 4), match='捕蛇者说'>>>> bb = 'abc123ADB'>>> re.match('\w{1,20}', bb)
<re.Match object; span=(0, 9), match='abc123ADB'>

しかし、のpython3で\ wので中国語を一致させることができ、これは、それが起こるかありますか?この質問に答えるために、我々は答えを見つけるために、公式Pythonドキュメントに戻る必要があります。

この問題を解決します

私たちはPythonの公式ドキュメントを読んだとき、あなたは、Python2とのpython3の大きな違いは、我々はPython2を見てみましょうwは\同じ正規のルールのため、あります:

When the LOCALE and UNICODE flags are not specified, matches any alphanumeric character and the underscore; this is equivalent to the set [a-zA-Z0-9_]. With LOCALE, it will match the set [0-9_] plus whatever characters are defined as alphanumeric for the current locale. If UNICODE is set, this will match the characters [0-9_] plus whatever is classified as alphanumeric in the Unicode character properties database.

LOCALE(re.L)とUNICODE(re.U)マークが設定されていない場合は、マッチング英数字とアンダースコア、あなたはLOCALE(re.L)を設定し、マッチング番号がLOCALEのテキストを強調する場合:翻訳。あなたはUNICODE(re.U)マーク、一致する数字とUnicode文字セットにアンダースコア文字を設定した場合。

その後のpython3:

对于 Unicode (str) 样式:
匹配Unicode词语的字符,包含了可以构成词语的绝大部分字符,也包括数字和下划线。如果设置了 ASCII 标志,就只匹配 [a-zA-Z0-9_] 。
对于8位(bytes)样式:
匹配ASCII字符中的数字和字母和下划线,就是 [a-zA-Z0-9_] 。如果设置了 LOCALE 标记,就匹配当前语言区域的数字和字母和下划线。

これは、私がアンダーとUnicode文字セットは、デフォルトでは、すべてのフラグを設定していない、Python2 \ wは試合の数字wは英数字とアンダースコアを含む文字のASCII文字セット、のpython3 \と一致して、理解しています。あなたはUnicode文字セットの文字、指定されたフラグを一致させたい場合はそのため、あなたはASCII文字セットの文字を一致させたい場合は、移行を容易にするために、指定されたフラグがre.Aは、あるre.U.

概要

これ、私の問題は完全に解決されていますが、2回のレッスンがあります。

  • もっと注意を払うようにオンラインチュートリアルを見て、具体的には、差チュートリアル環境と自分の環境
  • より多くの公式文書を参照してください。

Python2とのpython3について、多くの違いがありますが、私たちが使用するときに注意する必要があります!ここではそれらを一覧表示し、メッセージを議論するために歓迎されていません。

もっとPythonのチュートリアルは誰を更新していきます!

おすすめ

転載: www.cnblogs.com/cherry-tang/p/10968947.html