Как использовать функцию urllib.parse.unquote() для декодирования URL в Python 3.x

Как использовать функцию urllib.parse.unquote() для декодирования URL в Python 3.x

В библиотеке Python urllib модуль urllib.parse предоставляет ряд служебных функций для кодирования и декодирования URL-адресов, среди которых функция urllib.parse.unquote() может использоваться для декодирования URL-адресов. В этой статье описывается, как использовать функцию urllib.parse.unquote() для декодирования URL-адресов, и приводятся примеры кода.

Кодирование URL-адресов часто встречается при выполнении сетевых запросов или при манипулировании строками URL-адресов. Кодирование URL-адресов заключается в кодировании определенных символов в специальном формате для передачи или хранения в сети. И когда нам нужно получить фактический контент из URL-адреса, нам нужно его декодировать.

Функция Python urllib.parse.unquote() может декодировать закодированные символы в URL-адресе в соответствующую строку. Функция определяется следующим образом:

urllib.parse.unquote (строка, кодировка = 'utf-8', ошибки = 'заменить')

Описание параметра:

  • строка: строка URL для декодирования.
  • кодировка: кодировка, используемая при декодировании, по умолчанию — UTF-8.
  • ошибки: метод обработки при возникновении ошибки при декодировании, по умолчанию — «заменить», то есть символ, который не может быть декодирован, заменяется на «?».

Ниже приведен пример, демонстрирующий использование функции urllib.parse.unquote() для декодирования:

import urllib.parse

# 需要解码的 URL
encoded_url = 'https://www.example.com/%E6%B5%8B%E8%AF%95%E5%AD%97%E7%AC%A6%E4%B8%B2'

# 对 URL 进行解码
decoded_url = urllib.parse.unquote(encoded_url)

# 打印解码后的 URL
print(decoded_url)

В приведенном выше коде мы сначала определяем URL-адрес, который необходимо декодировать и который содержит закодированную строку. Затем используйте функцию urllib.parse.unquote() для декодирования URL-адреса, чтобы получить декодированный URL-адрес. Наконец, распечатайте декодированный URL-адрес, чтобы увидеть декодированный результат.

Запустите приведенный выше код, вывод будет следующим:

https://www.example.com/测试字符串

Вы можете видеть, что закодированная строка в декодированном URL-адресе была правильно преобразована обратно в соответствующие символы.

Помимо декодирования всего URL-адреса, функция urllib.parse.unquote() также может декодировать определенные части URL-адреса. Например, чтобы декодировать параметры строки запроса в URL-адресе:

import urllib.parse

# 需要解码的查询字符串参数
encoded_param = 'q%23=%E6%B5%8B%E8%AF%95'

# 对查询字符串参数进行解码
decoded_param = urllib.parse.unquote(encoded_param)

# 打印解码后的查询字符串参数
print(decoded_param)

Запустите приведенный выше код, вывод будет следующим:

q#=测试

Как видите, декодированные параметры строки запроса были правильно преобразованы обратно в соответствующие символы. В реальной разработке мы можем декодировать определенные части URL-адреса по мере необходимости для последующей обработки.

Описание:
В этой статье рассказывается, как использовать функцию urllib.parse.unquote() для декодирования URL-адресов в Python 3.x. Используйте эту функцию, чтобы легко декодировать закодированную строку в URL-адресе в соответствующие символы для последующей обработки. Во время разработки вы можете выбрать декодирование всего URL-адреса или части содержимого в соответствии с фактическими потребностями для удовлетворения конкретных потребностей бизнеса. Я надеюсь, что эта статья поможет вам изучить и использовать функцию Python urllib.parse.unquote().

Выше приведены подробности того, как использовать функцию urllib.parse.unquote() для декодирования URL-адресов в Python 3.x.

Acho que você gosta

Origin blog.csdn.net/lmrylll/article/details/132167416
Recomendado
Clasificación