Python:URL扩展器
我该如何编写一个python程序,它从文本文件中读取短URL列表,并对其进行扩展,然后将它们转储到另一个文件中?Python:URL扩展器
我需要为每个链接找到最近的重定向(返回“200 OK”),并且不知道从哪里开始。
可以使用requests
模块解析URL重定向:
import requests
url = '...'
response = requests.head(url)
if response.is_redirect:
print(response.headers['Location'])
我以前正在查看类似的示例,但它们似乎适用于逐个链接的基础。我不得不扩展1000个URL,并想知道我是否可以通过从文本文件中读取URL来制作循环?我知道我想做什么,只是不知道该怎么做,或者如果这是一个好主意。 –
@ Blips-n-Chitz我认为你需要从一个Python教程开始,它将向你展示如何编写循环。 –
非常感谢!我现在要找一个! –
一种方式做,这将是使用Mechanize库这样:
import mechanize
br = mechanize.Browser()
br.set_handle_robots(False)
fLong = open("longURL.txt", 'w')
with open("shortURL.txt",'r') as fShort:
for url in fShort:
br.open(url)
fLong.write(br.geturl() + '\n')
fLong.close()
开始做一个文本文件与URL,make和'openFile()'函数读取URL并将它们扩展到您喜欢的地方并将它们写入另一个文件。你必须展示你尝试过的东西的一些努力和代码。此网站用于帮助其他人使用他们的代码,而不是编写它;-) –
当然!我只是无法入门,因为我对python知之甚少! –
好吧,尝试编写一个函数,打开并读取文件,从那里谷歌和stackoverflow是你最好的朋友。也许尝试一些关于codeacademy的学习来让你开始? –