在CookieJar中放置一个`Cookie`
我正在使用新的Python请求库来发出http请求。我从服务器获取一个cookie作为文本。我怎么把它变成一个CookieJar
与它的cookie?在CookieJar中放置一个`Cookie`
我很困惑这个问题。请求库将cookie放入jar中。
import requests
import cookielib
URL = '...whatever...'
jar = cookielib.CookieJar()
r = requests.get(URL, cookies=jar)
r = requests.get(URL, cookies=jar)
URL的第一个请求将填充jar。第二个请求会将cookies发送回服务器。标准库的urllib模块cookielib也是如此。 (doc目前可用于2.x版本)
啊,不知道。谢谢。 –
刚发布的新版本(v0.6.0)允许您使用简单字典将cookie附加到请求。 http://docs.python-requests.org/en/latest/user/quickstart/#cookies –
谢谢!这让我意识到,在webtest中,testapp.post(url)会将任何收到的cookie添加到testapps cookiejar中。 –
试试这个网站:Voidspace article
多年来,我发现voidspace是做这种东西非常有用的岁月。希望我能帮上忙,虽然我相当笨拙。尽管下载文件是一个“.py-”文件,但代码可在Voidspace Recipes 处作为源代码.py。
对于这么简单的任务真的太复杂了。我猜我唯一能做的就是等待'requests'来实现cookie处理。 –
我是一名网络程序员,但我主要参与发送cookie。因为公司互联网不允许程序化网络潜水,所以我会在回家后进行修改。 –
刚发布的新版本(v0.6.0)允许您使用简单字典将cookie附加到请求。 http://docs.python-requests.org/en/latest/user/quickstart/#cookies –
我正在尝试做同样的事情。这是我迄今为止,并由于某种原因,它不是在标题中发送cookie。尽管如此,它可能会帮助你解决问题。
import requests
import cookielib
import logging
log = logging.getLogger(__name__)
def auth(auth_url, cookies):
cj = cookielib.CookieJar()
for x in cookies:
if len(cookies[x]) > 0:
ck = cookielib.Cookie(version=1, name=x, value=cookies[x],
port=None, port_specified=False, domain='.example.com',
domain_specified=True,
domain_initial_dot=True, path='/',
path_specified=True, secure=False,
expires=None, discard=True,
comment=None, comment_url=None,
rest=None, rfc2109=True)
log.info(ck)
cj.set_cookie(ck)
log.info("cookies = %s " % cj)
response = requests.get(auth_url, cookies=cj)
log.info("response %s \n" % response)
log.info("response.headers %s \n" % response.headers)
log.info("response.content %s \n" % response.content)
刚发布的新版本(v0.6.0)允许您使用简单字典将cookie附加到请求中。 http://docs.python-requests.org/en/latest/user/quickstart/#cookies –
@Kenneth Reitz真棒,谢谢。 –
为了帮助你,我写了一个完整的模块。我试着用我的个人网页和谷歌的cookies,所以我会假设它的工作原理。
我得到的帮助来自How to add cookie to existing cookielib CookieJar instance in Python?
我在这里包括半杂牌很多unpythonic代码,所以你的里程可能会有所不同。按照你的意愿调整它,特别是假设的项目(例如端口80),下面的“请求”作为参数是requests.request类型,我意识到“方法”参数必须是全部大写。希望我能帮忙!
注意:我没有时间添加注释以便澄清,因此您必须使用源代码。
import Cookie,cookielib,requests,datetime,time #had this out but realized later I needed it when I continued testing
def time_to_tuple(time_string):
wday = {'Mon':0,'Tue':1,'Wed':2,'Thu':3,'Fri':4,'Sat':5,'Sun':6}
mon = {'Jan':1,'Feb':2,'Mar':3,'Apr':4,'May':5,'Jun':6,'Jul':7,'Aug':8,'Sep':9,'Oct':10,'Nov':11,'Dec':12}
info = time_string.split(' ')
info = [i.strip() for i in info if type(i)==str]
month = None
for i in info:
if '-' in i:
tmp = i.split('-')
for m in tmp:
try:
tmp2 = int(m)
if tmp2<31:
mday = tmp2
elif tmp2 > 2000:
year = tmp2
except:
for key in mon:
if m.lower() in key.lower():
month = mon[key]
elif ':' in i:
tmp = i.split(':')
if len(tmp)==2:
hour = int(tmp[0])
minute = int(tmp[1])
if len(tmp)==3:
hour = int(tmp[0])
minute = int(tmp[1])
second = int(tmp[2])
else:
for item in wday:
if ((i.lower() in item.lower()) or (item.lower() in i.lower())):
day = wday[item]
if month is None:
for item in mon:
if ((i.lower() in item.lower()) or (item.lower() in i.lower())):
month = mon[item]
return year,month,mday,hour,minute,second
def timefrom(year,month,mday,hour,minute,second):
time_now = time.gmtime()
datetime_now = datetime.datetime(time_now.tm_year,time_now.tm_mon,
time_now.tm_mday,time_now.tm_hour,
time_now.tm_min,time_now.tm_sec)
then = datetime.datetime(year,month,mday,hour,minute,second)
return (datetime_now-then).total_seconds()
def timeto(year,month,mday,hour,minute,second):
return -1*timefrom(year,month,mday,hour,minute,second)
##['comment', 'domain', 'secure', 'expires', 'max-age', 'version', 'path', 'httponly']
def parse_request(request):
headers = request.headers
cookieinfo = headers['set-cookie'].split(';')
name = 'Undefined'
port=80
port_specified=True
c = Cookie.SmartCookie(headers['set-cookie'])
cj = cookielib.CookieJar()
for m in c.values():
value = m.coded_value
domain = m['domain']
expires = m['expires']
if type(expires) == str:
tmp = time_to_tuple(expires)
expires = timeto(tmp[0],tmp[1],tmp[2],tmp[3],tmp[4],tmp[5])
max_age=m['max-age']
version = m['version']
if version == '':
version = 0
path = m['path']
httponly = m['httponly']
if httponly == '':
if 'httponly' in headers['set-cookie'].lower():
httponly = True
else:
httponly = False
secure = m['secure']
comment=m['comment']
port = 80
port_specified=False
domain_specified=True
domain_initial_dot = domain.startswith('.')
path_specified=True
discard = True
comment_url=None
rest={'HttpOnly':httponly}
rfc2109=False
ck = cookielib.Cookie(version,name,value,port,port_specified,domain,
domain_specified,domain_initial_dot,path,path_specified,
secure,expires,discard,comment,comment_url,rest,rfc2109)
cj.set_cookie(ck)
return cj
我有name =“undefined”,因为我一直无法找出名字的位置。如果有人能指出哪里,我会很乐意更新代码。 –
如果你有太多的cookies(我怀疑cookie的作用),请随意使用yield而不是return。 –
刚发布的新版本(v0.6.0)允许您使用简单字典将cookie附加到请求。 http://docs.python-requests.org/en/latest/user/quickstart/#cookies –
那么cookielib.LWPCookieJar就有加载和保存方法。查看格式并查看它是否与原生cookie格式相匹配,您可以使用StringIO直接将cookie加载到cookie jar中。或者,如果请求使用的是引擎盖下的urllib2,那么您是否可以将cookie处理程序添加到默认的opener?
假设您已请求url
并且您得到了headers
作为响应。类型的url
是字符串。类型的headers
是列表。
import urllib2
import cookielib
class dummyResponse:
def __init__(self,headers):
self.headers=headers
def info(self):
return dummyInfo(self.headers)
class dummyInfo:
def __init__(self,headers):
self.headers=headers
def getheaders(self,key):
#Headers are in the form: 'Set-Cookie: key=val\r\n'. We want 'key=val'
newMatches=[]
for header in self.headers:
if header.lower().startswith(key.lower()):
clearHeader=header[len(key)+1:].strip()
newMatches.append(clearHeader)
return newMatches
req=urllib2.Request(url)
resp=dummyResponse(headers)
jar=cookielib.CookieJar()
jar.extract_cookies(resp, req)
A请求Session
也将接收和发送饼干。
s = requests.Session()
s.get('http://httpbin.org/cookies/set/sessioncookie/123456789')
r = s.get("http://httpbin.org/cookies")
print(r.text)
# '{"cookies": {"sessioncookie": "123456789"}}'
(以上代码从http://www.python-requests.org/en/latest/user/advanced/#session-objects被盗)
如果你想饼干坚持在你的代码的运行之间的磁盘,你可以直接使用cookie罐和保存/加载它们。比较烦琐,但还是很容易:
import requests
import cookielib
cookie_file = '/tmp/cookies'
cj = cookielib.LWPCookieJar(cookie_file)
# Load existing cookies (file might not yet exist)
try:
cj.load()
except:
pass
s = requests.Session()
s.cookies = cj
s.get('http://httpbin.org/cookies/set/sessioncookie/123456789')
r = s.get("http://httpbin.org/cookies")
# Save cookies to disk, even session cookies
cj.save(ignore_discard=True)
然后看该文件中:
$ cat /tmp/cookies
#LWP-Cookies-2.0
Set-Cookie3: sessioncookie=123456789; path="/"; domain="httpbin.org"; path_spec; discard; version=0
由于dstanek answered,请求将自动把响应饼干的饼干罐为您服务。
但是,如果您手动指定一个Cookie
标题条目,请求不会将这些cookie放在一个jar中供您使用。这意味着后续的任何请求都将缺少您的初始Cookie,但将会有新的cookies出现。
如果确实需要手动为请求创建cookie jar,请使用requests.cookies.RequestsCookieJar
。如果他们的示例代码的变化:
jar = requests.cookies.RequestsCookieJar()
jar.set('tasty_cookie', 'yum', domain='httpbin.org', path='/cookies')
jar.set('gross_cookie', 'blech', domain='httpbin.org', path='/elsewhere')
url = 'http://httpbin.org/cookies'
r = requests.get(url, cookies=jar)
请注意,如果您提供的cookie罐和一个Cookie
头,头优先,但饼干罐仍将维持将来的请求。
我看到你的Python邮件列表消息,我在这里看到你绝望的原因。 –
我看不到它。最重要的答案是什么如此糟糕/令人费解? – panzi
最好的答案非常好,我被之前的答案迫切地解决了。 –