Python CookieJar - Google Analytics 设置的 Cookie
我对这种情况有点困惑。我正在编写一个登录网站的脚本。我正在使用 CookieJar 并且登录方法工作得很好。
如果我尝试显示 cookieJar 内容:
for index, cookie in enumerate(cw.cj):
print index, ':', cookie
我得到的 cookie 为:
0 : <Cookie C4CSESSID=tqb2qn92du8i9k5r4vnpd83i73 for www.example.com/>
但是在我的 Firefox 中,如果我在 cookie 编辑器中查找该域(事实上,没有 www),我还可以看到 google 分析的域( __utma、__utmc 等)。
我怎样才能在cj中捕获这个cookie? 我的目标是能够修改 __utmb cookie 内容。 (我可以从 FF 做到这一点,但我也想从脚本中做到)
谢谢
I'm a little bit confused about this situation. I'm working on a script to login into a website. I'm using CookieJar and the login method is working just fine.
If I try to display the cookieJar content:
for index, cookie in enumerate(cw.cj):
print index, ':', cookie
I get a cookie as:
0 : <Cookie C4CSESSID=tqb2qn92du8i9k5r4vnpd83i73 for www.example.com/>
But in my Firefox if I'm looking for that domain (in fact, w/out www) in the cookies editor, I can see also the google analytics ones (__utma, __utmc, etc).
How can I capture this cookies also in cj?
My goal is to be able to modify __utmb cookie content. (I can do it from FF but I want from the script also)
Thanks
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
我认为一旦该页面上的跟踪代码执行完毕(在 Google 服务器的响应中),您就会获得该 cookie。由于它是 javascript,您需要找到一种方法来解释代码中的 Javascript,或者模仿跟踪代码发出的请求。
从浏览器的上下文中解释 Javascript 可能会很棘手,我怀疑跟踪代码需要访问 DOM,例如,如果您使用 urllib 获取页面,则可能无法访问 DOM。
I think you get that cookie once the tracking code on that page has executed (in the response from the Google server). As it's javascript, you'll need to find a way to either interpret Javascript in your code, or mimic the request the tracking code issues.
Interpreting Javascript out of the context of a browser could prove tricky, I suspect that the tracking code needs access to the DOM, which it probably doesn't have if you get the page with urllib for example.
这些 cookie 由 Google Analytics 的 javascript 代码设置。
您需要解释此代码才能获取 cookie。
努力工作
These cookies are set by the javascript code for Google Analytics.
You need to interpret this code to get the cookie.
Hard work
我想知道,如果创建一个 cookieJar 并在那里添加一些“损坏的”cookie(例如 __utmb),它会对该网站上的下一个查询产生影响吗?
覆盖 ga cookie 的东西。
I'm wondering, if creating a cookieJar and adding some "mangled" cookies there (__utmb for example) it makes a difference in the next queries on that website?
Something as an overwriting for the ga cookie.