网络分析工具如何工作?

发布于 2024-07-12 09:33:15 字数 204 浏览 8 评论 0原文

我正在为我的下一个任务收集有关网络分析工具(如 Google Web Analytics)的信息,但我找不到任何好的信息。 我正在寻找:

  1. 使用的关键术语。
  2. 哪些媒介可用于数据收集以及它们的工作原理。
  3. 任何参考书、白皮书等(技术和非技术)。
  4. 任何开源实现(尤其是在 .NET 中)。

I am in process of gathering information about web analytics tools (like Google Web Analytics) for my next assignment, but I am not able to find any good information.
I am looking for:

  1. Key terms used.
  2. What all mediums are available for data collection and How they works.
  3. Any reference books, white papers etc (technical and non technical both).
  4. Any open source implementation (especially in .NET).

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

最后的乘客 2024-07-19 09:33:16

好吧,

我不是专家,但您可以检索以下一些常见数据来构建自己的分析:

string str;
str += "Refferer:" + Request.UrlReferrer.AbsolutePath.ToString() + "<BR>";
str += "Form data:" + Request.Form.ToString() + "<br>";
str += "User Agent:" + Request.ServerVariables["HTTP_USER_AGENT"] + "<br>";
str += "IP Address:" + Request.UserHostAddress.ToString() + "<BR>";
str += "Browser:" + Request.Browser.Browser + " Version: " + Request.Browser.Version + " Platform: " + Request.Browser.Platform + "<BR>";
str += "Is Crawler: " + Request.Browser.Crawler.ToString() + "<BR>";
str += "QueryString" + Request.QueryString.ToString() + "<BR>";

您还可以像这样解析用户访问您网站的关键字:

protected string GetKeywordFromReferrer(string url)
{
    if (url.Trim() == "")
    {
        return "no url";
    }
    string urlEscaped = Uri.UnescapeDataString(url).Replace('+', ' ');
    string terms = "";
    string site = "";

    Match searchQuery = Regex.Match(urlEscaped, @"[\&\?][qp]\=([^\&]*)");
    if (searchQuery.Success)
    {
        terms = searchQuery.Groups[1].Value;
    }
    else
    {
        Match siteDomain = Regex.Match(urlEscaped, @"http\:\/\/(.+?)\/");
        if (siteDomain.Success)
        {
            site = siteDomain.Groups[1].Value;
        }
    }
    if (terms != "")
    {
        return terms;
    }
    if (site != "")
    {
        return site;
    }

    return "Direct Access";

}

希望这对您有所帮助。

Well,

I'm no expert, but here is some common data you can retrieve to build you own analytics:

string str;
str += "Refferer:" + Request.UrlReferrer.AbsolutePath.ToString() + "<BR>";
str += "Form data:" + Request.Form.ToString() + "<br>";
str += "User Agent:" + Request.ServerVariables["HTTP_USER_AGENT"] + "<br>";
str += "IP Address:" + Request.UserHostAddress.ToString() + "<BR>";
str += "Browser:" + Request.Browser.Browser + " Version: " + Request.Browser.Version + " Platform: " + Request.Browser.Platform + "<BR>";
str += "Is Crawler: " + Request.Browser.Crawler.ToString() + "<BR>";
str += "QueryString" + Request.QueryString.ToString() + "<BR>";

You can also parse the keyword the user has reached your website from like this:

protected string GetKeywordFromReferrer(string url)
{
    if (url.Trim() == "")
    {
        return "no url";
    }
    string urlEscaped = Uri.UnescapeDataString(url).Replace('+', ' ');
    string terms = "";
    string site = "";

    Match searchQuery = Regex.Match(urlEscaped, @"[\&\?][qp]\=([^\&]*)");
    if (searchQuery.Success)
    {
        terms = searchQuery.Groups[1].Value;
    }
    else
    {
        Match siteDomain = Regex.Match(urlEscaped, @"http\:\/\/(.+?)\/");
        if (siteDomain.Success)
        {
            site = siteDomain.Groups[1].Value;
        }
    }
    if (terms != "")
    {
        return terms;
    }
    if (site != "")
    {
        return site;
    }

    return "Direct Access";

}

Hope this has helped a bit.

泪冰清 2024-07-19 09:33:16

1. 使用的关键术语
与答案 1

2 一样。 哪些媒介可用于数据收集以及它们的工作原理。
来自 Apache、IIS 的日志文件。 ASP.NET 的 HTTP 处理程序或您的实际页面。 Javascript 包括(Javascript 可用的对象为您提供有关客户端所需的大部分信息)

3。 任何参考书、白皮书等(技术和非技术)
HTTP 上的 RFC 很有用,它为您提供了大部分可捕获的请求标头。

4.任何开源实现(尤其是在 .NET 中)。

我编写了一个已完成分析的解析部分的代码(在我看来这是最难的部分)。 需要在某些方面进行一些调整:

它已经有 4 年历史了, 缺少 DAL,这比听起来更难 - 主要障碍是确保您不会复制日志每一行的确切数据,因为您也可以只使用日志文件。 另一部分是以良好的格式显示这些聚合数据。 我的目标是将其存储在 SQL Server 中,并以 db4o 格式存储,以满足小型网站的需求。

Statmagic 项目的“悲伤”部分是 Google 的出现,彻底消灭了竞争对手以及我完成该项目的任何意义。

1. Key terms used
As with answer 1

2. What all mediums are available for data collection and How they works.
Log files from Apache, IIS. HTTP Handlers for ASP.NET, or your actual page. Javascript includes (the objects available to Javascript give you most information you need about the client)

3. Any reference books, white papers etc (technical and non technical both)
The RFC on HTTP is useful, that gives you most of the request headers that are capturable.

4.Any open source implementation (especially in .NET).

I wrote one that has the parsing part of the analysis done (in my view the hardest part). It needs a bit of tweaking in certain areas as it's 4 years old:

It's missing a DAL, which is harder than it sounds - the main hurdle is making sure you don't replicate the exact data that each row of the log has, as you then may as well just use the log files. The other part is displaying this aggregated data in a nice format. My goal was to have it stored in SQL Server, and also db4o format to cater for smaller websites.

The 'sad' part of the Statmagic project is Google came along and completely wiped out the competition and any point in me finishing it.

余罪 2024-07-19 09:33:15

以下是使用的关键术语

  • 点击(互联网)
  • 页面浏览量
  • 访问/会话
  • 首次访问/首次会话
  • 访问者/唯一访问者/唯一用户
  • 重复访问者
  • 新访问者
  • 印象
  • 单例
  • 跳出率
  • % 退出
  • 可见时间
  • 会话持续时间
  • 页面查看持续时间/页面停留时间
  • 页面深度/每个会话的页面浏览量
  • 频率/每个唯一
  • 点击路径的

会话使用的方法

  • Web 服务器日志文件分析
  • 页面标记

Web 服务器日志文件分析

在此方法中您编写脚本从日志文件中抓取详细信息,然后将其写入数据库。 此方法不会为您提供实时统计数据。 您可以在此处了解有关网络日志分析软件的更多信息。

页面标记

添加 JavaScript 代码或仅添加图像,然后使用该代码获取有关页面、引用、访问者等的所有详细信息。

...这些是网络中包含的图像
显示次数的页面
已请求该图像,其中
是对数量的估计
访问该页面。 20世纪90年代末
这个概念演变为包括
小的隐形图像而不是
可见的,并且通过使用 JavaScript,
与图像请求一起传递
有关该页面的某些信息以及
访客。 然后该信息可以
由网络远程处理
分析公司和广泛的
生成的统计数据...

如果您在自己的网站中使用分析,则可以使用 代码由 Eytan Levit 提供

来源 wikipedia。 可以在那里找到更多信息。

Here are the key terms used:

  • Hit (internet)
  • Page view
  • Visit / Session
  • First Visit / First Session
  • Visitor / Unique Visitor / Unique User
  • Repeat Visitor
  • New Visitor
  • Impression
  • Singletons
  • Bounce Rate
  • % Exit
  • Visibility time
  • Session Duration
  • Page View Duration / Time on Page
  • Page Depth / Page Views per Session
  • Frequency / Session per Unique
  • Click path

Methods used:

  • Web server logfile analysis
  • Page tagging

Web server logfile analysis

In this method you write script to scrape details out of your log files and then write it to your database. This method will not give you real time statistics. You can read more about web log analysis software here.

Page tagging

Add a code of javascript or just an image and then use the code to get all the dtails about the page, referrr, visitor etc.

...these were images included in a web
page that showed the number of times
the image had been requested, which
was an estimate of the number of
visits to that page. In the late 1990s
this concept evolved to include a
small invisible image instead of a
visible one, and, by using JavaScript,
to pass along with the image request
certain information about the page and
the visitor. This information can then
be processed remotely by a web
analytics company, and extensive
statistics generated...

If you are using analytics in your own website, you can use the code provided by Eytan Levit

Credit wikipedia. More information can be found there.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文