当前位置：文江博客话题详情

网络分析工具如何工作？

发布于 2024-07-12 09:33:15 字数 204 浏览 14 评论 0原文

我正在为我的下一个任务收集有关网络分析工具（如 Google Web Analytics）的信息，但我找不到任何好的信息。我正在寻找：

使用的关键术语。
哪些媒介可用于数据收集以及它们的工作原理。
任何参考书、白皮书等（技术和非技术）。
任何开源实现（尤其是在 .NET 中）。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

最后的乘客 2024-07-19 09:33:16

好吧，

我不是专家，但您可以检索以下一些常见数据来构建自己的分析：

string str;
str += "Refferer:" + Request.UrlReferrer.AbsolutePath.ToString() + "<BR>";
str += "Form data:" + Request.Form.ToString() + "<br>";
str += "User Agent:" + Request.ServerVariables["HTTP_USER_AGENT"] + "<br>";
str += "IP Address:" + Request.UserHostAddress.ToString() + "<BR>";
str += "Browser:" + Request.Browser.Browser + " Version: " + Request.Browser.Version + " Platform: " + Request.Browser.Platform + "<BR>";
str += "Is Crawler: " + Request.Browser.Crawler.ToString() + "<BR>";
str += "QueryString" + Request.QueryString.ToString() + "<BR>";

您还可以像这样解析用户访问您网站的关键字：

protected string GetKeywordFromReferrer(string url)
{
    if (url.Trim() == "")
    {
        return "no url";
    }
    string urlEscaped = Uri.UnescapeDataString(url).Replace('+', ' ');
    string terms = "";
    string site = "";

    Match searchQuery = Regex.Match(urlEscaped, @"[\&\?][qp]\=([^\&]*)");
    if (searchQuery.Success)
    {
        terms = searchQuery.Groups[1].Value;
    }
    else
    {
        Match siteDomain = Regex.Match(urlEscaped, @"http\:\/\/(.+?)\/");
        if (siteDomain.Success)
        {
            site = siteDomain.Groups[1].Value;
        }
    }
    if (terms != "")
    {
        return terms;
    }
    if (site != "")
    {
        return site;
    }

    return "Direct Access";

}

希望这对您有所帮助。

Well,

I'm no expert, but here is some common data you can retrieve to build you own analytics:

string str;
str += "Refferer:" + Request.UrlReferrer.AbsolutePath.ToString() + "<BR>";
str += "Form data:" + Request.Form.ToString() + "<br>";
str += "User Agent:" + Request.ServerVariables["HTTP_USER_AGENT"] + "<br>";
str += "IP Address:" + Request.UserHostAddress.ToString() + "<BR>";
str += "Browser:" + Request.Browser.Browser + " Version: " + Request.Browser.Version + " Platform: " + Request.Browser.Platform + "<BR>";
str += "Is Crawler: " + Request.Browser.Crawler.ToString() + "<BR>";
str += "QueryString" + Request.QueryString.ToString() + "<BR>";

You can also parse the keyword the user has reached your website from like this:

protected string GetKeywordFromReferrer(string url)
{
    if (url.Trim() == "")
    {
        return "no url";
    }
    string urlEscaped = Uri.UnescapeDataString(url).Replace('+', ' ');
    string terms = "";
    string site = "";

    Match searchQuery = Regex.Match(urlEscaped, @"[\&\?][qp]\=([^\&]*)");
    if (searchQuery.Success)
    {
        terms = searchQuery.Groups[1].Value;
    }
    else
    {
        Match siteDomain = Regex.Match(urlEscaped, @"http\:\/\/(.+?)\/");
        if (siteDomain.Success)
        {
            site = siteDomain.Groups[1].Value;
        }
    }
    if (terms != "")
    {
        return terms;
    }
    if (site != "")
    {
        return site;
    }

    return "Direct Access";

}

Hope this has helped a bit.

回复收藏 0 原文

泪冰清 2024-07-19 09:33:16

1. 使用的关键术语
与答案 1

2 一样。哪些媒介可用于数据收集以及它们的工作原理。
来自 Apache、IIS 的日志文件。 ASP.NET 的 HTTP 处理程序或您的实际页面。 Javascript 包括（Javascript 可用的对象为您提供有关客户端所需的大部分信息）

3。任何参考书、白皮书等（技术和非技术）
HTTP 上的 RFC 很有用，它为您提供了大部分可捕获的请求标头。

4.任何开源实现（尤其是在 .NET 中）。

我编写了一个已完成分析的解析部分的代码（在我看来这是最难的部分）。需要在某些方面进行一些调整：

Statmagic（对于日志文件）

它已经有 4 年历史了，缺少 DAL，这比听起来更难 - 主要障碍是确保您不会复制日志每一行的确切数据，因为您也可以只使用日志文件。另一部分是以良好的格式显示这些聚合数据。我的目标是将其存储在 SQL Server 中，并以 db4o 格式存储，以满足小型网站的需求。

Statmagic 项目的“悲伤”部分是 Google 的出现，彻底消灭了竞争对手以及我完成该项目的任何意义。

回复收藏 0 原文

余罪 2024-07-19 09:33:15

以下是使用的关键术语：

点击（互联网）
页面浏览量
访问/会话
首次访问/首次会话
访问者/唯一访问者/唯一用户
重复访问者
新访问者
印象
单例
跳出率
% 退出
可见时间
会话持续时间
页面查看持续时间/页面停留时间
页面深度/每个会话的页面浏览量
频率/每个唯一
点击路径的

会话使用的方法：

Web 服务器日志文件分析
页面标记

Web 服务器日志文件分析

在此方法中您编写脚本从日志文件中抓取详细信息，然后将其写入数据库。此方法不会为您提供实时统计数据。您可以在此处了解有关网络日志分析软件的更多信息。

页面标记

添加 JavaScript 代码或仅添加图像，然后使用该代码获取有关页面、引用、访问者等的所有详细信息。

...这些是网络中包含的图像
显示次数的页面
已请求该图像，其中
是对数量的估计
访问该页面。 20世纪90年代末
这个概念演变为包括
小的隐形图像而不是
可见的，并且通过使用 JavaScript，
与图像请求一起传递
有关该页面的某些信息以及
访客。然后该信息可以
由网络远程处理
分析公司和广泛的
生成的统计数据...

如果您在自己的网站中使用分析，则可以使用代码由 Eytan Levit 提供，

来源 wikipedia。可以在那里找到更多信息。