当前位置：文江博客话题详情

哪些统计概念对于分析有用？

发布于 2024-08-19 23:35:04 字数 149 浏览 3 评论 0原文

我一直想温习一下我的统计学知识。统计数据似乎有用的一个领域是分析代码。我这样说是因为分析似乎总是涉及我尝试从大量数据中提取一些信息。

我可以复习一下统计学中的任何主题，以便更好地理解探查器输出吗？如果您能给我推荐一本书或其他资源来帮助我更好地理解这些主题，那就加分了。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

嘿哥们儿 2024-08-26 23:35:04

我不确定统计学书籍在分析方面是否有用。运行探查器应该会为您提供一个函数列表以及每个函数所花费的时间百分比。然后，您查看百分比最高的那个，看看是否可以以任何方式对其进行优化。重复直到你的代码足够快。我觉得标准差或卡方的范围不大。

回复收藏 0 原文

木森分化 2024-08-26 23:35:04

我对分析的了解只是我刚刚在维基百科中读到的:-)，但我确实对统计有一定的了解。分析文章提到了采样数据的采样和统计分析。显然，统计分析将能够使用这些样本来制定一些有关绩效的统计报表。假设您有某种性能衡量标准 m，并且对该衡量标准进行了 1000 次采样。假设您了解创建 m 值的基本过程。例如，如果 m 是一堆随机变量的总和，则 m 的分布可能是正态分布。如果 m 是一堆随机变量的乘积，则分布可能是对数正态分布。等等...

如果您不知道基本分布并且想要对比较性能做出一些陈述，您可能需要所谓的非参数统计。

总的来说，我建议任何关于统计推断的标准文本（DeGroot），一本涵盖不同概率分布及其适用范围的文本（Hastings＆Peacock），以及一本关于非参数统计的书（Conover）。希望这有帮助。

回复收藏 0 原文

⊕婉儿 2024-08-26 23:35:04

统计数据很有趣，但对于性能调优来说，你不需要它。这里有一个解释，但一个简单的类比可能会给出这个想法。

性能问题就像一个物体（实际上可能是多个相连的物体）埋在一英亩的雪下，你试图通过用棍子随机探测来找到它。如果你的棍子击中它几次，你就已经找到了它——它的确切尺寸并不那么重要。（如果你真的想更好地估计它有多大，请使用更多的探头，但这不会改变它的大小。）在找到雪之前你必须探测雪的次数取决于雪的面积有多大它下面的雪。

一旦找到它，就可以将其拉出来。现在雪减少了，但积雪下可能还有更多物体。因此，通过更多的探测，您也可以找到并删除它们。通过这种方式，您可以继续前进，直到找不到更多可以删除的东西为止。

在软件中，雪就是时间，探测是对调用堆栈进行随机时间采样。通过这种方式，可以找到并消除多个问题，从而产生大的加速因子。

统计数据与此无关。

回复收藏 0 原文

白日梦 2024-08-26 23:35:04

Zed Shaw 像往常一样，对统计和编程主题有一些想法，但他提出他们比我更有说服力。

回复收藏 0 原文

花之痕靓丽 2024-08-26 23:35:04

我认为在这种情况下需要理解的最重要的统计概念是阿姆达尔定律。尽管阿姆达尔定律通常在并行化背景下提及，但它具有更一般的解释。以下是维基百科页面的摘录：

从技术上讲，涉及法律
与可实现的加速
改进计算
影响其中的比例 P
计算改进之处
S 的加速比。（例如，如果
改进可加快 30%
计算，P为0.3；如果
改善使受影响的部分
速度提高两倍，S 将为 2。）Amdahl 的
法律规定，总体加速
应用改进将是

$alt text$

回复收藏 0 原文

一袭水袖舞倾城 2024-08-26 23:35:04

我认为与统计和分析（您原来的问题）相关的一个概念非常有用，并且被一些人使用（您不时看到建议的技术）是在进行“微观分析”时：很多程序员会集会并大喊大叫“你不能进行微观分析，微观分析根本不起作用，太多的事情会影响你的计算”。

然而，只需运行 n 次您的分析，并仅保留 x% 的观察结果，即中位数附近的观察结果，因为中位数是一个“稳健的统计数据”（与平均值），不受异常值的影响（异常值正是您在进行此类分析时不希望考虑的值）。

对于想要对代码进行微观剖析的程序员来说，这绝对是一种非常有用的统计学技术。

回复收藏 0 原文

迷离° 2024-08-26 23:35:04

如果您将 MVC 编程方法与 PHP 结合使用，那么您需要分析以下内容：

<前><代码>应用：
控制器设置时间
模型建立时间
查看设置时间
数据库
查询-时间
曲奇饼
名称 - 值
会议
名称 - 值

If you apply the MVC programming method with PHP this would be what you need to profile:

Application:
   Controller Setup time
   Model Setup time
   View Setup time
Database
   Query - Time
Cookies
   Name - Value
Sessions
   Name - Value

回复收藏 0 原文

~没有更多了~