8 工业界领域特定算法
8.1 指数设计
统计指数的概念有广义和狭义之分,前者是泛指反映社会经济现象变动程度的相对数,后者是指综合反映多种不同事物在不同时间上的总变动的特殊的相对数。
根据不同的分类方法,指数主要可分为:个体指数、总指数和组指数;综合指数与平均指数;定基指数与环比指数;数量指标指数与质量指标指数等。
按研究对象范围的不同,指数可以分为个体指数、总指数和组指数。个体指数是用于反映总体中某一单个现象动态变化的指数。总指数则是反映被研究现象全体的总动态变化。组指数也称为类指数,是在总指数中通过统计分组计算的反映各个组动态变化的指数。
在总指数中,按研究方法的不同,可以分为综合指数与平均指数。综合指数(Synthetic index) 的主要特点是:将不可以直接度量的指数化指标,通过同度量因素转化为可以合计的总量指标,然后将不同时期的总量指标进行对比以综合反映现象的 动态变化;平均指数(Average index) 则是以个体指数为基础,通过简单平均或加权平均的方法计算总指数。
按照对比时采用的基期不同,指数可以分为定基指数与环比指数。从具体计算方法上看,指数是两个时期的指标数值之比,其中作为比较基础的时期称为 基期 (Base term),而被比较的时期称为 报告期 (Reporting term) 或计算期。若在计算指数时,不只是仅把两个时期的数值进行对比,而是随时间推移连续编制指数,这就形成指数数列(Index number series)。在指数数列中,如果各个指数都以某一固定时期作为基期,就得到定基指数(Fixed base index);如果各个指数都以报告期的前期作为基期,就得到环比指数(Changed base index)。
按指数的经济内容和性质不同,可以分为数量指标指数和质量指标指数。数量指标指数(Quantitative index) 包括产品产量指数、商品销售量指数等,质量指标指数(Qualitive index) 包括产品成本指数(Index of production cost)、劳动生产率指数(Index of labor productivity)、零售物价指数(Index of retail prices)、居民消费品价格指数(Consumption price index) 等。
指数设计的步骤主要有三步:一是选定指标(若干参数项);二是标准化指标(常用对数函数 LOG/IN 转化);三是指标加权。
股价指数
股价 平均数 的计算方法主要有三种,即算术平均法、几何平均法和加权平均法。加权平均法权数的选择,可以是股票的 成交金额,也可以是它的上市股数。若选择计算期的同度量因素作为权数,则被称为派氏(Paasche)加权法。与前两类方法相比,加权平均股价指数能更真 实地反映市场整体走势,因此,加权平均法更适合用于开发股指期货合约的标的指数。
示例:上证指数
上证 180:根据总市值和成交金额对股票进行综合排名;按照各行业的自由流通调整市值比例分配样本只数,在行业内选取综合排名靠前的 180 名公司作 为样本股。上海证券市场上最具代表性的大型蓝筹股票指数,是投资评价尺度和金融衍生产品标的的基础指数,于 2002 年 7 月发布。
8.2 广告系统
广告可以分为展示广告和点击广告。
广告的计费方式 主要有以下几种:
CPM: Cost Per Miles, 每千人成本,指的是广告投放过程中,听到或者看到某广告的每一人平均分担到多少广告成本。 按访问人次收费已经成为网络广告的惯例。
CPC: Cost Per Click, 每点击成本。以每点击一次计费。这样的方法加上点击率限制可以〖WX)〗加强作弊的难度,而且是宣传网站站点的最优方式。对于不需点击可以看到的广告来说不合理。
CPA: Cost Per Action, 每行动成本。指按广告投放实际效果,即按回应的有效问卷或定单来计费,而不限广告投放量。CPA 的计价方式对于网站而言有一定的风险,但若广告投放成功,其收益也比 CPM 的计 价方式要大得多。
CPR:(Cost Per Response) 每回应成本,以浏览者的每一个回应计费。这种广告计费充分体现了网络广告
及时反应、直接互动、准 确记录
的特点,但是,这个显然是属于辅助销售的广告模式,对于那些实际只要亮出名字 就已经有一半满足的品牌广告要求,大概所有的网站都会给予拒绝,因为得到广告费的机会 比 CPC 还要渺茫。CPP:(Cost Per Purchase) 每购买成本 ,广告主为规避广告费用风险,只有在网络用户点击旗帜广告并进行在线交易后,才按销售笔 数付给广告站点费用。
备注 :无论是 CPA 还是 CPP,广告主都要求发生目标消费者的 点击
,甚至进一步形成购买,才予 付费:CPM 则只要求发生 目击
(或称 展露
、 印象
),就产生广告付费。
广告投放算法
表格 13 混合广告投放中的权重设置
投放方式 | 权重 | 原理 |
---|---|---|
广告与搜索词相关性 | 0.65 | |
基于 USER-BASED 协同过滤 | 0.15 | KNN,计算用户相似度,效果较差,常是离线分析。 |
基于 ITEM-BASED 协同过滤 | 0.1 | 基于历史纪录与当前广告相似程度,一般是在线分析。 |
基于 MODEL-BASED 协同过滤 | 0.1 | 综合贝叶斯和 LSI,可以实时计算。 |
备注:
Google Adsense
广告收入公式 :
$$
CPM = coverage * depth * CTR * CRC * 1000 (注:可简化成 CPM=CTR*CRC)
$$
- CPM: Cost Per Mille,每千次广告展示的收入
- coverage: 广告覆盖率=出现广告的搜索页面/所有搜索页面,谷歌约为 1/3。
- depth: 平均每页广告数,即页面显示广告位,通常在 3 以内。
- CTR: Click-Through-Rate,广告点击率=点击量/展示量,跟用户相关,谷歌约为 3%~4%。
- CRC: 每次点击所产生的费用,跟广告主相关。谷歌采用的是竞价排名中第二私密竞价模式。
广告质量公式
$$
广告排名分数 = 最高点击成本 * 广告质量得分 CTR
$$
注:广告质量得分即广告点击率。
本章参考
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论