返回介绍

D.3 提速方法

发布于 2024-10-15 23:56:39 字数 4246 浏览 0 评论 0 收藏 0

现在,关键的性能瓶颈应已隔离出来。接下来,可对其应用两种类型的优化:常规手段以及依赖 Java 语言。

D.3.1 常规手段

通常,一个有效的提速方法是用更现实的方式重新定义程序。例如,在《Programming Pearls》(编程拾贝)一书中[14],Bentley 利用了一段小说数据描写,它可以生成速度非常快、而且非常精简的拼写检查器,从而介绍了 Doug McIlroy 对英语语言的表述。除此以外,与其他方法相比,更好的算法也许能带来更大的性能提升——特别是在数据集的尺寸越来越大的时候。欲了解这些常规手段的详情,请参考本附录末尾的“一般书籍”清单。

D.3.2 依赖语言的方法

为进行客观的分析,最好明确掌握各种运算的执行时间。这样一来,得到的结果可独立于当前使用的计算机——通过除以花在本地赋值上的时间,最后得到的就是“标准时间”。

运算 示例 标准时间

本地赋值 i=n; 1.0

实例赋值 this.i=n; 1.2

int 增值 i++; 1.5

byte 增值 b++; 2.0

short 增值 s++; 2.0

float 增值 f++; 2.0

double 增值 d++; 2.0

空循环 while(true) n++; 2.0

三元表达式 (x<0) ?-x : x 2.2

算术调用 Math.abs(x); 2.5

数组赋值 a[0] = n; 2.7

long 增值 l++; 3.5

方法调用 funct(); 5.9

throw 或 catch 异常 try{ throw e; }或 catch(e){} 320

同步方法调用 synchMehod(); 570

新建对象 new Object(); 980

新建数组 new int[10]; 3100

通过自己的系统(如我的 Pentium 200 Pro,Netscape 3 及 JDK 1.1.5),这些相对时间向大家揭示出:新建对象和数组会造成最沉重的开销,同步会造成比较沉重的开销,而一次不同步的方法调用会造成适度的开销。参考资源[5]和[6]为大家总结了测量用程序片的 Web 地址,可到自己的机器上运行它们。

1. 常规修改

下面是加快 Java 程序关键部分执行速度的一些常规操作建议(注意对比修改前后的测试结果)。

将... 修改成... 理由

接口 抽象类(只需一个父时) 接口的多个继承会妨碍性能的优化

非本地或数组循环变量 本地循环变量 根据前表的耗时比较,一次实例整数赋值的时间是本地整数赋值时间的 1.2 倍,但数组赋值的时间是本地整数赋值的 2.7 倍

链接列表(固定尺寸) 保存丢弃的链接项目,或将列表替换成一个循环数组(大致知道尺寸) 每新建一个对象,都相当于本地赋值 980 次。参考“重复利用对象”(下一节)、Van Wyk[12] p.87 以及 Bentley[15] p.81

x/2(或 2 的任意次幂) X>>2(或 2 的任意次幂) 使用更快的硬件指令

D.3.3 特殊情况

■字串的开销:字串连接运算符+看似简单,但实际需要消耗大量系统资源。编译器可高效地连接字串,但变量字串却要求可观的处理器时间。例如,假设 s 和 t 是字串变量:

System.out.println("heading" + s + "trailer" + t);

上述语句要求新建一个 StringBuffer(字串缓冲),追加自变量,然后用 toString() 将结果转换回一个字串。因此,无论磁盘空间还是处理器时间,都会受到严重消耗。若准备追加多个字串,则可考虑直接使用一个字串缓冲——特别是能在一个循环里重复利用它的时候。通过在每次循环里禁止新建一个字串缓冲,可节省 980 单位的对象创建时间(如前所述)。利用 substring() 以及其他字串方法,可进一步地改善性能。如果可行,字符数组的速度甚至能够更快。也要注意由于同步的关系,所以 StringTokenizer 会造成较大的开销。

  • ■同步:在 JDK 解释器中,调用同步方法通常会比调用不同步方法慢 10 倍。经 JIT 编译器处理后,这一性能上的差距提升到 50 到 100 倍(注意前表总结的时间显示出要慢 97 倍)。所以要尽可能避免使用同步方法——若不能避免,方法的同步也要比代码块的同步稍快一些。
  • ■重复利用对象:要花很长的时间来新建一个对象(根据前表总结的时间,对象的新建时间是赋值时间的 980 倍,而新建一个小数组的时间是赋值时间的 3100 倍)。因此,最明智的做法是保存和更新老对象的字段,而不是创建一个新对象。例如,不要在自己的 paint() 方法中新建一个 Font 对象。相反,应将其声明成实例对象,再初始化一次。在这以后,可在 paint() 里需要的时候随时进行更新。参见 Bentley 编著的《编程拾贝》,p.81[15]。
  • ■异常:只有在不正常的情况下,才应放弃异常处理模块。什么才叫“不正常”呢?这通常是指程序遇到了问题,而这一般是不愿见到的,所以性能不再成为优先考虑的目标。进行优化时,将小的“try-catch”块合并到一起。由于这些块将代码分割成小的、各自独立的片断,所以会妨碍编译器进行优化。另一方面,若过份热衷于删除异常处理模块,也可能造成代码健壮程度的下降。
  • ■散列处理:首先,Java 1.0 和 1.1 的标准“散列表”(Hashtable)类需要造型以及特别消耗系统资源的同步处理(570 单位的赋值时间)。其次,早期的 JDK 库不能自动决定最佳的表格尺寸。最后,散列函数应针对实际使用项(Key)的特征设计。考虑到所有这些原因,我们可特别设计一个散列类,令其与特定的应用程序配合,从而改善常规散列表的性能。注意 Java 1.2 集合库的散列映射(HashMap)具有更大的灵活性,而且不会自动同步。
  • ■方法内嵌:只有在方法属于 final(最终)、private(专用)或 static(静态)的情况下,Java 编译器才能内嵌这个方法。而且某些情况下,还要求它绝对不可以有局部变量。若代码花大量时间调用一个不含上述任何属性的方法,那么请考虑为其编写一个“final”版本。
  • ■I/O:应尽可能使用缓冲。否则,最终也许就是一次仅输入/输出一个字节的恶果。注意 JDK 1.0 的 I/O 类采用了大量同步措施,所以若使用象 readFully() 这样的一个“大批量”调用,然后由自己解释数据,就可获得更佳的性能。也要注意 Java 1.1 的“reader”和“writer”类已针对性能进行了优化。
  • ■造型和实例:造型会耗去 2 到 200 个单位的赋值时间。开销更大的甚至要求上溯继承(遗传)结构。其他高代价的操作会损失和恢复更低层结构的能力。
  • ■图形:利用剪切技术,减少在 repaint() 中的工作量;倍增缓冲区,提高接收速度;同时利用图形压缩技术,缩短下载时间。来自 JavaWorld 的“Java Applets”以及来自 Sun 的“Performing Animation”是两个很好的教程。请记着使用最贴切的命令。例如,为根据一系列点画一个多边形,和 drawLine() 相比,drawPolygon() 的速度要快得多。如必须画一条单像素粗细的直线,drawLine(x,y,x,y) 的速度比 fillRect(x,y,1,1) 快。
  • ■使用 API 类:尽量使用来自 Java API 的类,因为它们本身已针对机器的性能进行了优化。这是用 Java 难于达到的。比如在复制任意长度的一个数组时,arraryCopy() 比使用循环的速度快得多。
  • ■替换 API 类:有些时候,API 类提供了比我们希望更多的功能,相应的执行时间也会增加。因此,可定做特别的版本,让它做更少的事情,但可更快地运行。例如,假定一个应用程序需要一个容器来保存大量数组。为加快执行速度,可将原来的 Vector(矢量)替换成更快的动态对象数组。
  • 1. 其他建议
  • ■将重复的常数计算移至关键循环之外——比如计算固定长度缓冲区的 buffer.length。
  • ■static final(静态最终)常数有助于编译器优化程序。
  • ■实现固定长度的循环。
  • ■使用 javac 的优化选项:-O。它通过内嵌 static,final 以及 private 方法,从而优化编译过的代码。注意类的长度可能会增加(只对 JDK 1.1 而言——更早的版本也许不能执行字节查证)。新型的“Just-in-time”(JIT)编译器会动态加速代码。
  • ■尽可能地将计数减至 0——这使用了一个特殊的 JVM 字节码。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文