java调用phantomjs的性能问题
java调用phantomjs,发现每次都要重新启动一个phantomjs进程,抓完数据关掉然后下一次抓取又生成新进程。很耗性能。
有没有办法让phantomjs进程一直在那挂着,然后随时传数据进去得到结果?
java的调用代码
Runtime rt = Runtime.getRuntime();
Process p = rt.exec("phantomjs /Users/cxs/utils/phantomjs/codes.js "+url);
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
只要不执行phantom.exit();进程就不会退出
phantoms启动后,启动它的父进程就无法和其沟通了,phantomjs没有相应地API可以做到这一点
如果需要动态的读取数据以抓取数据有2种方法供参考
A. 利用ChildProcess模块,反向处理,即启动phantomjs进程,然后利用child process模块启动java进程,通过子父进程之间共享的stdin/stdout来交互数据
B. 利用WebServer模块,在phantomjs中启动一个微型web服务,java进程往这个web服务发送数据及接受处理完成的结果