HTML5 中将浏览器选项卡共享屏幕

发布于 2023-01-08 19:33:30 字数 7604 浏览 192 评论 0

在过去的几年里，我已经帮助几家不同的公司仅使用浏览器技术实现了类似屏幕共享的功能。根据我的经验，仅在 Web 平台技术（即无插件）中实施 VNC 是一个难题。有很多事情需要考虑，有很多挑战需要克服。中继鼠标指针位置、转发击键以及以 60fps 实现完整的 24 位颜色重绘只是其中的几个问题。

捕获选项卡内容

如果我们消除传统屏幕共享的复杂性并专注于共享浏览器选项卡的内容，那么问题将大大简化为：

捕获当前状态下的可见选项卡
通过网络发送该帧

本质上，我们需要一种方法来对 DOM 进行快照并将其共享出去。

分享部分很简单。 Websockets 能够以不同的格式（字符串、JSON、二进制）发送数据。快照部分是一个更难的问题。 像 html2canvas 这样的项目已经通过重新实现浏览器的渲染引擎来解决 HTML 屏幕捕获问题……在 JavaScript 中！ 另一个例子是 Google Feedback ，尽管它不是开源的。这些类型的项目非常酷，但速度也非常慢。如果能达到 1fps 的吞吐量就已经很幸运了，更不用说令人垂涎的 60fps 了。

本文讨论了一些我最喜欢的“屏幕共享”选项卡的概念验证解决方案。

方法一：Mutation Observers + WebSocket

演示了一种镜像选项卡的方法 Rafael Weinstein 今年早些时候。他的技术使用 Mutation Observers 和 WebSocket。

本质上，演示者正在共享的选项卡会监视页面的更改，并使用 websocket 将差异发送给查看者。当用户滚动页面或与页面交互时，观察者会获取这些更改并使用 Rafael 的突变摘要库将它们报告给查看者。这样可以保持性能。并不是每一帧都发送整个页面。

正如 Rafael 在视频中指出的那样，这只是概念验证。不过，我认为这是将 Mutation Observers 等较新平台功能与 Websockets 等较旧平台功能相结合的巧妙方法。

方法 2：来自 HTMLDocument + 二进制 WebSocket 的 Blob

下一个方法是我最近突然想到的方法。它类似于 Mutation Observers 方法，但它不是发送摘要差异，而是创建整个的 Blob 克隆 HTMLDocument并通过二进制 websocket 发送它。这是按设置进行的设置：

将页面上的所有 URL 重写为绝对 URL。这可以防止静态图像和 CSS 资产包含损坏的链接。
克隆页面的文档元素： document.documentElement.cloneNode(true);
使用 CSS 使克隆只读、不可选择并防止滚动 pointer-events: 'none';user-select:'none';overflow:hidden;
捕获页面的当前滚动位置并将它们添加为 data-* 副本上的属性。
创建一个 new Blob() 来自 .outerHTML 的副本。

代码看起来像这样（我已经从完整源代码中进行了简化）：

function screenshotPage() {
  // 1. Rewrite current doc's imgs, css, and script URLs to be absolute before
  // we duplicate. This ensures no broken links when viewing the duplicate.
  urlsToAbsolute(document.images);
  urlsToAbsolute(document.querySelectorAll("link[rel='stylesheet']"));
  urlsToAbsolute(document.scripts);

  // 2. Duplicate entire document tree.
  var screenshot = document.documentElement.cloneNode(true);

  // 3. Screenshot should be readyonly, no scrolling, and no selections.
  screenshot.style.pointerEvents = 'none';
  screenshot.style.overflow = 'hidden';
  screenshot.style.userSelect = 'none'; // Note: need vendor prefixes

  // 4. ... read on ...

  // 5. Create a new .html file from the cloned content.
  var blob = new Blob([screenshot.outerHTML], {type: 'text/html'});

  // Open a popup to new file by creating a blob URL.
  window.open(window.URL.createObjectURL(blob));
}

urlsToAbsolute() 包含简单的正则表达式，用于将相对/无架构 URL 重写为绝对 URL。这是必要的，这样图像、css、字体和脚本在 blob URL 的上下文中查看时不会中断（例如，来自不同的来源）。

我做的最后一项调整是添加滚动支持。当演示者滚动页面时，观众应该跟随。为此，我将当前的 scrollX 和 scrollY 定位为 data-* 副本的属性 HTMLDocument，在创建最终的 Blob 之前，会注入一些在页面加载时触发的 JS：

// 4. Preserve current x,y scroll position of this page. See addOnPageLoad().
screenshot.dataset.scrollX = window.scrollX;
screenshot.dataset.scrollY = window.scrollY;

// 4.5. When screenshot loads (e.g. in blob URL), scroll it to the same location
// of this page. Do this by appending a window.onDOMContentLoaded listener
// which pulls out the screenshot (dupe's) saved scrollX/Y state on the DOM.
var script = document.createElement('script');
script.textContent = '(' + addOnPageLoad_.toString() + ')();'; // self calling.
screenshot.querySelector('body').appendChild(script);

// NOTE: Not to be invoked directly. When the screenshot loads, scroll it
// to the same x,y location of original page.
function addOnPageLoad() {
  window.addEventListener('DOMContentLoaded', function(e) {
    var scrollX = document.documentElement.dataset.scrollX || 0;
    var scrollY = document.documentElement.dataset.scrollY || 0;
    window.scrollTo(scrollX, scrollY);
  });

假装滚动给人的印象是我们已经截取了原始页面的一部分，而实际上，我们已经复制了整个内容，只是重新定位了它。

演示

下面的演示按钮截屏此页面并在新窗口中打开它。

注意：如果浏览器阻止弹出窗口，您可能需要取消阻止弹出窗口。

但是对于标签共享，我们需要不断地捕获标签并将其发送给查看者。为此，我编写了一个小型 Node websocket 服务器、应用程序和小书签来演示该流程。

未来的改进

一种优化是不要在每一帧上复制整个文档。这是一种浪费，而 Mutation Observer 示例在这方面做得很好。另一个改进是处理相关的 CSS 背景图像 urlsToAbsolute(). 这是当前脚本没有考虑的事情。

方法三：Chrome Extension API + Binary WebSocket

在 Google I/O 2012 上，我演示了另一种屏幕共享浏览器选项卡内容的方法。然而，这是一个骗子。它需要一个 Chrome 扩展 API：不是纯粹的 HTML5 魔法。

这个的来源也在 Github 上，但要点是：

将当前选项卡捕获为 .png dataURL。 Chrome 扩展有一个 API chrome.tabs.captureVisibleTab().
将 dataURL 转换为 Blob. 看 convertDataURIToBlob()帮手。
通过设置使用二进制 websocket 将每个 Blob（帧）发送到查看器 socket.responseType='blob'.

例子

下面是将当前选项卡截图为 png 并通过 websocket 发送框架的代码：

var IMG_MIMETYPE = 'images/jpeg'; // Update to image/webp when crbug.com/112957 is fixed.
var IMG_QUALITY = 80; // [0-100]
var SEND_INTERVAL = 250; // ms

var ws = new WebSocket('ws://...', 'dumby-protocol');
ws.binaryType = 'blob';

function captureAndSendTab() {
  var opts = {format: IMG_MIMETYPE, quality: IMG_QUALITY};
  chrome.tabs.captureVisibleTab(null, opts, function(dataUrl) {
    // captureVisibleTab returns a dataURL. Decode it -> convert to blob -> send.
    ws.send(convertDataURIToBlob(dataUrl, IMG_MIMETYPE));
  });
}

var intervalId = setInterval(function() {
  if (ws.bufferedAmount == 0) {
    captureAndSendTab();
  }
}, SEND_INTERVAL);

未来的改进

帧率对于这个来说出奇的好，但它可能会更好。一项改进是消除将 dataURL 转换为 Blob 的开销。很遗憾， chrome.tabs.captureVisibleTab()只给了我们一个数据 URL。如果它返回一个 Blob 或 Typed Array，我们可以直接通过 websocket 发送它，而不是自己转换成 Blob。请为crbug.com/32498 加注星标以实现这一目标！