使用 JS-XLS/X 读取和解析 Excel 表格文件
最近有一个要求,我们需要在浏览器动态解析 Excel 表格文件,刚开始我们想使用后台语言来完成,但是后台的同事又比较忙一直没弄,我就在网上找找有没有 JS 解析 Excel 文件的库,没想到还真找到了两个:
让我们看看他们是如何工作的。
兼容性
支持读取文件格式
- Excel 2007+ XML Formats (XLSX/XLSM)
- Excel 2007+ Binary Format (XLSB)
- Excel 2003-2004 XML Format (XML "SpreadsheetML")
- Excel 97-2004 (XLS BIFF8)
- Excel 5.0/95 (XLS BIFF5)
- OpenDocument Spreadsheet (ODS)
支持写文件格式
- XLSX
- CSV (and general DSV)
- JSON and JS objects (various styles)
Demo: http://oss.sheetjs.com/js-xlsx
Source: http://git.io/xlsx
JS-XLS
JS-XLS 的安装是很简单的,在浏览器中使用该脚本文件,并使用脚本标记加载它:
<!-- https://github.com/SheetJS/js-xls/blob/master/xls.js --> <script src="/path/to/xls.js"></script>
对于 Node.js,只要通过 NPM 安装:
$ npm install xlsjs $ node > require('xlsjs').readFile('excel_file.xls');
然后我们可以简单地使用他们提供的代码,在 JS 文件解析和转换的 xls 文件为 JSON/CSV 的数据格式。
function get_radio_value( radioName ) { var radios = document.getElementsByName( radioName ); for( var i = 0; i < radios.length; i++ ) { if( radios[i].checked ) { return radios[i].value; } } } function to_json(workbook) { var result = {}; workbook.SheetNames.forEach(function(sheetName) { var roa = XLS.utils.sheet_to_row_object_array(workbook.Sheets[sheetName]); if(roa.length > 0){ result[sheetName] = roa; } }); return result; } function to_csv(workbook) { var result = []; workbook.SheetNames.forEach(function(sheetName) { var csv = XLS.utils.make_csv(workbook.Sheets[sheetName]); if(csv.length > 0){ result.push("SHEET: " + sheetName); result.push(""); result.push(csv); } }); return result.join("\n"); } function to_formulae(workbook) { var result = []; workbook.SheetNames.forEach(function(sheetName) { var formulae = XLS.utils.get_formulae(workbook.Sheets[sheetName]); if(formulae.length > 0){ result.push("SHEET: " + sheetName); result.push(""); result.push(formulae.join("\n")); } }); return result.join("\n"); } var tarea = document.getElementById('b64data'); function b64it() { var cfb = XLS.CFB.read(tarea.value, {type: 'base64'}); var wb = XLS.parse_xlscfb(cfb); process_wb(wb); } function process_wb(wb) { var output = ""; switch(get_radio_value("format")) { case "json": output = JSON.stringify(to_json(wb), 2, 2); break; case "form": output = to_formulae(wb); break; default: output = to_csv(wb); } if(out.innerText === undefined) out.textContent = output; else out.innerText = output; } var drop = document.getElementById('drop'); function handleDrop(e) { e.stopPropagation(); e.preventDefault(); var files = e.dataTransfer.files; var i,f; for (i = 0, f = files[i]; i != files.length; ++i) { var reader = new FileReader(); var name = f.name; reader.onload = function(e) { var data = e.target.result; var cfb = XLS.CFB.read(data, {type: 'binary'}); //var arr = String.fromCharCode.apply(null, new Uint8Array(data)); //var cfb = XLS.CFB.read(btoa(arr), {type: 'base64'}); var wb = XLS.parse_xlscfb(cfb); process_wb(wb); }; reader.readAsBinaryString(f); //reader.readAsArrayBuffer(f); } } function handleDragover(e) { e.stopPropagation(); e.preventDefault(); e.dataTransfer.dropEffect = 'copy'; } if(drop.addEventListener) { drop.addEventListener('dragenter', handleDragover, false); drop.addEventListener('dragover', handleDragover, false); drop.addEventListener('drop', handleDrop, false); }
JS 代码很容易理解,它使用了 HTML5 拖放 API 允许我们上传文件然后看他们为二进制字符串。二进制然后直接传递到库,并进一步分析使用此代码:
var cfb = XLS.CFB.read(data, {type: 'binary'}); var wb = XLS.parse_xlscfb(cfb);
最终 WB(Workbook)对象是处理并转换成需要的格式(JSON,CSV 和 Excel公式)。这没有 HTML5 拖放文件阅读器的 API,可用于 Node.js 代码相同。
注:此模块不支持 xlsx。为了克服这一限制,我们可以通过同一作者称为 JS-XLSX 用另一个包。
JS-XLSX
再次安装和使用与上一节几乎相同。使用浏览器加载 jszip.js 和 xlsx 文件:
<!-- https://github.com/SheetJS/js-xlsx/blob/master/jszip.js --> <script src="/path/to/jszip.js"></script> <!-- https://github.com/SheetJS/js-xlsx/blob/master/xlsx.js --> <script src="/path/to/xlsx.js"></script>
对于 Node.js,只要通过 NPM 安装:
$ npm install xlsx $ node > require('xlsx').readFile('excel_file.xlsx');
然后我们可以简单地使用他们提供的代码,在 JS 文件解析和转换的 xls 文件为 JSON/CSV 的数据格式。
function get_radio_value( radioName ) { var radios = document.getElementsByName( radioName ); for( var i = 0; i < radios.length; i++ ) { if( radios[i].checked ) { return radios[i].value; } } } function to_json(workbook) { var result = {}; workbook.SheetNames.forEach(function(sheetName) { var roa = XLSX.utils.sheet_to_row_object_array(workbook.Sheets[sheetName]); if(roa.length > 0){ result[sheetName] = roa; } }); return result; } function to_csv(workbook) { var result = []; workbook.SheetNames.forEach(function(sheetName) { var csv = XLSX.utils.sheet_to_csv(workbook.Sheets[sheetName]); if(csv.length > 0){ result.push("SHEET: " + sheetName); result.push(""); result.push(csv); } }); return result.join("\n"); } function to_formulae(workbook) { var result = []; workbook.SheetNames.forEach(function(sheetName) { var formulae = XLSX.utils.get_formulae(workbook.Sheets[sheetName]); if(formulae.length > 0){ result.push("SHEET: " + sheetName); result.push(""); result.push(formulae.join("\n")); } }); return result.join("\n"); } var tarea = document.getElementById('b64data'); function b64it() { var wb = XLSX.read(tarea.value, {type: 'base64'}); process_wb(wb); } function process_wb(wb) { var output = ""; switch(get_radio_value("format")) { case "json": output = JSON.stringify(to_json(wb), 2, 2); break; case "form": output = to_formulae(wb); break; default: output = to_csv(wb); } if(out.innerText === undefined) out.textContent = output; else out.innerText = output; } var drop = document.getElementById('drop'); function handleDrop(e) { e.stopPropagation(); e.preventDefault(); var files = e.dataTransfer.files; var i,f; for (i = 0, f = files[i]; i != files.length; ++i) { var reader = new FileReader(); var name = f.name; reader.onload = function(e) { var data = e.target.result; //var wb = XLSX.read(data, {type: 'binary'}); var arr = String.fromCharCode.apply(null, new Uint8Array(data)); var wb = XLSX.read(btoa(arr), {type: 'base64'}); process_wb(wb); }; //reader.readAsBinaryString(f); reader.readAsArrayBuffer(f); } } function handleDragover(e) { e.stopPropagation(); e.preventDefault(); e.dataTransfer.dropEffect = 'copy'; } if(drop.addEventListener) { drop.addEventListener('dragenter', handleDragover, false); drop.addEventListener('dragover', handleDragover, false); drop.addEventListener('drop', handleDrop, false); }
有了这些项目,使我们的任务更变得更简单,如果你有任何的疑问,可以在 Github 上提交 Issues 获取帮助。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论