国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > JS > 正文

詳解使用Node.js 將txt文件轉為Excel文件

2024-05-06 16:38:17
字體:
來源:轉載
供稿:網友

最近同事需要對一份報告進行整理,一共有80個報告約9000多行放在一個txt文件中。雖然每份報告的格式比較類似,但其中部分字段對應的數量依舊會有差別。所以真要靠人工來做,無疑會是一件費時費力的并且是很枯燥的工作。據說如果有了這個程序,可以減少60%的工作量!那么為了我以后的下午茶,自然應該去嘗試一下不是么?

不過既然是費時費力又枯燥的工作,自然就應該交給代碼去解決。畢竟,我堅信任何的科學技術就是為了讓人類偷懶而存在的。那么就先切入正題,先上GitHub的項目地址。歡迎批評指點。

GitHub項目:report-maker

項目分析

既然準備要上代碼了,作為一個狂熱的前端愛好者,自然首選Node.js了。這一個項目主要的目的就是將txt文件中的內容按照一定的規則轉化為固定格式的表格并導出為Excel。那么重點就可以分為下面兩步了。

  1. Excel文件的生成
  2. txt內容的整理

1. Excel文件的生成

Excel文件自然是尋找可以依賴的模塊了(畢竟我自己寫不出來)。找了一圈,發現js-xlsx這一個模塊。雖然看起來很復雜,但其實只要提供好表頭和內容就可以,其余只是對于內容數據整理的固定模板。

相關教程可以參考下面這篇,講的比較詳細所以這里就不多做贅述了。

2. txt內容的整理

解決了Excel導出的問題(不然就得換Py了呢),文檔內容的整理便是這個項目最重要的問題了。最終整理的表格樣式以及需要抽出的項目內容已經和同事確認過了。那么接下來就是如何整理了一個有著80個長短不一報告的文件了。

首先來看看文件的格式,整個文件的格式類似于下面這樣。

 Policy Name:  policyName1 ……省略中間內容…… Policy Type:  Standard (0) ……省略中間內容…… Client/HW/OS/Pri/CIT: Client1 Client/HW/OS/Pri/CIT: Client2 Client/HW/OS/Pri/CIT: Client3 Client/HW/OS/Pri/CIT: Client4 ……省略多個Client Include:   /dir1 Include:   /dir2 Include:   /dir3 ……省略多個Include Schedule:    Schedule1  Type:  …… Schedule:    Schedule2  Type:  …… ……省略多個Schedule Policy Name:  policyName2 ……省略中間內容…… ……

可以看出,每一個段落是以Policy Name為分界的。那么,利用fs.readFile將完整的文件讀取進來,作為一個字符串使用split方法進行切割。具體代碼如下:

fs.readFile(filePath, 'UTF-8', function (err, data) { if (err) throw err; // 對文件讀取的數據進行處理,首先用 policyName 進行切割 var policyLists = data.split(config.splitRules.policyName); if (policyLists[0] === '/r/n') { policyLists.shift(); };

然后針對數組中每一個元素(一個段落)根據之前文件中所需要項目,使用正則表達式切提取出所需要的內容,然后將提取出的內容組成所需要的數據結構,具體代碼如下。其中schedule項目中內容也并非在一行中,所以也同樣使用上面的方法進行切割。而對于其他的項目,則通過正則表達式來進行內容的獲取。

 policyLists.forEach(function (policy) { var policyData = policyFormatter(config.splitRules.policyName + policy); excelData.push(policyData); });/** * 對每一個policy進行整理 使其符合表格插入的形式 * @param {*} policy  * { * policyName: String * client: []] * policyType: String * include: [] * schedule[] * scheduleResidence: String * } *  */function policyFormatter(policy) { var policyNameMatcher = new RegExp(config.splitRules.policyName + "([//s//w//d//-]*)//r//n"), clientMatcher = new RegExp(config.splitRules.client + "([//s//w//d//?//-//.]*)//r//n", "g"), policyTypeMatcher = new RegExp(config.splitRules.policyType + "([//s//w//d//(//)//-]*)//r//n"), includeMatcher = new RegExp(config.splitRules.include + "([//s///w//.////:_//?=///"//*]*)//r//n", "g"); var scheduleLists = policy.split(config.splitRules.schedule).slice(1), scheduleFormatLists = [], scheduleResidenceMatcher = new RegExp(config.splitRules.scheduleResidence + "([//s//w//d//-//(//)]*)//r//n"); scheduleLists.forEach(function (schedule) { var scheduleFormat = config.splitRules.schedule + schedule; scheduleFormatLists.push(scheduleFormat); }); // console.log(scheduleFormatLists); var results = { policyName: policy.match(policyNameMatcher)[1].trim(), client: policy.match(clientMatcher) ? policy.match(clientMatcher).join('').trim() : '', policyType: policy.match(policyTypeMatcher)[1].trim(), include: policy.match(includeMatcher).join('').trim(), schedule: scheduleFormatLists.join('').trim(), scheduleResidence: scheduleLists[0].match(scheduleResidenceMatcher)[1].trim() }; // console.dir(results); return results;}

主要邏輯處理完以后,把收集到的內容傳給excel處理模塊,導出成文件就能解決問題了。

不過似乎最終如果能導出為Word,似乎更好。看來還有新的改進空間還留著呢。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持VeVb武林網。


注:相關教程知識閱讀請移步到JavaScript/Ajax教程頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 雷州市| 克拉玛依市| 湘阴县| 吉木乃县| 宁国市| 靖安县| 赤峰市| 福泉市| 乃东县| 称多县| 墨竹工卡县| 安新县| 恭城| 华容县| 酒泉市| 海伦市| 黄梅县| 武宁县| 桐乡市| 汽车| 阳西县| 泾源县| 堆龙德庆县| 安庆市| 岳阳市| 晋州市| 偃师市| 福泉市| 天峨县| 长武县| 富平县| 改则县| 遂宁市| 临桂县| 遂溪县| 彭阳县| 上虞市| 上虞市| 大丰市| 静宁县| 康平县|