本文實例講述了Java編程實現提取文章中關鍵字的方法。分享給大家供大家參考,具體如下:
實現代碼:
/** * 相關的jar包 * lucene-core-3.6.2.jar,lucene-memory-3.6.2.jar, * lucene-highlighter-3.6.2.jar,lucene-analyzers-3.6.2.jar * IKAnalyzer2012.jar * * 截取一片文章中頻繁出現的關鍵字,并給予分組排序(倒敘),以數組格式返回n個關鍵字 * * 并該類內部含有一個List2Map方法,可將重復<String>集合轉換為Map<String, Integer>格式 * 并算出該<String>重復次數,放入相應的value中 */package com.lifeix.api.util; import java.io.IOException; import java.io.StringReader; import java.util.ArrayList; import java.util.Collections; import java.util.Comparator; import java.util.HashMap; import java.util.List; import java.util.Map; import java.util.Map.Entry; import org.apache.lucene.analysis.TokenStream; import org.apache.lucene.analysis.tokenattributes.CharTermAttribute; import org.wltea.analyzer.lucene.IKAnalyzer; /** * 獲取文章關鍵字 * @author anwj * */ public class WordUtil { /** 測試文章 */ static String keyWord = "笑星潘長江當上“男媒婆”了,但這回可不是演小品――由他自編自導自演的都市喜劇《男媒婆》將于1月13日在北" + "京衛視首播。劇中,潘長江變身成為能說會道、古道熱腸的“新時代男媒婆”丁二春,與“臺灣第一酒窩美女2”張庭上演了一出“ 主站蜘蛛池模板: 镇原县| 澳门| 阳谷县| 耒阳市| 潍坊市| 炎陵县| 吐鲁番市| 雅安市| 孝昌县| 监利县| 松桃| 衡阳市| 腾冲县| 石家庄市| 红河县| 格尔木市| 都安| 乌鲁木齐县| 南昌市| 林甸县| 工布江达县| 开平市| 竹山县| 江油市| 枣强县| 富锦市| 滕州市| 宜宾县| 婺源县| 秦皇岛市| 基隆市| 九龙坡区| 建昌县| 扶沟县| 江陵县| 博乐市| 昆明市| 布尔津县| 泰宁县| 景洪市| 海晏县|