Lucene是apache一个开源的搜索引擎,我的需求是对一篇文章抽取其摘要,本人菜鸟,实现代码如下
public static String luceneSummary(String txt) throws ParseException, IOException, InvalidTokenOffsetsException{ String pQuery= "穆 沙拉 法院"; //关键字 Formatter formatter = new SimpleHTMLFormatter("<font color='red'>","</font>"); //高亮 Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30); QueryParser parser = new QueryParser(Version.LUCENE_30, "", analyzer); Highlighter highlighter = new Highlighter(formatter , new QueryScorer(parser.parse(pQuery))); // Fragmenter fragmenter = new SimpleFragmenter(100); // highlighter.setTextFragmenter(fragmenter); highlighter.setTextFragmenter(new NullFragmenter()); //不要限制子多少 String[] strArray = txt.split("([。|,])"); //以逗号分隔传入的文章,逐句的提取摘要,这样的摘要最起码是一个句子 String text = ""; for(String str : strArray){ //循环每句话 String ret = highlighter.getBestFragment(analyzer, "", str); if(ret!=null){ text += ret+","; if(text.length()>300) //如果摘要累计300个字就停止 break; } } return text; } public static void main(String[] args) throws IOException, ParseException, InvalidTokenOffsetsException { //args[0]传一篇文章试试就知道了 luceneSummary(args[0]); }
相关推荐
类主要是符合本人项目的需求,内容摘要的高亮点实现没这么复杂,此类中不仅仅包含了内容的高亮点实现,还包含了获取xml内容和html纯文本的提取。注意一点的是在对内容进行高亮度化的过程中,其实也就是进行全文检索的...
教大家使用lucene进行简单的开发,贴出了主要的源码和注释.
本文是整理的关于lucene的一些简单的介绍,以及对于lucene的简单的使用。
lucene,solr的使用lucene,solr的使用lucene,solr的使用lucene,solr的使用lucene,solr的使用lucene,solr的使用lucene,solr的使用lucene,solr的使用lucene,solr的使用lucene,solr的使用lucene,solr的使用
lucene
使用Lucene.net进行全文查找多关键字匹配
使用lucene编程实现全文检索数据库内容,程序使用lucene-core-2.4.0以及access数据库
Lucene创建索引,查询索引的简单使用。
Lucene简单实例记录 简单Luncene的示例应用
lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例
lucene简单demo lucene简单demo lucene简单demo lucene简单demo
lucene.NET使用教程整合 lucene.NET使用教程整合 lucene.NET使用教程整合 lucene.NET使用教程整合 lucene.NET使用教程整合 lucene.NET使用教程整合
简单的介绍在HDFS中使用lucene完成索引和搜索的代码实例
lucene初级教程,教你如何使用LUCENE,以及一些简单的代码
lucene使用总结笔记lucene使用总结笔记lucene使用总结笔记lucene使用总结笔记lucene使用总结笔记
全文检索首先将要查询的目标文档中的词提取出来,组成索引,通过查询索引达到搜索目标文档的目的。这种先建立索引,再对索引进行搜索的过程就叫全文检索(Full-...这是一个使用lucene开源框架编写的一个简单的搜索功能
lucene3.0.3搜索的使用示例lucene3.0.3搜索的使用示例lucene3.0.3搜索的使用示例
spring-lucene简单项目
lucene 4.7.2支持java 6 ,之后的版本需要java 7以上,创建、删除、修改索引,搜索支持通用对象(可以根据对象类型搜索),可以范围搜索、排序、高亮,希望有所帮助
Lucene入门与使用,非常简单,适合入门