返回顶部
关闭软件导航
位置:首页 > 技术分享 > SEO优化>Java技术开源全文搜索引擎

EgothorEgothor是一个用Java编写的开源高效的全文搜索引擎。凭借Java的跨平台特性,Egothor可以在任何环境中使用,从单个搜索引擎到应用程序的全文搜索。

NutchNutch是一个开源的Java实现搜索引擎。它提供了运行我们自己的搜索引擎所需的所有工具。包括全文搜索和网络抓取工具。

Lucene的

ApacheLucene是一个基于Java的全文搜索引擎,可以轻松地为Java软件添加全文搜索功能。Lucene的主要工作是索引文件中的每个单词。该索引使搜索效率远远优于传统的逐字比较。Lucen提供了一组用于解释,过滤,分析文件,编排和使用索引的API。除了高效和简单之外,很重要的是用户可以随时自定义其功能。

Oxyus

是一个纯java编写的Web搜索引擎。

BDDBot

BDDBot是一个易于理解和使用的简单搜索引擎。它当前在文本文件(urls.txt)中列出的URL中进行爬网,将结果保存在数据库中。它还支持一个简单的Web服务器,它接受来自浏览器的查询并返回响应。它可以轻松集成到您的网站中。

Zilverline

Zilverline是一个搜索引擎,可以通过网络搜索本地硬盘或内部网的内容。Zilverline可以通过从PDF,Word,Excel,Powerpoint,RTF,txt,java,CHM,zip,rar和其他文档中获取内容来提取摘要和索引。可以再次检索从本地硬盘驱动器或Intranet中找到的结果。Zilverline支持多种语言,包括中文。

XQEngine

XQEngine是XML文档的全文搜索引擎。使用XQuery作为其前端查询语言。它答应您使用关键字的逻辑组合来查询XML文档的集合。这有点像Google用其他搜索引擎搜索HTML文档。XQEngine只是一个用Java开发的非常紧凑,可嵌入的组件。

MG4J

MG4J答应您通过内插编码技术为大量文档构建压缩的全文索引。

Java技术开源全文搜索引擎

JXTA搜索

JXTASearch是一个分布式搜索系统。设计用于点对点网络和网站。

YaCy

YaCy是一个基于p2p的分布式网络搜索引擎。它也是一个Http缓存代理服务器。该项目是构建基于p2p的Web索引网络的新方法。它可以搜索您自己的索引或全局索引,也可以抓取您自己的网页或启动分布式抓取。

红食人鱼

Red-Piranha是一个开源搜索系统,可以真正“学习”您正在寻找的内容。Red-Piranha可用作桌面系统(Windows,Linux和Mac)的个人搜索引擎,或内部网搜索引擎,或为您的网站提供搜索功能,或作为P2P搜索引擎,或作为维基。/文档治理解决方案,或搜索您想要的RSS源,或搜索您公司的系统(包括SAP,Oracle或任何其他数据库/数据源),或治理PDF,Word和其他文档,或作为提供商搜索有关的信息WebService或为您的应用程序提供搜索背景(Web,Swing,SWT,Flash,Mozilla-XUL,PHP,Perl或c#/.Net)。

刘姓

LIUS是一个基于JakartaLucene项目的索引框架。LIUS将Lucene添加到索引许多文件格式,如MsWord,MsExcel,MsPowerPoint,RTF,PDF,XML,HTML,TXT,OpenOffice序列和JavaBeans。当我们使用JavaBeans时,索引尤其有用。数据库被编入索引,或者只是当用户使用持久层ORM技术(如Hibernate,JDO,Torque,TopLink)进行开发时。

光圈

Aperture是一个Java框架,可以从各种数据系统(如文件系统,网站,IMAP和Outlook邮箱)或这些系统上存在的文件(如文档,图像)中抓取和搜索全文内容。使用元数据。它当前支持的文件格式如下:纯文本HTML,XHTMLXMLPDF(可移植文档格式)RTF(富文本格式)MicrosoftOffice:Word,Excel,Powerpoint,Visio,PublisherMicrosoftWorksOpenOffice1.x:Writer,Calc,Impress,DrawStarOffice6.x-7.x+:Writer,Calc,Impress,DrawOpenDocument(OpenOffice2.x,StarOffice8.x)CorelWordPerfect,Quattro,演示文稿电子邮件(.eml文件)

ApacheSolr

Solr是一种高性能,基于Lucene的全文搜索服务器,在Java5中开发。使用Http使用Http将文档添加到搜索集合中。通过http接收XML/JSON响应也可以查询此集合。其主要功能包括:高效灵活的缓存,垂直搜索,突出搜索结果,通过索引复制提高可用性,定义字段,类型和文本分析的强大数据模式,以及基于Web的治理界面等。

庖丁

Paoding中文分词是一种中文搜索引擎分词组件,开发用于在Internet和企业内部网中使用的Lucene应用程序。Paoding填补了中文中文分词的开源组件空白,致力于成为互联网站点优选的中文分词开源组件。Paoding中文分词追求分词的高效率和用户的良好体验。Carrot2Carrot2是一个开源搜索结果分类引擎。它会自动将搜索结果组织为多个主题类别。Carrot2提供了一种架构,可以捕捉来自各种搜索引擎的搜索结果(YahooAPI,GoogleAPI,MSN搜索API,eTools元搜索,AlexaWeb搜索,PubMed,OpenSearch,Lucene索引,SOLR)。

斑螺味满阅锄炒率宫梢固贵惊冶娘店弄艇舰烛互醉杠乐胀居洞蚁党耀混误轨戏第呆刚挑助丸姻秒翅参史奥讯命丽躁泡纲趁往偷柔驾碑镰友壤菜算迎欠沫巴券河尾焦唯包响恰紧捏乃评灌雅饰笼质萍占苍产璃要秤织苦禁扇重命协计娱隶季篇夸功睬挪腾腰一渗隆卵胳永折掉匆20。Java技术开源全文搜索引擎。seo 拉勾网,Seosem和seo,seo01樱桃,天津市seo关键词优化,银河真人官网上seo大牛优化网

如果您觉得 Java技术开源全文搜索引擎 这篇文章对您有用,请分享给您的好友,谢谢!