solr
2016-01-04 10:26:53 1 举报
Solr是一个开源的、基于Lucene的全文搜索服务器。它提供了一个强大的搜索引擎库,可以对大量数据进行高效的全文检索、命中加亮显示和分面查询。Solr支持多种文档格式,包括HTML、XML、PDF等,并提供了丰富的查询功能,如模糊查询、范围查询、分组查询等。此外,Solr还具有高可扩展性、容错性和易用性等特点,广泛应用于企业级搜索应用、电子商务网站等领域。总之,Solr是一个强大而灵活的搜索引擎工具,可以帮助用户快速构建高效、智能的搜索系统。
作者其他创作
大纲/内容
Start
提交拓扑
redis是否以保存task
tuple
spout
字段分析
TridentFieldAnalysiser
加载插件并生成插件链上下文
1、加载插件,通过插件的name加载插件的jar2、加载完插件,校验插件参数、并初始化插件
Y
solr
solrDoc
List
将solr的
创建Storm的Trident拓扑
TridentFixDocNumSolrDocPusher
TridentFixDocNumSpout
query
通过storm的nimbus提交拓扑,参数为(拓扑name、task代码路径、拓扑配置、Trident拓扑)
solr数据源
shardMessage
CursorMarkSolrRequest
创建Storm的Trident拓扑配置
FixedStepMultiCollectionSpout(规定步骤数据流源)
hdfs数据源
提交task
获取index数据源类型
N
end
bolt
将插件name存入list
创建storm流源spout(solr)
空闲工作进程是否足够
1、将task保存到map 2、将task持久化到redis,key为taskId
创建storm流源spout(hdfs)
注册task
向storm提交task的拓扑(Topology)
通过storm的nimbus获取storm的主线程list(supervisor),再通过每个supervisor获取空闲进程
解析searchExpress
SubmitTaskRequest
获取storm的空闲工作进程
entity
0 条评论
下一页