sphinx分布式索引

作者:吴泽鑫 分类: Sphinx全文检索 发布于:2016-4-6 0:49 ė4225次浏览 61条评论

分布式是为了改善查询延迟问题和提高多服务器、多cpu 或多核环境下的吞吐率, 对于大量数据(即十亿级的记录数和TB 级的文本量)上的搜索应用来说是很关键的。


分布式思想对数据进行水平分区 (HP, Horizontally partition),然后并行处理,当 searchd 收到一个对分布式索引的查询时,它做如下操作:

1. 连接到远程代理

2. 执行查询

3. 对本地索引迸行查询

4. 接收来自远程代理的搜索结果

5. 将所有结果合并,删除重复项

6. 将合并后的结果返回给客户端

相关配置参考如下:

index dist
{
    type=distributed
    local=chunk1
    agent=localhost:9312:chunk2 #本地,chunk2是索引名
    anget=192.168.100.2:9312:chunk3  #远程
}


本文出自 Jensen-吴泽鑫的博客,转载时请注明出处及相应链接:http://www.wuzexin.cn/post-59.html

评论

  1. 天才 2017-05-05 09:58 回复

    为什么我的不好用?只要配置这么简单的吗

发表评论

电子邮件地址不会被公开。必填项已用*标注


Ɣ回顶部