ADSL拨号VPS包含了中国大陆（联通，移动，电信，）

中国香港，国外拨号VPS。

当前位置：云主机 > MYSQL >

电信ADSL拨号VPS

上饶电信拨号VPS

洛阳电信拨号VPS

威海电信拨号VPS

济南电信拨号VPS

九江电信拨号VPS

厦门电信拨号VPS

邢台电信拨号VPS

湖州电信拨号VPS

绍兴电信拨号VPS

宁波电信拨号VPS

温州电信拨号VPS

杭州电信拨号VPS

郑州电信拨号VPS

铜陵电信拨号VPS

池州电信拨号VPS

黄山电信拨号VPS

十堰电信拨号VPS

荆门电信拨号VPS

莆田电信拨号VPS

三明电信拨号VPS

永州电信拨号VPS

张家界电信拨号VPS

常德电信拨号VPS

昆明电信拨号VPS

丽江电信拨号VPS

马鞍山电信拨号VPS

宣城电信拨号VPS

合肥电信拨号VPS

淮北电信拨号VPS

泰州电信拨号VPS

南通电信拨号VPS

南京电信拨号VPS

扬州电信拨号VPS

宿迁电信拨号VPS

镇江电信拨号VPS

苏州电信拨号VPS

淮安电信拨号VPS

盐城电信拨号VPS

包头电信拨号VPS

海口电信拨号VPS

江门电信拨号VPS

眉山电信拨号VPS

德阳电信拨号VPS

衢州电信拨号VPS

上海电信拨号VPS

桂林电信拨号VPS

成都电信拨号VPS

鞍山电信拨号VPS

福州电信拨号VPS

柳州电信拨号VPS

无锡电信拨号VPS

乌兰察布电信拨号VPS

深圳电信拨号VPS

河源电信拨号VPS

秦皇岛电信拨号VPS

徐州电信拨号VPS

台州电信拨号VPS

芜湖电信拨号VPS

蚌埠电信拨号VPS

潮州电信拨号VPS

重庆电信拨号VPS

连云港电信拨号VPS

绵阳电信拨号VPS

泰安电信拨号VPS

晋城电信拨号VPS

广州电信拨号VPS

联通ADSL拨号VPS

北京联通拨号VPS

滨州联通拨号VPS

莱芜联通拨号VPS

鞍山联通拨号VPS

连云港联通拨号VPS

海口联通拨号VPS

徐州联通拨号VPS

重庆联通拨号VPS

上海联通拨号VPS

西昌联通拨号VPS

南充联通拨号VPS

枣庄联通拨号VPS

抚顺联通拨号VPS

唐山联通拨号VPS

保定联通拨号VPS

廊坊联通拨号VPS

武汉联通拨号VPS

泰安联通拨号VPS

雅安联通拨号VPS

盘锦联通拨号VPS

泰州联通拨号VPS

移动ADSL拨号VPS

盐城移动拨号VPS

莱芜移动拨号VPS

在MySQL中使用Sphinx实现多线程搜索的方法

时间:2020-11-02 13:40 作者:admin

mysql/' target='_blank'>mysql、Sphinx及许多数据库和搜索引擎中的查询是单线程的。比如说，在一台32个CPU核心、16个磁盘的R910服务器上执行一个查询，它最多只会用到一个核心和一个磁盘。没错，只会使用一个。

如果查询是CPU密集型作业，那么会使用大约3%的整机CPU能力(以上述32核机器为例)。如果是磁盘密集型，则大约会使用6%的整机IO能力(也是与上例同样的配置，16个磁盘组成RAID10或RAID0)。

我再换个说法吧。如果你在一台单核单磁盘的机器上执行了某个查询，花了10秒，那么把同样的查询放到一台32核16磁盘的机器上去跑，同样需要10秒，不会有丝毫改善。

你早就知道这一点了，对吧？那么，我的问题是——有没有办法可以改善呢？

如果是Sphinx，太棒了，答案是有！而且不需要花上太多的工夫。你甚至不需要修改应用和数据库，只需要稍微改下Sphinx的配置。

计划

首先，我来说明一下我们的目标。

Sphinx本身就支持分布式搜索，在很久以前就已经朝着水平扩展的目标来设计。如果索引在一台机器上放不下，可以让多台机器分别对不同的部分进行索引，设置一个聚合节点，负责从应用接收请求，然后把请求再同时发给所有的数据节点，最后将它们返回的结果合并起来，返回给应用。在应用看起来，就好像只有一台服务器在为它服务。

好，下面你猜怎么着？哈，我们可以把这个功能应用到单台机器上，让我们的查询快上n多倍。而且，现在Sphinx已经支持这种做法了，所以我们根本不用再假装查询哪些远程节点。

还有另外一个好处，配置分布式搜索以后，索引是可以并行建的！

还是有一点需要注意，虽然这种做法可以加速绝大多数的查询，但还是有一些例外的情况。因为，并行的查询结果仍然需要合并起来，而这个合并过程是单线程的。而且，合并包括一些CPU密集的操作，如分级、排序，甚至用GROUP BY进行COUNT，如果数据量很大，合并过程就会变成瓶颈。

要确认这一点也很简单，只要查看Sphinx的查询日志，看看每个查询匹配的记录数有多少，我们就心里有数了。

执行

假设在服务器上一个索引配置如下 (很多细节都省略了):
复制代码代码如下:
source src1
{
type = MySQL
sql_query = SELECT id, text FROM table
}

index idx1
{
type = plain
source = src1
}

searchd
{
dist_threads = 0 # default
}
现在我们使用有3个CPU核心和磁盘的机器来做这个索引--就是这个idx1.下面是我们更改的配置文件 :

复制代码代码如下:
source src1
{
type = mysql
sql_query = SELECT id, text FROM table
}

source src1p0 : src1
{
sql_query = SELECT id, text FROM table WHERE id % 3 = 0;
}

source src1p1 : src1
{
sql_query = SELECT id, text FROM table WHERE id % 3 = 1;
}

source src1p2 : src1
{
sql_query = SELECT id, text FROM table WHERE id % 3 = 2;
}

index idx1_template
{
type = plain
source = src1
}

index idx1p0 : idx1_template
{
source = src0
}

index idx1p1 : idx1_template
{
source = src1
}

index idx1p2 : idx1_template
{
source = src2
}

index idx1
{
type = distributed
local = idx1p0
local = idx1p1
local = idx1p2
}

searchd
{
dist_threads = 3
}

做完这些后，你需要重建索引. 但是现在idx1p0到idx1p2的索引indexer命令可以同步进行.

另外，用不同的操作来分离数据不是最好的办法, 你可以在MYSQL中用一个辅助表来区分它们的范围, 配合 sql_query_range使用或是别的什么, 具体根据你的数据来决定.

写在最后

我一直都很喜欢 Sphinx，Sphinx可以如此容易的扩展到你所需要的足够多的机器上，并且这种方式在很多年前就已经在被使用了。然后，我想，我并没有和我往常一样，利用这个特性来使得在一台机器上的查询变得更快。嗯，这并不是在说它很慢或者其实什么，只是，查询永远不会太快，不是吗？

(责任编辑：admin)

上一篇：使用cgroups来限制MySQL企业备份服务对资源的占用
下一篇：详细讲解安全升级MySQL的方法

帮助中心: 会员注册; 找回密码; 新闻中心

快捷通道: 域名登录面板; 虚机登录面板; 云主机登录面板

关于我们: 关于我们; 联系我们

联系方式: 售前咨询：17830004266(重庆移动); 企业QQ：383546523

《中华人民共和国工业和信息化部》编号：ICP备00012341号

Copyright © 2002 -2018 香港云主机版权所有
声明：香港云主机品牌标志、品牌吉祥物均已注册商标，版权所有，窃用必究

云官方微信

在线客服

企业QQ:
技术支持：383546523

公司总台电话：17830004266(重庆移动)
售前咨询热线：17830004266(重庆移动)