• 查询分析

  • SQL SHOW PROFILE 语句和 "profile": true 的 JSON 接口选项都可以提供已执行查询的详细执行分析。在使用 SQL 时,必须在当前会话中提前启用分析功能,可以通过 SET profiling=1 语句来完成。默认情况下,分析功能是禁用的,以避免潜在的性能影响,如果未启用,将返回一个空的分析结果。

    每个分析结果包含以下字段:

    • Status 列简要描述了时间花费的具体状态,详见下文。

    • Duration 列显示了耗时,单位为秒。

    • Switches 列显示查询引擎切换到给定状态的次数。这些仅仅是逻辑引擎状态的切换,而不是任何操作系统级别的上下文切换或函数调用(尽管某些部分可能确实映射到函数调用),并且它们对性能没有直接影响。从某种意义上说,切换次数只是命中相应分析点的次数。

    • Percent 列显示在此状态下花费的时间百分比。

    分析中的状态以预先记录的顺序返回,大致与实际查询顺序对应(但并完全相同)。

    状态列表可能(且将会)随着时间的推移而变化,以下是当前分析的状态的简要描述:

    • unknown:通用状态,涵盖尚未进行分析的代码或属于其他状态但任务太小以至于无需独立状态的部分。

    • net_read:从网络(即应用程序)读取查询。

    • io:通用文件 IO 时间。

    • dist_connect:在分布式表情况下连接到远程代理。

    • sql_parse:解析 SQL 语法。

    • dict_setup:词典和分词器的设置。

    • parse:解析全文检索查询语法。

    • transforms:全文检索查询的转换(通配符扩展、简化等)。

    • init:初始化查询评估。

    • open:打开表文件。

    • read_docs:读取文档列表的 IO 时间。

    • read_hits:读取关键字位置的 IO 时间。

    • get_docs:计算匹配的文档。

    • get_hits:计算匹配的位置。

    • filter:过滤全文匹配结果。

    • rank:计算相关性排名。

    • sort:对匹配结果进行排序。

    • finalize:完成每个表的搜索结果集(如最后阶段的表达式等)。

    • dist_wait:在分布式表情况下等待远程结果。

    • aggregate:聚合多个结果集。

    • net_write:将结果集写入网络。

SQL:

最后更新于