count_min_sketch() 函数

工具包TimescaleDB 工具包函数在 Timescale 社区版下可用。它们自动包含在 Timescale 中，但必须为自托管 TimescaleDB 单独安装。点击了解更多。

使用概率性 count-min sketch 数据结构及其相关算法，计算值在列中出现的次数。对于可以容忍小错误率的应用程序，这可以大大节省 CPU 时间和内存，特别是对于大型数据集。

此组中的函数

警告

此函数组包含一些实验性函数。实验性函数可能会在未来的版本中更改或删除。我们不建议在生产环境中使用它们。实验性函数标有实验性标签。

count_min_sketch: 实验性将数据聚合到 CountMinSketch 中以进行近似计数

approx_count: 实验性从 CountMinSketch 估计值出现的次数

函数详情

count_min_sketch(
    values TEXT,
    error DOUBLE PRECISION,
    probability DOUBLE PRECISION,
) RETURNS CountMinSketch

将数据聚合到 CountMinSketch 对象中，您可以使用该对象来估计给定项目在列中出现的次数。草图生成频率的偏差估计器。它可能会高估项目计数，但不会低估。

您可以控制相对误差和估计值落在误差范围之外的概率。

必需参数

名称	类型	描述
`values`	`TEXT`	要计数的数值列
`error`	`DOUBLE PRECISION`	估计中的误差容限，相对于添加到草图中的数值数量计算
`probability`	`DOUBLE PRECISION`	估计值落在误差范围之外的概率

返回值

列	类型	描述
`count_min_sketch`	`CountMinSketch`	存储计数器表的对象

approx_count (
    item TEXT,
    agg CountMinSketch
) RETURNS INTEGER

估计给定文本值在列中出现的次数。

必需参数

名称	类型	描述
`item`	`TEXT`	您要估计出现次数的值
`agg`	`CountMinSketch`	使用 `count_min_sketch` 创建的 `CountMinSketch` 对象

返回值

列	类型	描述
`approx_count`	`INTEGER`	`item` 在草图中估计出现的次数

示例

给定股票数据表，估计符号 AAPL 出现的次数


WITH t AS (
  SELECT toolkit_experimental.count_min_sketch(symbol, 0.01, 0.01) AS symbol_sketch
  FROM stocks_real_time
)
SELECT toolkit_experimental.approx_count('AAPL', symbol_sketch)
FROM t;

count_min_sketch() 函数

相关超级函数组

两步聚合

此组中的函数

警告

聚合

访问器

函数详情

count_min_sketch()

approx_count()

count_min_sketch() 函数

简介

相关超级函数组

两步聚合

此组中的函数

警告

聚合

访问器

函数详情

count_min_sketch()

approx_count()

相关内容