函数管道

工具包TimescaleDB 工具包函数在 Timescale 社区版下可用。它们自动包含在 Timescale 中，但对于自托管的 TimescaleDB 必须单独安装。点击了解更多。实验性实验性 TimescaleDB 工具包函数不适用于生产环境。它们可能存在错误，并可能导致数据丢失。点击了解更多。

函数管道是一项实验性功能，旨在从根本上改进您编写查询以分析 PostgreSQL 和 SQL 中数据的方式。它们通过应用来自函数式编程和流行的工具（如 Python Pandas 和 PromQL）的原则来工作。

警告

实验性功能可能存在错误。它们可能不向后兼容，并可能在未来的版本中删除。使用这些功能需自行承担风险，并且不要在生产环境中使用任何实验性功能。

重要提示

timevector() 函数会在内存中物化其所有数据点。这意味着如果您在非常大的数据集上使用它，它会耗尽内存。不要在大型数据集或生产环境中使用 timevector 函数。

SQL 是数据分析的最佳语言，但它并非完美，有时很难构建您想要的查询。例如，此查询从 measurements 表中获取最近一天的数据，按 time 列对数据进行排序，计算值之间的增量，取增量的绝对值，然后取先前步骤结果的总和


SELECT device id,
sum(abs_delta) as volatility
FROM (
 SELECT device_id,
abs(val - lag(val) OVER last_day) as abs_delta
FROM measurements
WHERE ts >= now()-'1 day'::interval) calc_delta
GROUP BY device_id;

您可以使用函数管道像这样表达相同的查询


SELECT device_id,
    toolkit_experimental.timevector(ts, val)
        -> toolkit_experimental.sort()
        -> toolkit_experimental.delta()
        -> toolkit_experimental.abs()
        -> toolkit_experimental.sum() as volatility
FROM measurements
WHERE ts >= now()-'1 day'::interval
GROUP BY device_id;

函数管道完全符合 SQL 标准，这意味着任何支持 SQL 的工具都能够支持使用函数管道进行数据分析。

函数管道的结构

函数管道构建为一系列协同工作的元素，以创建您的查询。管道最重要的部分是名为 timevector 的自定义数据类型。然后，其他元素作用于 timevector 以构建您的查询，使用自定义运算符来定义元素运行的顺序。

Timevectors

timevector 是时间-值对的集合，具有定义的开始和结束时间，可能类似于这样

您的整个数据库可能具有追溯到很久以前并持续到未来的时间-值对，但 timevector 在该数据集中具有定义的开始和结束时间，可能类似于这样

An example of a timevector within a larger dataset

要从您的数据构造 timevector，请使用自定义聚合并传入要成为时间-值对的列。它使用 WHERE 子句来定义子集的限制，并使用 GROUP BY 子句来提供关于时间序列的识别信息。例如，要从包含温度的数据集中构造 timevector，SQL 看起来像这样


SELECT device_id,
 toolkit_experimental.timevector(ts, val)
FROM measurements
WHERE ts >= now() - '1 day'::interval
GROUP BY device_id;

自定义运算符

函数管道使用单个自定义运算符 ->。此运算符用于应用和组合多个函数。 -> 运算符接受运算符左侧的输入，并应用运算符右侧的操作。更简单地说，您可以将其视为“执行下一步操作”。

典型的函数管道可能看起来像这样


SELECT device_id,
  toolkit_experimental.timevector(ts, val)
        -> toolkit_experimental.sort()
        -> toolkit_experimental.delta()
        -> toolkit_experimental.abs()
        -> toolkit_experimental.sum() as volatility
FROM measurements
WHERE ts >= now() - '1 day'::interval
GROUP BY device_id;

虽然乍一看 timevector(ts, val) 操作似乎是 sort() 的参数，但在管道中，这些都是常规函数调用。每个调用只能对其自身括号中的内容进行操作，并且不了解语句中它们左侧的任何内容。

管道中的每个函数都返回一个自定义类型，该类型描述了函数及其参数，这些都是管道元素。 -> 运算符根据其左右两侧的类型执行两种不同类型的操作

将管道元素应用于左侧参数：直接对传入的数据类型执行管道元素描述的函数。
将管道元素组合成可以在未来某个时间点应用的组合元素。这是一种优化，允许您嵌套元素以减少所需的传递次数。

运算符根据其左右参数确定要执行的操作。

管道元素

管道元素主要有两种类型

转换更改 timevector 的内容，并返回更新后的向量。
终结器完成管道并输出结果数据。

转换元素接收 timevector 并生成 timevector。它们是最容易组合的元素，因为它们产生相同的类型。例如


SELECT device_id,
 toolkit_experimental.timevector(ts, val)
     -> toolkit_experimental.sort()
        -> toolkit_experimental.delta()
        -> toolkit_experimental.map($$ ($value^3 + $value^2 + $value * 2) $$)
        -> toolkit_experimental.lttb(100)
FROM measurements

终结器元素结束管道的 timevector 部分。它们可以生成指定格式的输出。或者它们可以生成 timevector 的聚合。

例如，产生输出的终结器元素


SELECT device_id,
 toolkit_experimental.timevector(ts, val)
    -> toolkit_experimental.sort()
    -> toolkit_experimental.delta()
    -> toolkit_experimental.unnest()
FROM measurements

或者产生聚合的终结器元素


SELECT device_id,
 toolkit_experimental.timevector(ts, val)
    -> toolkit_experimental.sort()
    -> toolkit_experimental.delta()
    -> toolkit_experimental.time_weight()
FROM measurements

第三种类型的管道元素是聚合访问器和修改器。这些在管道中的 timevector 上工作，但它们也适用于常规聚合查询。在管道中使用这些的示例


SELECT percentile_agg(val) -> toolkit_experimental.approx_percentile(0.5)
FROM measurements

转换元素

转换元素接收 timevector，并生成 timevector。

向量化数学函数

向量化数学函数元素使用指定的数学函数修改 timevector 内的每个 value。它们逐点应用，并且产生从输入到输出 timevector 的一对一映射。输入中的每个点在输出中都有一个对应的点，其 value 由指定的数学函数转换。

元素始终从左到右应用，因此即使存在显式括号，也不会考虑运算顺序。这意味着对于 timevector 行 ('2020-01-01 00:00:00+00', 20.0)，此管道有效


timevector('2021-01-01 UTC', 10) -> add(5) -> (mul(2) -> add(1))

并且此管道以相同的方式工作


timevector('2021-01-01 UTC', 10) -> add(5) -> mul(2) -> add(1)

这两个示例都产生 ('2020-01-01 00:00:00+00', 31.0)。

如果需要多个算术运算并且优先级很重要，请考虑使用 Lambda。

一元数学函数

一元数学函数元素将相应的数学函数应用于 timevector 中的每个数据点，保持时间戳和排序不变。可用的元素有

元素	描述
`abs()`	计算每个值的绝对值
`cbrt()`	计算每个值的立方根
`ceil()`	计算大于或等于每个值的最小整数
`floor()`	计算小于或等于每个值的最大整数
`ln()`	计算每个值的自然对数
`log10()`	计算每个值的以 10 为底的对数
`round()`	计算最接近每个值的整数
`sign()`	为每个正/负值计算 +/-1
`sqrt()`	计算每个值的平方根
`trunc()`	仅计算每个值的整数部分

即使元素在逻辑上计算整数，timevectors 也只处理双精度浮点值，因此计算值是整数的浮点表示。例如


-- NOTE: the (pipeline -> unnest()).* allows for time, value columns to be produced without a subselect
SELECT (
    toolkit_experimental.timevector(time, value)
    -> toolkit_experimental.abs()
    -> toolkit_experimental.unnest()).*
FROM (VALUES (TimestampTZ '2021-01-06 UTC',   0.0 ),
             (            '2021-01-01 UTC',  25.0 ),
             (            '2021-01-02 UTC',   0.10),
             (            '2021-01-04 UTC', -10.0 ),
             (            '2021-01-05 UTC',   3.3 )
     ) as v(time, value);

此示例的输出


time          | value
------------------------+-------
 2021-01-06 00:00:00+00 |     0
 2021-01-01 00:00:00+00 |    25
 2021-01-02 00:00:00+00 |   0.1
 2021-01-04 00:00:00+00 |    10
 2021-01-05 00:00:00+00 |   3.3
(5 rows)

二元数学函数

二元数学函数元素在 timevector 中每个点的 value 上运行相应的数学函数，使用提供的数字作为函数的第二个参数。可用的元素有

元素	描述
`add(N)`	计算每个值加 `N`
`div(N)`	计算每个值除以 `N`
`logn(N)`	计算每个值的以 `N` 为底的对数
`mod(N)`	计算每个数除以 `N` 时的余数
`mul(N)`	计算每个值乘以 `N`
`power(N)`	计算每个值的 `N` 次幂
`sub(N)`	计算每个值减去 `N`

这些元素通过对所有 values 求平方来计算 vector -> power(2)，而 vector -> logn(3) 给出每个 value 的以 3 为底的对数。例如


SELECT (
    toolkit_experimental.timevector(time, value)
    -> toolkit_experimental.power(2)
    -> toolkit_experimental.unnest()).*
FROM (VALUES (TimestampTZ '2021-01-06 UTC',   0.0 ),
             (            '2021-01-01 UTC',  25.0 ),
             (            '2021-01-02 UTC',   0.10),
             (            '2021-01-04 UTC', -10.0 ),
             (            '2021-01-05 UTC',   3.3 )
     ) as v(time, value);

此示例的输出


time          |        value
------------------------+----------------------
 2021-01-06 00:00:00+00 |                    0
 2021-01-01 00:00:00+00 |                  625
 2021-01-02 00:00:00+00 | 0.010000000000000002
 2021-01-04 00:00:00+00 |                  100
 2021-01-05 00:00:00+00 |   10.889999999999999
(5 rows)

数学变换仅应用于 timevector 中每个点的 value，并且始终产生一对一的输出 timevectors。复合变换可以同时涉及 timevector 中点的 time 和 value 部分，并且它们不一定是一对一的。可以使用输入中的一个或多个点来产生输出中的零个或多个点。因此，数学变换始终产生相同长度的 timevectors，而复合变换可以产生更大或更小的 timevectors 作为输出。

Delta 变换

delta() 变换计算 timevector 中连续 values 之间的差值。 timevector 中的第一个点被省略，因为没有先前的值，因此它不能有 delta()。数据应在使用 delta() 之前使用 sort() 元素进行排序。例如


SELECT (
    toolkit_experimental.timevector(time, value)
    -> toolkit_experimental.sort()
    -> toolkit_experimental.delta()
    -> toolkit_experimental.unnest()).*
FROM (VALUES (TimestampTZ '2021-01-06 UTC',   0.0 ),
             (            '2021-01-01 UTC',  25.0 ),
             (            '2021-01-02 UTC',   0.10),
             (            '2021-01-04 UTC', -10.0 ),
             (            '2021-01-05 UTC',   3.3 )
     ) as v(time, value);

此示例的输出


time          | value
------------------------+-------
 2021-01-02 00:00:00+00 | -24.9
 2021-01-04 00:00:00+00 | -10.1
 2021-01-05 00:00:00+00 |  13.3
 2021-01-06 00:00:00+00 |  -3.3
(4 rows)

注意

输出的第一行缺失，因为没有先前的值就无法计算增量。

填充方法变换

fill_to() 变换确保至少每 interval 有一个点，如果没有点，则使用提供的方法填充点。 timevector 必须在调用 fill_to() 之前排序。可用的填充方法有

fill_method	描述
LOCF	最后对象向前结转，用洞之前的最后一个已知值填充
Interpolate	使用与任一侧的第一个已知值共线的点填充洞
Linear	这是插值的别名
Nearest	用洞之前或之后的较近点的匹配值填充

例如


SELECT (
    toolkit_experimental.timevector(time, value)
    -> toolkit_experimental.sort()
    -> toolkit_experimental.fill_to('1 day', 'LOCF')
    -> toolkit_experimental.unnest()).*
FROM (VALUES (TimestampTZ '2021-01-06 UTC',   0.0 ),
             (            '2021-01-01 UTC',  25.0 ),
             (            '2021-01-02 UTC',   0.10),
             (            '2021-01-04 UTC', -10.0 ),
             (            '2021-01-05 UTC',   3.3 )
     ) as v(time, value);

此示例的输出


time          | value
------------------------+-------
 2021-01-01 00:00:00+00 |    25
 2021-01-02 00:00:00+00 |   0.1
 2021-01-03 00:00:00+00 |   0.1
 2021-01-04 00:00:00+00 |   -10
 2021-01-05 00:00:00+00 |   3.3
 2021-01-06 00:00:00+00 |     0
(6 rows)

最大三角形三桶 (LTTB) 变换

最大三角形三桶 (LTTB) 变换使用 LTTB 图形降采样算法将 timevector 降采样到指定的分辨率，同时保持视觉敏锐度。

排序变换

sort() 变换按时间升序对 timevector 进行排序。如果 timevector 已经排序，则忽略此变换。例如


SELECT (
    toolkit_experimental.timevector(time, value)
    -> toolkit_experimental.sort()
    -> toolkit_experimental.unnest()).*
FROM (VALUES (TimestampTZ '2021-01-06 UTC',   0.0 ),
             (            '2021-01-01 UTC',  25.0 ),
             (            '2021-01-02 UTC',   0.10),
             (            '2021-01-04 UTC', -10.0 ),
             (            '2021-01-05 UTC',   3.3 )
     ) as v(time, value);

此示例的输出


time          | value
------------------------+-------
 2021-01-01 00:00:00+00 |    25
 2021-01-02 00:00:00+00 |   0.1
 2021-01-04 00:00:00+00 |   -10
 2021-01-05 00:00:00+00 |   3.3
 2021-01-06 00:00:00+00 |     0
(5 rows)

Lambda 元素

Lambda 元素函数使用 Toolkit 的实验性 Lambda 语法来转换 timevector。 Lambda 是应用于 timevector 元素的表达式。它写为字符串，通常是 $$ 引用的，其中包含要运行的表达式。例如


$$
 let $is_relevant = $time > '2021-01-01't and $time < '2021-10-14't;
 let $is_significant = abs(round($value)) >= 0;
 $is_relevant and $is_significant
$$

Lambda 表达式可以使用以下组件构造

变量声明，例如 let $foo = 3; $foo * $foo。变量声明以分号结尾。所有 Lambda 都必须以表达式结尾，表达式没有分号。多个变量声明可以彼此跟随，例如：let $foo = 3; let $bar = $foo * $foo; $bar * 10
变量名，例如 $foo。它们必须以 $ 符号开头。变量 $time 和 $value 是保留的；它们指的是 Lambda 表达式被调用时向量中点的时间和值。
函数调用，例如 abs($foo)。支持大多数数学函数。
二元运算，包含算术二元运算符 and、or、=、!=、<、<=、>、>=、^、*、/、+ 和 -。
间隔字面量，用尾随 i 表示。例如，'1 day'i。除了尾随 i 之外，这些都遵循 PostgreSQL INTERVAL 输入格式。
时间字面量，例如 '2021-01-02 03:00:00't，用尾随 t 表示。除了尾随 t 之外，这些都遵循 PostgreSQL TIMESTAMPTZ 输入格式。
数字字面量，例如 42、0.0、-7 或 1e2。

Lambda 遵循大致等同于 EBNF 的语法。例如


Expr     = ('let' Variable '=' Tuple ';')* Tuple
Tuple    = Binops (',' Binops)*
Binops   = Unaryops (Binop Unaryops)*
UnaryOps = ('-' | 'not') UnaryOps | Term
Term     = Variable | Time | Interval | Number | Function | '(' Expr ')'
Function = FunctionName '(' (Binops ',')* ')'
Variable = ? described above ?
Time     = ? described above ?
Interval = ? described above ?
Number   = ? described above ?

Map Lambda

map() Lambda 映射 timevector 的每个元素。此 Lambda 必须返回 DOUBLE PRECISION，其中仅更改 timevector 中每个点的值，或返回 (TIMESTAMPTZ, DOUBLE PRECISION)，其中时间和值都已更改。 map() Lambda 返回 DOUBLE PRECISION 的示例


SELECT (
   toolkit_experimental.timevector(time, value)
   -> toolkit_experimental.map($$ $value + 1 $$)
   -> toolkit_experimental.unnest()).*
FROM (VALUES (TimestampTZ '2021-01-06 UTC',   0.0 ),
             (            '2021-01-01 UTC',  25.0 ),
             (            '2021-01-02 UTC',   0.10),
             (            '2021-01-04 UTC', -10.0 ),
             (            '2021-01-05 UTC',   3.3 )
     ) as v(time, value);

此示例的输出


time          | value
------------------------+-------
 2021-01-06 00:00:00+00 |     1
 2021-01-01 00:00:00+00 |    26
 2021-01-02 00:00:00+00 |   1.1
 2021-01-04 00:00:00+00 |    -9
 2021-01-05 00:00:00+00 |   4.3
(5 rows)

map() Lambda 返回 (TIMESTAMPTZ, DOUBLE PRECISION) 的示例


SELECT (
   toolkit_experimental.timevector(time, value)
   -> toolkit_experimental.map($$ ($time + '1day'i, $value * 2) $$)
   -> toolkit_experimental.unnest()).*
FROM (VALUES (TimestampTZ '2021-01-06 UTC',   0.0 ),
             (            '2021-01-01 UTC',  25.0 ),
             (            '2021-01-02 UTC',   0.10),
             (            '2021-01-04 UTC', -10.0 ),
             (            '2021-01-05 UTC',   3.3 )
     ) as v(time, value);

此示例的输出


time          | value
------------------------+-------
 2021-01-07 00:00:00+00 |     0
 2021-01-02 00:00:00+00 |    50
 2021-01-03 00:00:00+00 |   0.2
 2021-01-05 00:00:00+00 |   -20
 2021-01-06 00:00:00+00 |   6.6
(5 rows)

Filter Lambda

filter() Lambda 根据 Lambda 表达式过滤 timevector，该表达式对于应保留在 timevector 时间序列中的每个点返回 true，对于应删除的每个点返回 false。例如


SELECT (
   toolkit_experimental.timevector(time, value)
   -> toolkit_experimental.filter($$ $time != '2021-01-01't AND $value > 0 $$)
   -> toolkit_experimental.unnest()).*
FROM (VALUES (TimestampTZ '2021-01-06 UTC',   0.0 ),
             (            '2021-01-01 UTC',  25.0 ),
             (            '2021-01-02 UTC',   0.10),
             (            '2021-01-04 UTC', -10.0 ),
             (            '2021-01-05 UTC',   3.3 )
     ) as v(time, value);

此示例的输出


time          | value
------------------------+-------
 2021-01-02 00:00:00+00 |   0.1
 2021-01-05 00:00:00+00 |   3.3
(2 rows)

终结器元素

终结器元素完成函数管道，并输出值或聚合。

输出元素

您可以使用 timevector 输出元素来终结管道。这些在管道的末尾使用，以返回 timevector。如果您需要在以后在另一个管道中使用它们，这将非常有用。两种类型的输出是

unnest()，它返回一组 (TimestampTZ, DOUBLE PRECISION) 对。
materialize()，它强制管道物化 timevector。这会阻止任何延迟物化 timevector 的优化。

聚合输出元素

这些元素接收 timevector，并在其上运行相应的聚合以产生结果。可能的元素有

average()
integral()
counter_agg()
hyperloglog()
stats_agg()
sum()
num_vals()

使用 num_vals() 的聚合输出示例


SELECT toolkit_experimental.timevector(time, value) -> toolkit_experimental.num_vals()
FROM (VALUES (TimestampTZ '2021-01-06 UTC',   0.0 ),
             (            '2021-01-01 UTC',  25.0 ),
             (            '2021-01-02 UTC',   0.10),
             (            '2021-01-04 UTC', -10.0 ),
             (            '2021-01-05 UTC',   3.3 )
     ) as v(time, value);

此示例的输出


?column?
----------
        5
(1 row)

使用 stats_agg() 的聚合输出示例


SELECT
    toolkit_experimental.timevector(time, value)
    -> toolkit_experimental.stats_agg()
    -> toolkit_experimental.stddev()
FROM (VALUES (TimestampTZ '2021-01-06 UTC',   0.0 ),
             (            '2021-01-01 UTC',  25.0 ),
             (            '2021-01-02 UTC',   0.10),
             (            '2021-01-04 UTC', -10.0 ),
             (            '2021-01-05 UTC',   3.3 )
     ) as v(time, value);

此示例的输出


?column?
--------------------
 12.924666339987272
(1 row)

聚合访问器和修改器

聚合访问器和修改器在函数管道中的工作方式与在其他聚合中的工作方式相同。您可以使用它们从函数管道的聚合部分获取值。例如


SELECT device_id,
timevector(ts, val) -> sort() -> delta() -> stats_agg() -> variance()
FROM measurements

当您在管道中使用它们而不是标准函数访问器和修改器时，它们可以通过消除嵌套函数使语法更清晰。例如，嵌套语法看起来像这样


SELECT approx_percentile(0.5, percentile_agg(val))
FROM measurements

使用带有 -> 运算符的函数管道看起来像这样


SELECT percentile_agg(val) -> approx_percentile(0.5)
FROM measurements

计数器聚合

计数器聚合处理重置计数器。计数器是应用程序性能监控和指标中的常见指标类型。所有值都已考虑重置。当在管道中使用时，这些元素必须在其左侧有一个 CounterSummary，来自 counter_agg() 聚合或管道元素。可用的计数器聚合函数有

元素	描述
`counter_zero_time()`	基于输入到 `CounterSummary` 的点（x 轴截距）的最小二乘拟合，预测计数器值已归零的时间
`corr()`	调整后的计数器值的最小二乘拟合线的相关系数
`delta()`	计算计数器的最后一个值减去第一个值
`extrapolated_delta(method)`	使用提供的方法外推到范围边界的增量计算。边界必须已在聚合或 `with_bounds` 调用中提供。
`idelta_left()`/`idelta_right()`	计算第二个点和第一个点（左）或最后一个点和倒数第二个点（右）之间的瞬时差
`intercept()`	调整后的计数器值的最小二乘拟合线的 y 轴截距
`irate_left()`/`irate_right()`	计算第二个点和第一个点（左）或最后一个点和倒数第二个点（右）之间的瞬时变化率
`num_changes()`	计数器值更改的次数
`num_elements()`	项目数 - 任何具有完全相同时间的项目都只计数一次
`num_changes()`	计数器重置的次数
`slope()`	调整后的计数器值的最小二乘拟合线的斜率
`with_bounds(range)`	如果未在聚合步骤中提供范围，则使用 `range` (`TSTZRANGE`) 将边界应用于 `CounterSummary`

百分位数近似

百分位数近似聚合访问器用于近似百分位数。目前，仅为基于 percentile_agg 和 uddsketch 的聚合实现了访问器。我们尚未为使用 tdigest 的百分位数近似实现管道聚合。

元素	描述
`approx_percentile(p)`	百分位数 `p` 的近似值
`approx_percentile_rank(v)`	值 `v` 将落入的近似百分位数
`error()`	近似保证的最大相对误差
`mean()`	输入值的精确平均值。
`num_vals()`	输入值的数量

统计聚合

统计聚合访问器添加了对常见统计聚合的支持。这些使您可以计算和 rollup() 常见的统计聚合，如 average 和 stddev，更高级的聚合如 skewness，以及二维聚合如 slope 和 covariance。因为这些聚合既有单维度版本也有二维版本，所以访问器可以有多种形式。例如，average() 计算单维度聚合的平均值，而 average_y() 和 average_x() 计算两个维度中每个维度的平均值。可用的统计聚合有

元素	描述
`average()/average_y()/average_x()`	值的平均值
`corr()`	最小二乘拟合线的相关系数
`covariance(method)`	使用 `population` 或 `sample` 方法的值的协方差
`determination_coeff()`	值的确定系数（或 R 平方）
`kurtosis(method)/kurtosis_y(method)/kurtosis_x(method)`	使用 `population` 或 `sample` 方法的值的峰度（四阶矩）
`intercept()`	最小二乘拟合线的截距
`num_vals()`	看到的数值个数
`skewness(method)/skewness_y(method)/skewness_x(method)`	使用 `population` 或 `sample` 方法的值的偏度（三阶矩）
`slope()`	最小二乘拟合线的斜率
`stddev(method)/stddev_y(method)/stddev_x(method)`	使用 `population` 或 `sample` 方法的值的标准差
`sum()`	值的总和
`variance(method)/variance_y(method)/variance_x(method)`	使用 `population` 或 `sample` 方法的值的方差
`x_intercept()`	最小二乘拟合线的 x 轴截距

时间加权平均值聚合

可以在 time_weight() 的输出上调用 average() 访问器。例如


SELECT time_weight('Linear', ts, val) -> average()  FROM measurements;

近似去重计数聚合

这是对去重计数的近似。可以在 hyperloglog() 的输出上调用 distinct_count() 访问器。例如


SELECT hyperloglog(device_id) -> distinct_count() FROM measurements;

格式化 timevectors

您可以将 timevector 转换为格式化的文本表示形式。有两个函数可以将 timevector 转换为文本

to_text，它允许您指定模板
to_plotly，它输出适合与 Plotly JSON 图表模式一起使用的格式

`to_text`


toolkit_experimental.to_text(
    timevector(time, value),
    format_string
)

此函数生成文本表示形式，根据 format_string 格式化。格式字符串可以使用任何有效的 Tera 模板语法，并且可以包含任何内置变量

TIMES：timevector 中的所有时间，作为数组
VALUES：timevector 中的所有值，作为数组
TIMEVALS：timevector 中的所有时间-值对，格式化为 {"time": $TIME, "val": $VAL}，作为数组

例如，给定此数据表


CREATE TABLE data(time TIMESTAMPTZ, value DOUBLE PRECISION);

INSERT INTO data VALUES
    ('2020-1-1', 30.0),
    ('2020-1-2', 45.0),
    ('2020-1-3', NULL),
    ('2020-1-4', 55.5),
    ('2020-1-5', 10.0);

您可以使用带有 TIMEVALS 的格式字符串来生成以下文本


SELECT toolkit_experimental.to_text(
    timevector(time, value),
    '{{TIMEVALS}}'
) FROM data;


[{\"time\": \"2020-01-01 00:00:00+00\", \"val\": 30}, {\"time\": \"2020-01-02 00:00:00+00\", \"val\": 45}, {\"time\": \"2020-01-03 00:00:00+00\", \"val\": null}, {\"time\": \"2020-01-04 00:00:00+00\", \"val\": 55.5}, {\"time\": \"2020-01-05 00:00:00+00\", \"val\": 10} ]

或者您可以使用带有 TIMES 和 VALUES 的格式字符串来生成以下文本


SELECT toolkit_experimental.to_text(
    timevector(time,value),
    '{\"times\": {{ TIMES }}, \"vals\": {{ VALUES }}}'
) FROM data


{\"times\": [\"2020-01-01 00:00:00+00\",\"2020-01-02 00:00:00+00\",\"2020-01-03 00:00:00+00\",\"2020-01-04 00:00:00+00\",\"2020-01-05 00:00:00+00\"], \"vals\": [\"30\",\"45\",\"null\",\"55.5\",\"10\"]}

`to_plotly`

此函数生成文本表示形式，格式化为与 Plotly 一起使用。

例如，给定此数据表


CREATE TABLE data(time TIMESTAMPTZ, value DOUBLE PRECISION);

INSERT INTO data VALUES
    ('2020-1-1', 30.0),
    ('2020-1-2', 45.0),
    ('2020-1-3', NULL),
    ('2020-1-4', 55.5),
    ('2020-1-5', 10.0);

您可以生成以下与 Plotly 兼容的文本


SELECT toolkit_experimental.to_plotly(
    timevector(time, value)
) FROM data;


{\"times\": [\"2020-01-01 00:00:00+00\",\"2020-01-02 00:00:00+00\",\"2020-01-03 00:00:00+00\",\"2020-01-04 00:00:00+00\",\"2020-01-05 00:00:00+00\"], \"vals\": [\"30\",\"45\",\"null\",\"55.5\",\"10\"]}

所有函数管道元素

下表按字母顺序列出所有函数管道元素

元素	类别	输出
`abs()`	一元数学	`timevector` 管道
`add(val DOUBLE PRECISION)`	二元数学	`timevector` 管道
`average()`	聚合终结器	DOUBLE PRECISION
`cbrt()`	一元数学	`timevector` 管道
`ceil()`	一元数学	`timevector` 管道
`counter_agg()`	聚合终结器	`CounterAgg`
`delta()`	复合	`timevector` 管道
`div`	二元数学	`timevector` 管道
`fill_to`	复合	`timevector` 管道
`filter`	Lambda	`timevector` 管道
`floor`	一元数学	`timevector` 管道
`hyperloglog`	聚合终结器	HyperLogLog
`ln`	一元数学	`timevector` 管道
`log10`	一元数学	`timevector` 管道
`logn`	二元数学	`timevector` 管道
`lttb`	复合	`timevector` 管道
`map`	Lambda	`timevector` 管道
`materialize`	输出	`timevector` 管道
`mod`	二元数学	`timevector` 管道
`mul`	二元数学	`timevector` 管道
`num_vals`	聚合终结器	BIGINT
`power`	二元数学	`timevector` 管道
`round`	一元数学	`timevector` 管道
`sign`	一元数学	`timevector` 管道
`sort`	复合	`timevector` 管道
`sqrt`	一元数学	`timevector` 管道
`stats_agg`	聚合终结器	StatsSummary1D
`sub`	二元数学	`timevector` 管道
`sum`	聚合终结器	`timevector` 管道
`trunc`	一元数学	`timevector` 管道
`unnest`	输出	`TABLE (time TIMESTAMPTZ, value DOUBLE PRECISION)`

警告

重要提示

注意

相关内容