纽约市约有 900 万人口。本教程使用纽约市出租车和豪华轿车委员会 NYC TLC 提供的纽约黄色出租车网络的历史数据。NYC TLC 追踪超过 20 万辆汽车,每天约有 100 万次出行。由于几乎所有这些数据都是时序数据,因此正确的分析需要专门构建的时序数据库,例如 Timescale。

在开始之前,请确保您已拥有

本教程涵盖

  1. 设置您的数据集:设置并连接到 Timescale 服务,并使用 psql 将数据加载到您的数据库中。
  2. 查询您的数据集:使用 Timescale 和 PostgreSQL 分析包含纽约市出租车行程数据集。
  3. 奖励:高效存储数据:了解如何使用 Timescale 的压缩功能更有效地存储和查询您的纽约市出租车行程数据。

本教程使用 NYC 出租车数据 向您展示如何构建时序数据查询。您在本教程中进行的分析类似于数据科学组织用于执行诸如计划升级、设置预算和分配资源等操作的分析类型。

它首先教您如何设置和连接到 Timescale 数据库,创建表,并使用 psql 将数据加载到表中。

然后,您将学习如何在数据集上进行分析和监控。它将引导您使用 PostgreSQL 查询来获取信息,包括如何使用 JOIN 将您的时序数据与关系或业务数据结合起来。

注意

如果您在您的 Timescale 服务上获得了预加载的数据集,请直接转到 查询部分

关键词

在此页面上发现问题?报告问题 或 在 GitHub 上编辑此页