时间序列数据表示系统、流程或行为如何随时间变化。例如,如果您每五分钟从温度计获取一次测量值,则您正在收集时间序列数据。另一个常见的例子是股票价格变化,甚至智能手机的电池寿命。随着这些测量值随时间变化,每个数据点都会与其时间戳一起记录,从而可以对其进行测量、分析和可视化。
时间序列数据可以非常频繁地收集,例如金融数据,也可以不频繁地收集,例如天气或系统测量值。它可以定期收集,例如每毫秒或每小时,也可以不定期收集,例如仅在发生变化时收集。
数据库一直都有时间字段,但是使用专门的数据库来处理时间序列数据可以使您的数据库工作效率更高。像 Timescale 这样的专用时间序列数据库旨在处理大量数据库写入,因此它们运行速度更快。它们还针对处理模式更改进行了优化,并使用更灵活的索引,因此您无需在每次进行更改时都花费时间迁移数据。
时间序列数据无处不在,但在某些环境中,尤其重要的是使用像 Timescale 这样的专用时间序列数据库
- 监控计算机系统:虚拟机、服务器、容器指标、CPU、可用内存、网络/磁盘 IOP、服务和应用程序指标,例如请求率和请求延迟。
- 金融交易系统:证券、加密货币、支付和交易事件。
- 物联网:来自工业机器和设备、可穿戴设备、车辆、物理容器、托盘和智能家居消费设备的传感器数据。
- 事件应用:用户或客户互动数据,例如点击流、页面浏览量、登录和注册。
- 商业智能:跟踪关键指标和业务的整体健康状况。
- 环境监测:温度、湿度、压力、pH 值、花粉计数、气流、一氧化碳、二氧化氮或颗粒物。
要探索 Timescale 的功能,您需要一些示例数据。本指南使用来自 Twelve Data 的实时股票交易数据,也称为报价数据。
该数据集包含前 100 个交易最活跃的股票代码的每秒股票交易数据,存储在一个名为 stocks_real_time
的超表中。它还包含一个单独的公司代码和公司名称表,存储在一个名为 company
的常规 PostgreSQL 表中。
该数据集每晚更新,包含最近四周的数据,通常约为 800 万行数据。股票交易在纽约证券交易所正常交易时间(美国东部时间上午 9:30 - 下午 4:00)的周一至周五实时记录。
要将数据导入到您创建的表中,您需要下载数据集并将数据复制到您的数据库。
解压
到您的本地设备。此压缩包包含一个包含公司信息的.csv
文件,以及一个包含过去一个月实时股票交易信息的.csv
文件。在
psql
提示符下,使用COPY
命令将数据传输到您的 Timescale 实例。如果.csv
文件不在您当前目录中,请在以下命令中指定文件路径\COPY stocks_real_time from './tutorial_sample_tick.csv' DELIMITER ',' CSV HEADER;\COPY company from './tutorial_sample_company.csv' DELIMITER ',' CSV HEADER;由于有数百万行数据,因此
COPY
过程可能需要几分钟,具体取决于您的互联网连接和本地客户端资源。
关键词
在此页面上发现问题?报告问题 或 在 GitHub 上编辑此页面。