路线图
以下是我们计划实现的主要功能摘要。有关更多详细信息,请参阅 GitHub 路线图 。
将存储后端升级到 V2 存储 API
目前,Jaeger 使用 v1 存储 API ,它基于 Jaeger 特有的数据模型运行。每个存储后端都实现了此 API,需要将 Jaeger 的专有模型转换为现在行业标准的 OpenTelemetry 协议 (OTLP) 数据模型。
作为 #5079 的一部分,Jaeger 推出了更高效的 v2 存储 API ,该 API 原生支持 OpenTelemetry 数据模型 (OTLP),允许批量写入和结果流式传输。这项工作是与 OpenTelemetry Collector 框架 更广泛对齐的一部分,相关进展在 #4843 中跟踪。
更多信息请参阅 问题描述 。
[功能] 支持 ClickHouse 作为核心存储后端
为 ClickHouse 构建一流的支持,使其成为官方 Jaeger 后端。ClickHouse 是一款用于 OLAP 用例的开源列式数据库。它在海量数据摄取和搜索方面效率极高且性能卓越,使其特别适合作为追踪和日志数据的数据库。它还可以非常快速地执行聚合操作,这将为 Jaeger 中的多项功能提供便利。
用户优势
- 高效的后端
- 强大的搜索功能
- 分析能力,例如直接从 ClickHouse 支持 APM 功能(Jaeger 中的“监控”选项卡)的可能性
更多信息请参阅 问题描述 。
[功能]:支持 Elasticsearch 数据流
数据流是 Elasticsearch 和 OpenSearch 中用于存储仅追加可观测性数据的新兴趋势。数据流非常适合日志、事件、指标以及其他持续生成的数据。
更多信息请参阅 问题描述 。
改进流式传输支持
将流式分析支持直接集成到 Jaeger 后端,不再需要单独的 Spark/Flink 数据管道。
更多信息请参阅 问题描述 。
添加存储/检索不完整/部分 Span 的能力
允许客户端导出部分 Span,以支持两种用例
- 在长时间运行的 Span 完成之前将其刷新,以防进程在完成之前崩溃
- 使用来自其他源的信息丰富现有 Span,例如记录未通过追踪 SDK 捕获的日志事件
更多信息请参阅 问题描述 。
Jaeger 的 AI/ML 平台
目前,使用 Jaeger 进行 ML/AI 分析很困难。没有与 ML/AI 平台直接集成,我们对可以构建的模型也知之甚少。
- 针对使用追踪/遥测数据进行 ML/AI 创建社区/SIG。
- 将 ML/AI 集成到 Jaeger 中,方便数据科学家编写和评估模型(例如 Jupyter Notebook)。
- 创建模型/后处理管道注册表,从中提取追踪数据中的有用信息。
更多信息请参阅 问题描述 。
动态配置支持
我们需要一个动态配置解决方案,它在各种场景中都非常实用
- 服务黑名单
- 覆盖采样概率
- 控制服务器端下采样率
- 用于自适应采样的服务黑名单/白名单
- 等。
更多信息请参阅 问题描述 。