路线图 | Jaeger - Jaeger 分布式追踪平台

路线图

以下是我们计划实现的主要功能摘要。有关更多详细信息，请参阅 GitHub 路线图。

将存储后端升级到 V2 存储 API

目前，Jaeger 使用 v1 存储 API ，它基于 Jaeger 特有的数据模型运行。每个存储后端都实现了此 API，需要将 Jaeger 的专有模型转换为现在行业标准的 OpenTelemetry 协议 (OTLP) 数据模型。

作为 #5079 的一部分，Jaeger 推出了更高效的 v2 存储 API ，该 API 原生支持 OpenTelemetry 数据模型 (OTLP)，允许批量写入和结果流式传输。这项工作是与 OpenTelemetry Collector 框架更广泛对齐的一部分，相关进展在 #4843 中跟踪。

更多信息请参阅问题描述。

[功能] 支持 ClickHouse 作为核心存储后端

为 ClickHouse 构建一流的支持，使其成为官方 Jaeger 后端。ClickHouse 是一款用于 OLAP 用例的开源列式数据库。它在海量数据摄取和搜索方面效率极高且性能卓越，使其特别适合作为追踪和日志数据的数据库。它还可以非常快速地执行聚合操作，这将为 Jaeger 中的多项功能提供便利。

用户优势

高效的后端
强大的搜索功能
分析能力，例如直接从 ClickHouse 支持 APM 功能（Jaeger 中的“监控”选项卡）的可能性

更多信息请参阅问题描述。

[功能]：支持 Elasticsearch 数据流

数据流是 Elasticsearch 和 OpenSearch 中用于存储仅追加可观测性数据的新兴趋势。数据流非常适合日志、事件、指标以及其他持续生成的数据。

更多信息请参阅问题描述。

改进流式传输支持

将流式分析支持直接集成到 Jaeger 后端，不再需要单独的 Spark/Flink 数据管道。

更多信息请参阅问题描述。

添加存储/检索不完整/部分 Span 的能力

允许客户端导出部分 Span，以支持两种用例

在长时间运行的 Span 完成之前将其刷新，以防进程在完成之前崩溃
使用来自其他源的信息丰富现有 Span，例如记录未通过追踪 SDK 捕获的日志事件

更多信息请参阅问题描述。

Jaeger 的 AI/ML 平台

目前，使用 Jaeger 进行 ML/AI 分析很困难。没有与 ML/AI 平台直接集成，我们对可以构建的模型也知之甚少。

针对使用追踪/遥测数据进行 ML/AI 创建社区/SIG。
将 ML/AI 集成到 Jaeger 中，方便数据科学家编写和评估模型（例如 Jupyter Notebook）。
创建模型/后处理管道注册表，从中提取追踪数据中的有用信息。

更多信息请参阅问题描述。

动态配置支持

我们需要一个动态配置解决方案，它在各种场景中都非常实用

服务黑名单
覆盖采样概率
控制服务器端下采样率
用于自适应采样的服务黑名单/白名单
等。

更多信息请参阅问题描述。