路线图
以下是计划实施的主要功能摘要。更多详情请查看 GitHub 上的路线图 。
实现基于 OTLP 批次操作的存储 API v2
在基于 OTEL 的 Jaeger-v2 中,我们不希望强制 OTLP 跟踪数据进行不必要的转换以符合 Jaeger 当前的数据模型。我们希望定义一个 V2 版本的存储 API,以便 OTLP 数据可以在接收器-导出器管道中直接传递,无需额外转换,从而提高效率。
更多信息请参阅 问题描述 。
支持 Jaeger-v2 的 Helm Chart
开发一个全面的 Jaeger v2 Helm chart,以便在 Kubernetes 环境中轻松部署和管理 Jaeger v2 组件。此 chart 应提供灵活的配置、支持各种部署场景,并与 Jaeger v2 的新架构良好集成。
更多信息请参阅 问题描述 。
支持 Jaeger-v2 的 Kubernetes Operator
开发一个新的 Jaeger-v2 Operator,实现与 v1 Operator 的功能对等,同时引入改进和新功能。这个新 Operator 将利用 OpenTelemetry Operator 进行 Jaeger-v2 部署,同时维护并增强 v1 Operator 的存储管理功能。
更多信息请参阅 问题描述 。
ClickHouse 作为核心存储后端
将 ClickHouse 作为 Jaeger 的官方后端,提供一流的支持。ClickHouse 是一种开源的面向列的数据库,适用于 OLAP 用例。它对于大量数据的摄取和搜索具有极高的效率和性能,这使其成为专门用于跟踪和日志数据的良好数据库。它还可以非常快速地执行聚合,这对于 Jaeger 中的多项功能来说将非常有用。
对用户的益处
- 高效的后端
- 强大的搜索功能
- 分析能力,例如直接从 ClickHouse 支持 APM 功能(Jaeger 中的监控选项卡)的可能性
更多信息请参阅 问题描述 。
添加存储/检索不完整/部分 Span 的能力
允许客户端导出部分 Span,以支持两种用例
- 在长时间运行的 Span 完成之前将其 Flush,以防进程在完成前崩溃
- 用来自其他来源的信息丰富现有 Span,例如记录未通过跟踪 SDK 捕获的日志事件
更多信息请参阅 问题描述 。
改进流式支持
将流式分析支持直接引入 Jaeger 后端,而非需要独立的 Spark/Flink 数据管道。
更多信息请参阅 问题描述 。
Jaeger 的 AI/ML 平台
目前,使用 Jaeger 进行 ML/AI 分析很困难。与 ML/AI 平台没有直接集成,并且我们对可以构建的模型知之甚少。
- 创建用于使用跟踪/遥测数据进行 ML/AI 的社区/SIG。
- 构建与 Jaeger 的 ML/AI 集成,方便数据科学家编写和评估模型(例如 Jupyter notebook)。
- 创建模型/后处理管道的注册表,这些管道可以从跟踪数据中提取有用信息。
更多信息请参阅 问题描述 。
动态配置支持
我们需要一个在各种场景中都非常实用的动态配置解决方案
- 服务黑名单
- 覆盖采样概率
- 控制服务器端降采样率
- 用于自适应采样的服务黑/白名单
- 等
更多信息请参阅 问题描述 。