DevOps 和 SRE 团队正在改变软件开发流程。虽然 DevOps 工程师专注于高效的软件应用程序和服务交付,但 SRE 团队是确保可靠性、可扩展性和性能的关键。这些团队必须依赖全栈可观测性解决方案,以便他们可以管理和监控系统,并确保在问题影响业务之前得到解决。
现代分布式应用程序的整个堆栈的可观测性需要数据收集、处理和关联,通常以仪表板的形式呈现。摄取所有系统数据需要在堆栈、框架和提供商上安装代理 - 对于必须处理版本更改、兼容性问题以及无法随着系统变化而扩展的专有代码的团队来说,这是一个具有挑战性且耗时的过程。
得益于 OpenTelemetry (OTel),DevOps 和 SRE 团队现在有了一种收集和发送数据的标准方法,该方法不依赖于专有代码,并且拥有庞大的支持社区,从而减少了供应商锁定。
在这篇博客文章中,我们将向您展示如何使用 OpenTelemetry 手动检测 Go 应用程序。这种方法比使用自动检测稍微复杂一些
在之前的博客中,我们还回顾了如何使用 OpenTelemetry 演示并将其连接到 Elastic®,以及 Elastic 在 OpenTelemetry 方面的一些功能。在这篇博客中,我们将使用替代演示应用程序,它有助于以简单的方式突出显示手动检测。
最后,我们将讨论 Elastic 如何支持使用 Elastic 和 OpenTelemetry 代理运行的混合模式应用程序。这样做的好处是不需要 otel-collector!此设置使您能够根据最适合您业务的时间线,缓慢而轻松地将应用程序迁移到带有 Elastic 的 OTel。
应用程序、先决条件和配置
我们在这篇博客中使用的应用程序称为Elastiflix,这是一个电影流媒体应用程序。它由用 .NET、NodeJS、Go 和 Python 编写的多个微服务组成。
在我们检测示例应用程序之前,我们首先需要了解 Elastic 如何接收遥测数据。
Elastic 可观测性的所有 APM 功能都可与 OTel 数据一起使用。其中包括
- 服务地图
- 服务详细信息(延迟、吞吐量、失败的事务)
- 服务之间的依赖关系、分布式跟踪
- 事务(跟踪)
- 机器学习 (ML) 相关性
- 日志相关性
除了 Elastic 的 APM 和遥测数据的统一视图外,您还可以使用 Elastic 强大的机器学习功能来减少分析和告警,以帮助减少 MTTR。
先决条件
- 一个 Elastic Cloud 帐户 - 立即注册
- Elastiflix 演示应用程序的克隆,或您自己的 Go 应用程序
- Docker 的基本了解 - 可能会安装 Docker Desktop
- Go 的基本了解
查看示例源代码
包括本博客中使用的 Dockerfile 在内的完整源代码可以在GitHub上找到。该存储库还包含相同的未检测应用程序。这使您可以比较每个文件并查看差异。
在开始之前,我们先看一下未检测的代码。
这是我们简单的 Go 应用程序,可以接收 GET 请求。请注意,此处显示的代码是稍微缩写的版本。
package main
import (
"log"
"net/http"
"os"
"time"
"github.com/go-redis/redis/v8"
"github.com/sirupsen/logrus"
"github.com/gin-gonic/gin"
"strconv"
"math/rand"
)
var logger = &logrus.Logger{
Out: os.Stderr,
Hooks: make(logrus.LevelHooks),
Level: logrus.InfoLevel,
Formatter: &logrus.JSONFormatter{
FieldMap: logrus.FieldMap{
logrus.FieldKeyTime: "@timestamp",
logrus.FieldKeyLevel: "log.level",
logrus.FieldKeyMsg: "message",
logrus.FieldKeyFunc: "function.name", // non-ECS
},
TimestampFormat: time.RFC3339Nano,
},
}
func main() {
delayTime, _ := strconv.Atoi(os.Getenv("TOGGLE_SERVICE_DELAY"))
redisHost := os.Getenv("REDIS_HOST")
if redisHost == "" {
redisHost = "localhost"
}
redisPort := os.Getenv("REDIS_PORT")
if redisPort == "" {
redisPort = "6379"
}
applicationPort := os.Getenv("APPLICATION_PORT")
if applicationPort == "" {
applicationPort = "5000"
}
// Initialize Redis client
rdb := redis.NewClient(&redis.Options{
Addr: redisHost + ":" + redisPort,
Password: "",
DB: 0,
})
// Initialize router
r := gin.New()
r.Use(logrusMiddleware)
r.GET("/favorites", func(c *gin.Context) {
// artificial sleep for delayTime
time.Sleep(time.Duration(delayTime) * time.Millisecond)
userID := c.Query("user_id")
contextLogger(c).Infof("Getting favorites for user %q", userID)
favorites, err := rdb.SMembers(c.Request.Context(), userID).Result()
if err != nil {
contextLogger(c).Error("Failed to get favorites for user %q", userID)
c.String(http.StatusInternalServerError, "Failed to get favorites")
return
}
contextLogger(c).Infof("User %q has favorites %q", userID, favorites)
c.JSON(http.StatusOK, gin.H{
"favorites": favorites,
})
})
// Start server
logger.Infof("App startup")
log.Fatal(http.ListenAndServe(":"+applicationPort, r))
logger.Infof("App stopped")
}
逐步指南
步骤 0. 登录您的 Elastic Cloud 帐户
这篇博客假设您有一个 Elastic Cloud 帐户 - 如果没有,请按照在 Elastic Cloud 上开始使用的说明进行操作。
步骤 1. 安装并初始化 OpenTelemetry
第一步,我们需要向应用程序添加一些额外的包。
import (
"github.com/go-redis/redis/extra/redisotel/v8"
"go.opentelemetry.io/otel"
"go.opentelemetry.io/otel/attribute"
"go.opentelemetry.io/otel/exporters/otlp/otlptrace"
"go.opentelemetry.io/otel/exporters/otlp/otlptrace/otlptracegrpc"
"go.opentelemetry.io/otel/propagation"
"google.golang.org/grpc/credentials"
"crypto/tls"
sdktrace "go.opentelemetry.io/otel/sdk/trace"
"go.opentelemetry.io/contrib/instrumentation/github.com/gin-gonic/gin/otelgin"
"go.opentelemetry.io/otel/trace"
"go.opentelemetry.io/otel/codes"
)
此代码导入必要的 OpenTelemetry 包,包括用于跟踪、导出和检测特定库(如 Redis)的包。
接下来,我们读取“OTEL_EXPORTER_OTLP_ENDPOINT”变量并初始化导出器。
var (
collectorURL = os.Getenv("OTEL_EXPORTER_OTLP_ENDPOINT")
)
var tracer trace.Tracer
func initTracer() func(context.Context) error {
tracer = otel.Tracer("go-favorite-otel-manual")
// remove https:// from the collector URL if it exists
collectorURL = strings.Replace(collectorURL, "https://", "", 1)
secretToken := os.Getenv("ELASTIC_APM_SECRET_TOKEN")
if secretToken == "" {
log.Fatal("ELASTIC_APM_SECRET_TOKEN is required")
}
secureOption := otlptracegrpc.WithInsecure()
exporter, err := otlptrace.New(
context.Background(),
otlptracegrpc.NewClient(
secureOption,
otlptracegrpc.WithEndpoint(collectorURL),
otlptracegrpc.WithHeaders(map[string]string{
"Authorization": "Bearer " + secretToken,
}),
otlptracegrpc.WithTLSCredentials(credentials.NewTLS(&tls.Config{})),
),
)
if err != nil {
log.Fatal(err)
}
otel.SetTracerProvider(
sdktrace.NewTracerProvider(
sdktrace.WithSampler(sdktrace.AlwaysSample()),
sdktrace.WithBatcher(exporter),
),
)
otel.SetTextMapPropagator(
propagation.NewCompositeTextMapPropagator(
propagation.Baggage{},
propagation.TraceContext{},
),
)
return exporter.Shutdown
}
为了检测与 Redis 的连接,我们将向其添加跟踪挂钩,为了检测 Gin,我们将添加 OTel 中间件。这将自动捕获我们应用程序的所有交互,因为 Gin 将被完全检测。此外,所有与 Redis 的传出连接也将被检测。
// Initialize Redis client
rdb := redis.NewClient(&redis.Options{
Addr: redisHost + ":" + redisPort,
Password: "",
DB: 0,
})
rdb.AddHook(redisotel.NewTracingHook())
// Initialize router
r := gin.New()
r.Use(logrusMiddleware)
r.Use(otelgin.Middleware("go-favorite-otel-manual"))
添加自定义 Span
现在我们已经添加并初始化了所有内容,我们可以添加自定义 Span。
如果我们想为应用程序的一部分添加额外的检测,我们只需启动一个自定义 Span,然后推迟结束该 Span。
// start otel span
ctx := c.Request.Context()
ctx, span := tracer.Start(ctx, "add_favorite_movies")
defer span.End()
为了进行比较,这是我们示例应用程序的检测代码。您可以在 GitHub 中找到完整的源代码。
package main
import (
"log"
"net/http"
"os"
"time"
"context"
"github.com/go-redis/redis/v8"
"github.com/go-redis/redis/extra/redisotel/v8"
"github.com/sirupsen/logrus"
"github.com/gin-gonic/gin"
"go.opentelemetry.io/otel"
"go.opentelemetry.io/otel/attribute"
"go.opentelemetry.io/otel/exporters/otlp/otlptrace"
"go.opentelemetry.io/otel/exporters/otlp/otlptrace/otlptracegrpc"
"go.opentelemetry.io/otel/propagation"
"google.golang.org/grpc/credentials"
"crypto/tls"
sdktrace "go.opentelemetry.io/otel/sdk/trace"
"go.opentelemetry.io/contrib/instrumentation/github.com/gin-gonic/gin/otelgin"
"go.opentelemetry.io/otel/trace"
"strings"
"strconv"
"math/rand"
"go.opentelemetry.io/otel/codes"
)
var tracer trace.Tracer
func initTracer() func(context.Context) error {
tracer = otel.Tracer("go-favorite-otel-manual")
collectorURL = strings.Replace(collectorURL, "https://", "", 1)
secureOption := otlptracegrpc.WithInsecure()
// split otlpHeaders by comma and convert to map
headers := make(map[string]string)
for _, header := range strings.Split(otlpHeaders, ",") {
headerParts := strings.Split(header, "=")
if len(headerParts) == 2 {
headers[headerParts[0]] = headerParts[1]
}
}
exporter, err := otlptrace.New(
context.Background(),
otlptracegrpc.NewClient(
secureOption,
otlptracegrpc.WithEndpoint(collectorURL),
otlptracegrpc.WithHeaders(headers),
otlptracegrpc.WithTLSCredentials(credentials.NewTLS(&tls.Config{})),
),
)
if err != nil {
log.Fatal(err)
}
otel.SetTracerProvider(
sdktrace.NewTracerProvider(
sdktrace.WithSampler(sdktrace.AlwaysSample()),
sdktrace.WithBatcher(exporter),
//sdktrace.WithResource(resources),
),
)
otel.SetTextMapPropagator(
propagation.NewCompositeTextMapPropagator(
propagation.Baggage{},
propagation.TraceContext{},
),
)
return exporter.Shutdown
}
var (
collectorURL = os.Getenv("OTEL_EXPORTER_OTLP_ENDPOINT")
otlpHeaders = os.Getenv("OTEL_EXPORTER_OTLP_HEADERS")
)
var logger = &logrus.Logger{
Out: os.Stderr,
Hooks: make(logrus.LevelHooks),
Level: logrus.InfoLevel,
Formatter: &logrus.JSONFormatter{
FieldMap: logrus.FieldMap{
logrus.FieldKeyTime: "@timestamp",
logrus.FieldKeyLevel: "log.level",
logrus.FieldKeyMsg: "message",
logrus.FieldKeyFunc: "function.name", // non-ECS
},
TimestampFormat: time.RFC3339Nano,
},
}
func main() {
cleanup := initTracer()
defer cleanup(context.Background())
redisHost := os.Getenv("REDIS_HOST")
if redisHost == "" {
redisHost = "localhost"
}
redisPort := os.Getenv("REDIS_PORT")
if redisPort == "" {
redisPort = "6379"
}
applicationPort := os.Getenv("APPLICATION_PORT")
if applicationPort == "" {
applicationPort = "5000"
}
// Initialize Redis client
rdb := redis.NewClient(&redis.Options{
Addr: redisHost + ":" + redisPort,
Password: "",
DB: 0,
})
rdb.AddHook(redisotel.NewTracingHook())
// Initialize router
r := gin.New()
r.Use(logrusMiddleware)
r.Use(otelgin.Middleware("go-favorite-otel-manual"))
// Define routes
r.GET("/", func(c *gin.Context) {
contextLogger(c).Infof("Main request successful")
c.String(http.StatusOK, "Hello World!")
})
r.GET("/favorites", func(c *gin.Context) {
// artificial sleep for delayTime
time.Sleep(time.Duration(delayTime) * time.Millisecond)
userID := c.Query("user_id")
contextLogger(c).Infof("Getting favorites for user %q", userID)
favorites, err := rdb.SMembers(c.Request.Context(), userID).Result()
if err != nil {
contextLogger(c).Error("Failed to get favorites for user %q", userID)
c.String(http.StatusInternalServerError, "Failed to get favorites")
return
}
contextLogger(c).Infof("User %q has favorites %q", userID, favorites)
c.JSON(http.StatusOK, gin.H{
"favorites": favorites,
})
})
// Start server
logger.Infof("App startup")
log.Fatal(http.ListenAndServe(":"+applicationPort, r))
logger.Infof("App stopped")
}
步骤 2. 使用环境变量运行 Docker 镜像
如OTEL 文档中所述,我们将使用环境变量并传入 APM 代理的配置部分中找到的配置值。
由于 Elastic 本地接受 OTLP,我们只需要提供 OTEL Exporter 需要发送数据的端点和身份验证,以及其他一些环境变量。
在哪里在 Elastic Cloud 和 Kibana ® 中获取这些变量
您可以从 Kibana 中的路径 /app/home#/tutorial/apm 下复制端点和令牌。
您需要复制 OTEL_EXPORTER_OTLP_ENDPOINT 以及 OTEL_EXPORTER_OTLP_HEADERS。
构建镜像
docker build -t go-otel-manual-image .
运行镜像
docker run \
-e OTEL_EXPORTER_OTLP_ENDPOINT="<REPLACE WITH OTEL_EXPORTER_OTLP_ENDPOINT>" \
-e OTEL_EXPORTER_OTLP_HEADERS="Authorization=Bearer <REPLACE WITH TOKEN>" \
-e OTEL_RESOURCE_ATTRIBUTES="service.version=1.0,deployment.environment=production,service.name=go-favorite-otel-manual" \
-p 5000:5000 \
go-otel-manual-image
您现在可以发出一些请求以生成跟踪数据。请注意,这些请求预计会返回错误,因为此服务依赖于您当前未运行的与 Redis 的连接。如前所述,您可以在此处找到使用 Docker compose 的更完整示例。
curl localhost:500/favorites
# or alternatively issue a request every second
while true; do curl "localhost:5000/favorites"; sleep 1; done;
跟踪如何在 Elastic 中显示?
现在服务已检测,当查看 Node.js 服务的事务部分时,您应该在 Elastic APM 中看到以下输出
结论
在这篇博客中,我们讨论了以下内容
- 如何使用 OpenTelemetry 手动检测 Go
- 如何正确初始化 OpenTelemetry 并添加自定义 span
- 如何轻松地使用 Elastic 设置 OTLP ENDPOINT 和 OTLP HEADERS,而无需收集器
希望这能提供一个易于理解的关于使用 OpenTelemetry 检测 Go 以及如何轻松地将追踪发送到 Elastic 的演练。
开发者资源
- Elastiflix 应用程序,一个关于使用 OpenTelemetry 检测不同语言的指南
- Python:自动检测,手动检测
- Java:自动检测,手动检测
- Node.js:自动检测,手动检测
- .NET:自动检测,手动检测
- Go:手动检测
- 检测 OpenTelemetry 的最佳实践
通用配置和用例资源
- 在 Elastic 上使用 OpenTelemetry 的独立性
- 在 Kubernetes 上使用 Elastic 和 OpenTelemetry 的现代可观测性和安全性
- 使用 OpenTelemetry 和 Elastic 进行日志记录的 3 种模型
- 将免费开源的 Elastic APM 添加为 Elastic 可观测性部署的一部分
- 在代码中使用 OpenTelemetry API 通过 Elastic 捕获自定义指标
- 使用 OpenTelemetry 和 Elastic 使您的可观测性平台具有未来性
- Elastic 可观测性:专为 Kubernetes、OpenTelemetry、Prometheus、Istio 等开放技术而构建
还没有 Elastic Cloud 帐户?注册 Elastic Cloud 并试用我上面讨论的自动检测功能。我很乐意收到您关于使用 Elastic 深入了解您的应用程序堆栈的体验的反馈。
本文中描述的任何特性或功能的发布和时间安排均由 Elastic 自行决定。任何当前不可用的特性或功能可能不会按时交付,甚至根本不会交付。