Kwonjae Lee
SRE, Observability
Weekly - November 21, 2025
- 9 mins๐ ์ด๋ฒ ์ฃผ ์ถ์ฒ ์ํฐํด
1. Mozilla์ LLM ๋น์ฉ ๊ด๋ฆฌ ์๋ฃจ์ : any-llm-gateway ์คํ์์ค ๊ณต๊ฐ
์ถ์ฒ: geeknews | ๋ ์ง: 2025-11-21
Mozilla AI๊ฐ ๊ณต๊ฐํ โany-llm-gatewayโ๋ LLM ์ฌ์ฉ ์ ๋ฐ์ํ๋ ๋น์ฉ ํญ์ฆ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ์คํ์์ค ํ๋ก์ ์๋ฒ์ ๋๋ค. ๊ฐ๋ฐ์๋ค์ ์ด ๋๊ตฌ๋ฅผ ํตํด ์์ฐ ๊ด๋ฆฌ, API ํค ๊ด๋ฆฌ, ์ฌ์ฉ๋ ๋ถ์ ๋ฑ์ ๊ธฐ๋ฅ์ ํ์ฉํ์ฌ LLM์ ๋ ํจ์จ์ ์ด๊ณ ๊ฒฝ์ ์ ์ผ๋ก ์ด์ํ ์ ์์ต๋๋ค.
ํต์ฌ ํฌ์ธํธ:
- any-llm-gateway๋ฅผ ํ๋ก์ ์๋ฒ๋ก ๋์ ํ์ฌ LLM API ํธ์ถ ๋น์ฉ์ ์ค์๊ฐ ๋ชจ๋ํฐ๋งํ๊ณ ์์ฐ ํ๋๋ฅผ ์ค์ ํด ๋น์ฉ ์ด๊ณผ๋ฅผ ๋ฐฉ์งํ์ธ์
- ์ฌ๋ฌ LLM ์ ๊ณต์ ์ฒด์ API ํค๋ฅผ ์ค์์ง์ค์์ผ๋ก ๊ด๋ฆฌํ๊ณ , ํ๋ณ ๋๋ ํ๋ก์ ํธ๋ณ๋ก ์ ๊ทผ ๊ถํ์ ์ธ๋ถํํ์ฌ ๋ณด์์ฑ์ ๋์ด์ธ์
- ์ฌ์ฉ๋ ๋ถ์ ๋์๋ณด๋๋ฅผ ํ์ฉํ์ฌ ์ด๋ค ๋ชจ๋ธ์ด ๊ฐ์ฅ ํจ์จ์ ์ธ์ง ํ์ ํ๊ณ , ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ผ๋ก LLM ์ฌ์ฉ ์ ๋ต์ ์ต์ ํํ์ธ์
2. runs-on - ๋ ์ ๋ ดํ๊ณ ๋น ๋ฅด๋ฉฐ, ์ ํ ํธ์คํ ๊ฐ๋ฅํ GitHub Actions ๋ฌ๋
์ถ์ฒ: geeknews | ๋ ์ง: 2025-11-21
runs-on์ AWS ๊ณ์ ๋ด์์ ์ด์ํ ์ ์๋ ์ ํ ํธ์คํ GitHub Actions ๋ฌ๋๋ก, ๊ณต์ GitHub ๋ฌ๋ ๋๋น 7-15๋ฐฐ ์ ๋ ดํ ๋น์ฉ๊ณผ 30% ํฅ์๋ CPU ์ฑ๋ฅ์ ์ ๊ณตํฉ๋๋ค. ๊ธฐ์กด ์ํฌํ๋ก์ ์์ ํ ํธํ๋๋ฉด์ ์๋ฐฑ ๊ฐ์ ๋์ ์์ ์ ๋ฌด์ ํ์ผ๋ก ์ฒ๋ฆฌํ ์ ์์ด ๊ฐ๋ฐํ์ CI/CD ๋น์ฉ์ ํฌ๊ฒ ์ ๊ฐํ๊ณ ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์์ต๋๋ค.
ํต์ฌ ํฌ์ธํธ:
- ๊ธฐ์กด GitHub Actions ์ํฌํ๋ก๋ฅผ ์์ ์์ด ๊ทธ๋๋ก ์ฌ์ฉํ๋ฉด์ ๋น์ฉ์ 7-15๋ฐฐ ์ ๊ฐํ ์ ์์ด ์์ฐ ์ต์ ํ๊ฐ ๊ฐ๋ฅํฉ๋๋ค
- AWS ๊ณ์ ๋ด์์ ์ง์ ์ด์ํ๋ ์ ํ ํธ์คํ ๋ฐฉ์์ผ๋ก ๋ฐ์ดํฐ ๋ณด์๊ณผ ์ธํ๋ผ ์ ์ด๊ถ์ ํ๋ณดํ ์ ์์ต๋๋ค
- ์๋ฐฑ ๊ฐ์ ๋์ ์์ ์ ์ฒ๋ฆฌํ ์ ์๋ ํ์ฅ์ฑ์ผ๋ก ๋๊ท๋ชจ ๊ฐ๋ฐํ์ CI/CD ํ์ดํ๋ผ์ธ ๋ณ๋ชฉ์ ํด๊ฒฐํ ์ ์์ต๋๋ค
3. A tale of two incident responses: How our AI assistant found the root cause 3.5x faster
์ถ์ฒ: grafana | ๋ ์ง: 2025-11-17
Grafana Labs์์ AI ์ด์์คํดํธ๋ฅผ ํ์ฉํ์ฌ ์ฅ์ ๋์ ์ ๊ทผ๋ณธ ์์ธ ํ์ ์๊ฐ์ 3.5๋ฐฐ ๋จ์ถ์ํจ ์ฌ๋ก๋ฅผ ๋ค๋ฃน๋๋ค. ๊ธฐ์กด ์๋ ์ฅ์ ๋์ ํ๋ก์ธ์ค์ AI ๊ธฐ๋ฐ ์๋ํ๋ ์ ๊ทผ ๋ฐฉ์์ ๋น๊ต ๋ถ์ํ์ฌ ๊ฐ๋ฐ์๋ค์ด ํจ์จ์ ์ธ ์ธ์๋ํธ ๊ด๋ฆฌ ์ ๋ต์ ํ์ตํ ์ ์์ต๋๋ค.
ํต์ฌ ํฌ์ธํธ:
- AI ๊ธฐ๋ฐ ๊ด์ฐฐ ๊ฐ๋ฅ์ฑ ๋๊ตฌ๋ฅผ ํ์ฉํ์ฌ ๋ก๊ทธ, ๋ฉํธ๋ฆญ, ํธ๋ ์ด์ค ๋ฐ์ดํฐ๋ฅผ ์๋์ผ๋ก ๋ถ์ํ๊ณ ์๊ด๊ด๊ณ๋ฅผ ํ์ ํ๋ ์์คํ ๊ตฌ์ถ
- ์ธ์๋ํธ ๋ฐ์ ์ ์๋ ๋ถ์ ๋์ AI ์ด์์คํดํธ๊ฐ ํจํด ์ธ์๊ณผ ๋ฐ์ดํฐ correlaton์ ํตํด ๋น ๋ฅธ ๊ทผ๋ณธ ์์ธ ์ถ์ ํ๋ก์ธ์ค ๋์
- ํ ๋ด ์ฅ์ ๋์ ๋ฌธํ ๊ฐ์ ์ ์ํด AI ๋๊ตฌ์ ๊ธฐ์กด ์จ์ฝ ์์ง๋์ด๋ง ์ํฌํ๋ก์ฐ๋ฅผ ํตํฉํ๋ ํ์ด๋ธ๋ฆฌ๋ ์ ๊ทผ ๋ฐฉ์ ์ ์ฉ
4. The Declarative configuration journey: Why it took 5 years to ignore health check endpoints in tracing
์ถ์ฒ: opentelemetry | ๋ ์ง: 2025-11-19
์ด ๊ธ์ Java OpenTelemetry์์ ํฌ์ค์ฒดํฌ ์๋ํฌ์ธํธ์ span์ ํจ์จ์ ์ผ๋ก ์ ๊ฑฐํ๋ ๊ธฐ๋ฅ ๊ตฌํ์ด 5๋ ์ด๋ ๊ฑธ๋ฆฐ ์ด์ ๋ฅผ ์ ์ธ์ ์ค์ (declarative configuration) ๊ด์ ์์ ๋ถ์ํฉ๋๋ค. ๊ฐ๋ฐ์๋ค์ observability ๋๊ตฌ์์ ๋ถํ์ํ ํธ๋ ์ด์ฑ ๋ฐ์ดํฐ๋ฅผ ๊ด๋ฆฌํ๋ ๋ฐฉ๋ฒ๊ณผ ์ค์ ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ์ค์์ฑ์ ๋ฐฐ์ธ ์ ์์ต๋๋ค.
ํต์ฌ ํฌ์ธํธ:
- ํฌ์ค์ฒดํฌ์ ๊ฐ์ ๋ฐ๋ณต์ ์ธ ์๋ํฌ์ธํธ์ ๋ํ span ํํฐ๋ง์ ๊ตฌํํ์ฌ ํธ๋ ์ด์ฑ ์ค๋ฒํค๋๋ฅผ ์ค์ด๊ณ ์ฑ๋ฅ์ ์ต์ ํํ์ธ์
- ์ ์ธ์ ์ค์ ์ ํตํด ๋ฐํ์์ ์ฝ๋ ๋ณ๊ฒฝ ์์ด observability ๋์์ ์ ์ฐํ๊ฒ ์ ์ดํ ์ ์๋ ์ํคํ ์ฒ๋ฅผ ์ค๊ณํ์ธ์
- OpenTelemetry ์ค์ ์์ span ์ํ๋ง๊ณผ ํํฐ๋ง ๊ท์น์ ์ ์ ํ ๊ตฌ์ฑํ์ฌ ์๋ฏธ์๋ ๋ฐ์ดํฐ๋ง ์์งํ๋๋ก ์ต์ ํํ์ธ์
5. PHP 8.5์ ์๋ก์ด ๊ธฐ๋ฅ๋ค
์ถ์ฒ: geeknews | ๋ ์ง: 2025-11-21
PHP 8.5๋ ํ์ดํ ์ฐ์ฐ์, clone with ๊ธฐ๋ฅ, ์๋ก์ด URI ํ์ ๋ฑ ๊ฐ๋ฐ์ ์์ฐ์ฑ์ ๋์ด๋ ์ฃผ์ ๊ธฐ๋ฅ๋ค์ ์ ๊ณตํฉ๋๋ค. ํ์ดํ ์ฐ์ฐ์๋ฅผ ํตํด ํจ์ ํธ์ถ ์ฒด์ธ์ ๋จ์ํํ์ฌ ์ฝ๋ ๊ฐ๋ ์ฑ๊ณผ ์ ์ง๋ณด์์ฑ์ ํฌ๊ฒ ๊ฐ์ ํ ์ ์์ต๋๋ค. Clone with ๊ธฐ๋ฅ์ผ๋ก ๊ฐ์ฒด ๋ณต์ฌ ์์ ์ด ๋์ฑ ํจ์จ์ ์ด๊ณ ์ง๊ด์ ์ผ๋ก ๋ณํํฉ๋๋ค.
ํต์ฌ ํฌ์ธํธ:
-
ํ์ดํ ์ฐ์ฐ์( >)๋ฅผ ํ์ฉํ์ฌ ์ค์ฒฉ๋ ํจ์ ํธ์ถ์ ์ ํ์ ์ธ ์ฒด์ธ์ผ๋ก ๋ณํํด ์ฝ๋ ๊ฐ๋ ์ฑ์ ํฅ์์ํค์ธ์ - Clone with ๊ตฌ๋ฌธ์ ์ฌ์ฉํ์ฌ ๊ธฐ์กด ๊ฐ์ฒด์ ์ผ๋ถ ์์ฑ๋ง ์์ ํ ์๋ก์ด ๊ฐ์ฒด๋ฅผ ํจ์จ์ ์ผ๋ก ์์ฑํ์ธ์
- ์๋ก์ด URI ํ์ ๊ธฐ๋ฅ์ ํตํด URL ์ฒ๋ฆฌ ๋ก์ง์ ๋์ฑ ์์ ํ๊ณ ์ ํํ๊ฒ ๊ตฌํํ์ธ์
6. Evolving OpenTelemetryโs Stabilization and Release Practices
์ถ์ฒ: opentelemetry | ๋ ์ง: 2025-11-08
OpenTelemetry ํ๋ก์ ํธ์ ์์ ํ ๋ฐ ๋ฆด๋ฆฌ์ค ํ๋ํฐ์ค ๊ฐ์ ์ ๋ํ ๋ด์ฉ์ผ๋ก, ๋๊ท๋ชจ ์คํ์์ค ํ๋ก์ ํธ์ ์ฑ์ํ ๊ฐ๋ฐ ํ๋ก์ธ์ค๋ฅผ ๋ค๋ฃน๋๋ค. ๊ฐ๋ฐ์๋ค์ ํด๋ผ์ฐ๋ ๋ค์ดํฐ๋ธ ํ๊ฒฝ์์ ๊ด์ธก์ฑ(Observability) ๋๊ตฌ์ ์งํ ๊ณผ์ ๊ณผ ์์ ์ ์ธ ์ํํธ์จ์ด ๋ฆด๋ฆฌ์ค ์ ๋ต์ ํ์ตํ ์ ์์ต๋๋ค. ํนํ ๋๊ท๋ชจ ์ปค๋ฎค๋ํฐ ๊ธฐ๋ฐ ํ๋ก์ ํธ์ ๊ฑฐ๋ฒ๋์ค์ ํ์ง ๊ด๋ฆฌ ๋ฐฉ๋ฒ๋ก ์ ๋ํ ์ธ์ฌ์ดํธ๋ฅผ ์ป์ ์ ์์ต๋๋ค.
ํต์ฌ ํฌ์ธํธ:
- ๋๊ท๋ชจ ์คํ์์ค ํ๋ก์ ํธ์์ ์์ ์ ์ธ ๋ฆด๋ฆฌ์ค ์ฌ์ดํด์ ๊ตฌ์ถํ๊ธฐ ์ํ ์ฒด๊ณ์ ์ธ ํ๋ก์ธ์ค ์ค๊ณ ๋ฐฉ๋ฒ์ ์ ์ฉํ์ฌ ์์ ์ ํ๋ก์ ํธ ํ์ง์ ํฅ์์ํฌ ์ ์์ต๋๋ค
- OpenTelemetry์ ๊ด์ธก์ฑ ๋๊ตฌ์ ํ์คํ๋ ํ ๋ ๋ฉํธ๋ฆฌ ์์ง ๋ฐฉ์์ ํ์ฉํ์ฌ ์ ํ๋ฆฌ์ผ์ด์ ๋ชจ๋ํฐ๋ง ๋ฐ ๋๋ฒ๊น ์ญ๋์ ๊ฐํํ ์ ์์ต๋๋ค
- ์ปค๋ฎค๋ํฐ ๊ธฐ๋ฐ ํ๋ก์ ํธ์ ๊ฑฐ๋ฒ๋์ค ๋ชจ๋ธ๊ณผ ํ์ ๋ฐฉ์์ ์ฐธ๊ณ ํ์ฌ ํ ๋ด ๊ฐ๋ฐ ๋ฌธํ์ ์ฝ๋ ๋ฆฌ๋ทฐ ํ๋ก์ธ์ค๋ฅผ ๊ฐ์ ํ ์ ์์ต๋๋ค
7. Is the OTCA Exam Right for You? Insights for Both Newcomers and Advanced Users
์ถ์ฒ: opentelemetry | ๋ ์ง: 2025-11-21
์ด ๊ธ์ OpenTelemetry Certified Associate (OTCA) ์ํ์ ๋ํ ๊ฐ์ด๋๋ก, ์ด๋ณด์์ ๊ฒฝํ์ ๋ชจ๋์๊ฒ ์ ์ฉํ ํต์ฐฐ์ ์ ๊ณตํฉ๋๋ค. OpenTelemetry๊ฐ ๋๋ฆฌ ์ฑํ๋๋ฉด์ ๊ด๋ จ ์ธ์ฆ์ ๊ฐ์น์ ์ค๋ฌด ์ ์ฉ์ฑ์ ๋ํด ๋ถ์ํ๋ฉฐ, ๊ฐ๋ฐ์๋ค์ด ์์ ์ ๊ฒฝ๋ ฅ ๋จ๊ณ์ ๋ฐ๋ผ ์ํ ์ค๋น ์ฌ๋ถ๋ฅผ ๊ฒฐ์ ํ๋ ๋ฐ ๋์์ ์ค๋๋ค.
ํต์ฌ ํฌ์ธํธ:
- ์์ ์ OpenTelemetry ๊ฒฝํ ์์ค๊ณผ ์ ๋ฌด ์๊ตฌ์ฌํญ์ ํ๊ฐํ์ฌ OTCA ์ํ์ ํ์์ฑ์ ํ๋จํ๋ผ
- ๊ด์ฐฐ๊ฐ๋ฅ์ฑ(Observability) ๋๊ตฌ๋ก์ OpenTelemetry์ ์ค๋ฌด ์ ์ฉ ์ฌ๋ก๋ฅผ ํ์ตํ์ฌ ์์คํ ๋ชจ๋ํฐ๋ง ์ญ๋์ ๊ฐํํ๋ผ
- ์ธ์ฆ ์ทจ๋๋ณด๋ค๋ OpenTelemetry ๊ธฐ์ ์์ฒด์ ์ดํด์ ์ค๋ฌด ๊ฒฝํ์ ์ฐ์ ์ํ์ฌ ์ค์ง์ ์ธ ๊ฐ๋ฐ ์ญ๋์ ํค์๋ผ
๐ This Weekโs Picks
1. Mozilla์ LLM ๋น์ฉ ๊ด๋ฆฌ ์๋ฃจ์ : any-llm-gateway ์คํ์์ค ๊ณต๊ฐ
Source: geeknews | Date: 2025-11-21
Mozilla AI has released โany-llm-gatewayโ, an open-source proxy server that addresses the cost explosion issues when using LLMs. Developers can leverage this production-ready tool to operate LLMs more efficiently and economically through budget management, API key management, and usage analytics features.
Key Points:
- Implement any-llm-gateway as a proxy server to monitor LLM API call costs in real-time and set budget limits to prevent cost overruns
- Centrally manage API keys from multiple LLM providers and enhance security by implementing granular access controls per team or project
- Utilize usage analytics dashboards to identify the most efficient models and optimize your LLM usage strategy based on data-driven insights
2. runs-on - ๋ ์ ๋ ดํ๊ณ ๋น ๋ฅด๋ฉฐ, ์ ํ ํธ์คํ ๊ฐ๋ฅํ GitHub Actions ๋ฌ๋
Source: geeknews | Date: 2025-11-21
runs-on is a self-hosted GitHub Actions runner solution that operates within your AWS account, offering 7-15x cost savings and 30% better CPU performance compared to official GitHub runners. It provides full workflow compatibility while supporting unlimited concurrent jobs, enabling development teams to significantly reduce CI/CD costs and improve performance.
Key Points:
- Achieve 7-15x cost reduction while maintaining full compatibility with existing GitHub Actions workflows, enabling significant budget optimization
- Gain data security and infrastructure control through self-hosting within your own AWS account environment
- Eliminate CI/CD pipeline bottlenecks for large development teams with scalability supporting hundreds of concurrent jobs
3. A tale of two incident responses: How our AI assistant found the root cause 3.5x faster
Source: grafana | Date: 2025-11-17
This article presents a case study from Grafana Labs where an AI assistant reduced root cause identification time by 3.5x during incident response. It compares traditional manual incident response processes with AI-powered automated approaches, providing developers with insights into efficient incident management strategies.
Key Points:
- Implement AI-powered observability tools that automatically analyze logs, metrics, and traces to identify correlations and patterns in system data
- Adopt AI assistant-driven root cause analysis processes that use pattern recognition and data correlation instead of manual investigation during incidents
- Integrate AI tools with existing on-call engineering workflows using a hybrid approach to improve team incident response culture and efficiency
4. The Declarative configuration journey: Why it took 5 years to ignore health check endpoints in tracing
Source: opentelemetry | Date: 2025-11-19
This article analyzes why it took 5 years to implement the ability to efficiently drop spans for health check endpoints in Java OpenTelemetry from a declarative configuration perspective. Developers will learn how to manage unnecessary tracing data in observability tools and understand the importance of configuration-based approaches.
Key Points:
- Implement span filtering for repetitive endpoints like health checks to reduce tracing overhead and optimize performance
- Design architecture that allows flexible control of observability behavior through declarative configuration without runtime code changes
- Optimize OpenTelemetry configuration by properly setting up span sampling and filtering rules to collect only meaningful data
5. PHP 8.5์ ์๋ก์ด ๊ธฐ๋ฅ๋ค
Source: geeknews | Date: 2025-11-21
PHP 8.5 introduces major productivity-enhancing features including pipe operators, clone with functionality, and a new URI parser for developers. The pipe operator simplifies function call chains, significantly improving code readability and maintainability. The clone with feature makes object copying operations more efficient and intuitive.
Key Points:
-
Utilize the pipe operator ( >) to transform nested function calls into linear chains for improved code readability - Use the clone with syntax to efficiently create new objects by modifying only specific properties of existing objects
- Implement URL processing logic more safely and accurately using the new URI parser functionality
6. Evolving OpenTelemetryโs Stabilization and Release Practices
Source: opentelemetry | Date: 2025-11-08
This article discusses OpenTelemetryโs evolving stabilization and release practices as one of the largest cloud-native projects. Developers will learn about the maturation process of observability tools and stable software release strategies in cloud-native environments. It provides insights into governance and quality management methodologies for large-scale community-driven projects.
Key Points:
- Apply systematic process design methods for building stable release cycles in large-scale open source projects to improve your own project quality
- Leverage OpenTelemetryโs observability tools and standardized telemetry collection methods to enhance application monitoring and debugging capabilities
- Reference community-based project governance models and collaboration approaches to improve team development culture and code review processes
7. Is the OTCA Exam Right for You? Insights for Both Newcomers and Advanced Users
Source: opentelemetry | Date: 2025-11-21
This article serves as a guide to the OpenTelemetry Certified Associate (OTCA) exam, offering valuable insights for both beginners and experienced professionals. It analyzes the value and practical applicability of OpenTelemetry certification as the technology becomes widely adopted, helping developers decide whether to pursue the exam based on their career stage.
Key Points:
- Evaluate your OpenTelemetry experience level and job requirements to determine if the OTCA exam is necessary for your career path
- Study real-world OpenTelemetry use cases as an observability tool to strengthen your system monitoring and troubleshooting capabilities
- Prioritize understanding OpenTelemetry technology and gaining hands-on experience over certification itself to build practical development skills
๐ Sources
Articles curated from various tech blogs and communities including SRE Weekly, GeekNews, OpenTelemetry, Grafana, and more.
์ํฐํด ์ ์์ด ์์ผ์๋ฉด ์ด๋ฉ์ผ๋ก ์ฐ๋ฝ์ฃผ์๊ฑฐ๋ ๋๊ธ์ ๋จ๊ฒจ์ฃผ์ธ์!
Have an article suggestion? Feel free to reach out via email or leave a comment below!