'llmops' 태그의 글 목록

AI Agent가 데모에서는 잘 되는데 운영에서는 무너지는 이유: 런타임 계층이 빠졌을 때

AI Agent를 처음 만들면 놀랍도록 빠르게 돌아간다. LLM API를 붙이고, 도구 몇 가지를 연결하고, 간단한 루프를 짜면 데모 영상 하나는 금방 완성된다. 문제는 그 다음이다. 실제 사용자 트래픽이 들어오고, 세션이 수십 개로 늘어나고, 에이전트가 외부 시스템을 호출하는 순간부터 예상치 못한 곳에서 조용히 무너지기 시작한다.요약AI Agent는 일반 웹 애플리케이션과 다른 방식으로 실행된다. 상태를 유지하고, 도구를 연속으로 호출하고, 긴 세션 동안 컨텍스트를 관리해야 한다. 이 모든 것을 애플리케이션 코드 안에서 직접 처리하려 하면 확장과 운영 모두 어려워진다. AI Agent 런타임은 이 문제를 해결하기 위한 별도 운영 계층이다.이 글이 필요한 사람AI Agent 프로젝트를 처음 운영 단계로 ..

AI 2026. 6. 20. 14:20

AWS Bedrock Agent와 Azure AI Agent Service를 운영 관점에서 비교하기

요약Agentic AI를 실제 업무에 붙이기 시작하면 질문은 금방 바뀝니다. 처음에는 "어떤 모델을 쓸까?"를 고민하지만, 운영 단계에서는 "이 에이전트가 어떤 도구를 호출했고, 어떤 권한으로 실행됐으며, 장애가 났을 때 어디서 추적할 수 있는가?"가 더 중요해집니다.이번 글에서는 AWS의 Amazon Bedrock Agents 및 Bedrock AgentCore와 Azure의 Azure AI Foundry Agent Service를 운영자 관점에서 비교합니다. 단순 기능 목록보다 런타임, 권한, 도구 연결, 관측성, 배포 흐름을 기준으로 어느 상황에 어떤 접근이 더 자연스러운지 정리합니다.이런 분들을 위한 글클라우드 인프라, DevOps, 플랫폼 엔지니어링, AI 서비스 운영을 담당하면서 Agentic..

AI 2026. 6. 11. 16:42

Agentic AI를 도입하기 전에 준비해야 할 Observability 기준

요약Agentic AI를 운영 환경에 붙일 때 가장 먼저 준비해야 할 것은 모델 선택이 아니라 관측 가능성, 즉 Observability 기준이다. Agent는 단순히 답변을 생성하는 것을 넘어 도구를 호출하고, 외부 시스템을 조회하고, 여러 단계의 판단을 거쳐 결과를 만든다.그래서 운영자는 "정답이 나왔는가"만 볼 수 없다. 어떤 사용자 요청에서 시작됐고, 어떤 Agent 버전이 동작했고, 어떤 도구를 어떤 권한으로 호출했으며, 실패했을 때 어느 단계가 원인이었는지를 추적할 수 있어야 한다.이 글을 읽으면 좋은 사람클라우드 운영, DevOps, SRE, 플랫폼 엔지니어링, LLMOps 업무에서 Agentic AI 도입을 검토하는 분들을 위한 글이다.특히 AWS Bedrock Agent, Bedrock ..

AI 2026. 6. 10. 10:40

Agentic AI 운영에서 권한 설계가 중요한 이유

AI Agent에게 운영 권한을 줄 때 먼저 나눠야 할 경계오늘의 관점Agentic AI의 위험은 "AI가 틀릴 수 있다"에서 끝나지 않는다. 실제 운영 환경에서는 틀린 판단보다 더 위험한 것이, 그 판단이 곧바로 변경 권한과 연결되는 구조다.요약Agentic AI는 단순 챗봇과 다르게 도구를 호출하고, 시스템을 조회하고, 경우에 따라 실제 변경 작업까지 수행할 수 있다. 그래서 운영 환경에 AI Agent를 붙일 때는 모델 성능보다 먼저 권한 경계, 승인 흐름, 감사 로그를 설계해야 한다.이 글에서는 인프라와 DevOps 담당자가 Agentic AI를 운영 자동화에 적용하기 전에 확인해야 할 권한 설계 원칙을 정리한다. AWS와 Azure 관점에서는 Agent가 어떤 도구를 호출할 수 있는지, 어떤 작..

AI 2026. 6. 9. 18:00

이전 1 다음

이전 다음

최근에 올라온 글

Total

Today

Yesterday

클라우드 나침반

티스토리툴바