728x90
반응형
SMALL

2026/05/14 2

[AI] CSP들의 LLM 서비스: Google, AWS, Microsoft (+Hugging Face)

클라우드 서비스 제공사에서 제공하는 LLM 서비스, 뭐가 있을까?LLM을 프로젝트에 활용하려면 어떤 플랫폼을 선택해야 할까요? 네이버 클로바 스튜디오처럼 LLM 학습, 튜닝, 추론을 모두 지원하는 서비스들이 많이 있습니다. 각 플랫폼마다 지원하는 모델, 가격, 튜닝 방식이 다르기 때문에 프로젝트의 요구사항에 맞게 선택하시면 됩니다.이번 글에서는 엔터프라이즈급 LLM 서비스 4가지를 비교해보겠습니다. 먼저 한눈에 보는 비교표로 각 서비스의 차이를 파악한 후, 각 서비스의 상세 설명을 읽으시면 좋을 것 같습니다.4가지 서비스 빠른 비교서비스모델 다양성파인튜닝가격대추천 대상Vertex AIGoogle 중심SFT, Prompt Tuning중간~높음엔터프라이즈, ML 파이프라인Bedrock✅ 최고 (Claude,..

IT/AI 2026.05.14

[LLM] 어떻게 작동할까? 필수 개념 Attention과 KV Cache (추론 최적화의 핵심)

Attention의 기본 원리Attention 메커니즘은 트랜스포머 모델의 핵심입니다. 각 토큰이 이전의 모든 토큰과 얼마나 "주목(Attend)"해야 하는지를 학습하는 방식입니다. LLM이 "다음 단어를 예측할 때 문맥을 이해하는 이유"가 바로 Attention입니다.Attention의 작동 방식을 이해하려면 세 가지 핵심 요소를 알아야 합니다. Query(Q), Key(K), Value(V)가 그것인데, 이들이 어떻게 상호작용하는지 보겠습니다. 자세한 내용은 트랜스포머 논문(https://arxiv.org/abs/1706.03762)을 참고하시면 좋을 것 같습니다. Attention Is All You NeedThe dominant sequence transduction models are based..

IT/AI 2026.05.14
728x90
반응형
LIST