728x90
반응형
SMALL

llm 11

[AI] CSP들의 LLM 서비스: Google, AWS, Microsoft (+Hugging Face)

클라우드 서비스 제공사에서 제공하는 LLM 서비스, 뭐가 있을까?LLM을 프로젝트에 활용하려면 어떤 플랫폼을 선택해야 할까요? 네이버 클로바 스튜디오처럼 LLM 학습, 튜닝, 추론을 모두 지원하는 서비스들이 많이 있습니다. 각 플랫폼마다 지원하는 모델, 가격, 튜닝 방식이 다르기 때문에 프로젝트의 요구사항에 맞게 선택하시면 됩니다.이번 글에서는 엔터프라이즈급 LLM 서비스 4가지를 비교해보겠습니다. 먼저 한눈에 보는 비교표로 각 서비스의 차이를 파악한 후, 각 서비스의 상세 설명을 읽으시면 좋을 것 같습니다.4가지 서비스 빠른 비교서비스모델 다양성파인튜닝가격대추천 대상Vertex AIGoogle 중심SFT, Prompt Tuning중간~높음엔터프라이즈, ML 파이프라인Bedrock✅ 최고 (Claude,..

IT/AI 2026.05.14

[LLM] 어떻게 작동할까? 필수 개념 Attention과 KV Cache (추론 최적화의 핵심)

Attention의 기본 원리Attention 메커니즘은 트랜스포머 모델의 핵심입니다. 각 토큰이 이전의 모든 토큰과 얼마나 "주목(Attend)"해야 하는지를 학습하는 방식입니다. LLM이 "다음 단어를 예측할 때 문맥을 이해하는 이유"가 바로 Attention입니다.Attention의 작동 방식을 이해하려면 세 가지 핵심 요소를 알아야 합니다. Query(Q), Key(K), Value(V)가 그것인데, 이들이 어떻게 상호작용하는지 보겠습니다. 자세한 내용은 트랜스포머 논문(https://arxiv.org/abs/1706.03762)을 참고하시면 좋을 것 같습니다. Attention Is All You NeedThe dominant sequence transduction models are based..

IT/AI 2026.05.14

[CLOVA Studio] 모델 튜닝 실습부터, 프롬프트, API 발급 방법까지

CLOVA Studio로 시작하는 HyperCLOVA X네이버 클라우드의 CLOVA Studio는 HyperCLOVA X 모델을 활용하여 프롬프트 작성, 모델 튜닝, API 연동을 모두 할 수 있는 통합 플랫폼입니다. 2025년 기준 여러 모델 라인업을 제공하고 있으며, 각 모델의 특징에 맞춰 선택하여 사용하시면 됩니다. CLOVA Studio는 확률 기반 언어 모델을 기반으로 합니다. 동일한 프롬프트를 입력하더라도 각 단어를 확률로 예측하기 때문에 매번 다양한 결과가 도출될 수 있습니다. 이를 제어하려면 Temperature, Top P/K 같은 파라미터를 조정하시면 됩니다. 자세한 내용은 공식 CLOVA Studio 사이트(https://clova.ai/clova-studio)에서 확인하실 수 있습니..

IT/AI 2026.05.10

[AI 동향] Claude Opus 4.7의 '성능 역주행': 세차하려는데 1분거리라서 걸어가라고?

같은 질문, 다른 답변: 일관성의 붕괴2026년 4월, Anthropic이 Claude Opus 4.7을 공개한 직후 충격적인 반응이 터져 나왔습니다.사용자들은 "개선점이 없다"는 수준을 넘어 "성능이 퇴보했다"고 지적했습니다. 새 모델이 출시될 때마다 "현존 최강"이라는 칭호를 받아온 만큼, 이례적인 것 같습니다.https://event.stibee.com/v2/click/MTY5MzU5LzMzNDQ3NzQvMjgxMzQ5Lw/aHR0cHM6Ly93d3cucmVkZGl0LmNvbS9yL0NsYXVkZUFJL2NvbW1lbnRzLzFzbmhmemQvY2xhdWRlX29wdXNfNDdfaXNfYV9zZXJpb3VzX3JlZ3Jlc3Npb25fbm90X2FuLw Claude Opus 4.7 is a seri..

IT/AI 2026.04.21

[AI 코드리뷰] LLM부터 Agent Orchestration까지: 개발 생산성 향상 전략

개발부터 코드리뷰까지의 과정에서, AI 활용 역량을 높힐 수 있는 내용을 다뤄보고자 합니다.요즘AI 코드리뷰의 선택지가 늘어나고 있습니다. 자동 문법 검사 도구부터 LLM 기반 지능형 분석까지 다양한 방법이 있지만, 같이 일하는 동료들과의 표준을 정립하고 효율적으로 활용하는 것이 핵심입니다. 이 글에서는 단계별 코드리뷰 자동화 전략을 소개합니다. 1단계: LLM 기반 diff 분석LLM이 형상관리 솔루션(GitHub, GitLab 등)에 연동되어 있다면, 커밋된 코드의 변경점을 자동으로 추출하고 분석할 수 있습니다. 이 방식의 장점은 불필요한 컨텍스트를 제거하고 실제 변경사항에 집중하는 것입니다.커밋 메시지: "User API 응답시간 개선"diff 기반 분석 (권장)- UserController.jav..

IT/etc 2026.04.20

[Kanana-o] 베타 테스터로 선정되신 것을 축하드립니다! (#앰배서더)

저번 달 Kanana-o 모델 공개 당시 소개 글을 작성한 적이 있습니다. [AI] Kanana-o, 카카오 독자 개발 옴니(Omni) 모델. 과연 사람과 얼마나 가까울까? (https://snapcode.tistory.com/195) [AI] Kanana-o, 카카오 독자 개발 옴니(Omni) 모델. 과연 사람과 얼마나 가까울까?2026.02.12 모집 시작. 그리고 2026.02.20, 안내 메시지가 도착했습니다. 요즘 카카오는 확실히 AI에 집중하고 있다는 느낌을 받습니다. 이번에 공개된 모델은 Kanana-o국내 최초 통합 멀티모달 언어모델snapcode.tistory.com 그리고 오늘 저녁.운이 좋게도, 카카오의 멀티모달 AI 모델 Kanana-o API 베타 테스터에 참여하게 되었습니다...

IT/AI 2026.03.04

[AI] GitHub Copilot Pro 한도 초과 후기: LTE 다 쓰고 3G로 버티는 기분

신나게 개발하고 있었는데, 나에게도 드디어 찾아왔다.한 도 초 과. 검색해보니 GitHub Copilot 설정 페이지를 들어가보라고 나온다.https://github.com/settings/copilot/features GitHub · Change is constant. GitHub keeps you ahead.Join the world's most widely adopted, AI-powered developer platform where millions of developers, businesses, and the largest open source community build software that advances humanity.github.com 그리고 빨간색 바를 마주했다. ..

IT/AI 2026.02.20

[AI] Kanana-o, 카카오 독자 개발 옴니(Omni) 모델. 과연 사람과 얼마나 가까울까?

2026.02.12 모집 시작. 그리고 2026.02.20, 안내 메시지가 도착했습니다. 요즘 카카오는 확실히 AI에 집중하고 있다는 느낌을 받습니다. 이번에 공개된 모델은 Kanana-o국내 최초 통합 멀티모달 언어모델이라고 소개합니다. https://omni.kanana.ai/?t_src=talk&t_ch=msg Kanana-o더욱 똑똑하게 답하며, 더욱 풍부한 감정표현을 향한 Kanana-o의 진화 과정omni.kanana.ai 사람에 가까운 자연스러운 이걸 엄청 강조하는 것 같습니다. 최근 LLM은 성능 경쟁을 넘어 “어떻게 경험을 설계하느냐”의 단계로 넘어가고 있다고 느낍니다. Kanana-o 역시 멀티모달 + 자연스러운 발화 + 한국어 최적화라는 방향으로 카카오식 AI..

IT/AI 2026.02.20

[AI] 카카오 AI 앰배서더, AI를 소비하면서 동시에 제품으로 만드는 개발자.

https://tech.kakao.com/posts/809 카카오 AI 앰배서더 ‘KANANA 429 앰배서더’를 신규 모집합니다. - tech.kakao.com이 글은 카카오 공식 보도자료로, 기술블로그에 동시 게재합니다. KANANA...tech.kakao.com 어느날 "카카오 AI 앰배서더" 공개 모집 알림톡이 날라왔습니다.AI를 실사용 및 개발하고있는 요즘, 외부 커뮤니티 활동에도 참여하면 좋을 것 같다고 생각하여 신청했습니다. 이왕이면 내부 프로젝트에만 머무르지 않고, 외부 커뮤니티 활동을 통해 더 넓은 관점에서 AI를 다뤄보고 싶었습니다. 그래서 지원했습니다. 지금은 안보이지만, 3가지 중에 하나를 선택해야 하더군요. 지원 분야는 세 가지였습니다. - AI 전문가 - 콘텐츠 크..

IT/AI 2026.02.20

[MCP] Gemini + LangChain4j 활용하여 검색 기능 개선

[ MCP Inspertor Search Result ] 상황기존 검색은 정해진 SQL로 단순 키워드만 조회했습니다. 이번에 Gemini AI(무료 플랜) + LangChain4j를 결합하여 자연어를 JSON으로 변환한 후, 동적 SQL을 안전하게 생성하는 시스템을 구현했습니다. 핵심 개선사항기존: 고정 SQL, WHERE 조건 사전 정의개선: 자연어 → LLM 분석 → JSON 추출 → 동적 SQL (유연성 ↑)아키텍처 흐름사용자 입력 (자연어) ↓[Gemini 2.0 Flash] 검색 조건 분석 ↓JSON 파싱 (필터 조건 구조화) ↓[PreparedStatement] 안전한 SQL 조립 ↓데이터베이스 실행 → 결과 반환실제 예시입력: "금융 회사의 5년 이상 경력 개발자 공고..

IT/AI 2026.02.17
728x90
반응형
LIST