반응형

전체 글 123

Gemini CLI로 Gemini 2.5 Pro를 무료로 사용해 보자! #1

최근 구글에서 gemini cli를 발표했어요. openai cli등 비슷한 방식들은 이미 있었죠. 그런데 눈에 띄는 부분은 현재 Gemini의 최신 모델인 Gemini 2.5 pro를 무료로 사용할 수 있다는 거죠. 뭐 더 말할 게 있을까요? 사용해 봐야죠. 설치방법과 어떻게 사용하는 건지 정리해 볼게요.Gemini CLI로 Gemini 2.5 Pro를 무료로 사용해 보자! #1 Gemini CLI의 개념과 등장 이유Gemini CLI는 구글의 대규모 언어 모델인 Gemini의 기능을 명령줄 인터페이스(CLI) 환경에서 직접 활용할 수 있도록 설계된 오픈 소스 AI 에이전트입니다. 기존에는 웹 기반 인터페이스나 특정 IDE 통합을 통해 AI 모델에 접근하는 것이 일반적이었으나, Gemini CLI는 ..

파이썬 GIL과 멀티스레딩 - 멀티코어 환경에서 병렬 처리와 성능 한계 #1

요즘 컴퓨터 사양을 보다 보면 쿼드 코어니 옥타 코어니 하는 용어를 흔히 볼 수 있죠. 때문에 오히려 싱글 코어를 보기 어려워졌어요. 그런데, 왜 파이썬은 이 모든 코어를 동시에 사용하지 못하고 오로지 하나만 사용한다는 거예요. 이것은 파이썬의 GIL(Global Interpreter Lock) 메커니즘 때문인데요, 오늘은 파이썬의 가장 큰 특징인 GIL에 대해 정리해 보겠습니다.파이썬 GIL과 멀티스레딩 GIL(Global Interpreter Lock)GIL은 이름 그대로 파이썬 인터프리터 전체에 걸쳐 작동하는 "잠금(Lock)" 장치입니다. 파이썬 인터프리터는 파이썬 코드를 읽고 실행하는 소프트웨어인데, GIL은 이 인터프리터가 한 번에 하나의 스레드(Thread)만이 파이썬 바이트코드(Bytec..

컨테이너, MSA, DevOps, 웹 서비스 아키텍처의 핵심과 Docker & Kubernetes의 역할

웹 서비스의 아키텍처 변화와 컨테이너 기술의 등장 과정을 살펴보고 수많은 컨테이너를 효율적으로 관리하는 컨테이너 오케스트레이션(Kubernetes)에 대해서까지 정리해 보죠. 컨테이너, MSA, DevOps, 웹 서비스 아키텍처의 핵심 초기 웹 서비스 구조초기 웹 서비스는 대부분 모놀리식 아키텍처(Monolithic Architecture)로 구축되었습니다.특징: 웹 서비스의 모든 기능(사용자 인증, 상품 관리, 결제, 추천 등)이 하나의 거대한 애플리케이션으로 묶여 하나의 서버에 배포.서버 구성: Apache나 Nginx 같은 웹 서버가 요청을 받고, Tomcat이나 JBoss 같은 WAS(Web Application Server)에서 Java, Python, PHP 등으로 개발된 애플리케이션 코드를..

tiktoken 라이브러리 활용 - OpenAI LLM 토큰 계산으로 AI 모델 비용 예상하기

대규모 언어 모델(LLM)에서 자연어 처리의 핵심 개념 중 하나는 토큰(Token)입니다. OpenAI에서 개발한 tiktoken 라이브러리는 바로 이 토큰수를 예상할 수 있는 라이브러리입니다. 이번에는 tiktoken를 어떻게 활용할 수 있는지 코드와 함께 정리해 보겠습니다. OpenAI LLM 토큰수 계산하기 tiktoken 라이브러리tiktoken은 OpenAI의 모델들이 텍스트를 인코딩(토큰화)하고 디코딩하는 데 사용하는 BPE(Byte Pair Encoding)입니다. 쉽게 말해, 우리가 작성하는 문장을 모델이 이해할 수 있는 작은 숫자(토큰 ID)들의 배열로 변환하거나, 반대로 토큰 ID 배열을 다시 우리가 읽을 수 있는 문장으로 변환해 주는 역할을 합니다. 다음과 같이 활용됩니다.토큰 수 ..

OpenAI API input/output token(토큰) 계산 및 확인 방법 - LLM 모델 사용량과 비용 #1

이번에는 토큰(Token) 수 계산 방법에 대해 살펴보도록 할게요. OpenAI API를 사용하다 보면 토큰(Token) 수에 따라 비용이 책정되는 것을 볼 수 있는데요, 이것은 LLM기반 생성형 AI 모델을 사용함에 있어서 반드시 적용되는 부분으로 어떤 모델을 사용하던지 필요한 단위가 됩니다. OpenAI API input/output token(토큰) 계산간단히 말하자면, LLM(대규모 언어 모델)은 이미 언어를 구성할때 토큰이라는 개념을 사용합니다. 때문에 생성형 AI를 사용함에 있어서 토큰이 사용량 측정의 기본 단위가 되는 것은 어쩌면 너무나 당연한 것입니다. 그러므로, 이러한 기본 단위인 토큰을 기준으로 사용량에 따른 비용을 책정한다는 것은 너무나 당연하다고도 할 수 있죠. 결국, 내가 얼마나..

OpenAI API Chat Format으로 챗봇 만들기 - 프롬프트 엔지니어링 가이드 #5

이번에는 프롬프트 엔지니어링 마지막 이야기로, OpenAI API의 "Chat Format"을 활용한 대화형 챗봇(ChatBot)을 구현해 보도록 할게요. 생성형 AI을 이해하는 데에 있어서 대화형 챗봇은 아주 좋은 예가 될 거예요. OpenAI API Chat Format으로 챗봇 만들기 역할 기반 메시지 구성Chat API의 핵심은 role 기반 메시지 시스템이에요. 모든 대화는 다음과 같은 역할로 구분됩니다.system: 초기 설정과 규칙을 정합니다. user: 사용자가 입력한 메시지입니다.assistant: 모델이 생성한 답변입니다.이 구조를 활용하면 원하는 성격과 기능을 가진 챗봇을 쉽게 설계할 수 있죠, 다음 예시 코드를 보면 잘 이해할 수 있을 거예요.messages = [ {"rol..

GPT로 고객 리뷰 분석부터 뉴스 주제 추출까지 - 정보 추출 자동화 프롬프트 방법 #4

이번에는 프롬프트 엔지니어링 방법을 이용해서 어떤 텍스트 자료에서 원하는 정보를 추출하거나 어떤 요소를 추축해 내는 방법에 대해 다뤄보겠습니다. 정보 추출 자동화 프롬프트 방법기업과 조직이 다루는 데이터 중 상당수는 문장으로 이루어진 비정형 텍스트입니다. 개인마다 다르겠지만, 저 같은 경우도 개인적으로 필요한 데이터는 모두 텍스트 형식이죠. 이런 데이터를 사람이 직접 읽고 분류하는 데에는 시간이 많이 소요됩니다. 더구나, 많은 데이터를 분류하다 보면 분류 기준의 일관성도 흔들리기 쉽습니다.만일, 특정 정보만 선별해 구조화된 형태로 추출할 수 있다면, 개인이나, 조직의 분석 효율을 높이고 운영 의사결정을 빠르게 내릴 수 있을 거예요. GPT를 활용한 정보 추출GPT 모델은 사용자가 입력한 프롬프트..

반응형