본문 바로가기

분류 전체보기

Part4. 개발자를 위한 Kubernetes 활용 개발자를 위한 Kubernetes 활용 파트 컨셉 1. 클라우드 인프라 기반 컨테이너 플랫폼 환경 설계 및 구축 수행 2. 컨테이너 플랫폼 기반 개발 환경 구성 3. 컨테이너 플랫폼의 안정적인 운영 방안 마련   개발자를 위한 Kubernetes 활용 파트 구성 0. 개발자를 위한 Kubernetes 활용 소개 1. Terraform을 활용한 AWS EKS 생성 2. AWS EKS 기본 Plugin 구성 방법 3. Kubernetes Manifest 작성을 위한 Helm 활용 4. Kubernetes 배포를 위한 GitHub와 ArgoCD 활용 5. Kubernetes 안정성 강화 방법 6. Kubernetes Custom 관리 방법 7. Kubernetes 보안 강화 방법 8. Kubernetes 트러.. 더보기
RestAPI, FastAPI, Flask 차이 REST API정의: REST API는 특정 프레임워크가 아니라 웹 서비스를 설계하는 아키텍처 스타일입니다. REST(Representational State Transfer) 원칙을 따르는 API를 의미합니다.목적: 클라이언트와 서버 간의 통신을 위한 구조를 제공.특징:자원 기반 구조.HTTP 메서드(예: GET, POST, PUT, DELETE)를 사용하여 자원 조작.상태 무저장(stateless).URI를 통해 자원 식별.FastAPI정의: FastAPI는 Python으로 작성된 현대적인 고성능 웹 프레임워크입니다.목적: 빠르고 쉽게 RESTful API를 만들기 위해 설계됨.특징:고성능: Starlette과 Pydantic을 기반으로 하여 비동기 기능과 데이터 검증을 지원.자동화된 문서화: Swa.. 더보기
LoRA for Efficient Stable Diffusion Fine-Tuning 출처- Using LoRA for Efficient Stable Diffusion Fine-Tuning (huggingface.co) Using LoRA for Efficient Stable Diffusion Fine-TuningUsing LoRA for Efficient Stable Diffusion Fine-Tuning LoRA: Low-Rank Adaptation of Large Language Models is a novel technique introduced by Microsoft researchers to deal with the problem of fine-tuning large-language models. Powerful models with billions ohuggingface.co.. 더보기
Ollama 활용 모델 커스터마이징- llama3를 커스터마이징 해본다$ ollama pull llava # 모델 다운- 다운 받은 모델은 .ollama/models/blob 에 위치하게 되는데, 이때 Modelfile 도 같이 저장되는 것으로 보인다 - 그이유는 아래에 나와 있다.더보기ollama show --modelfile {모델명} 해보면 modelfile을 보여주는데 FROM 의 파일이 sha256XXX.인코딩 파일이다.따라서, modelfile도 같이 .ollama/models/blob 에 저장되는 것을 알 수 있다.Modelfile를 수정할 경우 기존의 FROM을 llava:latest로 바꾸라고 한다.기존 llava가 인코딩된 파일을 가리키지 말라고 한다, 왤까??  - Modelfile 생성 FROM ll.. 더보기
[1] 유튜브 영상 요약하기 동기- CVPR 유튜브 영상을 챙겨 보다가 영상의 길이가 너무 길어, 이참에 OpenAI Whisper API를 이용한 동영상 요약을 진행해보고자 하였다.CVPR #18546 - Denoising Diffusion Models: A Generative Learning Big Bang (youtube.com)다음의 순서로 진행하고자 한다1) Speech to text   - 유튜브 영상을 mp3로 전환  -  mp3 파일을 txt로 변환하여 스크립트 저장2) LLM을 이용한 텍스트 요약 Speech to text (Whisper 사용법)-  Audio API는 transcriptions(필사), translations(번역) 기능을 제공한다. - mp3, mp4, mpeg, mpga, m4a, wav, w.. 더보기
GGUF 파일이란? GGUF(Georgi Gerganov Unified Format) 소개- GGUF는 GGML을 사용하여 대형 모델을 실행하는 프로그램과 모델을 저장하는 파일 형식이다. 참고로 GGML은 보통 컴퓨터에서도 큰 모델을 빠르게 돌릴 수 있는 ML용 라이브러리이다.-  Georgi Gerganov(@ggerganov)란 개발자가 만들었다.- 2023년 하반기에 나타나더니 급속도로 인기를 얻고 있으며 많은 사람들이 Pytorch의 .pt 포맷의 모델 파일을 .gguf 포맷으로 컨버팅하며 공유하고 있다.(역시 많이 쓰이는 것이 업계의 표준이 된다)  파일 구조- @mishig25가 작성한 GGUFv3 다이어그램 - 모델의 weight 텐서 값과 메타데이터가 key-value 형식으로 저장되어 있다.  사용 예시- .. 더보기
LangServe 개요 ❏ 개요LangServe는 개발자가 LangChain 실행 가능 항목과 체인(LCEL)을 REST API로 배포하는 데 도움을 줍니다.이 라이브러리는 FastAPI와 통합되어 있으며 데이터 검증을 위해 pydantic을 사용합니다.또한 서버에 배포된 실행 파일을 호출하는 데 사용할 수 있는 클라이언트를 제공합니다. JavaScript 클라이언트는 LangChain.js에서 사용할 수 있습니다. ❏ 특징입력 및 출력 스키마는 LangChain 개체에서 자동으로 추론되고 모든 API 호출에 적용되며 풍부한 오류 메시지가 표시됩니다.JSONSchema 및 Swagger가 포함된 API 문서 페이지단일 서버에서 많은 동시 요청을 지원하는 효율적인 /invoke, /batch 및 /stream 엔드포인트체인/에이.. 더보기
SORA 톺아보기 서론- 다양한 지속 시간, 해상도 및 종횡비의 비디오와 이미지에 대해 텍스트 조건부 확산 모델을 훈련합니다.- 우리는 비디오 및 이미지 잠재 코드의 시공간 패치에서 작동하는 트랜스포머 아키텍처를 활용합니다. 가장 큰 모델인 Sora는 1분 분량의 고화질 비디오를 생성할 수 있습니다.- 우리의 결과는 비디오 생성 모델을 확장하는 것이 물리적 세계의 범용 시뮬레이터를 구축하기 위한 유망한 경로임을 시사    이 기술 보고서는 (1) 모든 유형의 시각적 데이터를 생성 모델의 대규모 학습을 가능하게 하는 통합 표현(unified representation)으로 전환하는 방법과 (2) Sora의 기능 및 한계에 대한 정성적 평가에 중점을 둡니다. 모델 및 구현 세부 정보는 이 보고서에 포함되지 않습니다.   많은.. 더보기