전체 글 37

텍스트 분할 전략의 마스터플랜: RAG-LLM의 진정한 잠재력을 깨우다

왜 내가 업로드한 pdf 문서에서 원하는 답이 잘 추출되지 않을까? 정확하게 추출하려면 어떻게 해야할까? RAG-LLM (Retrieval-Augmented Generation for Language Models) 모델을 사용하여 데이터에서 원하는 답을 얻는 과정의 아키텍쳐에는 지식에 해당하는 문서를 사전에 vector database에 임베딩을 해두어야한다. 하지만 효율적인 retrieval을 위해서는 임베딩전 문서를 여러 조각 (chunk) 으로 나누는 텍스트 splitting을 시행하게된다. 정확한 지식기반 LLM을 위해서는 텍스트 splitting 전략 또한 매우 중요하다. 텍스트를 얼마만한 조각으로 나눌지 (chunk size), 조각끼리 얼마나 겹치게 할지 (chunk overlap), 문서의..

나만의 데이터로 GPT 활용-local LLM 구축 도전기 (3): LocalGPT

이번에는 좀더 기대되었던 'LocalGPT'에 대해 설치과정과 간단 사용경험을 공유하고자 합니다 지난번은 UI가 그래도 chatGPT처럼 친숙한 환경을 제공하였던 'Ollama' 라는 local LLM 구축경험을 공유였었죠 https://medtalk.tistory.com/entry/나만의-데이터로-GPT-활용-local-LLM-구축-도전기-2-Ollama-LLaMa 나만의 데이터로 GPT 활용-local LLM 구축 도전기 (2): Ollama-LLaMa지난 번 글에서는 LangChain기반 AI 모델 구축의 일반적인 내용을 담았고 이번에는 실제 구축한 LLM 모델에 대해 설명하고자 한다. 이로서 인터넷 서버를 통하지 않고 local computer인 내 노트북, 내 데medtalk.tistory.co..

마크다운의 장점: RAG-LLM에서 텍스트 추출과 임베딩의 용이성

마크다운, RAG-LLM 기반 인공지능 시대에 현대 문서 작성의 새로운 지평을 열 수 있을까? 문서 작성은 오늘날 정보의 전달과 공유에 있어 필수적인 부분이다. 그런데 기존의 파일 형식들, 예를 들어 PDF, .txt, .doc 등은 복잡한 형식과 스타일을 내포하거나 가독성, 변환의 어려움 등의 문제가 있다. 이러한 배경에서 마크다운 (Markdown) 형식이 주목받고 있다. 마크다운은 간결성과 유연성을 바탕으로 현대 문서 작성에 새로운 패러다임을 제시할 수 있을 것으로 생각한다.다음은 오로지 장점만 바라본 편향된 의견으로 작성되었으니 적절히 알아서 판단하면 좋겠다.탄생배경과 간단한 문법은 다음 링크를 참고https://ko.wikipedia.org/wiki/마크다운 마크다운 - 위키백과, 우리 모두의 ..

나만의 데이터로 GPT 활용-local LLM 구축 도전기 (2): Ollama-LLaMa

지난 번 글에서는 LangChain기반 AI 모델 구축의 일반적인 내용을 담았고 이번에는 실제 구축한 LLM 모델에 대해 설명하고자 한다. 이로서 인터넷 서버를 통하지 않고 local computer인 내 노트북, 내 데스크톱 PC에서 LLM을 구축하고 내가 쌓은 의학지식을 이용한 Retrieval Augmented Generation-기반 LLM 모델을 가지게 되는 것이다. https://medtalk.tistory.com/entry/나만의-데이터로-GPT를-활용하자-LangChain기반-맞춤형-AI-모델-구축-도전기-1-AI-시대의-맞춤형-데이터-활용 나만의 데이터로 GPT 활용: LangChain기반 AI 모델 구축 도전기 (1) 나만의 데이터로 GPT 활용: LangChain기반 AI 모델 구축 ..

ChatGPT 4.0 Knowledge 기능: 파일 업로드의 이해와 한계

chatGPT 4.0에서 knowledge 기능으로 file을 업로드 할 수 있게 되어 있다. 아래와 같이 7개까지 올려보면서 궁금증이 생겼다. 1. 최대 몇 개의 파일을 업로드 할 수 있을까? 2. 파일당 크기는 얼마까지 가능할까? 3. 업로드된 파일에서 제대로 parsing을 할 수 있을까? 한참을 구글 검색을 하다 허망하게도 OpneAI 홈페이지 FAQ에 잘 기술되어 있어서 번역과 링크를 달아두고자 한다(번역은 챗지피티에게 ^^). https://help.openai.com/en/articles/8555545-file-uploads-faq All Collections> ChatGPT > File uploads FAQ 한 번에 GPT에 업로드할 수 있는 파일 수는 몇 개인가요? 한 GPT의 수명 동안..

당신만의 AI 친구 만들기: ChatGPT를 활용한 'my GPT' 생성 가이드

혁신적인 기술의 발전은 우리의 일상과 업무 방식을 변화시키고 있습니다. 그 중심에는 인공지능(AI)이 자리 잡고 있으며, 특히 개인화된 AI 경험을 제공하는 'my GPT'가 주목받고 있습니다. 이번 블로그 글에서는 'my GPT'의 독특한 장점과 기능들을 탐색하고 어떻게 생성하는지 알아보고자 합니다. 'my GPT'의 장점 개인 맞춤형 대화 경험 'my GPT'는 사용자의 선호도, 필요, 관심사에 맞춰 조정됩니다. 이를 통해 표준화된 AI 대화에서 벗어나 개인에게 최적화된 상호작용을 경험할 수 있습니다. 다양한 활용 가능성 'my GPT'는 교육, 엔터테인먼트, 비즈니스, 헬스케어 등 다양한 분야에 적용될 수 있습니다. 사용자의 목적에 맞게 AI를 구성하여 특화된 정보와 지원을 받을 수 있습니다. 지속..

chatGPT와 대화로 풀어가는 PubMed 맞춤형 검색

안녕하세요, 여러분! 오늘은 지난글 (아래 링크)에 이어 ChatGPT Action을 이용해 PubMed 검색을 어떻게 혁신할 수 있는지에 대해 이야기해보려 합니다. chatGPT를 이용한 PubMed 데이터 검색에 관심이 있는 분이라면 이 글이 정말 흥미로울 거예요! https://medtalk.tistory.com/entry/당신만의-AI-친구-만들기-ChatGPT를-활용한-my-GPT-생성-가이드 당신만의 AI 친구 만들기: ChatGPT를 활용한 'my GPT' 생성 가이드 혁신적인 기술의 발전은 우리의 일상과 업무 방식을 변화시키고 있습니다. 그 중심에는 인공지능(AI)이 자리 잡고 있으며, 특히 개인화된 AI 경험을 제공하는 'my GPT'가 주목받고 있습니다. 이번 medtalk.tistor..

나만의 데이터로 GPT 활용: LangChain기반 AI 모델 구축 도전기 (1)

나만의 데이터로 GPT 활용: LangChain기반 AI 모델 구축 도전기 (1) 1. 나의 컴퓨터가 말을 하기 시작하다! 만약 우리의 노트북, 컴퓨터가 단순한 학습 도구를 넘어서서 지식 파트너가 된다면 어떨까? 매일 지식를 정리하고, 리포트를 작성하고, 취미와 관심사, 전문학술지식을 탐색하는 동안 수집된 여러분의 데이터가 살아 움직이는 듯한 느낌을 준다고 상상해보자. 마치 아이언맨의 자비스가 나에게도 생긴 것처럼. 어떻게 그렇게 할 수 있을까? chatGPT가 좀더 내가 가진 전문지식이나 내 컴퓨터 어딘가에 저장되어 있는 고급 문서 정보들을 학습해서 알려줄 수 없을까? 이런 생각들이 자연히 가질 수 밖에 없다. 바로 LangChain과 GPT의 결합이 이를 가능하게 해줄 수 있다. 이 기술은 우리의 개..

피트니스의 새로운 동반자: 닭가슴살과 프로틴 드링크 후기

안녕하세요~ 오늘은 프로틴 관련 제품 두가지 (닭가슴살, 프로틴 드링크)에 대해 후기를 올려볼까 합니다. 건강에 관심이 많고 꾸준히 피트니스를 하고 있기도 하고 나이가 들기도 하고 여러가지 이유로 프로틴 식이에 대해 관심이 있었습니다. 쵸코 가루 타 먹는 것도 해봤지만 맛이 너무 없어 몇 번 먹다가 말았네요. 닭가슴살도 몇 몇 제품을 사먹어 봤지만 씹을 때의 질감, 맛 등등의 이유로 지속적으로 먹기가 힘들었습니다. 그러던 중...! 아임닥의 닭가슴살 큐브 '숯불갈비맛'을 먹어 보았는데 일단 씹을 때의 질감이 제게 너무 마음에 들었습니다. 츄잉감이 있고 그냥 먹기 심심하면 소스나 김치랑 같이 먹기도 하고.. 매일 저녁으로 잘 먹고 있습니다. 그리고 쵸코가루대신 질리지 않는 것을 찾다가 편의점에서 2+1 이..

라이프 2024.01.09

차세대 AI 예술의 문을 여는 열쇠: Stable Diffusion Web UI 소개: Stable Diffusion Web UI 설치하기 [mac 버전]

Stable Diffusion Web UI는 사용자가 간단한 텍스트 입력을 하거나, 기존 이미지를 통해 복잡한 이미지를 생성할 수 있는 웹 기반 인터페이스입니다. 이는Deep Learning과 Generative Adversarial Networks (GANs)를 기반으로 하여, 웹툰, 쇼츠, 유튜브, 블로그 등 다양한 창작활동에 활용할 수 있는 유용한 툴입니다. Apple Silicon 칩을 탑재한 Mac 이 글에서는 Apple Silicon 칩을 탑재한 Mac에서 Stable Diffusion Web UI를 설치하는 방법을 단계별로 안내합니다. Stable Diffusion Web UI는 GitHub에서 다운로드할 수 있습니다. https://github.com/AUTOMATIC1111/stable-..