AI 8

FineTuning 구축하기(RAG 비교)

FineTuning(특화학습기반) vs RAG(정보검색기반)- RAG는 범용 모델로서 우수한 성능을 보이지만, 특정 조직의 고유한 아이덴티티를 반영하지 못한다.(ChatGpt처럼 범용적으로 사용하고 다양한 데이터를 가져오는데에는 RAG가 우수하다.)- 데이터보안(망분리 및 규제)의 환경에서는 On-Premise환경에서 독립적으로 구축하려면 FineTuning 기법을 활용한 LLM을 구축해야한다.- FineTuning은 제한된 리소스내에서 결과를 도출하기에 좁지만 정확한 결과를 도출 할 수 있다.LoRA(Low-Rank Adaptation) : 효율적인 파인튜닝 기법거대 모델의 전체 파라미터를 전체 재학습하는 것은 높은 비용과 자원 소요되므로,사전 학습된 가중치는 고정(Freeze)하고, Low-Rank ..

AI 2025.11.28

RAG 개발을 위한 Retriever, Reranking 개념

Retriever : 앙상블 해석 하이브리드 검색 구현핵심 알고리즘1 : BM25(Best Match 25)- TF-IDF(검색계의 시조새급 알고리즘)의 완성형 핵심 알고리즘2 : RRF(Reciprocal Rank Fusion)"점수(Score)가 아닌 등수(Rank)로" 구현 순서1. 정형화한 데이터 Chunk2. Chunk된 데이터를 저장할 백터 DB(Chroma DB)에 저장3. 기본 벡터 검색 테스트 : 가장 기본적인 유사도검색(Similarity Search) 수행4. Vector Search의 한계 : "의미적 유사도 기반으로 정량적 검색하기 때문에 한계가 존재" --> 5. 키워드 검색기 도입(BM25 활용)6. Vector와 BM25에 가중치를 부여하여 앙상블(Ensemble)방식으로 적..

AI 2025.11.21

Streamlit을 활용한 데이터 멋지게 보여주기

Streamlit 실행하기#기본 실행streamlit run 소스파일명.py#소스 경로에 한글이 있는경우python -m streamlit run 소스파일명.py - Streamlit 코드 생성 프롬프트 예시ChatGpt에 아래 질문 내용을 통해 토이프로젝트를 만들었다.streamlit ui를 하나 만들거야. 그 과정에서 필요한 요소들을 정리해주고, 필요한 질문들을 나에게 해줘. 좀 더 상세하게, 기획안을 정해서 소스를 만들었다. 더보기streamlit ui를 하나 만들거야. 그 과정에서 필요한 요소들을 정리해주고, 필요한 질문들을 나에게 해줘. 참고로, 아래 내용은 서비스 기획안이야. 🎄 기획안 #1 크리스마스 파티 테마 추천기 + 아이템 추천(어필리에이트) “우리가 어떤 파티를 하고 싶은지 알려..

AI 2025.11.14

LLM API사용을 위한 Wrapper와 ReAct패턴

LLM API사용을 통해 OpenAI, Gemini 등의 기능을 구현하여 파이프라인을 구성할 때 필요한 내용이다. 위의 각 AI들은 서로 다른 API규격을 가지므로 각각 Wrapper를 통해 커스텀이 필요하다.아래는 Wrapper를 어떤식으로 사용하는지에 대해 정리한 내용이다.Wrapper의 사용단계서비스 -> Wrapper(번역) [ OpenAI / 사내AI / Gemini 등의 API 표준화 ] -> 각 AI로 호출커스텀한 Wrapper 사용법: 1. .env에 특정LLM_API_KEY 설정 2. 특정LLM 또는 특정ChatModel 사용 3. LangChain의 모든 기능 (Chain, Agent 등)과 호환 ReAct패턴과 그 외 다른 패턴패턴한줄설명ReAct“생각→행동→생각→행동” 하며 퍼..

AI 2025.11.14

VSCode jupyter 인코딩 에러 해결방법

아래와 같이 .env파일의 KEY값에 주석을 넣으려고했다가 발생했다. python 파일을 통으로 터미널에서 Run하면 정상 실행되지만cell단위로 실행하면 encoding 에러가 발생했다. 에러'latin-1' codec can't encode character '\uac12' in position 25: ordinal not in range(256) 위에서 \uac12는 한국어로 "값"이라는 말이므로, 내가 "값"이라는 한국어를 주석처럼 넣으려다가 발생한것이다. 아래는 내가 실수한 샘플POTENS_API_KEY="어쩌구저쩌구키" # 결론은, 주석을 쓸거면 KEY값과 다른 라인에다가 쓰면 된다. 환경.env 파일 해석 방식결과 및 원인터미널 (python file.py)dotenv 라이브러리 또는 쉘 ..

AI 2025.11.07

AI 개발툴 추천(생성형,문서,PPT,이미지)

아래 내용은 필자가 직접 사용해보고 추천하는 AI툴이며, 추후 사용하기 위해 링크도 같이 남긴다.AI로 일하는 시대, 꼭 써봐야 할 AI 툴 4가지 AI를 활용하면 자료 조사부터 PPT 제작, 이미지 생성까지 모든 과정을 효율적으로 자동화할 수 있다.오늘은 리서치와 정리, 발표자료 제작, 이미지/영상 생성에 유용한 AI 툴 4가지를 소개한다.🧠 1. GEMINI 딥리서치AI가 대신 조사하고 요약해주는 지능형 리서치 도구🔗 GEMINI Deep Research 바로가기GEMINI 딥리서치는 단순 검색이 아닌 AI 기반 심층 리서치 기능을 제공한다.사용자가 질문을 입력하면 관련 논문, 기사, 기술자료를 찾아 요약 보고서 형태로 정리해준다.특히 출처 링크가 함께 제공되어 신뢰성 높은 자료를 빠르게 확보할 ..

AI 2025.11.07

AI로 인한 개발자 미래 방향 제시

근 2년간 AI의 비약적인 발전에 따라,코딩을 처음 시작할때부터 AI가 있었던 "AI Native 개발자"와전통적인 시대부터 개발하던 "기성세대 개발자"가 나뉘게 되었다. AI툴 이전의 과도기 예시 : 메모장-코드편집기-IDE필자 역시도 메모장에 코딩을 하던 시대의 사람은 아니지만, Intellij/Pycharm 등 IDE 툴을 적극 활용하던 개발하던 개발자이다. 이러한 환경에서 개발을 하다가, 회사에 가서 이클립스/VisualStudio로 코드 편집기 기능만으로 개발하려고 하니 코드 생산성이 확 떨어지는 것을 체감한 적이 있다.또한, 코딩테스트 시험의 경우도 자동완성이 되지않는 환경에서 보는 경우가 많은데, 이 경우에도 라이브러리 import부터 작성이 막히는 등 많은 어려움이 있었다. 이와 비슷하게 ..

AI 2025.04.20

데이터 프레임 참고 링크

https://dandyrilla.github.io/2017-08-12/pandas-10min/ 판다스(pandas) 기본 사용법 익히기 데이터 분석을 위한 파이썬 라이브러리인 판다스(pandas) 의 기본 사용법을 소개해 놓은 ‘10 Minutes to pandas’ 를 번역해 놓은 글입니다. pandas 의 기본 사용법을 익히시려는 분들에게 실습을 천천히 dandyrilla.github.io 데이터 분석을 위해 파이썬 공부 및 판다스를 통해 데이터 프레임 공부의 필요성을 느껴 메모합니다. https://codingapple.com/course/python-basic/ 빠르게 정리하는 파이썬 기초 문법 - 코딩애플 온라인 강좌 (파이썬 웹크롤러/업무자동화 강의 + 딥러닝 AI 강의 패키지 할인 이벤트 ..

AI 2022.03.10