'2025/11 글 목록

FineTuning 구축하기(RAG 비교)

FineTuning(특화학습기반) vs RAG(정보검색기반)- RAG는 범용 모델로서 우수한 성능을 보이지만, 특정 조직의 고유한 아이덴티티를 반영하지 못한다.(ChatGpt처럼 범용적으로 사용하고 다양한 데이터를 가져오는데에는 RAG가 우수하다.)- 데이터보안(망분리 및 규제)의 환경에서는 On-Premise환경에서 독립적으로 구축하려면 FineTuning 기법을 활용한 LLM을 구축해야한다.- FineTuning은 제한된 리소스내에서 결과를 도출하기에 좁지만 정확한 결과를 도출 할 수 있다.LoRA(Low-Rank Adaptation) : 효율적인 파인튜닝 기법거대 모델의 전체 파라미터를 전체 재학습하는 것은 높은 비용과 자원 소요되므로,사전 학습된 가중치는 고정(Freeze)하고, Low-Rank ..

AI 2025.11.28

RAG 개발을 위한 Retriever, Reranking 개념

Retriever : 앙상블 해석 하이브리드 검색 구현핵심 알고리즘1 : BM25(Best Match 25)- TF-IDF(검색계의 시조새급 알고리즘)의 완성형 핵심 알고리즘2 : RRF(Reciprocal Rank Fusion)"점수(Score)가 아닌 등수(Rank)로" 구현 순서1. 정형화한 데이터 Chunk2. Chunk된 데이터를 저장할 백터 DB(Chroma DB)에 저장3. 기본 벡터 검색 테스트 : 가장 기본적인 유사도검색(Similarity Search) 수행4. Vector Search의 한계 : "의미적 유사도 기반으로 정량적 검색하기 때문에 한계가 존재" --> 5. 키워드 검색기 도입(BM25 활용)6. Vector와 BM25에 가중치를 부여하여 앙상블(Ensemble)방식으로 적..

AI 2025.11.21

논블로킹-비동기 개발에 관하여(WebFlux, Netty, CompletableFuture)

요즘 IT 서비스에서는 비동기 개발에 대한 역량을 중요하게 보는곳이 많아지고 있다.아무래도 Micro 단위의 서비스가 많아지면서, 각각 분리하여 서비스를 처리하며, 성능 개선에 대한 업계 변화를 감지한듯하다. 비동기(Async)프로그래밍에 대해서 논할때 논블로킹(Non-Blocking)/블로킹(Blocking)에 대한 이야기가 많이 나온다.그 중에서도 비동기-논블로킹 조합이 가장 많이 나온다. 요청을 기다리지 않고 즉시 다음 작업을 처리할 수 있는 구조 본 글은 'Non-blocking & Asynchronous programming'에 대해서 정리하는 글이다. 사용환경사용환경은 아래와 같다.꼭 아래의 상황이라면 비동기+논블로킹 기술을 사용하라는것이 아닌, 고려해볼만한 상황을 작성해두었다.대량의 I/O ..

웹(Web)/백엔드(Backend) 2025.11.18

Streamlit을 활용한 데이터 멋지게 보여주기

Streamlit 실행하기#기본 실행streamlit run 소스파일명.py#소스 경로에 한글이 있는경우python -m streamlit run 소스파일명.py - Streamlit 코드 생성 프롬프트 예시ChatGpt에 아래 질문 내용을 통해 토이프로젝트를 만들었다.streamlit ui를 하나 만들거야. 그 과정에서 필요한 요소들을 정리해주고, 필요한 질문들을 나에게 해줘. 좀 더 상세하게, 기획안을 정해서 소스를 만들었다. 더보기streamlit ui를 하나 만들거야. 그 과정에서 필요한 요소들을 정리해주고, 필요한 질문들을 나에게 해줘. 참고로, 아래 내용은 서비스 기획안이야. 🎄 기획안 #1 크리스마스 파티 테마 추천기 + 아이템 추천(어필리에이트) “우리가 어떤 파티를 하고 싶은지 알려..

AI 2025.11.14

LLM API사용을 위한 Wrapper와 ReAct패턴

LLM API사용을 통해 OpenAI, Gemini 등의 기능을 구현하여 파이프라인을 구성할 때 필요한 내용이다. 위의 각 AI들은 서로 다른 API규격을 가지므로 각각 Wrapper를 통해 커스텀이 필요하다.아래는 Wrapper를 어떤식으로 사용하는지에 대해 정리한 내용이다.Wrapper의 사용단계서비스 -> Wrapper(번역) [ OpenAI / 사내AI / Gemini 등의 API 표준화 ] -> 각 AI로 호출커스텀한 Wrapper 사용법: 1. .env에 특정LLM_API_KEY 설정 2. 특정LLM 또는 특정ChatModel 사용 3. LangChain의 모든 기능 (Chain, Agent 등)과 호환 ReAct패턴과 그 외 다른 패턴패턴한줄설명ReAct“생각→행동→생각→행동” 하며 퍼..

AI 2025.11.14

VSCode jupyter 인코딩 에러 해결방법

아래와 같이 .env파일의 KEY값에 주석을 넣으려고했다가 발생했다. python 파일을 통으로 터미널에서 Run하면 정상 실행되지만cell단위로 실행하면 encoding 에러가 발생했다. 에러'latin-1' codec can't encode character '\uac12' in position 25: ordinal not in range(256) 위에서 \uac12는 한국어로 "값"이라는 말이므로, 내가 "값"이라는 한국어를 주석처럼 넣으려다가 발생한것이다. 아래는 내가 실수한 샘플POTENS_API_KEY="어쩌구저쩌구키" # 결론은, 주석을 쓸거면 KEY값과 다른 라인에다가 쓰면 된다. 환경.env 파일 해석 방식결과 및 원인터미널 (python file.py)dotenv 라이브러리 또는 쉘 ..

AI 2025.11.07

AI 개발툴 추천(생성형,문서,PPT,이미지)

아래 내용은 필자가 직접 사용해보고 추천하는 AI툴이며, 추후 사용하기 위해 링크도 같이 남긴다.AI로 일하는 시대, 꼭 써봐야 할 AI 툴 4가지 AI를 활용하면 자료 조사부터 PPT 제작, 이미지 생성까지 모든 과정을 효율적으로 자동화할 수 있다.오늘은 리서치와 정리, 발표자료 제작, 이미지/영상 생성에 유용한 AI 툴 4가지를 소개한다.🧠 1. GEMINI 딥리서치AI가 대신 조사하고 요약해주는 지능형 리서치 도구🔗 GEMINI Deep Research 바로가기GEMINI 딥리서치는 단순 검색이 아닌 AI 기반 심층 리서치 기능을 제공한다.사용자가 질문을 입력하면 관련 논문, 기사, 기술자료를 찾아 요약 보고서 형태로 정리해준다.특히 출처 링크가 함께 제공되어 신뢰성 높은 자료를 빠르게 확보할 ..

AI 2025.11.07

아이패드 프로 M5 13인치 리뷰

* 이 포스팅은 쿠팡파트너스의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다. ↑구매링크만 해당 되는 내용이며, 이 외에는 100% 블로그 주인의 솔직한 리뷰임을 밝힙니다. Apple 2025 아이패드 프로 11 M5 스탠다드 글래스 - 태블릿PC | 쿠팡쿠팡에서 Apple 2025 아이패드 프로 11 M5 스탠다드 글래스 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 태블릿PC 제품도 바로 쿠팡에서 확인할 수 있습니다.www.coupang.com 먼저 요약하자면, 필자는 이렇게 말하고 싶다.아이패드 프로 M5 13인치는 ‘태블릿의 끝판왕’이며, 동시에 ‘노트북의 시작점’이다. 본 제품은 회사의 사수 아이패드 프로 M5 제품을 통해 리뷰를 전달한다. 디자인 – 익숙하지만 여전히 완벽..

카테고리 없음 2025.11.02

SK_MOUSE 개발일기

2025/11 8

티스토리툴바

« 2025/11 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30