본문 바로가기

ai21

[AI] Dify를 이용한 RAG 시스템 챗봇 만드는 방법 소개 (지식 생성, 지식 탐색) Dify는 오픈소스 LLM 개발 플랫폼으로, 사내 내부서버에 RAG 시스템을 구축하는 데에 활용되고 있습니다. 이번 글에서는 Dify를 이용해서 RAG 시스템을 간단히 만들어보는 시간을 가져봅니다. [ Contents ] 1. Dify 템플릿 생성 우선 템플릿을 이용해서 간단히 RAG 시스템을 구축해봅니다. Dify의 스튜디오 탭에서, [템플릿에서 시작] 버튼을 누릅니다. [Knowledge Retrieval + Chatbot] 을 클릭합니다. 위와 같이 [질의 - 지식탐색 - LLM - 답변] 과 같은 가장 기본적인 RAG시스템 구조가 나타납니다. RAG시스템에 대한 관한 내용은 이전에 서술했으므로, 아래 글을 참조해주세요. 2026.02.10 - [AI (Artificial Intellige.. 2026. 2. 18.
[AI] Dify 오픈소스 LLM 개발 플랫폼, 노코드 챗봇 RAG 시스템 구축 가능한 디파이 오픈소스 LLM 개발 플랫폼인 Dify에 대해서 알아봅니다. Dify는 노코드로, 비개발자도 쉽게 AI 서비스를 구축할 수 있는 개발 플랫폼입니다. [ Contents ] 1. Dify생성형 AI 애플리케이션을 No-code(Low code)로 만들 수 있는 오픈소스 LLM 앱 개발 플랫폼 Dify는 드래그 앤 드롭으로 워크플로를 구성해서, 생성형 AI 앱을 만드는 개발 플랫폼입니다. 우리나라에서는 '블록 코딩'이라고 불리는 쉬운 개발 방식을 차용하고 있습니다. 단순히 블록을 연결하고, 이에 대한 파라미터와 설정만 해주면 되므로 개발 난이도가 굉장히 쉽습니다. 프로그래밍을 잘 알지 못하는 비개발자도 쉽게 할 수 있다는 장점이 있죠. 특히 최근에는 사내 인력을 재교육해서 AI를 도입하려는 기관이 늘고.. 2026. 2. 15.
RAG(Retrieval-Augmented Generation, 검색 증강 생성) 개념 및 작동방식, 장단점 RAG(Retrieval-Augmented Generation) 시스템을 최근 사내에 내부 AI를 도입하고 있습니다. 이러한 RAG시스템의 개념과 작동방식, 장단점에 대해 알아봅니다. [ Contents ] 1. RAG (Retrieval-Augmented Generation) 이란?내부 데이터 소스(DB)에서 검색(Retrieval)한 후, 그 내용을 바탕으로 LLM 답변을 생성(Generation)하는 기술 RAG시스템은 내부 데이터를 LLM 답변에 이용할 수 있는 특징이 있는 기술입니다. 주로 정부나 기업에서 내부 데이터를 활용하는 방법으로 이용됩니다. 현재 Chat GPT나 Gemini, Claude처럼 성능이 뛰어난 생성형 AI서비스는 많지만, 보안상 내부 데이터를 입력 후 사용하는 건 제한.. 2026. 2. 10.
[Gemini] 나노 바나나(Nano Banana) 프로, 제미나이 이미지 생성 AI 사용법 구글 제미나이(Gemini)의 이미지 생성 AI, 나노바나나에 대해 알아봅니다. 그리고 그 사용법을 배워봅니다. [ Contents ] 1. 나노 바나나(Nano Banana)란?구글이 개발한 차세대 생성형 이미지 AI 모델의 코드 네임 정식 명칭은 Gemini 2.5 Flash Image로, 최근에는 성능이 더 강화된 Gemini 3 Pro Image(나노바나나 프로)가 출시되었습니다. '나노 바나나'라는 명칭이 좀 특이한 편인데, 원래 구글은 새로운 AI모델이나 프로젝트를 개발할 때 음식이나 과일 이름을 코드네임으로 사용한다고 합니다. 여기서 '나노'가 붙은 이유는 "매우 빠르고 효율적이며 가볍게 동작"한다는 기술적 특징을 강조하기 위해서라고 합니다. 실제로 꽤나 빠르게 이미지가 생성됩니다. 2.. 2026. 2. 6.
[AI/DL] 랜덤포레스트 앙상블 모델로 분류 문제 예측하는 방법 (Sklearn 이용) sklearn 패키지를 통해 랜덤포레스트 분류 학습을 하는 방법을 알아봅니다. [ Contents ] 1. 모델 학습from sklearn.model_selection import train_test_splitx_train, x_val, y_train, y_val = train_test_split(train_data, y, test_size=0.1)print(x_train.shape, x_val.shape, y_train.shape, y_val.shape) 모델 학습에 앞서, 학습 및 평가에 쓰일 데이터를 분리합니다. train_test_split 를 이용해서 9대 1 비중으로 학습데이터와 평가데이터를 나눕니다. # 모델 학습from sklearn.ensemble import RandomForest.. 2025. 6. 15.
[AI/DL] 부스팅(Boosting) 앙상블 기법의 개념과 절차, 특징 알아보기 앙상블 기법 중 하나인 부스팅(Boosting)의 개념과 학습 절차, 특징을 알아봅니다. [ Contents ]  1. 부스팅(Boosting) 예측력이 약한 모델을 순차적으로 결합하여 학습시키면서, 점차 보완하여 예측력이 강한 모델을 만드는 기법  부스팅은 순차적으로 여러 모델을 거쳐 학습해서, 점차 보완된 모델을 얻는 기법입니다. 모델1의 학습데이터 평가 및 가중치를 조정하고, 이를 모델 2가 받아서 또 학습하는 식입니다. 이렇게 순차적으로 대물림받으며 학습을 진행하며, 잘못 학습된 가중치를 바로 잡으면서 정확도를 높여 갑니다. 병렬적으로 여러 분류기를 학습시킨 후, 그 분류기의 값을 취합하는 배깅과는 약간 상반된 앙상블 기법입니다. 2025.04.04 - [AI (Artificial Intellig.. 2025. 4. 4.
[AI/DL] 배깅(Bagging) 앙상블 기법의 개념 및 절차, 특징 알아보기 앙상블 기법은 여러 개의 예측 모델을 조합해서 하나의 최종 예측 모델을 만드는 방식으로, 배깅은 여러 예측 모델의 결과값을 평균 혹은 다수결의 원칙에 따라 최종 도출하는 방식입니다. 이러한 배깅 기법에 대해서 자세히 알아보겠습니다.  [ Contents ]  1. 배깅 (Bagging, Bootstrap Aggregating)부트스트랩 데이터를 기반으로 여러 모델을 학습시키고, 그 결과를 평균(또는 다수결)해서 예측하는 기법  배깅은 'Bootstrap(부트스트랩)'과 'Aggregating(합산)'의 합성어로, 부트스트랩 데이터로 여러 모델에 각각 학습시키고 그 결과를 합산하는 기법입니다. 다양한 데이터로 여러 모델에 학습하는 앙상블 기법 중 하나로, 대체로 성능이 준수한 편입니다. 다만 여러 모델에 .. 2025. 4. 4.
[AI/DL] 매개변수 최적화 기법 종류: 확률적 경사 하강법(SGD), 모멘텀, AdaGrad, Adam 매개변수 최적화 기법의 개념에 대해서 알아보고, 그 종류를 살펴봅니다. (확률적 경사 하강법(SGD), 모멘텀, Adam) [ Contents ]  1. 매개변수 최적화 (Parameter Optimization)딥러닝에서 모델의 성능을 높이기 위해 파라미터(가중치, 편향)를 조정하는 과정  딥러닝에서는 학습을 통해 각 뉴런의 가중치와 편향을 조정합니다. 대량의 데이터 학습은 '입력에 따라 올바른 출력값을 도출하기 위한 매개변수(가중치, 편향) 조정 과정'으로, 효율적인 학습을 위해서는 매개변수 최적화가 필요하죠. 아래에서는 이러한 매개변수 최적화 방법에 대해서 알아보겠습니다.  2. 매개변수 최적화 기법1) 확률적 경사 하강법(Stochastic Gradient Descent, SGD)무작위 샘플 또는.. 2025. 4. 4.
[AI/DL] 혼동 행렬 평가지표: 정확도, 정밀도, 재현율, 특이도, 조화 평균(F1 Score) 혼동 행렬(Confusion Matrix)는 분류모델의 평가 지표로 많이 쓰이며, 그 지표에는 정확도, 정밀도, 재현율, 특이도, 조화평균이 있습니다. 아래에서는 각 평가지표를 구하는 방법과 쓰이는 예시를 살펴보겠습니다. [ Contents ]  1. 혼동 행렬 (Confusion Matrix)TP (True Positive): 실제도 양성이고, 예측도 양성 → 정답TN (True Negative): 실제도 음성이고, 예측도 음성 → 정답FP (False Positive): 실제는 음성인데, 예측은 양성 → 오답 (오탐지)FN (False Negative): 실제는 양성인데, 예측은 음성 → 오답 (미탐지)  분류 모델에서 나올 수 있는 결과값을 행렬 형태로 정리한 걸 '혼동 행렬 (Confusion M.. 2025. 4. 3.