LLaMA 3.0 SFT (3) Trainer
앞서 ‘LLaMA 3.0 SFT (2) Tokenizer, Dataset’에서 LLaMA 3.0 SFT에 활용할 Tokenizer, Dataset을 정의했습니다. 8. Trainer # Training setup from trl import SFTTrainer from transformers import TrainingArguments traini...
앞서 ‘LLaMA 3.0 SFT (2) Tokenizer, Dataset’에서 LLaMA 3.0 SFT에 활용할 Tokenizer, Dataset을 정의했습니다. 8. Trainer # Training setup from trl import SFTTrainer from transformers import TrainingArguments traini...
앞서 ‘LLaMA 3.0 SFT (1) 환경 세팅’에서 LLaMA 3.0 SFT를 위한 실험 환경 구성에 대해 살펴보았습니다. 7. Tokenizer # Tokenizer 설정 from transformers import AutoTokenizer tokenizer = AutoTokenizer.from_pretrained("meta-llama/Met...
Overview 본 포스트는 LLaMA 3.0 8B를 Alpaca 데이터셋을 활용해 SFT(Supervised Fine Tuning)하는 과정을 살펴봅니다. 아래와 같은 환경, 세팅으로 진행 예정입니다. 1. Llama 모델 Access Llama 모델은 오픈소스이지만, 이를 사용하기 위해서서는 huggingface에 로그인, Access Token...
앞선 post ‘langgraph - multi-agents 구조 (Planning)’에서 langgraph document를 바탕으로 Planning을 중심으로 하는 대표적 아키텍쳐 구성을 살펴보았습니다. 이번에는 Reflection에 초점을 둔 여러 아키텍쳐들을 살펴보겠습니다. 이번에도 역시 langgraph document를 중심으로 살펴봅니다...
앞선 post ‘langgraph - multi-agents 구조’에서 langgraph document를 바탕으로 Basic한 대표적 아키텍쳐 구성을 살펴보았습니다. 이번에는 Planning에 초점을 둔 여러 아키텍쳐들을 살펴보겠습니다. 이번에도 역시 langgraph document를 중심으로 살펴봅니다. 예시: Plan-and-Execute ...
Multi Agents system 최근 LLM의 성능이 급격히 올라오면서, 다양한 Tool을 연결해 보다 복잡하고 넓은 범위의 문제를 해결하고자 하는 ReAct-style의 접근이 많아지고 있습니다. 문제는 아무리 성능이 좋은 LLM이라 하더라도, Tool의 갯수를 무제한으로 늘리는 데는 한계가 발생합니다. 아무래도 tool assign 정확도가 낮...
State 변환: LangGraph 부모-자식 Graph 간 스키마 불일치 해소 LangGraph를 사용하여 복잡한 에이전트 워크플로우를 설계할 때, 상위(parent) 그래프와 하위(subgraph) 그래프 간에 서로 다른 state 스키마를 사용해야 하는 경우가 자주 발생합니다. 이 글에서는 세 단계의 계층 구조를 가진 그래프들이 어떻게 서로 다...
Langgraph의 sub-graph Langgraph는 sub-graph라는 개념을 지원한다.보다 복잡한 하위 기능들을 엮어서 전체적인 그래프를 구성하고자 할 때, 이 하위 기능들을 하나의 sub-grpah로 엮을 수 있다. 출처: langgraph How to use subgraphs sub-graph 구성 방법 sub-graph를 만드...
LangGraph에서 tool 호출과 응답 처리 (tool_calls, ToolMessage 포함) LangGraph는 LLM 기반 에이전트가 tool를 효과적으로 활용하도록 설계되었습니다. 핵심적인 메커니즘은 LLM의 tool 사용 요청(tool_calls)과 tool 실행 결과(ToolMessage)를 명확히 구분하여 처리하는 것입니다. Too...
LangGraph Human-in-the-Loop LLM 기반 애플리케이션에서 Human-in-the-Loop(이하 ‘HIL’)이 필요한 주요 Use Case는 다음과 같습니다. 🛠️ Tool Call 검토: LLM이 외부 도구(API, database 등)를 사용하기 전에, 인간이 Tool Call 요청을 검토, 편집, 승인할 수 있습니다....