LLM + RAG졸업프로젝트

Fastball

LLM과 RAG를 결합하여 스포츠 기사 작성을 자동화하는 AI 기반 기사 생성 시스템

dashboard-preview

Hybrid RAG Search

ChromaDB(70%) + PostgreSQL(30%) 최적 비율 검색

Contextual Gen

Claude API 기반 문맥 이해형 기사 생성

Auto Pipeline

AWS Lambda 기반 자동 데이터 수집 및 가공

기획 의도

Context & Problem

문제점

언론진흥재단 조사에 따르면 기자들은 하루 평균 14건 이상의 기사를 작성하며, 반복적인 데이터 정리와 초안 작성에 최소 30분 이상 소요됩니다.

Problem

단순 반복적 데이터 처리에 과도한 시간 소모

Solution

AI 자동화로 고부가가치 심층 취재 집중 여력 확보

왜 이렇게 설계했는가

System Approach

01

자동화된 데이터 파이프라인

AWS EventBridge와 Lambda를 활용해 매일 KBO 경기 데이터를 수집하고 최신 상태를 유지합니다.

02

하이브리드 RAG 아키텍처

벡터 기반 시맨틱 검색과 구조화된 데이터 검색을 결합하여 정보의 정확성과 다양성을 모두 확보했습니다.

03

문맥 이해 기반 자연어 생성

Claude API를 연동하여 단순 수치 나열이 아닌, 경기 흐름을 파악한 자연스러운 문장 기사를 생성합니다.

04

원스톱 통합 워크플로우

데이터 수집부터 생성, 편집, 최종 배포까지 단일 웹 인터페이스에서 완결되는 시스템을 구축했습니다.

시스템 아키텍처

Solution Architecture

Fastball Architecture

AWS 기반의 스케줄링 수집 시스템과 RAG 파이프라인 통합 구조

사용된 기술 스택

Engineering Stack

Frontend
React
Backend
FastAPIUvicorn
AI & LLM
LangChainHuggingFace (llama-ko)Claude API
Database & Vector
PostgreSQL (RDS)SQLiteFAISSChromaDB
DevOps
Docker

아쉬운점 및 발전 가능성

Integrated Summary

Limitations

  • 데이터 품질 편차에 따른 품질 변동
  • 고성능 모델 사용에 따른 운영비용 부담

Business Scalability

본 프로젝트는 현재 프로토타입 단계이나, 실시간 경기 전산망과 연동 시 스포츠 미디어 인프라를 혁신할 솔루션으로 확장될 가치가 큽니다.

수행 역할 및 구현 포인트

My Contributions

Development Role

프론트엔드 개발 (React UI/UX 구현, API 통신, 실시간 미리보기, 워크플로우 설계)

React 기반 프론트엔드 인터페이스 구축

실시간 미리보기 및 UX 최적화

전체 기사 생성 워크플로우 설계