🤖

인공지능 기초

미래 배추값 예측 모델

프로젝트 개요

본 프로젝트는 배추 가격의 계절적 패턴을 분석하여 가장 저렴한 시기를 예측하는 모델을 개발하는 것을 목표로 합니다. 이를 통해 김장을 준비하는 가정에 경제적 이익을 줄 수 있는 정보를 제공하고자 합니다.

문제 정의 및 목표 설정

배경

부모님이 김장을 하실 때마다 배추값이 비싸서 고민하시는 모습을 보고, 배추값이 가장 저렴할 때를 예측하여 김장 시기를 결정하면 좋겠다는 아이디어에서 시작되었습니다.

가설

배추값은 주로 계절적 요인에 따라 변화하며, 특정 시기(예: 김장철 이전)에 일정한 가격 패턴을 보일 것입니다. 따라서 과거 배추 가격 데이터를 분석하면 계절적 패턴을 통해 배추값이 가장 저렴한 시점을 예측할 수 있을 것입니다.

분석 목표

배추값에 영향을 미치는 주요 요인 파악
과거 배추값의 패턴(시계열 데이터 분석)을 통해 향후 배추값 변화 예측
배추값이 가장 저렴할 시점 도출

데이터 수집 및 정제

데이터 세트 요약

데이터 세트: 가락시장 배추 가격
데이터 개수: 1,108개
전체 속성 개수: 6,648개
독립 변수(X): 년월
종속 변수(y): 배추 평균 가격

데이터 정제 과정

결측치 처리: Date 컬럼의 결측치 제거
불필요한 속성 제거: 전년가격, 평년가격, 이름 컬럼 제거
데이터 타입 변환: 등급을 string에서 int형(1,2,3,4)으로 변환, Date를 int로 변경

모델 선정 및 학습

사용한 알고리즘

1.
선형 회귀 알고리즘
2.
결정 트리 회귀 알고리즘

최종 선정 알고리즘: 선형 회귀

선정 이유:
배추값 예측 문제에서 변수들 간에 선형 관계가 있을 것으로 가정
모델의 직관성과 높은 설명 가능성

모델 평가 및 개선

가설 검증

배추값은 공급량, 수요, 가격 등 여러 요소들에 의해 영향을 받는다는 가설은 채택 되었으나, 모델 개선이 필요한 것으로 나타났습니다.

개선 방안

선형 회귀 외에도 결정 트리 회귀, 랜덤 포레스트 등의 비선형 모델을 시도하여 비선형적인 데이터 관계를 더 잘 모델링할 수 있도록 개선할 예정입니다.

활용 사례 및 기대 효과

농업 관련 산업에서의 배추 가격 예측 활용
농민과 유통업체의 재고 관리 및 판매 전략 수립에 도움
정부의 농산물 가격 안정화 정책 수립에 기여
소비자의 안정적인 가격 유지 기대

프로젝트 소감

본 프로젝트를 통해 실제 시장 데이터를 활용한 분석 경험을 쌓을 수 있었습니다. 모델의 정확도 향상과 데이터 시각화 기술의 중요성을 깨달았으며, 앞으로 이를 개선하고 발전시켜 나가고자 합니다. 이번 경험을 바탕으로 더 복잡한 예측 모델 개발에 도전할 계획입니다.