-zolotoypesok

🛍️ Анализ ассортимента интернет-магазина Золотой Песок

Учебный проект по Data Analysis: сбор данных с сайта и их визуальный анализ


📌 О проекте

Проект демонстрирует полный цикл работы с данными:

  1. Web Scraping — сбор данных с сайта zolotoypesok.com
  2. Data Cleaning — очистка и преобразование данных
  3. EDA — разведочный анализ и визуализация

Стек: Python · pandas · BeautifulSoup · matplotlib · seaborn


📊 Данные

Параметр Значение
Всего товаров 1 075
Категорий 21
Товаров со скидкой 317 (29.5%)
Средняя цена 6 106 руб.
Средняя скидка 28.9%

Поля датасета:

Колонка Описание
category_url URL страницы категории
name Название товара
old_price Цена до скидки (если есть)
new_price Актуальная цена
image Ссылка на фото товара

🌐 Интерактивный дашборд

Живой дашборд доступен на GitHub Pages:
https://kseniafedotova1-jpg.github.io/-zolotoypesok/dashboard.html


🗂️ Структура репозитория

├── scraper.py              # Скрипт парсинга сайта
├── analysis.py             # Скрипт анализа и построения графиков
├── analysis_notebook.ipynb # Jupyter Notebook с полным анализом
├── dashboard.html          # Интерактивный дашборд (GitHub Pages)
├── all_products.csv        # Собранный датасет
├── charts/                 # Сохранённые графики
│   ├── 01_products_by_category.png
│   ├── 02_price_distribution.png
│   ├── 03_avg_price_by_category.png
│   ├── 04_avg_discount_by_category.png
│   ├── 05_discount_share_by_category.png
│   ├── 06_price_boxplot_top_categories.png
│   ├── 07_old_vs_new_price_scatter.png
│   └── 08_top15_most_expensive.png
└── requirements.txt

🚀 Быстрый старт

# 1. Клонировать репозиторий
git clone https://github.com/kseniafedotova1-jpg/-zolotoypesok.git
cd -zolotoypesok

# 2. Установить зависимости
pip install -r requirements.txt

# 3. (Опционально) Заново запустить парсинг
python scraper.py

# 4. Запустить анализ
python analysis.py

# 5. Или открыть ноутбук
jupyter notebook analysis_notebook.ipynb

📈 Основные выводы


📷 Примеры графиков

Количество товаров по категориям

chart1

Распределение цен

chart2

Средняя скидка по категориям

chart4


🛠️ Технологии


👤 Автор

Проект создан в учебных целях. Данные получены открытым способом с публичного сайта.