Учебный проект по Data Analysis: сбор данных с сайта и их визуальный анализ
Проект демонстрирует полный цикл работы с данными:
Стек: Python · pandas · BeautifulSoup · matplotlib · seaborn
| Параметр | Значение |
|---|---|
| Всего товаров | 1 075 |
| Категорий | 21 |
| Товаров со скидкой | 317 (29.5%) |
| Средняя цена | 6 106 руб. |
| Средняя скидка | 28.9% |
Поля датасета:
| Колонка | Описание |
|---|---|
category_url |
URL страницы категории |
name |
Название товара |
old_price |
Цена до скидки (если есть) |
new_price |
Актуальная цена |
image |
Ссылка на фото товара |
Живой дашборд доступен на GitHub Pages:
https://kseniafedotova1-jpg.github.io/-zolotoypesok/dashboard.html
├── scraper.py # Скрипт парсинга сайта
├── analysis.py # Скрипт анализа и построения графиков
├── analysis_notebook.ipynb # Jupyter Notebook с полным анализом
├── dashboard.html # Интерактивный дашборд (GitHub Pages)
├── all_products.csv # Собранный датасет
├── charts/ # Сохранённые графики
│ ├── 01_products_by_category.png
│ ├── 02_price_distribution.png
│ ├── 03_avg_price_by_category.png
│ ├── 04_avg_discount_by_category.png
│ ├── 05_discount_share_by_category.png
│ ├── 06_price_boxplot_top_categories.png
│ ├── 07_old_vs_new_price_scatter.png
│ └── 08_top15_most_expensive.png
└── requirements.txt
# 1. Клонировать репозиторий
git clone https://github.com/kseniafedotova1-jpg/-zolotoypesok.git
cd -zolotoypesok
# 2. Установить зависимости
pip install -r requirements.txt
# 3. (Опционально) Заново запустить парсинг
python scraper.py
# 4. Запустить анализ
python analysis.py
# 5. Или открыть ноутбук
jupyter notebook analysis_notebook.ipynb



requests + BeautifulSoup4 — парсингpandas — обработка данныхmatplotlib + seaborn — визуализацияПроект создан в учебных целях. Данные получены открытым способом с публичного сайта.