Чему вы научитесь:
- web scraping (парсинг)
- data mining (сбор данных)
- output data in Excel (перенос данных в эксель)
- run SQL commands on your dataframe (использование команд SQL)
- data extraction (извлечение данных)
- create your own dataset (создание собственных наборов данных)
- output your dataframe in PostgreSQL (перенос данных в PostgreSQL)
В этом курсе студенты узнают, как очищать данные из API веб-сайта (если таковой имеется). Начнем с основ и проекта начального уровня. После этого будут рассмотрены два разных проекта, а затем продвинутый проект. После очистки данных проекта результаты будут сохранены в файле Excel. В рамках проекта продвинутого уровня мы создадим два разных набора данных по 5000 результатов в каждом. Цель состоит в том, чтобы объединить оба фрейма данных (всего: 10000 результатов), сохранить их в Excel и вывести данные в базу данных PostgreSQL, а также выполнить команды SQL для наших собственных данных.
Требование для прохождения этого курса - базовые знания программирования на Python. Поскольку мы не будем рассматривать очень сложные темы Python, вам не обязательно быть профессионалом. Самая важная характеристика - это то, что вам интересно узнать о веб-парсинге и интеллектуальном анализе данных. Вы должны быть готовы потратить время на получение знаний, которые преподаются в этом курсе.
После этого курса у вас будут знания и опыт для очистки собственных данных и создания собственного набора данных.
Материалы курса
5 разделов • 23 лекций • Общая продолжительность 4 ч 25 мин
+ jupyter notebooks
Язык курса - английский + субтитры
- web scraping (парсинг)
- data mining (сбор данных)
- output data in Excel (перенос данных в эксель)
- run SQL commands on your dataframe (использование команд SQL)
- data extraction (извлечение данных)
- create your own dataset (создание собственных наборов данных)
- output your dataframe in PostgreSQL (перенос данных в PostgreSQL)
В этом курсе студенты узнают, как очищать данные из API веб-сайта (если таковой имеется). Начнем с основ и проекта начального уровня. После этого будут рассмотрены два разных проекта, а затем продвинутый проект. После очистки данных проекта результаты будут сохранены в файле Excel. В рамках проекта продвинутого уровня мы создадим два разных набора данных по 5000 результатов в каждом. Цель состоит в том, чтобы объединить оба фрейма данных (всего: 10000 результатов), сохранить их в Excel и вывести данные в базу данных PostgreSQL, а также выполнить команды SQL для наших собственных данных.
Требование для прохождения этого курса - базовые знания программирования на Python. Поскольку мы не будем рассматривать очень сложные темы Python, вам не обязательно быть профессионалом. Самая важная характеристика - это то, что вам интересно узнать о веб-парсинге и интеллектуальном анализе данных. Вы должны быть готовы потратить время на получение знаний, которые преподаются в этом курсе.
После этого курса у вас будут знания и опыт для очистки собственных данных и создания собственного набора данных.
Материалы курса
5 разделов • 23 лекций • Общая продолжительность 4 ч 25 мин
+ jupyter notebooks
Язык курса - английский + субтитры
Скрытое содержимое могут видеть только пользователи групп(ы): VIP