За словами ексвіцепрезидента Google Еріка Шмідта, тепер за два дні людство виробляє стільки ж інформації, скільки накопичило від зародження цивілізації до 2003 року. У такому масиві даних мало просто вміти орієнтуватися постфактум. Для бізнесу життєво потрібна можливість аналізувати Big Data й ухвалювати предикативні рішення на основі цифр. І в цьому компаніям допомагають представники професії Data Scientist.
Це відносно нова, але вже потрібна спеціалізація на ринку IT-послуг. За AIN, середня зарплата цієї категорії фахівців — 112 тисяч гривень. Примітно, що для 76% претендентів це або перша робота в IT, або їхній досвід у сфері менш як 6 років, — тобто поріг входження в цю спеціальність невисокий і не потребує глибоких технічних знань.
Де аналітик даних може пройти навчання та які скіли потрібні для роботи в цій професії — розбираємося.
Хто такий Data Scientist?
Data Scientist, або дослідник даних — це фахівець, який працює з аналітикою великих масивів даних. Переважно до зони його відповідальності входять:
- пошук певних параметрів чи закономірностей у наборах даних;
- робота з сирими даними, їх вибірка, очищення, форматування, пошук загальних ознак;
- візуалізація інформації у вигляді звітів і дашбордів;
- створення й розвиток моделі машинного навчання.
Простими словами, робота цього фахівця — аналізувати великі масиви даних і витягувати звідти інформацію, яка потрібна бізнесу.
Data Scientist: з чого почати
Must have навичок для тих, кому цікаво, як стати Data Scientist:
- програмування. Фахівець у галузі цифрових наук повинен орієнтуватися в чужому коді й уміти створювати власний;
- математика. Без гарного математичного бекграунду та знань у галузі математичного аналізу, статистики й лінійної алгебри складати прогнози та знаходити закономірності в наборах даних буде нелегко;
- машинне навчання — один з ключових інструментів у роботі;
- англійська мова. Як і для багатьох вакансій у сфері ІТ, без англійської не обійтися.
Хочете дізнатися, як стати Data Scientist з нуля й де вчити Big Data? Наступна вибірка курсів Data Science для вас.
Курси Data Science для початківців
Введення в науку про дані від Coursera та IBM
Формат навчання: онлайн.
Кому підходить: новачкам, що хочуть розібратися й розпочати кар’єру в Data Science.
Вартість: є можливість приєднатися безплатно.
Тривалість навчання: 4 місяці
Є можливість отримати сертифікат про завершення курсу від Coursera й цифровий значок від IBM, який підтверджує, що ви є фахівцем з основ науки про дані. Проходження курсу може бути прирівняне до професійного сертифіката IBM Data Science Professional.
Підтримка під час працевлаштування: немає.
Програма курсу
Курс дає базові навички в галузі науки про дані. Студенти вивчать:
- що таке наука про дані;
- що таке машинне навчання;
- інструменти для роботи з масивами даних (JupyterLab, R Studio, GitHub і Watson Studio);
- специфіку роботи й завдання фахівців з даних;
- що таке Big Data;
- статистичний аналіз.
Після закінчення курсу з аналітики даних студенти отримують теоретичну базу, потрібну для подальшого розвитку в галузі аналітики даних, і практичний досвід на реальних кейсах і завданнях, які можна додати до портфоліо.
Особливості: це перший з чотирьох курсів з навчання роботі у сфері Data Science від Coursera та IBM.
Machine Learning Crash Course від Google
Формат навчання: онлайновий курс, розрахований на 15 уроків.
Кому підійде: тим, хто хоче почати кар’єру в Data Science або почав її нещодавно.
Вартість: безплатно.
Тривалість навчання: 20 годин теорії та практики.
Сертифікат: ні.
Підтримка під час працевлаштування: немає.
Програма курсу
Crash Course — можливість вивчити й застосувати фундаментальні концепції машинного навчання та отримати реальний досвід роботи з Kaggle — системою організації конкурсів з дослідження даних.
На виході студенти отримують теоретичну базу й перші навички роботи з масивами даних у форматі Data Science.
Особливості курсів: робота з інструментами Tensorflow.
Формат навчання: онлайновий курс, розрахований на 8 тижнів навчання.
Кому підійде: новачкам у сфері Data Science.
Вартість: безплатно без іспиту або 149 доларів у розширеній версії з іспитом і зворотним зв’язком.
Тривалість навчання: 16 годин теорії та практики.
Сертифікат: професійний сертифікат у галузі науки про дані.
Підтримка під час працевлаштування: немає.
Ментор: Рафаєль Ірізаррі, професор біостатистики в Гарварді.
Програма курсу:
- робота з основами програмування R;
- функції та типи даних R;
- як працювати з векторами й коли використовувати розширені функції, такі як сортування;
- як застосовувати загальні функції програмування: команди if-else та for loop;
- як аналізувати й візуалізувати дані за допомогою ggplot2;
- робота з dplyr;
- організування файлів за допомогою UNIX / Linux;
- контроль версій за допомогою Git і GitHub;
- готування документів за допомогою RStudio.
Особливість курсу: практичні заняття відбуваються з урахуванням реальних даних про злочинність у США.
Введення в Data Science та машинне навчання від Stepik
Формат навчання: онлайновий курс із 30 уроків.
Кому підійде: новачкам у сфері Data Science.
Вартість: безплатно.
Тривалість навчання: 30 уроків, 9 годин відео, 54 тести, 21 інтерактивне завдання.
Сертифікат: сертифікат Інституту біоінформатики.
Підтримка під час працевлаштування: немає.
Програма курсу:
- методи машинного навчання: дерева рішень і нейронні мережі;
- бібліотеки для аналізу даних мовами Python — Pandas і Scikit-learn;
- робота з кодом, https://stepik.org/course/2614/syllabusбазами даних;
- робота з Big Data;
- робота з Linux, віддаленими серверами, Git.
Особливість курсу: підготовлений на основі програми Інституту біоінформатики.
Курс із машинного навчання від Geek University
Формат навчання: онлайновий курс із живими вебінарами й лекціями в записі. Курс розрахований на півтора року.
Кому підійде: новачкам у сфері Data Science.
Вартість: 1699 грн / місяць.
Тривалість навчання: 30 уроків, 9 годин відео, 54 тести, 21 інтерактивне завдання.
Сертифікат: сертифікат Geek University.
Підтримка під час працевлаштування: команда Geek University допоможе скласти резюме й підбере вакансії з пулу тих, що є у вільному доступі.
Програма курсу
380 годин навчального контенту та 2 вебінари на тиждень.
Студенти вивчають:
- основи математики;
- основи програмування;
- основи мови Python;
- Git;
- створення робочої станції в Linux;
- створення серверів у хмарних сервісах AWS;
- пошук інформації та основні операції з файлами;
- моніторинг роботи сервера;
- мову запитів SQL;
- створення й оптимізацію складних запитів;
- бібліотеки мови Python, призначені для Data Science: Numpy, Pandas, Matplotlib, SciKit-Learn.
Особливості курсу: 14 практичних проєктів у портфоліо.
Data Science від Skillbox
Формат навчання: живий онлайновий курс із практичними завданнями.
Кому підійде: новачкам, розробникам та аналітикам-початківцям.
Вартість: 2445 грн / місяць.
Тривалість навчання: 24 місяці.
Сертифікат: сертифікат Skillbox.
Підтримка під час працевлаштування: немає.
Програма курсу охоплює отримання базових знань за спеціальністю (основи статистики й теорії імовірності, основи математики) та поглиблене вивчення матеріалу за однією з вибраних спеціальностей: Machine Learning, Data Engineering або Data Analytics.
Особливості курсу: бонусні безплатні курси «Англійська для розробників», «Система контролю версій», поради з працевлаштування і 3 проєкти з вибраної спеціальності для портфоліо — вступного, Junior- та Middle-рівня.
Формат навчання: онлайновий курс із практичними завданнями та записом лекцій.
Кому підійде: бізнес-аналітикам і новачкам у сфері Data Science.
Вартість: 9200 грн.
Тривалість навчання: 7 занять по 3 години.
Сертифікат: сертифікат ITEA.
Підтримка під час працевлаштування: є. Студентів з найвищими балами можуть порекомендувати компаніям-партнерам. Також навчальний центр допомагає скласти перше резюме.
Під час навчання студенти:
- розберуться в таких базових поняттях, як Big Data, Business Intelligence, Data Mining, Data Science, Machine Learning, Artificial Intelligence;
- вивчать популярні фреймворки та інструменти для рішень Data Science;
- дізнаються і застосують на практиці підходи й методики для візуалізації даних (Power BI та R).
Особливості курсу: практика на реальних проєктах.
Курс Big Data Lab від Vodafone
Формат навчання: онлайнові вебінари та записи лекцій.
Кому підійде: фахівцям з досвідом у Data Science.
Вартість: 59 000 грн.
Тривалість навчання: 6 місяців.
Сертифікат: сертифікат Vodafone.
Підтримка під час працевлаштування: немає.
Програма курсу
Під час навчання студенти розберуться, як стати аналітиком Big Data, дізнаються про основні методи обчислень (лінійна алгебра, математичний аналіз, математична статистика, теорія імовірності), отримають базові навички у процесах машинного навчання та нейронних мережах, розберуться у специфіці Big Data аналізу даних.
Особливості: багато практики на реальних проєктах.
Стажування з Data Science від WinstarsTechnology
Формат навчання: онлайнові та офлайнові заняття у Вінниці.
Кому підійде: студентам або випускникам технічних університетів, IT-шкіл, спеціалістам-початківцям.
Вартість: безплатно, є можливість отримати оплачуване стажування.
Тривалість навчання: 3 місяці по 20 годин на тиждень.
Сертифікат: WinstaTechnology.
Підтримка під час працевлаштування: стажування й місця в компанії для найліпших випускників.
Програма стажування передбачає навчання аналізу даних, повне занурення в реальні проєкти й багато практики.
Особливості: вікові обмеження для учасників — 18—25 років.
Data Science Bootcamp від DEVrepublik
Формат навчання: онлайновий курс.
Кому підійде: спеціалістам-початківцям.
Вартість: безплатно.
Тривалість навчання: 6 місяців.
Сертифікат: ні.
Підтримка під час працевлаштування: немає.
Програма курсу:
- Python і SQL для Data Science;
- Математика та статистика для Data Science;
- Machine Learning.
Особливості: захист реального проєкту у фіналі навчання.
Python for Data Science від robot dreams
Формат навчання: онлайновий курс.
Кому підійде: спеціалістам-початківцям, аналітикам і розробникам.
Вартість: 2200 грн / місяць.
Тривалість навчання: 16 онлайнових занять.
Сертифікат: є.
Підтримка під час працевлаштування: немає.
За час навчання студенти:
- навчаться очищення даних і пошуку відсутніх значень;
- розберуться в прогнозуванні та класифікації;
- вивчать кластерний аналіз даних і пошук взаємозв’язків;
- дізнаються про запуск a/b-тестувань і валідацію гіпотез, відбір ознак і
- розберуть побудову моделей machine learning;
- навчаться працювати з цифрами й математичними формулами в NumPy, з табличними даними — у Pandas, з візуалізаціями — у Matplotlib, Seaborn і Plotly;
- освоять 6 бібліотек Python для Data Science.
Особливості: складні домашні завдання та фідбек від лектора щодо кожного з них.
Machine Learning від Hillel
Формат навчання: онлайновий або офлайновий курс у Києві.
Кому підійде: IT-фахівцям та інженерам будь-якої спеціальності, які знають Python, лінійну алгебру, математичний аналіз і статистику на рівні першого курсу технічного вишу.
Вартість: уточнюємо.
Тривалість навчання: 20 занять.
Сертифікат: є, від Hillel.
Підтримка під час працевлаштування: немає.
Програма курсу
Студенти здобудуть базові знання про вибір і налаштування параметрів моделі, найпростіші, рекурентні та згорткові нейронні мережі та їх альтернативи, автокодувальники та кластеризацію.
Особливості: записи уроків після закінчення курсу залишаються у студентів.
Професія Data Scientist — можливість уже сьогодні «заглядати» в майбутнє й отримувати реалістичні чіткі прогнози, які дуже цінує бізнес. Якщо робота з великими масивами даних вам подобається, а вища математика викликає захоплення, а не жах, варто спробувати себе в новій спеціалізації. Хай щастить!