Data science: Machine Learning + AI - kurs zaawansowany - Małopolski Pociąg do Kariery / Kierunek Rozwój / Graj po Zielone
Data science: Machine Learning + AI - kurs zaawansowany - Małopolski Pociąg do Kariery / Kierunek Rozwój / Graj po Zielone
Informacje podstawowe
Informacje podstawowe
- KategoriaInformatyka i telekomunikacja / Bazy danych
- Sposób dofinansowaniawsparcie dla osób indywidualnychwsparcie dla pracodawców i ich pracowników
- Grupa docelowa usługi
Kurs skierowany jest do osób interesujących się praktycznym zastosowaniem sztucznej inteligencji oraz modeli uczenia maszynowego w analizie danych - wiedzy, która daje obecnie olbrzymie możliwości rozwoju w praktycznie każdej branży.
Zaleca się, aby Uczestnicy posiadali wiedzę z zakresu programowania w języku Python.
Usługa adresowana również również dla Uczestników Projektu Kierunek – Rozwój, Małopolski Pociąg do Kariery, mBony+, Graj po Zielone (oraz innych programów w ramach 6.6 i 10.17 z terenu woj. Śląskiego), a także dla uczestników innych programów dofinansowań.
Kurs prowadzony jest z naciskiem na budowanie świadomości ekologicznej i wykorzystanie tych umiejętności w celu wspierania zrównoważonego rozwoju. Przyczynia się również do budowania zielonych miejsc pracy w sektorach tradycyjnych.
- Minimalna liczba uczestników8
- Maksymalna liczba uczestników16
- Data zakończenia rekrutacji14-03-2025
- Forma prowadzenia usługizdalna w czasie rzeczywistym
- Liczba godzin usługi56
- Podstawa uzyskania wpisu do BURZnak Jakości Małopolskich Standardów Usług Edukacyjno-Szkoleniowych (MSUES) - wersja 2.0
Cel
Cel
Cel edukacyjny
Kurs uczy samodzielnego tworzenia modeli uczenia maszynowego oraz praktycznego zastosowania AI w analizie danych.Dzięki przekazywaniu również umiejętności ogólnych niezbędnych do pracy w sektorze zielonej gospodarki (zg. z GreenComp), kurs buduje także świadomość ekologiczną i przekazuje kompetencje do rozwoju ekologicznych rozwiązań technologicznych.
Efekty uczenia się oraz kryteria weryfikacji ich osiągnięcia i Metody walidacji
Efekty uczenia się | Kryteria weryfikacji | Metoda walidacji |
---|---|---|
Efekty uczenia się Tworzy zaawansowane modele uczenia maszynowego i wykorzystuje je w celu analizy danych | Kryteria weryfikacji wykorzystuje zoptymalizowane pod kątem zasobooszczędności modele ML do analizy danych i predykcji | Metoda walidacji Test teoretyczny |
Kryteria weryfikacji korzysta z algorytmów KNN, regresji logistycznej, Random Forest, Xgboost. | Metoda walidacji Test teoretyczny | |
Kryteria weryfikacji buduje modele w Scikit-learn | Metoda walidacji Test teoretyczny | |
Kryteria weryfikacji korzysta z zaawansowanych technik głębokiego uczenia i tworzy modele do analizy danych sekwencyjnych | Metoda walidacji Test teoretyczny | |
Efekty uczenia się Posiada umiejętności ogólne niezbędne do pracy w sektorze zielonej gospodarki | Kryteria weryfikacji charakteryzuje główne poglądy na temat zrównoważonego rozwoju, zasady środowiskowe 6R w kontekście TIK (rethink, refuse, reduce, reuse, recycle, recover) oraz ocenia wpływ na przyrodę rozwiązań z zakresu cyfrowej gospodarki | Metoda walidacji Test teoretyczny |
Kryteria weryfikacji posiada świadomość, iż każde działanie człowieka ma wpływ na środowisko | Metoda walidacji Test teoretyczny | |
Efekty uczenia się Współpracuje w grupie z innymi członkami zespołu | Kryteria weryfikacji komunikuje się z innymi członkami zespołu za pośrednictwem narzędzi kontroli wersji (git) | Metoda walidacji Test teoretyczny |
Kwalifikacje i kompetencje
Kwalifikacje
Kompetencje
Usługa prowadzi do nabycia kompetencji.Warunki uznania kompetencji
Program
Program
Kurs skierowany jest do osób interesujących się praktycznym zastosowaniem sztucznej inteligencji oraz modeli uczenia maszynowego w analizie danych - rozwój kariery w tym kierunku daje obecnie ogromne możliwości i mocną pozycję na rynku pracy.
W szkoleniu mogą wziąć udział zarówno osoby, które myślą o przyszłej pracy w roli data scientist, jak również osoby chcące zdobyć nowe umiejętności a zajmowanych już stanowiskach pracy, kadra kierownicza, właściciele firm, czy też specjaliści sektora zielonej gospodarki - dla których dostęp do analiz jest kluczem do podejmowania trafnych decyzji w bieżącej działalności.
Z racji dynamicznego rozwoju branż zielonych technologii, kurs uczy tworzenia modeli uczenia maszynowego w sposób pozytywnie wpływający na środowisko i wspierający zrównoważony rozwój oraz pozwala na zrozumienie roli technologii cyfrowych we wspieraniu zielonej gospodarki.
--
STRUKTURA I PROGRAM KURSU:
Szkolenie pozwala na poznanie tajnik budowania, trenowania i oceny modeli analizy danych. Uczestnicy opanowują kluczowe algorytmy: od KNN, Regresji Logistycznej po Random Forest i Xgboost, a także umiejętność właściwego podziału danych i budowy modeli w Scikit-learn. Przechodzą przez techniki cross-walidacji, optymalizacji hiperparametrów i inżynierię cech, umożliwiające lepsze i bardziej zasobooszczędne przetwarzanie danych dla modeli ML. Omawiane są również podstawy przetwarzania języka naturalnego (NLP), odkrywając nowe możliwości w analizie danych tekstowych.
W drugiej części kursu uczestnicy opanowują zaawansowane techniki głębokiego uczenia, takie jak CNN, transfer learning i rekurencyjne sieci neuronowe. Poznają tajniki tworzenia modeli do rozpoznawania obrazów, wykorzystywania gotowych rozwiązań w projektach, analizy danych sekwencyjnych , jak również danych z sektora zielonej gospodarki.
Szkolenie obejmuje łącznie ponad 80h nauki, na które składa się:
- 56h lekcyjnych (45 min) = w przeliczeniu 42h zegarowe (60 min)) prowadzonych na żywo (on-line), na platformie webinarowej, w formie wirtualnej klasy, w formule live-coding - przez cały czas z trenerem;
- dodatkowa samodzielna praca własna kursantów w domu (ćwiczenia, projekty), z możliwością konsultacji na platformie Slack - praca ta pozwala utrwalić zdobyta podczas zajec wiedzę i nie jest wliczana do czasu trwania usługi.
Grupy liczą maksymalnie 8-16 osób i są jednymi z najmniejszych grup na rynku.
Machine Learning - uczenie nadzorowane
- statystyka predykcyjna, modele nieparametryczne
- podział danych na zbiór treningowy / testowy
- efektywność zarządzania danymi
- undertraining / overtraining
- KNN, Logistic Regression
- SVM, Decision Trees, Random Forrest
- Cross-walidacja I optymalizowanie hiperparametrow
- Xgboost
- inżynieria cech
- Pipelines i Transformatory - tworzenie pipelines, customowe transformatory z sklearn
- optymalizacja modeli uczenia nadzorowanego ML i AI pod kątem zasobooszczędności
- praktyczne zastosowanie uczenia nadzorowanego (w tym na bazie danych środowiskowych)
NLP
- analiza sentymentu z użyciem modeli ML
Machine Learning - uczenie nienadzorowane
- redukcja wymiarowości - PCA, LDA
- analiza skupień - k-means, klasterowanie hierarchiczne, DBSCAN
- zaawansowane metody ML - ensemble methods- stacking
- systemy rekomendacyjne ML
- tworzenie efektywnych modeli ML
- optymalizacja modeli uczenia nienadzorowanego ML i AI pod kątem zasobooszczędności
- praktyczne zastosowanie uczenia nienadzorowanego (w tym na bazie danych środowiskowych)
Deep learning / CNN / RNN:
- single perceptron, multi-layer perceptron
- CNN
- Transfer Learning
- sieci rekurencyjne - zastosowanie w danych tekstowych / sekwencyjnych
- praktyczne zastosowanie modeli AI i deep learning (np. w celu predykcji zmian klimatycznych)
Wykorzystanie umiejętności cyfrowych w celu wsparcia zrównoważonego rozwoju:
- zielona gospodarka - charakterystyka poglądów dotyczących zrównoważonego rozwoju, Europejskie ramy kompetencji w zakresie zrównoważonego rozwoju (GreenComp)
- zasady środowiskowe 6R (refuse, reduce, reuse, recover, recycle, rethink)
- zastosowanie modeli AI w zielonej gospodarce
Całość zajęć prowadzona jest na żywo online.
Poza zajęciami na żywo (online, wirtualna klasa), uczestnicy otrzymują dodatkowe zadania do pracy w domu, z możliwością kontaktu z prowadzącym również poza zajęciami (na platformie Slack).
Aby osiągnąć zakładany cel realizacji usługi, uczestnik powinien być obecny w trakcie zajęć zdalnych w czasie rzeczywistym.
--
Kurs uczy zaawansowanych technik analizy danych z wykorzystaniem modeli opartych na sztucznej inteligencji, które to modele są z powodzeniem wykorzystywane m.in. w celu predykcji zmian klimatycznych, optymalizacji procesów i redukcji zużycia zasobów. Big data wspiera optymalizację zużycia energii w budynkach i infrastrukturze oraz śledzenie emisji i odpadów, umożliwia automatyzację i personalizację, wspiera rozwój energii odnawialnej i monitorowanie zużycia wody, energii i pozostałych zasobów.
Dzięki przekazywaniu umiejętności ogólnych niezbędnych do pracy w sektorze zielonej gospodarki (zgodnie z GreenComp), szkolenie przyczynia się również do tworzenia tzw. “zielonych miejsc pracy” zarówno w sektorach zielonej gospodarki, jak również w sektorach tradycyjnych.
Wiedza zdobyta podczas szkolenia wykorzystywana może być m.in. w celu realizacji inwestycji opisanych m.in. w Rozp. nr 2021/1056 PEiR(UE) ustanawiającym Fundusz Sprawiedliwej Transformacji, tj. m.in. w przypadku wdrażania technologii oraz systemów i infrastruktury zapewniającej czystą energię, redukcję emisji gazów cieplarnianych, inwestycji w energię odnawialną i w efektywność energetyczną, inteligentną i zrównoważoną mobilność lokalną, poprawę efektywności energetycznej, cyfryzację i łączność cyfrową.
Harmonogram
Harmonogram
Przedmiot / temat zajęć | Prowadzący | Data realizacji zajęć | Godzina rozpoczęcia | Godzina zakończenia | Liczba godzin |
---|---|---|---|---|---|
Przedmiot / temat zajęć 1 z 18 KNN, Logistic Regression (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 15-03-2025 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 12:00 | Liczba godzin 03:00 |
Przedmiot / temat zajęć 2 z 18 Przerwa | Prowadzący Bartek Bilski | Data realizacji zajęć 15-03-2025 | Godzina rozpoczęcia 12:00 | Godzina zakończenia 12:30 | Liczba godzin 00:30 |
Przedmiot / temat zajęć 3 z 18 Wykorzystanie AI i ML w celu wsparcia zrównoważonego rozwoju, zasady 6R, Greencomp, KNN, LR (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 15-03-2025 | Godzina rozpoczęcia 12:30 | Godzina zakończenia 15:30 | Liczba godzin 03:00 |
Przedmiot / temat zajęć 4 z 18 SVM, Decision Trees, Random Forrest (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 18-03-2025 | Godzina rozpoczęcia 18:00 | Godzina zakończenia 21:00 | Liczba godzin 03:00 |
Przedmiot / temat zajęć 5 z 18 Cross-walidacja i optymalizowanie hiperparametrów (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 20-03-2025 | Godzina rozpoczęcia 18:00 | Godzina zakończenia 21:00 | Liczba godzin 03:00 |
Przedmiot / temat zajęć 6 z 18 Xgboost, inżynieria cech (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 25-03-2025 | Godzina rozpoczęcia 18:00 | Godzina zakończenia 21:00 | Liczba godzin 03:00 |
Przedmiot / temat zajęć 7 z 18 Tworzenie pipelines, customowe transformatory z sklearn (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 27-03-2025 | Godzina rozpoczęcia 18:00 | Godzina zakończenia 21:00 | Liczba godzin 03:00 |
Przedmiot / temat zajęć 8 z 18 Analiza sentymentu używając modeli ML, optymalizacja modeli pod kątem czystego kodu i zasobooszczędności (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 08-04-2025 | Godzina rozpoczęcia 18:00 | Godzina zakończenia 21:00 | Liczba godzin 03:00 |
Przedmiot / temat zajęć 9 z 18 Redukcja wymiarowości - PCA , LDA (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 10-04-2025 | Godzina rozpoczęcia 18:00 | Godzina zakończenia 21:00 | Liczba godzin 03:00 |
Przedmiot / temat zajęć 10 z 18 Analiza skupień - k-means, klasterowanie hierarchiczne, DBSCAN (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 12-04-2025 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 12:00 | Liczba godzin 03:00 |
Przedmiot / temat zajęć 11 z 18 Przerwa | Prowadzący Bartek Bilski | Data realizacji zajęć 12-04-2025 | Godzina rozpoczęcia 12:00 | Godzina zakończenia 12:30 | Liczba godzin 00:30 |
Przedmiot / temat zajęć 12 z 18 Ensemble methods - stacking, systemy rekomendacyjne ML (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 12-04-2025 | Godzina rozpoczęcia 12:30 | Godzina zakończenia 15:30 | Liczba godzin 03:00 |
Przedmiot / temat zajęć 13 z 18 Ensemble methods - stacking, systemy rekomendacyjne ML, zastosowanie uczenia nienadzorowanego na bazie danych z sekt. ziel. gosp. (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 22-04-2025 | Godzina rozpoczęcia 18:00 | Godzina zakończenia 21:00 | Liczba godzin 03:00 |
Przedmiot / temat zajęć 14 z 18 Single perceptron, multi-layer perceptron (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 24-04-2025 | Godzina rozpoczęcia 18:00 | Godzina zakończenia 21:00 | Liczba godzin 03:00 |
Przedmiot / temat zajęć 15 z 18 CNN, Transfer Learning (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 26-04-2025 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 12:00 | Liczba godzin 03:00 |
Przedmiot / temat zajęć 16 z 18 Przerwa | Prowadzący Bartek Bilski | Data realizacji zajęć 26-04-2025 | Godzina rozpoczęcia 12:00 | Godzina zakończenia 12:30 | Liczba godzin 00:30 |
Przedmiot / temat zajęć 17 z 18 Sieci Rekurencyjne - zastosowanie w danych tekstowych /sekwencyjnych (on-line, na żywo, wykład + ćw.) | Prowadzący Bartek Bilski | Data realizacji zajęć 26-04-2025 | Godzina rozpoczęcia 12:30 | Godzina zakończenia 14:30 | Liczba godzin 02:00 |
Przedmiot / temat zajęć 18 z 18 Walidacja umiejętności (test w formie cyfrowej) | Prowadzący - | Data realizacji zajęć 26-04-2025 | Godzina rozpoczęcia 15:30 | Godzina zakończenia 16:30 | Liczba godzin 01:00 |
Cena
Cena
Cennik
- Rodzaj cenyCena
- Koszt przypadający na 1 uczestnika brutto5 040,00 PLN
- Koszt przypadający na 1 uczestnika netto5 040,00 PLN
- Koszt osobogodziny brutto90,00 PLN
- Koszt osobogodziny netto90,00 PLN
Prowadzący
Prowadzący
Szymon Budziak
Wykształcenie: Computer Science, Engineer's degree, Università degli Studi di Napoli Federico II (2023), inż., Informatyka, AGH w Krakowie (2024). Dodatkowe szkolenia, m.in.: Python for Data Science and Machine Learning, Machine Learning Specialization by Andrew Ng.
Posiada dośw. w zakresie ziel. komp. W okresie ostatnich 5 lat: m.in.: twórca aplikacji przewidującej efektywność energetyczną w gospodarstwach domowych USA na podstawie danych energetycznych (z wykorzystaniem AI), w oparciu o technologie Python oraz Tensorfl ow do analizy danych energetycznych, a także API do zbierania informacji o zużyciu energii. Aplikacja miała na celu wspieranie decyzji o optymalizacji zużycia energii w gospodarstwach domowych i promowanie bardziej zrównoważonych praktyk w gospodarce.
Bartek Bilski
Doświadczenie, m.in.: obecnie, Data Scientist, Allegro, 2023 - 2024, Data Scientist, Kokoro Global, 2022, Data Analyst, Cord, 2020 - 2021, Mortgage Advisor. Wykształcenie: Uniwersity of Bath (Data Science)(2022) oraz University of West of England (Matematyka i Statystyka)(2017). Dodatkowe szkolenia, m.in.: Azure Databricks, Databricks Data + AI World Tour London, IRX @ DTX + UCX.
Posiada dośw. w zakresie ziel. komp. W okresie ostatnich 5 lat: m.in.: analizy i projekt segmentacji(GivEnergy Ltd., magazyny energii), skupiający się na odnawialnych źródłach energii i działaniach proekologicznych, z wykorzystaniem ML oraz modeli LLM (GPT).
Mikołaj Kucharski
Doświadczenie, m.in.: obecnie, Big Data Engineer, Allekgo, 2023 - 2024, Data Science, Capgemini, 2023, Data Engineer, EY, 2021 - 2023, Assistant Geotechnical Designer, Stump Franki, 2020 - 2021, Geotechnical Engineer, Jacobs, 2019 - 2020, Geotechnical Specialist. Wykształcenie: mgr, Informatyka, Polsko-Japońska Akademia Technik Komputerowych w Warszawie (2024), mgr inż,Civil Engineering - Geotechnical Engineering, SGGW w Warszawie (2021), inż, Civil Engineering -Geotechnical Engineering, SGGW w Warszawie (2022).
Posiada dośw. w zakresie ziel. komp. W okresie ostatnich 5 lat: m.in. praca nad infr. do analizy KPI z zakresu ESG, praca nad optymalizacją proc. biznesowych w celu redukcji zuż. zasobów, optymalizacja przetw. dużych zbiorów danych w celu red. kosztów i śladu węglowego.
Informacje dodatkowe
Informacje dodatkowe
Informacje o materiałach dla uczestników usługi
W ramach szkolenia uczestnik otrzymuje:
- dostęp do materiałów oraz ćwiczeń podsumowujących zdobytą wiedzę (materiały on-line formie pdf,html, jupyter notebook)
- zbiory danych wykorzystywane podczas ćwiczeń;
- bezpłatną licencję edukacyjną na wybrane IDE Jetbrains;
- dostęp do kanałów Slack dedykowanych szkoleniu;
- dostęp do nagrań z odbytych zajęć.
Warunki uczestnictwa
Uczestnicy kursu nie muszą mieć żadnego wcześniejszego doświadczenia w zakresie programowania. W szkoleniu mogą wziąć udział zarówno osoby, które myślą o przyszłej pracy w roli data scientist, jak równiez kadra kierownicza i pracownicy sektora zielonej gospodarki, czy właściciele firm, dla których dostęp do analiz jest kluczem do podejmowania trafnych decyzji w bieżącej działalności.
W przypadku korzystania z dofinansowania, warunkiem uczestnictwa jest zapisanie się przez BUR wraz z podaniem aktualnego ID wsparcia.
Informacje dodatkowe
Zakres zg. z RSI Woj. Śl. 2030: Techn. Inf. i kom., (i) techn. szt. int. i uczenia masz., (ii) techn. data mining, (iii) techn. zaaw. baz danych i hurtowni danych oraz z RSI Woj. Mał.. Met. i urz. służące do poz. dan.
Usługi real. są w godz. dyd. (1 godz. dyd. = 45 min.).
Przewidziane są przerwy podczas zajęć 6h, które zostały uwzgl. w harm. usługi, jednak nie wliczają się do ilości godzin samej usługi.
Podst. zw. z VAT: Dz.U.2013.1722, art. 3, ust. 1, pkt. 14 - usł. kszt. zaw. lub przekw. zaw., fin. w co najmniej 70% ze środków publ. - każdorazowo wer. w stosunku do Uczestnika.
Zapisanie się w BUR nie jest jednoznaczne z zarezerwowaniem miejsca. Prosimy o dodatkowy kontakt tel. / mail / msg / www w celu potw. miejsca.
Zawarto umowę z WUP w Krakowie w ramach projektu Małopolski Pociąg do Kariery.
Zawarto umowę z WUP w Toruniu w ramach projektu Kierunek Rozwój.
Usługi dedykowane również uczestnikom innych programów dof.
Zdobyte kompetencje dotyczą cyfrowej transformacji.
Warunki techniczne
Warunki techniczne
Zajęcia prowadzone są w czasie rzeczywistym na platformie Zoom, wraz z dostępem do kanałów grupowych na platformie Slack.
Minimalne wymagania sprzętowe:
- komputer / laptop / lub inne urządzenie ze stałym dostępem do internetu, wyposażone w kamerę internetową
Minimalne wymagania dotyczące parametrów łącza sieciowego:
- szybkość pobierania / przesyłania: minimalna 2 Mb/s / 128 kb/s, zalecana: 4 Mb/s / 512 kb/s
Niezbędne oprogramowanie umożliwiające dostęp do zajęć oraz materiałów:
- przeglądarka internetowa
- Zoom w wersji bezpłatnej dla użytkownika
Uczestnicy otrzymują linki do spotkań przed każdymi zajęciami. Link umożliwiający uczestnictwo w szkoleniu jest aktywny w godzinach wskazanych na karcie usługi.