Studia podyplomowe: analiza i inżynieria danych - data science
Studia podyplomowe: analiza i inżynieria danych - data science
Informacje podstawowe
Informacje podstawowe
- KategoriaInformatyka i telekomunikacja / Programowanie
- Sposób dofinansowaniawsparcie dla osób indywidualnychwsparcie dla pracodawców i ich pracowników
- Grupa docelowa usługi
Studia skierowane są do przedsiębiorców i pracowników, w szczególności: banków, instytucji ubezpieczeniowych, przedsiębiorstw handlowych, produkcyjnych, ośrodków przetwarzania informacji oraz ośrodków badania opinii społecznej, firm prowadzących badania kliniczne, instytucji administracji państwowej samorządowej.
- Minimalna liczba uczestników10
- Maksymalna liczba uczestników15
- Data zakończenia rekrutacji25-10-2024
- Forma prowadzenia usługizdalna w czasie rzeczywistym
- Liczba godzin usługi215
- Podstawa uzyskania wpisu do BURart. 163 ust. 1 ustawy z dnia 20 lipca 2018 r. Prawo o szkolnictwie wyższym i nauce (t.j. Dz. U. z 2023 r. poz. 742, z późn. zm.)
- Zakres uprawnieńStudia podyplomowe
Cel
Cel
Cel edukacyjny
Celem studiów jest zapoznanie słuchaczy z najbardziej popularnymi technikami, algorytmami, narzędziami i oprogramowaniem stosowanym w Data Science oraz w Big Data.Usługa studia podyplomowe: analiza i inżynieria danych przygotowuje do samodzielnego wykonywania przetwarzania, analizy i wizualizacji danych, tworzenia modeli predykcyjnych oraz analizy dużych zbiorów danych.
Efekty uczenia się oraz kryteria weryfikacji ich osiągnięcia i Metody walidacji
Efekty uczenia się | Kryteria weryfikacji | Metoda walidacji |
---|---|---|
Efekty uczenia się Programuje w wybranym języku programowania | Kryteria weryfikacji Charakteryzuje metody i techniki programowania;Stosuje techniki obliczeniowe oraz techniki programowania, wspomagające pracę analityka; Dokonuje ilustracji obliczeń symbolicznych za pomocą pakietów oprogramowania; Projektuje i uzasadnia poprawność działania programu z uwzględnieniem złożoności algorytmów i zapisuje go w języku wysokiego poziomu; Rozumie ograniczenia własnej wiedzy i umiejętności, odczuwa potrzebę dalszego kształcenia, w tym zdobywania wiedzy pozadziedzinowej | Metoda walidacji Obserwacja w warunkach symulowanych |
Metoda walidacji Obserwacja w warunkach rzeczywistych | ||
Efekty uczenia się Tworzy i zarządza systemami baz danych | Kryteria weryfikacji Wymienia zasady dotyczące projektowania, tworzenia i zarządzania systemami baz danych;Posługuje się właściwie dobranymi środowiskami programistycznymi do projektowania, tworzenia, modyfikacji i zarządzania bazami danych; Analizuje złożoność struktur i baz danych, proponuje stosowne procedury, ocenia ich poprawność oraz implementuje je w wybranym języku programowania; Ocenia możliwości wykorzystania dotychczasowych osiągnięć technologii w swoim zawodzie | Metoda walidacji Obserwacja w warunkach rzeczywistych |
Metoda walidacji Obserwacja w warunkach symulowanych | ||
Efekty uczenia się Stosuje metody i techniki sztucznej inteligencji;Przygotowuje i buduje model uczenia maszynowego | Kryteria weryfikacji Wymienia zasady dotyczące reprezentowania wiedzy oraz mechanizmów klasyfikujących;Podaje przykłady ilustrujące konkretne pojęcia matematyczne; Stosuje techniki obliczeniowe oraz techniki programowania, wspomagające pracę analityka; Dokonuje ilustracji obliczeń symbolicznych za pomocą pakietów oprogramowania; podaje różne przykłady rozkładów prawdopodobieństwa dyskretnych i ciągłych i omawia wybrane eksperymenty losowe oraz modele matematyczne, w jakich te rozkłady występują; Posługuje się charakterystykami statystycznymi populacji i ich odpowiednikami próbkowymi; Projektuje i uzasadnia poprawność działania programu z uwzględnieniem złożoności algorytmów i zapisuje go w języku wysokiego poziomu; Implementuje poznane algorytmy w zakresie zagadnień związanych z wizualizacją komputerową; | Metoda walidacji Obserwacja w warunkach rzeczywistych |
Metoda walidacji Obserwacja w warunkach symulowanych | ||
Efekty uczenia się Stosuje wybrane modele matematyczne i techniki eksploracji do rozwiązywania wybranych zadań analizy danych;Dokonuje wizualizacji danych za pomocą wybranego oprogramowania | Kryteria weryfikacji Definiuje pojęcia matematyczne z zakresu algebry i statystyki;Podaje przykłady ilustrujące konkretne pojęcia matematyczne; Definiuje pojęcia dotyczące wizualizacji danych na komputerze; Dobiera odpowiedni model statystyczny do analizy danych oraz implementuje go w praktyce przy pomocy oprogramowania; Podaje różne przykłady rozkładów prawdopodobieństwa dyskretnych i ciągłych i omawia wybrane eksperymenty losowe oraz modele matematyczne, w jakich te rozkłady występują; Posługuje się charakterystykami statystycznymi populacji i ich odpowiednikami próbkowymi; Implementuje poznane algorytmy w zakresie zagadnień związanych z wizualizacją komputerową; Rozumie ograniczenia własnej wiedzy i umiejętności, odczuwa potrzebę dalszego kształcenia, w tym zdobywania wiedzy pozadziedzinowej | Metoda walidacji Obserwacja w warunkach rzeczywistych |
Metoda walidacji Obserwacja w warunkach symulowanych | ||
Efekty uczenia się Korzysta z wybranych technik i narzędzi przetwarzania dużych zbiorów danych w celu pozyskania z nich informacji i wiedzy; | Kryteria weryfikacji Prezentuje techniki obliczeniowe oraz techniki programowania, wspomagające pracę analityka;Dobiera odpowiedni model statystyczny do analizy danych oraz implementuje go w praktyce przy pomocy oprogramowania; Pracuje z odbiorcami tworzonych rozwiązań informatycznych i analitycznych, aktywnie uczestniczy w dyskusji o potrzebach, możliwych rozwiązaniach i zasadach pozyskania, przetwarzania danych oraz ich wykorzystania; Ocenia możliwości wykorzystania dotychczasowych osiągnięć technologii w swoim zawodzie; Zachowuje się w sposób profesjonalny, przestrzega zasad etyki zawodowej i poszanowania różnorodności poglądów; uznaje zawód informatyka oraz analityka danych jako rolę społeczną i uwzględnia problemy związane z poufnością danych; Komunikuje się ze specjalistami w swojej dziedzinie | Metoda walidacji Obserwacja w warunkach rzeczywistych |
Metoda walidacji Obserwacja w warunkach symulowanych |
Kwalifikacje i kompetencje
Kwalifikacje
Kompetencje
Usługa prowadzi do nabycia kompetencji.Warunki uznania kompetencji
Program
Program
115 godz.dyd. w semestrze zimowym, 100 godz.dyd. w semestrze letnim* (godzina dydaktyczna = 45 minut).
Forma wszystkich zajęć ćwiczenia laboratoryjne
Zjazdy sobotnio-niedzielne online w czasie rzeczywistym na platformie Google Workspace.
Ramowy program usługi
Wprowadzenie do data science
Instalacja i konfiguracja środowiska pracy.
Podstawowe elementy języka programowania: organizacja kodu, podstawowe typy danych, instrukcje warunkowe, pętle.
Organizacja kodu: funkcje, moduły, pakiety oraz dokumentacja kodu.
Obsługa narzędzia Jupyter Notebook.
Podstawowe wykorzystanie pakietów pandas, matplotlib oraz seaborn w środowisku Jupyter Notebook.
Język znaczników Markdown.
Wykorzystanie systemu kontroli wersji Git.
Wizualizacja danych i techniki data mining
Podstawowe metody statystyczne.
Wczytywanie danych z różnych źródeł.
Wybrane techniki data mining.
Analiza sygnałów i szeregów czasowych
Podstawowe metody regresji liniowej i nieliniowej oraz prognozowania szeregów czasowych.
Przetwarzanie danych tekstowych: normalizacja i wektoryzacji.
Przetwarzanie zbiorów - zmiany formatu, brakujące wartości, przekształcanie itp.
Eksploracja danych - filtrowanie, sortowanie, agregacja (biblioteki numpy, pandas).
Wizualizacja danych - przegląd najpopularniejszych bibliotek (matplotlib, seaborn, plotly, bokeh, altair).
Systemy baz danych
Relacyjne bazy danych - język SQL.
Nierelacyjne bazy danych – Cassandra.
Integracja Python z bazami danych.
Programowanie baz danych PL/SQL.
Podstawy pakietu R
Instalacja środowiska.
Podstawowe elementy konstrukcyjne języka.
Podstawowe funkcje i ich tworzenie.
Instrukcje sterujące.
Import/eksport danych.
Wizualizacja danych.
Power BI
Importowanie i transformacja danych.
Praca z modelem danych.
Wizualizacja danych.
Raportowanie.
Zaawansowane programowanie w języku Python
Programowanie zorientowane obiektowo.
Moduły i pakiety.
Obsługa plików.
Dekoratory.
Wyrażenia lambda.
Usuwanie błędów, testowanie.
Wyrażenia regularne.
Metody i techniki sztucznej inteligencji
Uczenie nadzorowane i regresja liniowa.
Statystyki Bayesowskie.
Drzewa decyzyjne.
Uczenie nienadzorowane.
Sieci neuronowe.
Modele generatywne i autokodery.
Algorytmy i metody uczenia modeli głębokich.
Wybrane problemy klasyfikacji, detekcji, regresji.
Analiza danych w praktyce
Realizacja zadań praktycznych.
Doskonalenie techniki prezentacji przeprowadzonej analizy.
Inżynieria big data
Wprowadzenie do inżynierii danych.
Platforma Apache Hadoop.
Podstawy Apache Spark.
Batchowe i strumieniowe przetwarzanie danych.
Budowa przepływów danych z użyciem Apache Airflow.
Przetwarzanie danych w chmurze obliczeniowej.
Infrastruktura big data.
Harmonogram
Harmonogram
Przedmiot / temat zajęć | Data realizacji zajęć | Godzina rozpoczęcia | Godzina zakończenia | Liczba godzin |
---|---|---|---|---|
Brak wyników. |
Cena
Cena
Cennik
- Rodzaj cenyCena
- Koszt przypadający na 1 uczestnika brutto6 900,00 PLN
- Koszt przypadający na 1 uczestnika netto6 900,00 PLN
- Koszt osobogodziny brutto32,09 PLN
- Koszt osobogodziny netto32,09 PLN
Prowadzący
Prowadzący
Krzysztof Ropiak
Tomasz Krzywicki
Doświadczenie zawodowe: asystent WMiI UWM w Olsztynie
Doświadczenie w świadczeniu tego typu usług: prowadzenie zajęć na studiach I i II stopnia na kierunku informatyka (od 2019r.), prowadzenie zajęć na studiach podyplomowych Data science w praktyce, Data science w Python, Zaawansowane technologie informatyczne
Wykształcenie: dr w dyscyplinie informatyka i telekomunikacja
Paweł Drozda
Prowadzenie szkoleń Statystyka, bazy danych, MS Office, analiza danych.
Agnieszka Zbrzezny
Piotr Jastrzębski
Prowadzący zajęcia z m.in. z takich przedmiotów jak: Programowanie Obiektowe, Programowanie Strukturalne, Programowanie gier w środowisku Unity, Projekt zespołowy, Analiza struktury procesów masowych, Wizualizacja Danych, Techniki graficznej prezentacji danych statystycznych, Analiza statystyczna wielowymiarowa.
Promotor kilkudziesięciu prac dyplomowych.
Znajomość języków programowania: C#, Java, Python, C, Maltab, R.
Marek Panfiłow
Informacje dodatkowe
Informacje dodatkowe
Informacje o materiałach dla uczestników usługi
materiały dydaktyczne udostępniane w postaci elektronicznej:
- skrypty z opisem teorii
- prezentacje w formie slajdów
- zadania z rozwiązaniami
- kody skryptów w językach programowania
Warunki uczestnictwa
Warunkiem ubiegania się o przyjęcia na studia podyplomowe jest posiadanie dyplomu ukończenia studiów co najmniej pierwszego stopnia dowolnego kierunku.
Informacje dodatkowe
135 godz.dyd. w semestrze zimowym, 90 godz.dyd. w semestrze letnim*
*godzina dydaktyczna = 45 minut
Kadra:
dr Paweł Drozda (Katedra Metod Matematycznych Informatyki WMiI UWM w Olsztynie)
dr inż. Agnieszka Zbrzezny (Katedra Metod Matematycznych Informatyki WMiI UWM w Olsztynie)
mgr Marek Panfiłow (Urząd Statystyczny w Olsztynie)
mgr Krzysztof Ropiak (Katedra Metod Matematycznych Informatyki WMiI UWM w Olsztynie)
dr inż. Tomasz Krzywicki (Katedra Metod Matematycznych Informatyki WMiI UWM w Olsztynie)
mgr inż. Karol Wieszczycki (Polska Akademia Edukacji)
Usługa jest rejestrowana na potrzeby usługodawcy i korzystającego z usługi jak również na potrzeby monitoringu, kontroli oraz w celu utrwalenia efektów kształcenia
Warunki techniczne
Warunki techniczne
- platforma / rodzaj komunikatora, za pośrednictwem której prowadzona będzie usługa
Przeglądarka internetowa Chrome lub Firefox w aktualnych wersjach dostępnych na stronach internetowych producenta / pakiet Google Workspace (Hangouts Meet)
- minimalne wymagania sprzętowe, jakie musi spełniać komputer Uczestnika lub inne urządzenie do zdalnej komunikacji,
Parametry sprzętowe umożliwiające płynne działanie systemu operacyjnego mininalnie 4GB pamięci RAM, procesor intel core i3 lub odpowiednik. System operacyjny Windows 8.1 lub wyższy, MacOS i Linux w aktualny wersjach.
Komputer Uczestnika musi posiadać lub mieć podłączone sprawny mikrofon i kamerę. Uczestnik spotkania zobowiązany jest do wcześniejszej weryfikacji sprawności oraz konfiguracji mikrofonu i kamery.
c)minimalne wymagania dotyczące parametrów łącza sieciowego, jakim musi dysponować Uczestnik,
10 Mb/s – minimalna prędkość internetu
d) niezbędne oprogramowanie umożliwiające Uczestnikom dostęp do prezentowanych treści i materiałów,
System operacyjny Windows 7/8/10 w przypadku PC/laptopów, Android w wersji 5.0 w przypadku tabletów,
System operacyjny, przeglądarka internetowa, przeglądarka plików PDF oraz zgodnie z pkt 1 oraz łącze internetowe o parametrach opisanych w pkt 3
R for windows
RStudio Desktop Open Source License
Notepad++
JAVA JDK
Pycharm
Powerbi desktop
Pyscripter/spider,
biblioteki do analizy danych
Git SCM
Mongo DB
VirtualBox
SQL Developer
Putty
XAMPP
Cassandra
Python (pakiety numpy, scipy, pandas, matplotlib, statsmodels, MySQLdb, psycopg2, os, xlsxwriter, cassandra)
Microsoft Office / Libre Office
e)okres ważności linku umożliwiającego uczestnictwo w spotkaniu on-line.
W okresie trwania szkolenia. Materiały związane z przygotowaniem środowiska do szkolenia będą dostępne bez ograniczeń czasowych.