Studia podyplomowe: Data analysis and engineering
Studia podyplomowe: Data analysis and engineering
Informacje podstawowe
Informacje podstawowe
- KategoriaInformatyka i telekomunikacja / Programowanie
- Sposób dofinansowaniawsparcie dla osób indywidualnychwsparcie dla pracodawców i ich pracowników
- Grupa docelowa usługi
Studia skierowane są do przedsiębiorców i pracowników, w szczególności: banków, instytucji ubezpieczeniowych, przedsiębiorstw handlowych, produkcyjnych, ośrodków przetwarzania informacji oraz ośrodków badania opinii społecznej, firm prowadzących badania kliniczne, instytucji administracji państwowej samorządowej.
The studies are addressed to entrepreneurs and employees, in particular: banks, insurance institutions, commercial and manufacturing enterprises, information processing centers and public opinion research centers, companies conducting clinical trials, and local government administration institutions.
- Minimalna liczba uczestników10
- Maksymalna liczba uczestników15
- Data zakończenia rekrutacji07-02-2025
- Forma prowadzenia usługizdalna w czasie rzeczywistym
- Liczba godzin usługi210
- Podstawa uzyskania wpisu do BURart. 163 ust. 1 ustawy z dnia 20 lipca 2018 r. Prawo o szkolnictwie wyższym i nauce (t.j. Dz. U. z 2023 r. poz. 742, z późn. zm.)
- Zakres uprawnieńStudia podyplomowe
Cel
Cel
Cel edukacyjny
Studia realizowane w języku angielskim w formie online w czasie rzeczywistym. Celem jest zapoznanie słuchaczy z najbardziej popularnymi technikami, algorytmami i narzędziami stosowanymi w data science oraz w big data, przygotowują do samodzielnego przetwarzania, analizy i wizualizacji danych.Studies conducted in English online in real time. The aim is to familiarize students with the most popular techniques, algorithms and tools used in data science and big data.
Efekty uczenia się oraz kryteria weryfikacji ich osiągnięcia i Metody walidacji
Efekty uczenia się | Kryteria weryfikacji | Metoda walidacji |
---|---|---|
Efekty uczenia się Słuchacz programuje w wybranym języku programowania / The student programs in a selected programming language | Kryteria weryfikacji Charakteryzuje metody i techniki programowania;Stosuje techniki obliczeniowe oraz techniki programowania, wspomagające pracę analityka; Dokonuje ilustracji obliczeń symbolicznych za pomocą pakietów oprogramowania; Projektuje i uzasadnia poprawność działania programu z uwzględnieniem złożoności algorytmów i zapisuje go w języku wysokiego poziomu; Rozumie ograniczenia własnej wiedzy i umiejętności, odczuwa potrzebę dalszego kształcenia, w tym zdobywania wiedzy pozadziedzinowej | Metoda walidacji Obserwacja w warunkach symulowanych |
Metoda walidacji Obserwacja w warunkach rzeczywistych | ||
Kryteria weryfikacji Characterizes programming methods and techniques;Applies computational and programming techniques to support the analyst's work; Illustrates symbolic computations using software packages; Designs and justifies the correct operation of the program, taking into account the complexity of the algorithms, and writes it in a high-level language; Understands the limitations of one's own knowledge and skills and feels the need for further education, including acquiring knowledge outside the field | Metoda walidacji Obserwacja w warunkach symulowanych | |
Metoda walidacji Obserwacja w warunkach rzeczywistych | ||
Efekty uczenia się Słuchacz tworzy i zarządza systemami baz danych / The student creates and manages database systems | Kryteria weryfikacji Wymienia zasady dotyczące projektowania, tworzenia i zarządzania systemami baz danych;Posługuje się właściwie dobranymi środowiskami programistycznymi do projektowania, tworzenia, modyfikacji i zarządzania bazami danych; Analizuje złożoność struktur i baz danych, proponuje stosowne procedury, ocenia ich poprawność oraz implementuje je w wybranym języku programowania; Ocenia możliwości wykorzystania dotychczasowych osiągnięć technologii w swoim zawodzie | Metoda walidacji Obserwacja w warunkach rzeczywistych |
Metoda walidacji Obserwacja w warunkach symulowanych | ||
Kryteria weryfikacji Lists the principles of designing, creating and managing database systems;Uses appropriately selected programming environments to design, create, modify and manage databases; Analyzes the complexity of structures and databases, proposes appropriate procedures, assesses their correctness and implements them in the selected programming language; Assesses the possibilities of using current technological achievements in his profession | Metoda walidacji Obserwacja w warunkach symulowanych | |
Metoda walidacji Obserwacja w warunkach symulowanych | ||
Efekty uczenia się Słuchacz stosuje metody i techniki sztucznej inteligencji;Słuchacz przygotowuje i buduje model uczenia maszynowego / The student applies artificial intelligence methods and techniques; The student prepares and builds a machine learning model | Kryteria weryfikacji Wymienia zasady dotyczące reprezentowania wiedzy oraz mechanizmów klasyfikujących;Podaje przykłady ilustrujące konkretne pojęcia matematyczne; Stosuje techniki obliczeniowe oraz techniki programowania, wspomagające pracę analityka; Dokonuje ilustracji obliczeń symbolicznych za pomocą pakietów oprogramowania; podaje różne przykłady rozkładów prawdopodobieństwa dyskretnych i ciągłych i omawia wybrane eksperymenty losowe oraz modele matematyczne, w jakich te rozkłady występują; Posługuje się charakterystykami statystycznymi populacji i ich odpowiednikami próbkowymi; Projektuje i uzasadnia poprawność działania programu z uwzględnieniem złożoności algorytmów i zapisuje go w języku wysokiego poziomu; Implementuje poznane algorytmy w zakresie zagadnień związanych z wizualizacją komputerową; | Metoda walidacji Obserwacja w warunkach rzeczywistych |
Metoda walidacji Obserwacja w warunkach symulowanych | ||
Kryteria weryfikacji Lists the principles of knowledge representation and classification mechanisms;Provides examples to illustrate specific mathematical concepts; Applies computational and programming techniques to support the analyst's work; Illustrates symbolic computations using software packages; gives various examples of discrete and continuous probability distributions and discusses selected random experiments and mathematical models in which these distributions occur; Uses statistical characteristics of the population and their sample equivalents; Designs and justifies the correct operation of the program, taking into account the complexity of the algorithms, and writes it in a high-level language; Implements the known algorithms in the field of computer visualization issues; | Metoda walidacji Obserwacja w warunkach symulowanych | |
Metoda walidacji Obserwacja w warunkach rzeczywistych | ||
Efekty uczenia się Słuchacz stosuje wybrane techniki eksploracji do rozwiązywania wybranych zadań analizy danych;Słuchacz dokonuje wizualizacji danych za pomocą wybranego oprogramowania / The student applies selected exploration techniques to solve selected data analysis tasks; The student visualizes the data using selected software | Kryteria weryfikacji Podaje przykłady ilustrujące konkretne pojęcia matematyczne;Definiuje pojęcia dotyczące wizualizacji danych na komputerze; Dobiera odpowiedni model statystyczny do analizy danych oraz implementuje go w praktyce przy pomocy oprogramowania; Podaje różne przykłady rozkładów prawdopodobieństwa dyskretnych i ciągłych i omawia wybrane eksperymenty losowe oraz modele matematyczne, w jakich te rozkłady występują; Posługuje się charakterystykami statystycznymi populacji i ich odpowiednikami próbkowymi; Implementuje poznane algorytmy w zakresie zagadnień związanych z wizualizacją komputerową; Rozumie ograniczenia własnej wiedzy i umiejętności, odczuwa potrzebę dalszego kształcenia, w tym zdobywania wiedzy pozadziedzinowej | Metoda walidacji Obserwacja w warunkach rzeczywistych |
Metoda walidacji Obserwacja w warunkach symulowanych | ||
Kryteria weryfikacji Provides examples to illustrate specific mathematical concepts;Defines concepts related to data visualization on a computer; Selects an appropriate statistical model for data analysis and implements it in practice using software; Gives various examples of discrete and continuous probability distributions and discusses selected random experiments and mathematical models in which these distributions occur; Uses statistical characteristics of the population and their sample equivalents; Implements the known algorithms in the field of computer visualization issues; Understands the limitations of one's own knowledge and skills and feels the need for further education, including acquiring knowledge outside the field | Metoda walidacji Obserwacja w warunkach symulowanych | |
Metoda walidacji Obserwacja w warunkach rzeczywistych | ||
Efekty uczenia się Słuchacz korzysta z wybranych technik i narzędzi przetwarzania dużych zbiorów danych w celu pozyskania z nich informacji i wiedzy / The student uses selected techniques and tools for processing large data sets in order to obtain information and knowledge from them; | Kryteria weryfikacji Prezentuje techniki obliczeniowe oraz techniki programowania, wspomagające pracę analityka;Dobiera odpowiedni model statystyczny do analizy danych oraz implementuje go w praktyce przy pomocy oprogramowania; Pracuje z odbiorcami tworzonych rozwiązań informatycznych i analitycznych, aktywnie uczestniczy w dyskusji o potrzebach, możliwych rozwiązaniach i zasadach pozyskania, przetwarzania danych oraz ich wykorzystania; Ocenia możliwości wykorzystania dotychczasowych osiągnięć technologii w swoim zawodzie; Zachowuje się w sposób profesjonalny, przestrzega zasad etyki zawodowej i poszanowania różnorodności poglądów; uznaje zawód informatyka oraz analityka danych jako rolę społeczną i uwzględnia problemy związane z poufnością danych; Komunikuje się ze specjalistami w swojej dziedzinie | Metoda walidacji Obserwacja w warunkach rzeczywistych |
Metoda walidacji Obserwacja w warunkach symulowanych | ||
Kryteria weryfikacji Presents computational and programming techniques that support the analyst's work;Selects an appropriate statistical model for data analysis and implements it in practice using software; Works with recipients of the created IT and analytical solutions, actively participates in discussions about needs, possible solutions and principles of obtaining, processing and using data; Assesses the possibilities of using current technological achievements in his profession; Behaves in a professional manner, adheres to the principles of professional ethics and respect for diversity of views; recognizes the profession of IT specialist and data analyst as a social role and takes into account issues related to data confidentiality; Communicates with specialists in their field | Metoda walidacji Obserwacja w warunkach symulowanych | |
Metoda walidacji Obserwacja w warunkach rzeczywistych |
Kwalifikacje i kompetencje
Kwalifikacje
Kompetencje
Usługa prowadzi do nabycia kompetencji.Warunki uznania kompetencji
Program
Program
110 godz.dyd. w semestrze zimowym, 100 godz.dyd. w semestrze letnim* (godzina dydaktyczna = 45 minut).
Forma wszystkich zajęć ćwiczenia laboratoryjne
Zjazdy sobotnio-niedzielne online w czasie rzeczywistym na platformie Google Workspace.
==========
110 hours of teaching in the winter semester, 100 teaching hours in the summer semester* (teaching hour = 45 minutes).
The form of all classes is laboratory exercises
Saturday-Sunday meetings online in real time on the Google Workspace platform.
Ramowy program usługi / Framework study program
Introduction to analytics tools
Installation and configuration of the working environment.
Basic elements of the Python language: code organization, basic data types, conditional statements, loops.
Code organization: functions, modules, packages and code documentation.
Introduction to Jupyter Notebook.
Basic use of pandas, matplotlib and seaborn packages in Jupyter Notebook environment.
Markdown markup language.
Using the Git version control system.
Data exploration and visualization
Loading data from various sources.
File processing - format changes, missing values, transformations, etc.
Data mining - filtering, sorting, aggregation (numpy, pandas libraries).
Data visualization - overview of the most popular libraries (matplotlib, seaborn, plotly, bokeh, altair).
Databases
Relational databases - SQL language.
Non-relational databases - Cassandra.
Integration - Python with databases.
PL/SQL language - database programming
Data mining elements
Introduction to the CRISP-DM standard.
Basic statistical methods:
- study of the distribution of decision classes,
- frequency of values,
- measures of dispersion, central tendency,
- calculation of correlations between variables and the influence of conditional attributes on the decision class (positive ratio).
Selected techniques for working with data:
- standardization,
- normalization,
- supplementing damaged data,
- conversion of symbolic values into numerical ones.
Analysis of signals and time series.
Basic methods of linear and non-linear regression and time series forecasting.
Text data processing: normalization and vectorization.
Use of Python to explore, analyze and process data.
Advanced Python
Object-oriented programming.
Modules and packages.
File support.
Decorators.
Lambda expressions.
Exceptions, testing.
Regular expressions.
Machine learning
Supervised learning and linear regression.
Bayesian statistics.
Decision trees.
Unsupervised learning.
Neural networks.
Generative models and autocoders.
Algorithms and methods of learning deep models.
Selected problems of classification, detection, regression
Big Data engineering
Introduction to Big Data
Architecture and technologies of Big Data.
Apache Hadoop platform.
Basics of Apache spark.
Batch and Stream Data Processing.
Building Data Pipelines with Apache Airflow.
Machine Learning in Big Data.
Lp. |
Courses name |
Type of classes |
Number of hours |
The form of passing the subject / way to verify learning outcomes |
ECTS credits |
|
1 |
Introduction to analytical tools |
exercises |
35 |
pass / activity in the exercises; mini-project |
5 |
|
2 |
Data exploration and visualization |
exercises |
20 |
graded credit / activity in the exercises; mini-project |
3 |
|
3 |
Databases |
exercises |
35 |
graded credit / activity in the exercises; mini-project |
5 |
|
4 |
Data mining elements |
exercises |
20 |
graded credit / activity in the exercises; mini-project |
3 |
|
5 |
Advanced Python |
exercises |
30 |
graded credit / activity in the exercises; mini-project |
4 |
|
6 |
Machine learning |
exercises |
40 |
graded credit / activity in the exercises; mini-project |
6 |
|
7 |
Big Data engineering |
exercises |
30 |
graded credit / activity in the exercises; mini-project |
4 |
Harmonogram
Harmonogram
Przedmiot / temat zajęć | Data realizacji zajęć | Godzina rozpoczęcia | Godzina zakończenia | Liczba godzin |
---|---|---|---|---|
Brak wyników. |
Cena
Cena
Cennik
- Rodzaj cenyCena
- Koszt przypadający na 1 uczestnika brutto12 000,00 PLN
- Koszt przypadający na 1 uczestnika netto12 000,00 PLN
- Koszt osobogodziny brutto57,14 PLN
- Koszt osobogodziny netto57,14 PLN
Prowadzący
Prowadzący
Krzysztof Ropiak
Tomasz Krzywicki
Doświadczenie zawodowe: asystent WMiI UWM w Olsztynie
Doświadczenie w świadczeniu tego typu usług: prowadzenie zajęć na studiach I i II stopnia na kierunku informatyka (od 2019r.), prowadzenie zajęć na studiach podyplomowych Data science w praktyce, Data science w Python, Zaawansowane technologie informatyczne
Wykształcenie: mgr inż. informatyki
Paweł Drozda
Prowadzenie szkoleń Statystyka, bazy danych, MS Office, analiza danych.
Adam Lecko
Piotr Jastrzębski
Prowadzący zajęcia z m.in. z takich przedmiotów jak: Programowanie Obiektowe, Programowanie Strukturalne, Programowanie gier w środowisku Unity, Projekt zespołowy, Analiza struktury procesów masowych, Wizualizacja Danych, Techniki graficznej prezentacji danych statystycznych, Analiza statystyczna wielowymiarowa.
Promotor kilkudziesięciu prac dyplomowych.
Znajomość języków programowania: C#, Java, Python, C, Maltab, R.
Paweł Procaj
Informacje dodatkowe
Informacje dodatkowe
Informacje o materiałach dla uczestników usługi
materiały dydaktyczne udostępniane w postaci elektronicznej:
- skrypty z opisem teorii
- prezentacje w formie slajdów
- zadania z rozwiązaniami
- kody skryptów w językach programowania
teaching materials available in electronic form:
- scripts with a description of the theory
- presentations in the form of slides
- tasks with solutions
- script codes in programming languages
Warunki uczestnictwa
Warunkiem ubiegania się o przyjęcie na studia podyplomowe jest posiadanie polskiego lub zagranicznego dyplomu ukończenia studiów wyższych dowolnego kierunku uprawniającego do kontynuacji kształcenia na studiach wyższego stopnia lub ubiegania się o nadanie stopnia doktora w kraju wydania.
The condition for applying for admission to postgraduate studies is to have a Polish or foreign higher education diploma in any field entitling to continue education at higher level studies or to apply for a doctoral degree in the country of issue.
Informacje dodatkowe
110 godz.dyd. w semestrze zimowym, 100 godz.dyd. w semestrze letnim*
*godzina dydaktyczna = 45 minut
Kadra:
dr Paweł Drozda (WMiI UWM w Olsztynie)
mgr Krzysztof Ropiak (WMiI UWM w Olsztynie)
mgr inż. Tomasz Krzywicki (WMiI UWM w Olsztynie)
mgr inż. Paweł Procaj (ProLogic Labs IT Consulting Paweł Procaj)
Usługa jest rejestrowana na potrzeby usługodawcy i korzystającego z usługi jak również na potrzeby monitoringu, kontroli oraz w celu utrwalenia efektów kształcenia
110 hours of teaching in the winter semester, 100 teaching hours in the summer semester*
*teaching hour = 45 minutes
Personnel:
Paweł Drozda (WMiI UWM in Olsztyn)
Krzysztof Ropiak (WMiI UWM in Olsztyn)
Tomasz Krzywicki (WMiI UWM in Olsztyn)
Paweł Procaj (ProLogic Labs IT Consulting Paweł Procaj)
The service is registered for the needs of the service provider and the service user, as well as for monitoring, control and consolidation of learning outcomes.
Warunki techniczne
Warunki techniczne
- platforma / rodzaj komunikatora, za pośrednictwem której prowadzona będzie usługa
Przeglądarka internetowa Chrome lub Firefox w aktualnych wersjach dostępnych na stronach internetowych producenta / pakiet Google Workspace (Hangouts Meet)
- minimalne wymagania sprzętowe, jakie musi spełniać komputer Uczestnika lub inne urządzenie do zdalnej komunikacji,
Parametry sprzętowe umożliwiające płynne działanie systemu operacyjnego mininalnie 4GB pamięci RAM, procesor intel core i3 lub odpowiednik. System operacyjny Windows 8.1 lub wyższy, MacOS i Linux w aktualny wersjach.
Komputer Uczestnika musi posiadać lub mieć podłączone sprawny mikrofon i kamerę. Uczestnik spotkania zobowiązany jest do wcześniejszej weryfikacji sprawności oraz konfiguracji mikrofonu i kamery.
c)minimalne wymagania dotyczące parametrów łącza sieciowego, jakim musi dysponować Uczestnik,
10 Mb/s – minimalna prędkość internetu
d) niezbędne oprogramowanie umożliwiające Uczestnikom dostęp do prezentowanych treści i materiałów,
System operacyjny Windows 7/8/10 w przypadku PC/laptopów, Android w wersji 5.0 w przypadku tabletów,
System operacyjny, przeglądarka internetowa, przeglądarka plików PDF oraz zgodnie z pkt 1 oraz łącze internetowe o parametrach opisanych w pkt 3
R for windows
RStudio Desktop Open Source License
Notepad++
JAVA JDK
Pycharm
Powerbi desktop
Pyscripter/spider,
biblioteki do analizy danych
Git SCM
Mongo DB
VirtualBox
SQL Developer
Putty
XAMPP
Cassandra
Python (pakiety numpy, scipy, pandas, matplotlib, statsmodels, MySQLdb, psycopg2, os, xlsxwriter, cassandra)
Microsoft Office / Libre Office
e)okres ważności linku umożliwiającego uczestnictwo w spotkaniu on-line.
W okresie trwania szkolenia. Materiały związane z przygotowaniem środowiska do szkolenia będą dostępne bez ograniczeń czasowych.
platform/type of messenger through which the service will be provided
Chrome or Firefox web browser in current versions available on the manufacturer's websites / Google Workspace package (Hangouts Meet)
minimum hardware requirements that must be met by the Participant's computer or other remote communication device,
Hardware parameters enabling smooth operation of the operating system: minimum 4GB RAM, Intel Core i3 processor or equivalent. Operating system Windows 8.1 or higher, MacOS and Linux in current versions.
The Participant's computer must have or be connected to a working microphone and camera. The meeting participant is obliged to verify the functionality and configuration of the microphone and camera in advance.
c) minimum requirements regarding the parameters of the network connection that the Participant must have,
10 Mb/s – minimum internet speed
d) necessary software enabling Participants to access the presented content and materials,
Operating system Windows 7/8/10 for PC/laptops, Android version 5.0 for tablets,
Operating system, web browser, PDF file viewer and, in accordance with point 1, and Internet connection with the parameters described in point 3
Notepad++
JAVA JDK
Pycharm
Pyscripter/spider,
libraries for data analysis
Git SCM
MongoDB
VirtualBox
SQL Developer
Putty
XAMPP
Cassandra
Python (packages numpy, scipy, pandas, matplotlib, statsmodels, MySQLdb, psycopg2, os, xlsxwriter, cassandra)
Microsoft Office/LibreOffice
e) validity period of the link enabling participation in the online meeting.
During the training period. Materials related to preparing the training environment will be available without time limits.