Nowoczesna Analiza Danych
Nowoczesna Analiza Danych
Informacje podstawowe
Informacje podstawowe
- KategoriaInne / Edukacja
- Grupa docelowa usługi
Studia przeznaczone są dla osób zainteresowanych szeroko pojęta analizą danych. Materiał wszystkich przedmiotów realizowany jest od podstaw, a więc nawet osoby bez przygotowania mogą uczestniczyć w zajęciach. Studenci poznają metody przygotowywania i selekcji analizowanych danych. Pozyskują umiejętność wyboru odpowiedniej metody analitycznej, skonfigurowania jej i zastosowania. W trakcie studiów studenci poznają różne środowiska do analizy danych, m.in. MS Excel, Pakiet R, Power BI, Python, SQL Server, Oracle Data Mining. Absolwenci studiów będą posiadać umiejętności pozwalające na precyzyjną analizę danych z punktu widzenia zasad statystyki, fachowe szacowanie błędów oraz określania istotności uzyskanych wyników. Nabędą wiedzę i umiejętności pozwalające na posługiwanie się współczesnymi narzędziami analizy danych, pozwalającymi na tworzenie dedykowanych modeli danych oraz ich efektywną analizę.
- Minimalna liczba uczestników15
- Maksymalna liczba uczestników40
- Data zakończenia rekrutacji30-09-2025
- Forma prowadzenia usługizdalna w czasie rzeczywistym
- Liczba godzin usługi208
Cel
Cel
Cel edukacyjny
Absolwent będzie- posiadał wiedzę matematyczna niezbędna do efektywnej analizy danych i wnioskowania;
- potrafił korzystać z wybranych narzędzi dedykowanym zadaniom Data Science;
- potrafił zaprojektować w wybranym narzędziu odpowiednie do zadania metody transformacji danych, ich selekcji i czyszczenia;
- potrafił samodzielnie przeprowadzić analizę danych, dobierając odpowiednią metodę, weryfikując procedurę oraz wyciągając wnioski.
Efekty uczenia się oraz kryteria weryfikacji ich osiągnięcia i Metody walidacji
Efekty uczenia się | Kryteria weryfikacji | Metoda walidacji |
---|---|---|
Efekty uczenia się Absolwent zna i rozumie podstawowe pojęcia z matematyki w zakresie niezbędnym dozrozumienia zaawansowanych zagadnień technik informatycznych. | Kryteria weryfikacji egzamin końcowy | Metoda walidacji Test teoretyczny |
Efekty uczenia się Absolwent zna i rozumie zastosowania informatyki w naukach ekonomicznych iprzyrodniczych | Kryteria weryfikacji egzamin końcowy | Metoda walidacji Test teoretyczny |
Efekty uczenia się Absolwent potrafi zredagować, przeanalizować, a następnie zrealizować wymagania wprzedsięwzięciach związanych z analizą, eksploracją i prezentacją danych o różnorodnym pochodzeniu | Kryteria weryfikacji zadania wykonywane w ramach studiów | Metoda walidacji Analiza dowodów i deklaracji |
Kryteria weryfikacji egzamin końcowy | Metoda walidacji Test teoretyczny | |
Efekty uczenia się Absolwent jest gotów do odpowiedzialności za wspólnie realizowane zadania, związane zpracą zespołową. | Kryteria weryfikacji zadania do samodzielnego lub grupowego wykonania | Metoda walidacji Analiza dowodów i deklaracji |
Kwalifikacje i kompetencje
Kwalifikacje
Kompetencje
Usługa prowadzi do nabycia kompetencji.Warunki uznania kompetencji
Program
Program
Opis przedmiotów
Studia rozpoczynają się od wykładu wprowadzającego w tematykę studiów. Następnie krok po kroku wprowadzane są podstawy statystycznej analizy danych oraz statystyki matematycznej. Poparte są one przykładami opartymi na rzeczywistych danych. Te i analogiczne dane są również analizowane w środowisku R, a w drugim semestrze w środowisku Python. Niezależnie, uczestnicy studiów uczą się pracy z relacyjnymi bazami danych, w szczególności tworzenia rozbudowanych raportów w oparciu o język SQL. Drugi semestr studiów poświęcony jest przede wszystkim dwóm podstawowym obecnie technologiom: chmurom obliczeniowym oraz zaawansowanym metodom analizy danych. Te ostatnie obejmują metody modelowania oraz analizy danych, jak również prezentacji i wymiany wyników.
Podstawy statystycznej analizy danych
W analizie danych niezbędna jest znajomość podstawowych zagadnień statystyki opisowej i matematycznej. Ilościowy opis analizowanych danych i ich prezentację graficzną umożliwia znajomość statystyki opisowej. Do wnioskowania statystycznego na podstawie badanych danych niezbędna jest podstawowa wiedza z zakresu analizy błędów, która z kolei stanowi podstawę statystyki matematycznej.
- Ilościowy opis danych statystycznych, miary średnie, wariancja, odchylenie standardowe, kwantyle.
- Graficzna prezentacja danych, wykres pudełkowy, histogram.
- Skośność i kurtoza rozkładu empirycznego.
- Błąd statystyczny, błąd wartości średniej.
- Rozkład Gaussa i rozkłady z próby.
- Estymatory, testy statystyczne, przedziały ufności.
- Analiza dwóch zmiennych, regresja liniowa. Regresja liniowa wielu zmiennych.
W ramach ćwiczeń, przykłady analizy danych prowadzone są w programie Excel oraz w Pakiecie R.
Wstęp do analizy wielowymiarowej
- Istota danych wielowymiarowych i podstawowe problemy związane z ich analizą.
- Transformacja danych oraz redukcja wymiaru.
- Podstawowe metody analizy danych wielowymiarowych, techniki Data Mining i Machine Learning.
MS SQL Server
Microsoft SQL Server to jeden z najpopularniejszych serwerów bazodanowych na świecie. Na jego przykładzie słuchacze studiów poznają podstawy relacyjnych baz danych oraz język SQL.
- Wstęp do relacyjnych baz danych i języka SQL.
- Wydobywanie danych z bazy danych i formatowanie wyników.
- Filtrowanie rekordów.
- Grupowanie danych.
- Wydobywanie danych z wielu tabel.
Pakiet R
R jest językiem programowania dystrybuowanym na licencji open-source. Służy do analiz statystycznych i wizualizacji danych. Zdobył dużą popularność w środowiskach naukowych i akademickich, ale jest też wykorzystywany w wielu firmach i instytucjach: Facebook, Google, Merck, Altera, Pfizer, LinkedIn, Shell, Novartis, Ford, Mozilla, czy Twitter. Jest wciąż rozbudowywany, pojawiają się nowe specjalistyczne pakiety.
W ramach przedmiotu Podstawy Statystycznej Analizy Danych (6 godz.).
- Wstęp do środowiska R, instalacja pakietów, wczytywanie i zapisywanie danych, struktury danych w R, przekształcanie danych, filtrowanie.
- Elementy programowania: tworzenie skryptów obliczeniowych, obliczenia z wykorzystaniem pętli, budowa własnych funkcji.
- Prezentowanie danych i wyników: wykresy słupkowe, kołowe, histogramy, wykresy pudełkowe (boxplot).
- Metody statystyczne: statystyczny opis danych, przedziały ufności, testy parametryczne, testy zgodności i niezależności.
W ramach przedmiotu Pakiet R (18 godz.).
- Regresja liniowa jednej i wielu zmiennych, kryteria informacyjne, punkty odstające i wpływowe, metody graficzne.
- Regresja logistyczna, drzewa klasyfikacyjne, lasy losowe.
- Metody analizy skupień, w tym metoda k-średnich.
- Metoda głównych składowych, metoda wektorów nośnych.
- Drzewa regresyjne.
Power BI
Power BI to aplikacja firmy Microsoft typu desktop przeznaczona do pracy w systemie Windows. Zdobywa coraz większą popularność z powodu swojej kompleksowości (umożliwia tzw. analizę typu self-service) oraz współpracy z chmurą. Aplikacja umożliwia łączenie się całym spektrum różnych źródeł danych, pobieranie ich i modelowanie. Posiada wbudowanych coraz więcej elementów hurtowni danych, również tych, związanych z technikami Data Mining. Pozwala na projektowanie i udostępnianie raportów i wyników analiz.
- Wstęp do architektury Power BI.
- Pozyskiwanie i transformowanie danych.
- Tworzenie modeli danych.
- Analiza danych.
- Tworzenie elementów wizualnych i raportów.
Python
Przedmiot ten obejmuje wszystkie najważniejsze zagadnienia związane z językiem programowania obiektowo-skryptowym Python. Python to obecnie jeden z najpopularniejszych języków programowania, który swoją elastycznością stał się jednym z najważniejszych rozwiązań również do procesów ETL oraz ELT. Wraz z rozwiązaniami chmurowymi stawowi on dopełnienie w rozwiązaniach business intelligence.
- Wstęp do programowania w języku Python. Środowisko, instalacja oraz zarządzanie pakietami. Narzędzia do programowania (IDE), metody wersjonowania i testowania kodu.
- Omówienie typów danych, funkcji , operatorów, itd.
- Pętle i instrukcje warunkowe.
- Konstrukcja metod, funkcji i klas.
- Omówienie wykorzystania najważniejszych pakietów dostępnych w środowisku Python wraz z ich przykładowym zastosowaniem.
- Wykorzystanie Pythona do wydobywania i analizy danych danych.
MS SQL Business Intelligence
Microsoft SQL Server Business Intelligence to kompletna platforma dla środowisk inteligencji biznesowej. Składa się ona z serwera baz danych, środowiska Integration Services do tworzenia rozwiązań ETL (Extract – Transorm – Load) służących do dystrybucji i transformowania danych, Analysis Services do projektowania i tworzenia wydajnych hurtowni danych opartych na architekturze wielowymiarowej lub tabelarycznej oraz Reporting Services do projektowania, tworzenia i dystrybucji raportów.
- Wstęp do środowiska MS SQL Server BI.
- Tworzenie pakietów do transferowania i transformowania danych.
- Tworzenie elementów hurtowni danych: wymiary, kostki, obliczenia, itp.
- Tworzenie hurtowni danych.
- Tworzenie modeli Data Mining i analiza danych.
- Projektowanie i tworzenie raportów.
Oracle Data Mining
Firma Oracle jest największym dostawcą rozwiązań bazodanowych na świecie. Oferuje nie tylko serwery bazodanowe, ale również cały szereg aplikacji, w tym do analizy danych. W tej części studiów słuchacze zapoznają się z bazami danych Oracle i podstawami języka PL/SQL. Główną częścią przedmiotu będzie przygotowanie danych i ich analiza przy pomocy technik Data Mining oraz Machine Learning (uczenie maszynowe).
- Wstęp do baz danych Oracle i PL/SQL.
- Integracja Oracle z pakietami Python i R.
- Techniki Data Mining i Machine Learning.
- Analiza wspólnego koszyka.
- Wykrywanie anomalii.
- Wdrażanie rozwiązań Data Mining i Machine Learning.
Rozwiązania chmurowe
Rozwiązania chmurowe omawiane są na przykładzie technologii Apache Hadoop. Jest to zestaw bibliotek i narzędzi służących do przechowywania, przetwarzania oraz analizowania dużych zbiorów danych. Jest on ściśle powiązany z takimi pojęciami jak Cloud Computing, Big Data, Machine Learning, czy Artificial Intelligence. Apache Hadoop pozwala przechowywać i przetwarzać duże ilości danych przy pomocy wielu zadań wsadowych. Do przetwarzania danych na Hadoop można jeszcze użyć Apache Spark, czyli platformy opartej na klastrach. Spark dostarczą nowe możliwości programiście, których sam Hadoop nie posiada. Oba te rozwiązania mogą używać programu Hive, który tworzy interfejs dostępu do danych HiveQL, który bazuje na języku SQL. HBase jest przykładem aplikacji uruchomionej na systemie plików HDFS, który jest częścią Hadoopa. Baza HBase jest modelowana w oparciu o Google Bigtable czyli nie-relacyjnej bazie danych.
- Wprowadzenie do tematyki Big Data.
- Komponenty środowiska Hadoop. HDFS – rozproszone przechowywanie danych.
- Nierelacyjne bazy danych. Hive – omówienie działania MapReduce i ćwiczenia w operowaniu językiem HQL.
- Apache Spark – komponenty i charakterystyka przetwarzania danych.
- Wprowadzenie i ćwiczenia w użyciu biblioteki PySpark.
- Tworzenie, wdrażanie i optymalizacja aplikacji sparkowych.
Harmonogram
Harmonogram
Przedmiot / temat zajęć | Prowadzący | Data realizacji zajęć | Godzina rozpoczęcia | Godzina zakończenia | Liczba godzin |
---|---|---|---|---|---|
Przedmiot / temat zajęć 1 z 31 Wykład wprowadzający | Prowadzący - | Data realizacji zajęć 25-10-2025 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 10:30 | Liczba godzin 01:30 |
Przedmiot / temat zajęć 2 z 31 Podstawy statystycznej analizy danych | Prowadzący - | Data realizacji zajęć 25-10-2025 | Godzina rozpoczęcia 10:45 | Godzina zakończenia 17:45 | Liczba godzin 07:00 |
Przedmiot / temat zajęć 3 z 31 Podstawy statystycznej analizy danych | Prowadzący - | Data realizacji zajęć 26-10-2025 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 16:00 | Liczba godzin 07:00 |
Przedmiot / temat zajęć 4 z 31 Podstawy statystycznej analizy danych | Prowadzący - | Data realizacji zajęć 15-11-2025 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 17:45 | Liczba godzin 08:45 |
Przedmiot / temat zajęć 5 z 31 Podstawy statystycznej analizy danych | Prowadzący - | Data realizacji zajęć 16-11-2025 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 16:00 | Liczba godzin 07:00 |
Przedmiot / temat zajęć 6 z 31 Pakiet R | Prowadzący - | Data realizacji zajęć 29-11-2025 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 14:15 | Liczba godzin 05:15 |
Przedmiot / temat zajęć 7 z 31 Wstęp do analizy wielowymiarowej | Prowadzący - | Data realizacji zajęć 29-11-2025 | Godzina rozpoczęcia 14:30 | Godzina zakończenia 17:45 | Liczba godzin 03:15 |
Przedmiot / temat zajęć 8 z 31 Wstęp do analizy wielowymiarowej | Prowadzący - | Data realizacji zajęć 30-11-2025 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 10:30 | Liczba godzin 01:30 |
Przedmiot / temat zajęć 9 z 31 SQL Server | Prowadzący - | Data realizacji zajęć 30-11-2025 | Godzina rozpoczęcia 10:45 | Godzina zakończenia 17:45 | Liczba godzin 07:00 |
Przedmiot / temat zajęć 10 z 31 SQL Server | Prowadzący - | Data realizacji zajęć 13-12-2025 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 17:45 | Liczba godzin 08:45 |
Przedmiot / temat zajęć 11 z 31 SQL Server | Prowadzący - | Data realizacji zajęć 14-12-2025 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 14:15 | Liczba godzin 05:15 |
Przedmiot / temat zajęć 12 z 31 Pakiet R | Prowadzący - | Data realizacji zajęć 14-12-2025 | Godzina rozpoczęcia 14:30 | Godzina zakończenia 17:45 | Liczba godzin 03:15 |
Przedmiot / temat zajęć 13 z 31 Pakiet R | Prowadzący - | Data realizacji zajęć 10-01-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 17:45 | Liczba godzin 08:45 |
Przedmiot / temat zajęć 14 z 31 Pakiet R | Prowadzący - | Data realizacji zajęć 11-01-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 12:15 | Liczba godzin 03:15 |
Przedmiot / temat zajęć 15 z 31 Power BI | Prowadzący - | Data realizacji zajęć 11-01-2026 | Godzina rozpoczęcia 12:45 | Godzina zakończenia 17:45 | Liczba godzin 05:00 |
Przedmiot / temat zajęć 16 z 31 Power BI | Prowadzący - | Data realizacji zajęć 24-01-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 16:00 | Liczba godzin 07:00 |
Przedmiot / temat zajęć 17 z 31 Power BI | Prowadzący - | Data realizacji zajęć 25-01-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 16:00 | Liczba godzin 07:00 |
Przedmiot / temat zajęć 18 z 31 Python | Prowadzący - | Data realizacji zajęć 14-02-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 17:45 | Liczba godzin 08:45 |
Przedmiot / temat zajęć 19 z 31 Python | Prowadzący - | Data realizacji zajęć 14-03-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 14:15 | Liczba godzin 05:15 |
Przedmiot / temat zajęć 20 z 31 Business Intelligence | Prowadzący - | Data realizacji zajęć 14-03-2026 | Godzina rozpoczęcia 14:30 | Godzina zakończenia 17:45 | Liczba godzin 03:15 |
Przedmiot / temat zajęć 21 z 31 Business Intelligence | Prowadzący - | Data realizacji zajęć 15-03-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 16:00 | Liczba godzin 07:00 |
Przedmiot / temat zajęć 22 z 31 Business Intelligence | Prowadzący - | Data realizacji zajęć 28-03-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 17:45 | Liczba godzin 08:45 |
Przedmiot / temat zajęć 23 z 31 Business Intelligence | Prowadzący - | Data realizacji zajęć 29-03-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 12:15 | Liczba godzin 03:15 |
Przedmiot / temat zajęć 24 z 31 Oracle Data Mining | Prowadzący - | Data realizacji zajęć 29-03-2026 | Godzina rozpoczęcia 12:45 | Godzina zakończenia 16:00 | Liczba godzin 03:15 |
Przedmiot / temat zajęć 25 z 31 Oracle Data Mining | Prowadzący - | Data realizacji zajęć 18-04-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 16:00 | Liczba godzin 07:00 |
Przedmiot / temat zajęć 26 z 31 Oracle Data Mining | Prowadzący - | Data realizacji zajęć 19-04-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 16:00 | Liczba godzin 07:00 |
Przedmiot / temat zajęć 27 z 31 Oracle Data Mining | Prowadzący - | Data realizacji zajęć 09-05-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 12:15 | Liczba godzin 03:15 |
Przedmiot / temat zajęć 28 z 31 Rozwiązania Chmurowe | Prowadzący - | Data realizacji zajęć 09-05-2026 | Godzina rozpoczęcia 12:45 | Godzina zakończenia 16:00 | Liczba godzin 03:15 |
Przedmiot / temat zajęć 29 z 31 Rozwiązania Chmurowe | Prowadzący - | Data realizacji zajęć 10-05-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 16:00 | Liczba godzin 07:00 |
Przedmiot / temat zajęć 30 z 31 Rozwiązania Chmurowe | Prowadzący - | Data realizacji zajęć 13-06-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 16:00 | Liczba godzin 07:00 |
Przedmiot / temat zajęć 31 z 31 Rozwiązania Chmurowe | Prowadzący - | Data realizacji zajęć 14-06-2026 | Godzina rozpoczęcia 09:00 | Godzina zakończenia 12:15 | Liczba godzin 03:15 |
Cena
Cena
Cennik
Rodzaj ceny | Cena |
---|---|
Rodzaj ceny Koszt przypadający na 1 uczestnika brutto | Cena 8 600,00 PLN |
Rodzaj ceny Koszt przypadający na 1 uczestnika netto | Cena 8 600,00 PLN |
Rodzaj ceny Koszt osobogodziny brutto | Cena 41,35 PLN |
Rodzaj ceny Koszt osobogodziny netto | Cena 41,35 PLN |
Prowadzący
Prowadzący
Informacje dodatkowe
Informacje dodatkowe
Informacje o materiałach dla uczestników usługi
Treści są prezentowane w trakcie wykładów w formie plików pdf. W trakcie ćwiczeń uczestnicy otrzymują materiały dydaktyczne w różnych formatach.
Warunki uczestnictwa
Słuchaczami studiów mogą być osoby, które ukończyły studia wyższe i posiadają dyplom: licencjata, inżyniera, magistra lub magistra inżyniera. Ponad to są to osoby, które wniosły wszystkie, przewidziane regulaminem studiów opłaty (wpisowe + opłata za jeden lub oba semestry studiów).
Warunki techniczne
Warunki techniczne
Zajęcia odbywają się za pośrednictwem platformy MS Teams. Wymagane jest posiadanie komputera z dostępem do internetu. Niezbędne oprogramowanie uczestnicy będą instalować przed zajęciami zgodnie ze wskazówkami wykładowców.