Rozmowy multimodalne z AI (głos, obraz, kontekst)

Możliwość dofinansowania

Rozmowy multimodalne z AI (głos, obraz, kontekst)

Numer usługi 2025/11/12/11626/3141397

EUROKREATOR S.C. RAFAŁ KUNASZYK, ANNA KUNASZYK

360,00 PLN

brutto

360,00 PLN

netto

90,00 PLN

brutto/h

90,00 PLN

netto/h

zdalna w czasie rzeczywistym

Usługa szkoleniowa

4 h

18.12.2025 do 18.12.2025

0 zapisanych uczestników

Obserwuj

Zapisz się

Pobierz kartę usługi w PDF

Informacje podstawowe

Kategoria

Informatyka i telekomunikacja / Aplikacje biznesowe
Identyfikatory projektów

Kierunek - Rozwój, Małopolski Pociąg do kariery, Zachodniopomorskie Bony Szkoleniowe
Grupa docelowa usługi

Szkolenie przeznaczone jest dla osób indywidualnych i pracowników firm zainteresowanych wykorzystaniem sztucznej inteligencji w pracy biurowej, edukacyjnej, marketingowej lub administracyjnej. Uczestnicy powinni posługiwać się komputerem lub smartfonem na poziomie podstawowym. Nie jest wymagana wiedza techniczna ani programistyczna.
Minimalna liczba uczestników

4
Maksymalna liczba uczestników

15
Data zakończenia rekrutacji

17-12-2025
Forma prowadzenia usługi

zdalna w czasie rzeczywistym
Liczba godzin usługi

4
Podstawa uzyskania wpisu do BUR

Znak Jakości Małopolskich Standardów Usług Edukacyjno-Szkoleniowych (MSUES) - wersja 2.0

Cel

Cel edukacyjny

Celem szkolenia jest przygotowanie uczestników do praktycznego korzystania z funkcji multimodalnych sztucznej inteligencji, umożliwiających komunikację głosową i wizualną z narzędziami ChatGPT i Google Gemini. Uczestnik nauczy się, jak rozmawiać z AI, pokazywać jej obraz lub dokument, analizować dane wizualne oraz wykorzystywać wyniki rozmów w codziennej pracy.

Efekty uczenia się oraz kryteria weryfikacji ich osiągnięcia i Metody walidacji

Efekty uczenia się, kryteria weryfikacji i metody walidacji.
Efekty uczenia się	Kryteria weryfikacji	Metoda walidacji
Efekty uczenia się Rozpoznaje elementy komunikacji multimodalnej (głos, obraz, tekst).	Kryteria weryfikacji Wskazuje przykład sytuacji wykorzystania głosu i obrazu w rozmowie z AI.	Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie
Efekty uczenia się Identyfikuje funkcje ChatGPT i Gemini umożliwiające rozmowę głosowo-obrazową.	Kryteria weryfikacji Wybiera nazwę funkcji odpowiadającą komunikacji multimodalnej.	Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie
Efekty uczenia się Klasyfikuje wymagania techniczne potrzebne do uruchomienia rozmów głosowych z AI.	Kryteria weryfikacji Wskazuje niezbędny element techniczny do komunikacji (kamera, mikrofon, aplikacja).	Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie
Efekty uczenia się Wybiera właściwy tryb rozmowy multimodalnej w ChatGPT lub Gemini	Kryteria weryfikacji Wskazuje, które ustawienie pozwala rozpocząć rozmowę głosowo-obrazową.	Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie
Efekty uczenia się Rozróżnia zastosowania ChatGPT i Gemini w analizie obrazów i głosu.	Kryteria weryfikacji Wybiera przykład zastosowania właściwego dla danego narzędzia.	Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie
Efekty uczenia się Wskazuje sposób zabezpieczenia danych podczas rozmowy z AI.	Kryteria weryfikacji Wybiera działanie zgodne z zasadami bezpieczeństwa danych.	Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie
Efekty uczenia się Identyfikuje znaczenie etycznego i odpowiedzialnego korzystania z AI.	Kryteria weryfikacji Wybiera opis zachowania zgodnego z zasadami etycznego użycia AI.	Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie
Efekty uczenia się Rozróżnia sytuacje, w których wykorzystanie rozmów multimodalnych wspiera współpracę w zespole.	Kryteria weryfikacji Wskazuje scenariusz, w którym AI-asystent wspomaga pracę zespołu.	Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie

Kwalifikacje

Kompetencje

Usługa prowadzi do nabycia kompetencji.

Warunki uznania kompetencji

Pytanie 1. Czy dokument potwierdzający uzyskanie kompetencji zawiera opis efektów uczenia się?

TAK

Pytanie 2. Czy dokument potwierdza, że walidacja została przeprowadzona w oparciu o zdefiniowane w efektach uczenia się kryteria ich weryfikacji?

TAK

Pytanie 3. Czy dokument potwierdza zastosowanie rozwiązań zapewniających rozdzielenie procesów kształcenia i szkolenia od walidacji?

TAK

Program

Szkolenie trwa 1 dzień (łącznie 4 godziny dydaktyczne) i można w nim uczestniczyć z dowolnego miejsca, dołączając do wirtualnego pokoju konferencyjnego z wykorzystaniem urządzenia z dostępem do Internetu oraz kamery.

Podczas szkolenia zaplanowana jest przerwa, która nie wlicza się w czas trwania szkolenia.

Czas trwania szkolenia: 18.12.2025 r., godz. 16:30-19:45

Liczba godzin teorii: 1 h

Liczba godzin praktyki: 4 h

Zajęcia prowadzone w ramach szkolenia będą realizowane metodami interaktywnymi i aktywizującymi.

Zakres merytoryczny szkolenia:

To szkolenie pokazuje, jak rozmawiać z nowoczesną sztuczną inteligencją – taką, która potrafi słuchać, mówić i widzieć to, co jej pokazujesz.

Uczestnik nauczy się, jak włączyć mikrofon i kamerę, żeby AI mogła analizować zdjęcia, dokumenty, produkty lub otoczenie, a następnie opowiedzieć, co widzi.

Dowiesz się też, jak takie rozmowy wykorzystać w pracy – np. do tworzenia notatek, streszczeń, planów czy analiz.

To praktyczne szkolenie, które uczy korzystania z narzędzi takich jak ChatGPT (Voice + Vision) i Google Gemini w codziennej pracy i życiu.

Program szkolenia

1. Wprowadzenie do multimodalnej komunikacji z AI (ChatGPT i Gemini)

Czym jest multimodalna sztuczna inteligencja – połączenie głosu, obrazu i tekstu.
Możliwości i ograniczenia rozmów multimodalnych.
Wymagania techniczne: mikrofon, kamera, konfiguracja aplikacji mobilnych i desktopowych.
Przykłady zastosowań w biznesie, edukacji, marketingu i administracji.

2. Rozmowy głosowo-obrazowe z ChatGPT (Voice + Vision Mode)

Uruchamianie rozmowy z AI z użyciem mikrofonu i kamery.
Prezentowanie dokumentów, obiektów i otoczenia w czasie rzeczywistym.
Analiza obrazu przez AI: odczytywanie tekstu, rozpoznawanie elementów, interpretacja danych wizualnych.
Tworzenie notatek, streszczeń i planów na podstawie rozmowy oraz przesłanych obrazów.

3. Multimodalne rozmowy z Gemini (Google AI)

Aktywacja funkcji głosowych i wizualnych w Gemini.
Łączenie rozmów głosowych z analizą zdjęć, dokumentów i stron internetowych.
Tworzenie poleceń głosowych do pracy z dokumentami Google (Docs, Sheets, Gmail, Kalendarz).
Porównanie funkcji multimodalnych Gemini i ChatGPT w różnych środowiskach pracy.

4. Praktyczne ćwiczenia i symulacje zastosowań

Ćwiczenia: rozmowa z AI połączona z analizą zdjęcia, dokumentu lub otoczenia.
Symulacje: konsultacja biznesowa, planowanie projektu lub lekcji z użyciem AI-asystenta.
Przekształcanie rozmów i analiz AI w raporty, streszczenia i checklisty.
Dobre praktyki korzystania z mikrofonu i kamery oraz zasady ochrony danych podczas rozmów z AI.

5. Walidacja: test teretyczny z wynikiem generowanym automatycznym

Uczestnicy usługi otrzymają link do testu.

Od uczestników wymagane jest posiadanie na czas walidacji smartfona lub innego urządzenia, za pomocą którego będzie można wykonać test.

Wynik testu generowany jest automatycznie.

Zaliczenie testu możliwe jest po udzieleniu minimum 80% prawidłowych odpowiedzi.

Walidator nie jest obecny fizycznie na usłudze. Autorem testu jest osoba walidująca.

Harmonogram

Liczba przedmiotów/zajęć: 6

Harmonogram
Przedmiot / temat zajęć	Prowadzący	Data realizacji zajęć	Godzina rozpoczęcia	Godzina zakończenia	Liczba godzin
Przedmiot / temat zajęć 1 z 6 Wprowadzenie do multimodalnej komunikacji z AI (ChatGPT i Gemini)	Prowadzący Joanna Alberska	Data realizacji zajęć 18-12-2025	Godzina rozpoczęcia 16:30	Godzina zakończenia 17:00	Liczba godzin 00:30
Przedmiot / temat zajęć 2 z 6 Rozmowy głosowo-obrazowe z ChatGPT (Voice + Vision Mode)	Prowadzący Joanna Alberska	Data realizacji zajęć 18-12-2025	Godzina rozpoczęcia 17:00	Godzina zakończenia 18:00	Liczba godzin 01:00
Przedmiot / temat zajęć 3 z 6 Przerwa	Prowadzący Joanna Alberska	Data realizacji zajęć 18-12-2025	Godzina rozpoczęcia 18:00	Godzina zakończenia 18:15	Liczba godzin 00:15
Przedmiot / temat zajęć 4 z 6 Multimodalne rozmowy z Gemini (Google AI)	Prowadzący Joanna Alberska	Data realizacji zajęć 18-12-2025	Godzina rozpoczęcia 18:15	Godzina zakończenia 19:00	Liczba godzin 00:45
Przedmiot / temat zajęć 5 z 6 Praktyczne ćwiczenia i symulacje zastosowań	Prowadzący Joanna Alberska	Data realizacji zajęć 18-12-2025	Godzina rozpoczęcia 19:00	Godzina zakończenia 19:30	Liczba godzin 00:30
Przedmiot / temat zajęć 6 z 6 Walidacja: test teoretyczny z wynikiem generowanym automatycznie	Prowadzący Joanna Alberska	Data realizacji zajęć 18-12-2025	Godzina rozpoczęcia 19:30	Godzina zakończenia 19:45	Liczba godzin 00:15

Cena

Cennik

Cennik
Rodzaj ceny	Cena
Rodzaj ceny Koszt przypadający na 1 uczestnika brutto	Cena 360,00 PLN
Rodzaj ceny Koszt przypadający na 1 uczestnika netto	Cena 360,00 PLN
Rodzaj ceny Koszt osobogodziny brutto	Cena 90,00 PLN
Rodzaj ceny Koszt osobogodziny netto	Cena 90,00 PLN

Prowadzący

Liczba prowadzących: 1

1 z 1

Joanna Alberska

Trenerka ICT, pasjonatka rozwiązań pozwalających osiągnąć jak najlepsze efekty na płaszczyźnie edukacji, aktywności zawodowej i prywatnej. Twórca materiałów instruktażowych z zakresu zastosowania programów i aplikacji. Microsoft Innovative Educator Expert 2023-2024. Ponad 15-letnie doświadczenie w prowadzeniu szkoleń dla edukacji, administracji publicznej, biznesu oraz uczniów. Współpraca ze szkołami w ramach tutoringu dla uczniów – towarzyszenie młodzieży w zmianie, nauka przez projektowanie doświadczenia, pokazanie świata przez pryzmat możliwości.
Obszary zainteresowań: Sztuczna inteligencja AI i aplikacje dla edukacji, e-learning, Microsoft 365, praca w chmurze. Posiada bogate doświadczenie w prowadzeniu szkoleń o podobnej tematyce dla osób dorosłych w okresie 5 lat wstecz od daty rozpoczęcia szkolenia.

Informacje dodatkowe

Informacje o materiałach dla uczestników usługi

Notes z szkolenia.

Warunki uczestnictwa

Niezbędnym warunkiem uczestnictwa w szkoleniach i doradztwie, które dofinansowane są z funduszy europejskich jest założenie konta indywidualnego, a później firmowego w Bazie Usług Rozwojowych. Następnie zapis na wybrane szkolenie za pośrednictwem Bazy Usług Rozwojowych, spełnienie warunków przedstawionych przez danego Operatora, który dysponuje funduszami. Złożenie dokumentów o dofinansowanie do usługi rozwojowej u Operatora Usługi, zgodnie z wymogami jakie określił.

Ponadto niezbędnym warunkiem do nabycia kompetencji wypełnienie testu wiedzy na początku i na końcu szkolenia i przystąpienie do egzaminu (walidacji zgodnie z kartą szkolenia).

Uczestnik oświadcza, że jest świadomy i akceptuje możliwość rejestrowania jego wizerunku w trakcie realizacji usługi, w tym w formie zrzutów ekranu, na potrzeby potwierdzenia jego obecności, co jest niezbędne do prawidłowego rozliczenia usługi.

Informacje dodatkowe

Usługa jest zwolniona z podatku VAT w przypadku, kiedy przedsiębiorstwo zwolnione jest z podatku VAT lub dofinansowanie wynosi co najmniej 70%.W innej sytuacji do ceny netto doliczany jest podatek VAT w wysokości 23%.Podstawa: §3 ust. 1 pkt. 14 rozporządzenia Ministra Finansów z dnia 20.12.2013 r. w sprawie zwolnień od podatku od towarów i usług oraz szczegółowych warunków stosowania tych zwolnień (Dz.U. z 2018 r., poz. 701).

Warunkiem zaliczenia jest napisanie pre i post testów oraz testu walidacyjnego.

Uczestnictwo w min 80% zajęć. Potwierdzenie frekwencji na podstawie czasu logowań - wygenerowany raport z platformy zoom.

Uczestnik otrzyma zaświadczenie ze szkolenia

Uczestnicy są świadomi, że usługa realizowana z dofinansowaniem może podlegać monitoringowi ze strony Operatora lub PARP i wyrażają zgodę na jego przeprowadzenie.

Podpisano umowę z WUP Toruń w ramach projektu Kierunek Rozwój.

Warunki techniczne

Warunki techniczne

Aby zapewnić bezproblemowy przebieg szkolenia online, zalecamy korzystanie z:

• Komputera, laptopa lub innego urządzenia z dostępem do internetu

• Stabilnego połączenia internetowego (zalecane min. 2,5 Mb/s dla transmisji dźwięku i obrazu)

• Najnowszych wersji przeglądarek: Google Chrome, Mozilla Firefox, Safari, Edge lub Opera

• Głośników i mikrofonu (wbudowanego, USB lub Bluetooth) oraz kamery internetowej (wbudowanej lub zewnętrznej)

📌 Minimalne wymagania sprzętowe:

🔹 Procesor: Dwurdzeniowy 2 GHz lub lepszy (zalecany czterordzeniowy)

🔹 Pamięć RAM: min. 2 GB (zalecane 4 GB lub więcej)

🔹 System operacyjny: Windows 8 lub nowszy (zalecany Windows 10), Mac OS 10.13 lub nowszy, Linux, Chrome OS

📌 Połączenie internetowe:

🔹 Minimalna prędkość: 512 Kb/s dla dźwięku

🔹 Zalecana prędkość: min. 2,5 Mb/s dla transmisji audio-wideo

📌 Oprogramowanie:

Nie jest wymagane instalowanie dodatkowego oprogramowania – szkolenie odbywa się w przeglądarce internetowej.

📌 Dostęp do szkolenia:

Link umożliwiający udział w szkoleniu online jest aktywny od momentu rozpoczęcia do zakończenia szkolenia.

Kontakt

Paulina Chronowska-Haluch

E-mail

paulina.chronowska@eurokreator.eu

Telefon

(+48) 609 458 834

Rozmowy multimodalne z AI (głos, obraz, kontekst)