Rozmowy multimodalne z AI (głos, obraz, kontekst)
Rozmowy multimodalne z AI (głos, obraz, kontekst)
Informacje podstawowe
Informacje podstawowe
- KategoriaInformatyka i telekomunikacja / Aplikacje biznesowe
- Identyfikatory projektówKierunek - Rozwój, Małopolski Pociąg do kariery, Zachodniopomorskie Bony Szkoleniowe
- Grupa docelowa usługi
Szkolenie przeznaczone jest dla osób indywidualnych i pracowników firm zainteresowanych wykorzystaniem sztucznej inteligencji w pracy biurowej, edukacyjnej, marketingowej lub administracyjnej. Uczestnicy powinni posługiwać się komputerem lub smartfonem na poziomie podstawowym. Nie jest wymagana wiedza techniczna ani programistyczna.
- Minimalna liczba uczestników4
- Maksymalna liczba uczestników15
- Data zakończenia rekrutacji17-12-2025
- Forma prowadzenia usługizdalna w czasie rzeczywistym
- Liczba godzin usługi4
- Podstawa uzyskania wpisu do BURZnak Jakości Małopolskich Standardów Usług Edukacyjno-Szkoleniowych (MSUES) - wersja 2.0
Cel
Cel
Cel edukacyjny
Celem szkolenia jest przygotowanie uczestników do praktycznego korzystania z funkcji multimodalnych sztucznej inteligencji, umożliwiających komunikację głosową i wizualną z narzędziami ChatGPT i Google Gemini. Uczestnik nauczy się, jak rozmawiać z AI, pokazywać jej obraz lub dokument, analizować dane wizualne oraz wykorzystywać wyniki rozmów w codziennej pracy.Efekty uczenia się oraz kryteria weryfikacji ich osiągnięcia i Metody walidacji
| Efekty uczenia się | Kryteria weryfikacji | Metoda walidacji |
|---|---|---|
Efekty uczenia się Rozpoznaje elementy komunikacji multimodalnej (głos, obraz, tekst). | Kryteria weryfikacji Wskazuje przykład sytuacji wykorzystania głosu i obrazu w rozmowie z AI. | Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie |
Efekty uczenia się Identyfikuje funkcje ChatGPT i Gemini umożliwiające rozmowę głosowo-obrazową. | Kryteria weryfikacji Wybiera nazwę funkcji odpowiadającą komunikacji multimodalnej. | Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie |
Efekty uczenia się Klasyfikuje wymagania techniczne potrzebne do uruchomienia rozmów głosowych z AI. | Kryteria weryfikacji Wskazuje niezbędny element techniczny do komunikacji (kamera, mikrofon, aplikacja). | Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie |
Efekty uczenia się Wybiera właściwy tryb rozmowy multimodalnej w ChatGPT lub Gemini | Kryteria weryfikacji Wskazuje, które ustawienie pozwala rozpocząć rozmowę głosowo-obrazową. | Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie |
Efekty uczenia się Rozróżnia zastosowania ChatGPT i Gemini w analizie obrazów i głosu. | Kryteria weryfikacji Wybiera przykład zastosowania właściwego dla danego narzędzia. | Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie |
Efekty uczenia się Wskazuje sposób zabezpieczenia danych podczas rozmowy z AI. | Kryteria weryfikacji Wybiera działanie zgodne z zasadami bezpieczeństwa danych. | Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie |
Efekty uczenia się Identyfikuje znaczenie etycznego i odpowiedzialnego korzystania z AI. | Kryteria weryfikacji Wybiera opis zachowania zgodnego z zasadami etycznego użycia AI. | Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie |
Efekty uczenia się Rozróżnia sytuacje, w których wykorzystanie rozmów multimodalnych wspiera współpracę w zespole. | Kryteria weryfikacji Wskazuje scenariusz, w którym AI-asystent wspomaga pracę zespołu. | Metoda walidacji Test teoretyczny z wynikiem generowanym automatycznie |
Kwalifikacje i kompetencje
Kwalifikacje
Kompetencje
Usługa prowadzi do nabycia kompetencji.Warunki uznania kompetencji
Program
Program
Szkolenie trwa 1 dzień (łącznie 4 godziny dydaktyczne) i można w nim uczestniczyć z dowolnego miejsca, dołączając do wirtualnego pokoju konferencyjnego z wykorzystaniem urządzenia z dostępem do Internetu oraz kamery.
Podczas szkolenia zaplanowana jest przerwa, która nie wlicza się w czas trwania szkolenia.
Czas trwania szkolenia: 18.12.2025 r., godz. 16:30-19:45
Liczba godzin teorii: 1 h
Liczba godzin praktyki: 4 h
Zajęcia prowadzone w ramach szkolenia będą realizowane metodami interaktywnymi i aktywizującymi.
Zakres merytoryczny szkolenia:
To szkolenie pokazuje, jak rozmawiać z nowoczesną sztuczną inteligencją – taką, która potrafi słuchać, mówić i widzieć to, co jej pokazujesz.
Uczestnik nauczy się, jak włączyć mikrofon i kamerę, żeby AI mogła analizować zdjęcia, dokumenty, produkty lub otoczenie, a następnie opowiedzieć, co widzi.
Dowiesz się też, jak takie rozmowy wykorzystać w pracy – np. do tworzenia notatek, streszczeń, planów czy analiz.
To praktyczne szkolenie, które uczy korzystania z narzędzi takich jak ChatGPT (Voice + Vision) i Google Gemini w codziennej pracy i życiu.
Program szkolenia
1. Wprowadzenie do multimodalnej komunikacji z AI (ChatGPT i Gemini)
- Czym jest multimodalna sztuczna inteligencja – połączenie głosu, obrazu i tekstu.
- Możliwości i ograniczenia rozmów multimodalnych.
- Wymagania techniczne: mikrofon, kamera, konfiguracja aplikacji mobilnych i desktopowych.
- Przykłady zastosowań w biznesie, edukacji, marketingu i administracji.
2. Rozmowy głosowo-obrazowe z ChatGPT (Voice + Vision Mode)
- Uruchamianie rozmowy z AI z użyciem mikrofonu i kamery.
- Prezentowanie dokumentów, obiektów i otoczenia w czasie rzeczywistym.
- Analiza obrazu przez AI: odczytywanie tekstu, rozpoznawanie elementów, interpretacja danych wizualnych.
- Tworzenie notatek, streszczeń i planów na podstawie rozmowy oraz przesłanych obrazów.
3. Multimodalne rozmowy z Gemini (Google AI)
- Aktywacja funkcji głosowych i wizualnych w Gemini.
- Łączenie rozmów głosowych z analizą zdjęć, dokumentów i stron internetowych.
- Tworzenie poleceń głosowych do pracy z dokumentami Google (Docs, Sheets, Gmail, Kalendarz).
- Porównanie funkcji multimodalnych Gemini i ChatGPT w różnych środowiskach pracy.
4. Praktyczne ćwiczenia i symulacje zastosowań
- Ćwiczenia: rozmowa z AI połączona z analizą zdjęcia, dokumentu lub otoczenia.
- Symulacje: konsultacja biznesowa, planowanie projektu lub lekcji z użyciem AI-asystenta.
- Przekształcanie rozmów i analiz AI w raporty, streszczenia i checklisty.
- Dobre praktyki korzystania z mikrofonu i kamery oraz zasady ochrony danych podczas rozmów z AI.
5. Walidacja: test teretyczny z wynikiem generowanym automatycznym
Uczestnicy usługi otrzymają link do testu.
Od uczestników wymagane jest posiadanie na czas walidacji smartfona lub innego urządzenia, za pomocą którego będzie można wykonać test.
Wynik testu generowany jest automatycznie.
Zaliczenie testu możliwe jest po udzieleniu minimum 80% prawidłowych odpowiedzi.
Walidator nie jest obecny fizycznie na usłudze. Autorem testu jest osoba walidująca.
Harmonogram
Harmonogram
| Przedmiot / temat zajęć | Prowadzący | Data realizacji zajęć | Godzina rozpoczęcia | Godzina zakończenia | Liczba godzin |
|---|---|---|---|---|---|
Przedmiot / temat zajęć 1 z 6 Wprowadzenie do multimodalnej komunikacji z AI (ChatGPT i Gemini) | Prowadzący Joanna Alberska | Data realizacji zajęć 18-12-2025 | Godzina rozpoczęcia 16:30 | Godzina zakończenia 17:00 | Liczba godzin 00:30 |
Przedmiot / temat zajęć 2 z 6 Rozmowy głosowo-obrazowe z ChatGPT (Voice + Vision Mode) | Prowadzący Joanna Alberska | Data realizacji zajęć 18-12-2025 | Godzina rozpoczęcia 17:00 | Godzina zakończenia 18:00 | Liczba godzin 01:00 |
Przedmiot / temat zajęć 3 z 6 Przerwa | Prowadzący Joanna Alberska | Data realizacji zajęć 18-12-2025 | Godzina rozpoczęcia 18:00 | Godzina zakończenia 18:15 | Liczba godzin 00:15 |
Przedmiot / temat zajęć 4 z 6 Multimodalne rozmowy z Gemini (Google AI) | Prowadzący Joanna Alberska | Data realizacji zajęć 18-12-2025 | Godzina rozpoczęcia 18:15 | Godzina zakończenia 19:00 | Liczba godzin 00:45 |
Przedmiot / temat zajęć 5 z 6 Praktyczne ćwiczenia i symulacje zastosowań | Prowadzący Joanna Alberska | Data realizacji zajęć 18-12-2025 | Godzina rozpoczęcia 19:00 | Godzina zakończenia 19:30 | Liczba godzin 00:30 |
Przedmiot / temat zajęć 6 z 6 Walidacja: test teoretyczny z wynikiem generowanym automatycznie | Prowadzący Joanna Alberska | Data realizacji zajęć 18-12-2025 | Godzina rozpoczęcia 19:30 | Godzina zakończenia 19:45 | Liczba godzin 00:15 |
Cena
Cena
Cennik
| Rodzaj ceny | Cena |
|---|---|
Rodzaj ceny Koszt przypadający na 1 uczestnika brutto | Cena 360,00 PLN |
Rodzaj ceny Koszt przypadający na 1 uczestnika netto | Cena 360,00 PLN |
Rodzaj ceny Koszt osobogodziny brutto | Cena 90,00 PLN |
Rodzaj ceny Koszt osobogodziny netto | Cena 90,00 PLN |
Prowadzący
Prowadzący
Joanna Alberska
Obszary zainteresowań: Sztuczna inteligencja AI i aplikacje dla edukacji, e-learning, Microsoft 365, praca w chmurze. Posiada bogate doświadczenie w prowadzeniu szkoleń o podobnej tematyce dla osób dorosłych w okresie 5 lat wstecz od daty rozpoczęcia szkolenia.
Informacje dodatkowe
Informacje dodatkowe
Informacje o materiałach dla uczestników usługi
Notes z szkolenia.
Warunki uczestnictwa
Niezbędnym warunkiem uczestnictwa w szkoleniach i doradztwie, które dofinansowane są z funduszy europejskich jest założenie konta indywidualnego, a później firmowego w Bazie Usług Rozwojowych. Następnie zapis na wybrane szkolenie za pośrednictwem Bazy Usług Rozwojowych, spełnienie warunków przedstawionych przez danego Operatora, który dysponuje funduszami. Złożenie dokumentów o dofinansowanie do usługi rozwojowej u Operatora Usługi, zgodnie z wymogami jakie określił.
Ponadto niezbędnym warunkiem do nabycia kompetencji wypełnienie testu wiedzy na początku i na końcu szkolenia i przystąpienie do egzaminu (walidacji zgodnie z kartą szkolenia).
Uczestnik oświadcza, że jest świadomy i akceptuje możliwość rejestrowania jego wizerunku w trakcie realizacji usługi, w tym w formie zrzutów ekranu, na potrzeby potwierdzenia jego obecności, co jest niezbędne do prawidłowego rozliczenia usługi.
Informacje dodatkowe
Usługa jest zwolniona z podatku VAT w przypadku, kiedy przedsiębiorstwo zwolnione jest z podatku VAT lub dofinansowanie wynosi co najmniej 70%.W innej sytuacji do ceny netto doliczany jest podatek VAT w wysokości 23%.Podstawa: §3 ust. 1 pkt. 14 rozporządzenia Ministra Finansów z dnia 20.12.2013 r. w sprawie zwolnień od podatku od towarów i usług oraz szczegółowych warunków stosowania tych zwolnień (Dz.U. z 2018 r., poz. 701).
Warunkiem zaliczenia jest napisanie pre i post testów oraz testu walidacyjnego.
Uczestnictwo w min 80% zajęć. Potwierdzenie frekwencji na podstawie czasu logowań - wygenerowany raport z platformy zoom.
Uczestnik otrzyma zaświadczenie ze szkolenia
Uczestnicy są świadomi, że usługa realizowana z dofinansowaniem może podlegać monitoringowi ze strony Operatora lub PARP i wyrażają zgodę na jego przeprowadzenie.
Podpisano umowę z WUP Toruń w ramach projektu Kierunek Rozwój.
Warunki techniczne
Warunki techniczne
Warunki techniczne
Aby zapewnić bezproblemowy przebieg szkolenia online, zalecamy korzystanie z:
• Komputera, laptopa lub innego urządzenia z dostępem do internetu
• Stabilnego połączenia internetowego (zalecane min. 2,5 Mb/s dla transmisji dźwięku i obrazu)
• Najnowszych wersji przeglądarek: Google Chrome, Mozilla Firefox, Safari, Edge lub Opera
• Głośników i mikrofonu (wbudowanego, USB lub Bluetooth) oraz kamery internetowej (wbudowanej lub zewnętrznej)
📌 Minimalne wymagania sprzętowe:
🔹 Procesor: Dwurdzeniowy 2 GHz lub lepszy (zalecany czterordzeniowy)
🔹 Pamięć RAM: min. 2 GB (zalecane 4 GB lub więcej)
🔹 System operacyjny: Windows 8 lub nowszy (zalecany Windows 10), Mac OS 10.13 lub nowszy, Linux, Chrome OS
📌 Połączenie internetowe:
🔹 Minimalna prędkość: 512 Kb/s dla dźwięku
🔹 Zalecana prędkość: min. 2,5 Mb/s dla transmisji audio-wideo
📌 Oprogramowanie:
Nie jest wymagane instalowanie dodatkowego oprogramowania – szkolenie odbywa się w przeglądarce internetowej.
📌 Dostęp do szkolenia:
Link umożliwiający udział w szkoleniu online jest aktywny od momentu rozpoczęcia do zakończenia szkolenia.