Google zaprezentował Gemini Live

Podczas prezentacji nowych smartfonów, Google przedstawił również nową funkcję swojej sieci neuronowej. Tryb Gemini Live, według twórców, przekształca chatbota w pełnoprawnego rozmówcę, z którym można swobodnie porozmawiać, nie martwiąc się o "poprawność" komend głosowych. Przedstawiciele Google określili Gemini Live jako aplikację do komunikacji i porównali ją do "najlepszego przyjaciela", z którym zawsze można podzielić się nowymi pomysłami lub przećwiczyć ważną rozmowę.

Sieć neuronowa może odpowiadać na pytania męskim lub żeńskim głosem, oferując użytkownikowi wybór spośród 10 różnych opcji. Syntezowaną mowę AI-rozmówcy można w dowolnym momencie przerwać, poprosić o zgłębienie tematu lub zapauzować, aby wrócić do rozmowy później. Co więcej, można "rozmawiać" ze smartfonem nawet gdy jest zablokowany, co zwiększa wygodę i dostępność asystenta.

Gemini posiada zdolność samodzielnego wprowadzania danych do aplikacji Google — na przykład, może komponować e-maile w Gmail. W "najbliższych tygodniach" firma planuje rozszerzyć możliwości sieci neuronowej, dając jej dostęp do Google Keep i "Zadań", a także pogłębić integrację z YouTube Music. Przykładowo, użytkownik będzie mógł zrobić zdjęcie ulotki reklamującej koncert i poprosić asystenta o ustawienie przypomnienia o zakupie biletu. Gemini Live może zastąpić "Asystenta Google", przypisując uruchomienie sieci neuronowej do naciśnięcia przycisku zasilania lub wypowiedzenia frazy "Hey Google". W tym trybie można zapytać Gemini o tematykę aktualnie odtwarzanego na ekranie wideo, poprosić o wygenerowanie obrazu, a następnie ręcznie przeciągnąć go z okna pomocnika, na przykład do aplikacji Gmail. Google planuje również zintegrować sieć neuronową z Google Home, "Telefonem" i "Wiadomościami", co jeszcze bardziej rozszerzy funkcjonalność asystenta.

Warto zauważyć, że Gemini Live oferuje znacznie bardziej zaawansowane możliwości interakcji niż tradycyjni asystenci głosowi. Dzięki wykorzystaniu najnowszych technologii sztucznej inteligencji, asystent jest w stanie prowadzić bardziej naturalne i kontekstowe rozmowy, rozumiejąc niuanse języka i intencje użytkownika. Jednym z kluczowych aspektów Gemini Live jest jego zdolność do adaptacji do różnych sytuacji i kontekstów. Asystent może służyć nie tylko jako narzędzie do wykonywania prostych zadań, ale także jako partner do burzy mózgów, źródło inspiracji czy nawet wirtualny trener do ćwiczenia umiejętności interpersonalnych.

Ta wszechstronność czyni go niezwykle użytecznym w różnorodnych scenariuszach — od codziennych zadań po bardziej złożone wyzwania zawodowe czy edukacyjne. Integracja Gemini z ekosystemem Google otwiera nowe możliwości w zakresie produktywności i organizacji. Automatyzacja zadań, takich jak tworzenie wydarzeń w kalendarzu czy zarządzanie listami zadań, staje się bardziej intuicyjna i efektywna. Asystent może analizować kontekst rozmowy i proaktywnie sugerować działania, które mogą być przydatne dla użytkownika. Jednakże, mimo imponujących możliwości, Gemini Live na obecnym etapie ma pewne ograniczenia.

Asystent AI jest dostępny wyłącznie w języku angielskim i wymaga aktywnej subskrypcji Gemini Advanced w cenie 20 dolarów miesięcznie. To może stanowić barierę dla niektórych potencjalnych użytkowników, szczególnie na rynkach nieanglojęzycznych. Wprowadzenie Gemini Live przez Google jest kolejnym krokiem w kierunku coraz bardziej zaawansowanej i zintegrowanej sztucznej inteligencji w naszym codziennym życiu. Stawia to również pytania o przyszłość interakcji człowiek-maszyna i potencjalne implikacje etyczne związane z coraz bardziej "ludzkimi" asystentami AI. Podsumowując, Gemini Live reprezentuje znaczący postęp w dziedzinie asystentów AI, oferując bardziej naturalne i kontekstowe interakcje.

Choć technologia ta jest nadal w fazie rozwoju i ma pewne ograniczenia, jej potencjał do transformacji sposobu, w jaki wchodzimy w interakcje z naszymi urządzeniami i zarządzamy informacjami, jest ogromny. W miarę jak Google będzie rozwijać i udoskonalać tę technologię, możemy spodziewać się jeszcze bardziej zaawansowanych i wszechstronnych funkcji w przyszłości.