Startuj.AI · Dodatkowe zasoby 🛠

Write something

Sep '25 •

Dlaczego modele halucynują (paper od OpenAI)

OpenAI dodało nowy wpis i pełny dokument badawczy o halucynacjach modeli. To świeże materiały, polecam przeczytać albo nawet streścić w AI, bo klarownie tłumaczą problem i co z nim zrobić. Co to są halucynacje? To pewne siebie, lecz fałszywe odpowiedzi generowane przez model. Skąd się biorą? Model uczy się przewidywać następne słowo, a nie „znać fakty”. Przy rzadkich informacjach częściej zgaduje. Sposób testowania modeli bywa zły: dzisiejsze ewaluacje częściej nagradzają strzał niż szczere „nie wiem”. To uczy modele zgadywać. Co proponuje OpenAI? Zmienić ocenianie: mocniej karać pewne bzdury niż odpowiedzi „nie wiem” i nagradzać mądre przyznanie niepewności. Nie wystarczy osobny „test halucynacji”, trzeba poprawić główne metryki. Jak tą wiedzę wykorzystsać? Daj modelowi prawo do „nie wiem” i proś o poziom pewności/źródła. Jeśli odpowiedź brzmi zbyt pewnie przy „kruchych” danych (daty, liczby, nazwiska), najprościej dopytaj albo poproś o weryfikację. Stworzyliśmy o tym pełną lekcje na Startuj.AI Plus wraz z "metodami na halucynacje". Możesz dołączyć na 7 dni testowych bez żadnej opłaty 🙂 Przygotowałem NotebookLM z tym wpisem i paperem od OpenAI. Możesz z niego zrobić podcast, wideo (6minuttowe ode mnie jest poniżej) albo po prostu zapytać o szczegóły. Zapraszam do szybkiej nauki! :) Poniżej krótka lekcja na podstawie treści od OpenAI

New comment Sep '25

Dlaczego modele halucynują (paper od OpenAI)

Piotr Romański

Aug '25 •

Dodatkowe zasoby 🛠

Veo 3 jest DARMOWE dla wszystkich w aplikacji!

🚀 Google odpaliło promocję, przez ten weekend możecie za darmo przetestować Veo 3 (generator wideo od Google) w aplikacji Gemini. Macie do dyspozycji 3 generacje wideo bez kosztów dostępne do niedzieli, 24.08 🎬 Idealna okazja, żeby sprawdzić, jak AI radzi sobie z tworzeniem filmów. Kto przetestuje i się pochwali? 😁 Zobaczcie w Classroom wpis o Generatorze Promptów Wideo

New comment Aug '25

Veo 3 jest DARMOWE dla wszystkich w aplikacji!

Piotr Romański

Aug '25 •

Dodatkowe zasoby 🛠

🎬 Nowy film już na kanale! GPT-5 vs Gemini

Nowy GPT-5 już rozszedł się po internecie, ale… czy faktycznie jest lepszy od starego poczciwego Google Gemini w PRAKTYCZNYCH zadaniach? Bez benchmarków i nicnieznaczących cyferek, za to z realnymi przypadkami. Vinted, analiza długiego PDF, pisanie kodu i agenci. Do zobaczenia! 🔗 Oglądaj: https://youtu.be/aK3trMnS31M 💬 Daj znać w komentarzu na YouTube co u Ciebie sprawdza się lepiej i dlaczego?

New comment Aug '25

Piotr Romański

Aug '25 •

Dodatkowe zasoby 🛠

Grok 4 darmowy w aplikacji!

Oficjalny wpis xAI z X: „Grok 4 jest teraz darmowy dla wszystkich użytkowników na całym świecie! Użyj trybu Auto, a Grok automatycznie wybierze najlepsze odpowiedzi na złożone zapytania korzystając m. in. z Grok 4. Wolisz kontrolę? Wybierz tryb “Ekspert” w dowolnym momencie, aby zawsze korzystać z Grok 4. Przez ograniczony czas wprowadzamy hojne limity użytkowania, dzięki czemu możesz w pełni odkryć potencjał Grok 4.” Podobno „hojne” tj. 5 zapytań co 12h. Lepszy rydz niż nic. Kto nie ma żadnego abonamentu lub nigdy nie korzystał, uważam że warto przetestować! Powodzonka 🙂

New comment Aug '25