Activity
Mon
Wed
Fri
Sun
Aug
Sep
Oct
Nov
Dec
Jan
Feb
Mar
Apr
May
Jun
What is this?
Less
More

Memberships

Svenska AI-Akademin(Gratis)

3.5k members ‱ Free

LĂ€r dig AI 🇾đŸ‡Ș

937 members ‱ Free

AI Studion Sverige

82 members ‱ Free

2 contributions to LĂ€r dig AI 🇾đŸ‡Ș
BÀsta plattformen för transkribering av lÀngre mötesvideo?
Hej pÄ er! Jag behöver transkribera en mötesvideo pÄ cirka 1 timme och tar gÀrna emot tips. Vilken plattform eller tjÀnst skulle ni rekommendera för att: 1. Ladda upp en video pÄ cirka 1 timme 2. FÄ hela videon transkriberad till text Tacksam för alla rekommendationer! VÀnliga hÀlsningar Linda
0 likes ‱ May 29
Hej Linda! Ett annat alternativ Ă€r VisionaryAI Suite som jag sjĂ€lv utvecklar. Programmet kan transkribera lĂ€ngre ljud- och videofiler lokalt pĂ„ den egna datorn, men Ă€ven gĂ„ ett steg lĂ€ngre genom att identifiera talare, skapa tidslinjer, generera sammanfattningar och analysera innehĂ„llet med AI. För möten kan det vara vĂ€ldigt praktiskt att fĂ„ bĂ„de transkription, talaruppdelning och en sammanfattning av vad som faktiskt diskuterades. GĂ„r att lĂ€sa mer om programmet hĂ€r: bomarkanalys.se Jag Ă€r alltid nyfiken pĂ„ att höra hur andra löser sina transkriberingsflöden ocksĂ„ 😊
Ett stort genombrott för Vision och multimodal videoförstÄelse
Nu börjar VisionaryAI Suite faktiskt nĂ„ en nivĂ„ dĂ€r det kĂ€nns som nĂ„got mycket större Ă€n ett vanligt AI-projekt đŸ€ŻđŸ”„ Jag heter Robert och har under lĂ„ng tid byggt ett lokalt AI-system för att analysera bilder, video och ljud med multimodal AI. De senaste veckorna har jag gjort nĂ„gra riktigt stora genombrott kring Vision och multimodal videoförstĂ„else. Systemet kan nu: ‱ analysera riktiga videobildrutor med Vision-modeller ‱ koppla visuella hĂ€ndelser till exakt tidslinje ‱ kombinera vision, tal, OCR och metadata ‱ bygga semantisk förstĂ„else över tid ‱ skilja mellan observation, tolkning och osĂ€kra antaganden ‱ kontrollera hallucinationer och grounding ‱ skapa sökbar multimodal tidslinjeintelligens Det som kĂ€nns mest spĂ€nnande Ă€r att detta nu börjar gĂ„ frĂ„n klassisk AI tagging till nĂ„got som mer liknar en riktig multimodal media intelligence plattform. Och allt körs lokalt genom LM Studio och Vision-modeller đŸ˜…đŸ”„ Jag har ocksĂ„ byggt mycket kring semantiskt minne, grounded cinematic scene descriptions, hallucinationskontroll och tidslinjebaserad scenförstĂ„else. Det kĂ€nns faktiskt rĂ€tt surrealistiskt att se systemet förstĂ„ videoklipp scen för scen och koppla ihop vad som syns, vad som sĂ€gs och vad som hĂ€nder över tid. Sibbe, jag tror faktiskt detta börjar nĂ€rma sig en nivĂ„ dĂ€r det skulle vara vĂ€ldigt spĂ€nnande att lĂ„ta fler AI-intresserade mĂ€nniskor testa det đŸ€© Jag Ă€r genuint nyfiken pĂ„ vad mĂ€nniskor hĂ€r inne tycker om riktningen detta Ă€r pĂ„ vĂ€g mot.
3
0
1-2 of 2
Robert Bomark
1
2points to level up
@robert-bomark-6478
Vibecoding user

Active 31d ago
Joined Mar 31, 2026
Powered by