Kacper omawia metanaukę, która bada uniwersalne aspekty procesu naukowego, które pozostają niezmienne pomimo historycznych zmian w podejściach do nauki. Wczesna grecka filozofia przyrodnicza ceniła wiedzę teoretyczną ponad praktyczne zastosowania. Kluczowym punktem jest to, że nauka wprowadza zmiany i kwestionuje istniejące modele rzeczywistości, działając trochę też jako światopoglądowy czynnik chaosu w przeciwieństwie do utrzymania modelu status quo. Kacper argumentuje, że bardziej otwarte społeczeństwa, które pozwalają na swobodne myślenie i wymianę idei sprzyjają rozwojowi nauki. Omawiamy różnice między nauką a technologią oraz to, jak wczesne społeczeństwa ludzkie nie rozróżniały między technologią, magią a religią uważając to za najważniejsze praktyczne rozwiązania społeczne. Z tej myśli zrodziła się technologia naukowa.
Czy jest jakieś działające rozwiązanie do transkrypcji mowy z plików audio w języku polskim na tekst? Może być płatne (rozsądnie), byle działało, jak na razie każde, które sprawdziłem, tworzy więcej pracy niż oszczędza.
Nie musi być idealnie dokładne, tekst jest do późniejszej edycji, ale żeby chociaż zupełnych bzdur nie tworzyło.
Miło nam poinformować o uruchomieniu testów naszego oprogramowania #NapiGen (wcześniej #napgenpl) na sprzęcie bezpośrednio w naszej serwerowni. Oczywiście na naszym autorskim oprogramowaniu spinającym LLM. Można już wysyłać pliki i generować napisy bez naszego udziału, samodzielnie.
Osoby, które wpłaciły dotację na projekt w wysokości uprawniającej do wczesnego dostępu, prosimy o kontakt w celu wygenerowania kont dostępowych do systemu.
Osoby, które chciałyby wspomóc ten projekt i ewentualnie również uzyskać dostęp early-access zapraszamy na stronę zbiórki: https://zrzutka.pl/generator-napisow/
Trochę technikaliów:
Wykorzystujemy LLM whisper z Faster-Whisper. Wczesniej whisper.cpp ale miał problemy ze współpracą z GPU.
Głównie large-v2. Nasze oprogramowanie backend napisane jest w pythonie. Serwer uruchomiony w krakowskiej serwerowni, więc nie ma obawy o karmienie obcych llm/ai.
Maszyna to Dell r730 z pożyczonym GPU Geforce GTX 1080 Ti bo zbieramy nadal na swoją, a inna (P40) czeka "na cle".
w następnym, pełnowymiarowym odcinku podcastu [myśl i mowa] będę rozmawiał z Sebastianem (@sebastian ) z Fundacji Technologie dla Ludzi...
porozmawiamy sobie o samej fundacji, jej celach, działaniach i projektach, w szczególności zaś o projekcie #NapGenPL, no i zupełnie luźno o kondycji i perspektywach dla otwartoźródłowych, niekomercyjnych i wolnych social mediów.
niebawem ruszamy z robotą nad odcinkiem, zatem można się będzie go spodziewać w najbliższych dniach 🔥
Miło nam poinformować, że Lukas "Discrust" @lukaso666 został ambasadorem projektu #NapGenPL czyli Generatora Napisów PL z materiałów audio/wideo ❤️
Nawiązaliśmy współpracę z podkastem [myśl i mowa] https://myslimowa.diy.net.pl/ i zaprosiliśmy do programu wczesnego dostępu do wersji beta serwisu. Będziemy współpracować nad transkrypcjami #podkast-ów, napisami do #PeerTube i integracją transkrypcji z UI #Castopod-a oraz innych programów do słuchania treści audio.
Bardzo dziękujemy za zaufanie 👍
P.S. Jeśli prowadzisz kanał na PeerTube lub YouTube, albo podcast, do którego potrzebujesz transkrypcji, prosimy o kontakt.
Zanim uda się zebrać środki na zakup sprzętu do projektu, możemy posiłkować się wynajmem serwerów z koprocesorem CUDA. To dość drogie, ale warto.
Jeśli macie luźne 50 minut i chcecie posłuchać co się dzieje w Fundacji @ftdl czy o nowym projekcie Generatora Napisów z materiałów audio/video #NapGenPL to zapraszam do nowego podcastu:
Hej. Razem z @piotrsikora i @sebastian z @ftdl oraz Gadesem z podkastu "Gadanie Gadesa" zrealizowałem drugi odcinek, który jest pierwszym (takie fiku miku) podkastu fundacyjnego "FTdL kurier" @FTdL_kurier
na temat projektu zrzutki na generator napisów, który poza osobom niesłyszącym może przydać się także podkasterom do transkrypcji. Wszelkie szczegóły w rozmowie. Miłego słuchania.
hejka, nowy film już na kanale, w żadne premiery się nie będziemy bawić (tylko tym razem), a do tego ma od razu napisy (zajrzyj w opis filmu), polecam, zapraszam elooooooo
@mr_zvbr Pozwolę sobie dodać, że we współpracy z Żubrem testujemy projekt #NapGenPL na was, jeśli potrzebujecie włączać napisy 😉
A jak nie potrzebujecie napisów, to projekt przyda się też do indeksowania materiałów audio/wideo w wyszukiwarkach, po transkrypcji, więc zastosowań jest więcej.
Generator już działa, jak widzicie, ale by uruchomić go na serwerze dostępnym dla wszystkich, trzeba zakupić trochę specjalizowanego sprzętu. Niezbyt drogiego, ale Fundacja @ftdl dysponuje ograniczonymi środkami i potrzebuje wsparcia.
Tym razem wrzucam napisy tymczasowo bez żadnej korekty. Abyście mogli sobie sprawdzić czy warto wesprzeć projekt @ftdl który będzie oferował nam podobny silnik do generowania napisów po polsku. Program ma być nawet ulepszony o indywidualną korektę automatyczną z prostym interfejsem graficznym. Wszystko z myślą m.in. o osobach niesłyszących. Ale nie tylko. Pomyślcie o zaletach tworzenia w sposób ułatwiony transkrypcji podkastów i wideokastów np. w celach cytowania, wyszukiwania lub tworzenia artykułów.
Ja wsparłem już ten projekt. Myślę, że warto. Wy oceńcie sami. Link do zrzutki poniżej.
zainteresowani napisami do poprzedniego odcinka, które obiecałem na poniedziałek. Dwa tygodnie temu. Ale już są, a odcinek nie stracił na aktualności jak coś.
A co do napisów to zostałem AMBASADOREM projektu #NapGenPL czyli powstającego generatora napisów dla osób głuchych i niedosłyszących tworzonego przez fundację @ftdl
Ja sobie będę miał dostęp do bardzo wczesnej wersji serwisu, co powinno sprawić, że napisy będą w Gilotynie na premierę albo zaraz po (bo tam jeszcze będzie trzeba przelecieć i poprawić, co nie).
I będę przypominał Wam czasem , że możecie dorzucić się do projektu, które potrzebuje nieco finansowania, ale imo warto.
Link do zrzutki dam w komentarzu do tego posta, tak samo jak stronę fundacji.
Fundacji nie ma w "klasycznych" social mediach, bo jedną z jej misji jest pokazanie Wam (nam) alternatyw dla komercyjnych platform, alternatyw bez śledzenia, bez algorytmów i w ogóle promowanie całego tego #fediwersum.
Ale ja dziś nie o tym (może kiedyś), więcej na ich stronie. No, to tyle.
Miło nam poinformować, że Wojtek "Żubr" Boliński @mr_zvbr został ambasadorem projektu #NapGenPL czyli Generatora Napisów PL z materiałów audio/wideo ❤️
Nawiązaliśmy współpracę z kanałem #GilotynaTV i zaprosiliśmy go do programu wczesnego dostępu do wersji beta serwisu.
Sukcesywnie, wszystkie odcinki GilotynaTV nieposiadające napisów PL będą uzupełniane.
W miarę wdrożenia oprogramowania, premiery nowych odcinków będą już zawierały napisy i wszystkie osoby, również te niedosłyszące i niesłyszące będą cieszyć się równym dostępem do treści.
Bardzo dziękujemy za zaufanie, Wojtku 👍
P.S. Jeśli prowadzisz kanał na PeerTube lub YouTube, albo podcast, do którego potrzebujesz transkrypcji, prosimy o kontakt.
Zanim uda się zebrać środki na zakup sprzętu do projektu, możemy posiłkować się wynajmem serwerów z koprocesorem CUDA. To dość drogie, ale warto.
Piotr @piotrsikora przygotował małą demonstrację generatora polskich napisów #NapGenPL od fundacji @ftdl na przykładowym, bardzo ciekawym filmie o licencjach #CreativeCommons.