One of the things that the Stack Overflow brouhaha demonstrates is that it doesn’t matter if a service was founded by people trusted by the community (Atwood and Spolsky) and was broadly community-led. If it’s a VC-funded startup, they will sell out their users at some point.
Looks like 16.9 GiB for stackoverflow.com.sqlite.br (16.9GiB) and roughly 6 GiB for the rest. Maybe people running #SearXNG instances could add searches on data dumps like these?
Well #DuckDuckGo drank the cool aid. Can we just not plug hallucinating AI into every single thing? I've been meaning to get #SearXNG going on my infra. I guess it's time now.
Temat: Wyszukiwarki proprywatnościowe i antykomercyjne (nie w sensie, że nie oferują modelu np. sprzedaży jakiś usług za pieniądze, a w sensie wyszukiwania skoncentrowanego na algorytmach SEO i wyświetlania według kolejności związanej z kampaniami reklamowymi. Na poziomie deklaratywnym minimum.
Znam w kolejności poznania: DuckDuckGo, MetaGer, Kagi, Qwant, SVMetaSearch, SearXNG.
Pomijam na razie wyszukiwarki koncentrujące się na wyszukiwaniu publikacji naukowych. O te zapytam kiedy indziej.
Co sądzicie? Wady i zalety? Może znacie jeszcze jakieś inne? Od wygłoszenia mojej opinii na podstawie doświadczenia na razie powstrzymam się, aby nie kierunkować dyskusji.
My #LLM Assistant HAL can now query several search engines at once through #SearXNG, compile the meta, scrape the page bodies and URLs into a document and compile the top relevant results.I skip the cookies, skip the ads, get current real time web information.
I'm really disappointed with DuckDuckGo lately. It has been enshittified by adding the new AI feature and search quality has been deteriorated, so I don't trust them anymore. I'm thinking of switching to searXNG, but I'm not interested in self-hosting. So looking for trustworthy public instance which has strict no-log policy, any suggestions?
btw i've been daily driving https://search.birdcat.cafe and the performance has been fucking phenomenal. please try out #searxng, it's really good and gives you search results from #google, #duckduckgo, #bing, #wikipedia, and more. you can also disable the ones you don't want to use! it's pretty sick 😎
Die selbst gehostete #Suchmaschine#SearXNG macht auch auf meinem kleinen #Server eine recht passable Arbeit.
Die Suchergebnisse sind bis hierhin zufriedenstellend.
An der Geschwindigkeit könnte noch gearbeitet werden, aber das liegt wohl mehr an meinem Server.
Ne du, so was wie #DuckDuckGo, #StartPage & #Ecosia liefern Daten ihrer Crawler wie #Bing (M$) und/oder #Google. Pseudonymisiert ist nicht anonym, denn die sind vertraglich dazu verpflichtet.
🧵 …danke @narek für das Entwickeln vom Gugle #App für Android, das ua #SearX / #SearXNG* Suchmaschinen unterstützt und über @fdroidorg auf dem #Android installierbar ist. Das #Gugle App soll später auch noch die #Stract* Suchmaschine unterstützen.
🧵 …neben den #Web-Suchmaschinen wie @MetaGer, @Mojeek, @monocles und #SearXNG Servern (siehe oben weshalb) probiere ich nun struct.com aus. Das ist eine in #Rust / #RustLang entwickelte #OpenSource Suchmaschine und hat u.a. auch eine ordentliche #API. Ob es nun eine zusätzliche Alternative zu #Google & Co. ist muss ich erst noch herausfinden.
🧵 …ein weiteres Argument mehr um Google nicht mehr zu nutzen und wenn dies nun in der #USA so ist, betrifft es u.a. die #EU auch. Als Alternative empfehle und nutze ich @MetaGer, @Mojeek und/oder @monocles so wie #SearXNG - siehe oben. Die sammeln (fast) keine Daten und die Argumente sieht ihr oben im Toot. Abgesehen davon zeigt mittlerweile mMn #Google nur sehr wenig bei der #Suche an.
»Google-Suchdaten: US-Bürgerrechtler kritisieren Verwendung zur Strafverfolgung«
🧵 …hier noch eine Liste von aktiven und öffentlich nutzbaren #SearXNG Instanzen über #HTTPS und/oder #Tor. Die Liste zeigt nicht nur den #online Zustand der #Suchmaschinen an, sondern auch deren Geschwindigkeit und Nuzzeit.