Automatische Suche nach Informationen im Internet. Überprüfung von Programmen zum Durchsuchen von Dokumenten und Daten. Analyse aktueller Tweets

22.05.2020 Speicherkarten

Was ist das

DuckDuckGo ist eine ziemlich bekannte Open-Source-Suchmaschine. Quellcode. Die Server befinden sich in den USA. Neben dem eigenen Roboter nutzt die Suchmaschine Ergebnisse aus anderen Quellen: Yahoo, Bing, Wikipedia.

Je besser

DuckDuckGo positioniert sich als Suchmaschine, die ein Höchstmaß an Privatsphäre und Vertraulichkeit bietet. Das System sammelt keine Daten über den Benutzer, speichert keine Protokolle (kein Suchverlauf), verwendet Kekse so begrenzt wie möglich.

DuckDuckGo sammelt nicht Persönliche Angaben Benutzer und gibt es nicht weiter. Dies ist unsere Datenschutzerklärung.

Gabriel Weinberg, Gründer von DuckDuckGo

Warum brauchen Sie das?

Alle großen Suchmaschinen versuchen, Suchergebnisse basierend auf Daten über die Person vor dem Monitor zu personalisieren. Dieses Phänomen wird als „Filterblase“ bezeichnet: Der Nutzer sieht nur die Ergebnisse, die seinen Präferenzen entsprechen oder die das System als solche ansieht.

Erzeugt ein objektives Bild, das nicht von Ihrem bisherigen Verhalten im Internet abhängt, und eliminiert thematische Werbung von Google und Yandex basierend auf Ihren Suchanfragen. Mit DuckDuckGo ist es einfach, nach Informationen zu suchen Fremdsprachen, während Google und Yandex standardmäßig russischsprachigen Websites den Vorzug geben, auch wenn die Anfrage in einer anderen Sprache eingegeben wird.


Was ist das

not Evil ist ein System, das das anonyme Tor-Netzwerk durchsucht. Um es zu verwenden, müssen Sie zu diesem Netzwerk gehen, indem Sie beispielsweise eine spezielle .

not Evil ist nicht die einzige Suchmaschine ihrer Art. Es gibt LOOK (Standardsuche im Tor-Browser, zugänglich über normales Internet) oder TORCH (eine der ältesten Suchmaschinen im Tor-Netzwerk) und andere. Aufgrund des klaren Hinweises von Google (schauen Sie sich einfach die Startseite an) haben wir uns für not Evil entschieden.

Je besser

Es sucht dort, wo Google, Yandex und andere Suchmaschinen im Allgemeinen geschlossen sind.

Warum brauchen Sie das?

Das Tor-Netzwerk enthält viele Ressourcen, die im gesetzestreuen Internet nicht zu finden sind. Und ihre Zahl wird zunehmen, da die staatliche Kontrolle über die Inhalte des Internets zunimmt. Tor ist eine Art Netzwerk im Internet mit eigenen sozialen Netzwerken, Torrent-Trackern, Medien, Handelsplattformen, Blogs, Bibliotheken usw.

3. YaCy

Was ist das

YaCy ist eine dezentrale Suchmaschine, die nach dem Prinzip von P2P-Netzwerken funktioniert. Jeder Computer, auf dem das Hauptsoftwaremodul installiert ist, scannt das Internet selbstständig, ist also analog Suchroboter. Die erhaltenen Ergebnisse werden in einer gemeinsamen Datenbank gesammelt, die von allen YaCy-Teilnehmern genutzt wird.

Je besser

Es ist schwer zu sagen, ob dies besser oder schlechter ist, da YaCy einen völlig anderen Ansatz zur Organisation der Suche darstellt. Das Fehlen eines einzigen Servers und Eigentümerunternehmens macht die Ergebnisse völlig unabhängig von den Vorlieben anderer. Durch die Autonomie jedes Knotens entfällt die Zensur. YaCy ist in der Lage, das Deep Web und nicht indizierte öffentliche Netzwerke zu durchsuchen.

Warum brauchen Sie das?

Wenn Sie ein Befürworter von Open-Source-Software und einem freien Internet sind und nicht dem Einfluss von Regierungsbehörden und Großkonzernen unterliegen, dann ist YaCy Ihre Wahl. Es kann auch verwendet werden, um eine Suche innerhalb eines Unternehmens oder eines anderen autonomen Netzwerks zu organisieren. Und auch wenn YaCy im Alltag nicht sehr nützlich ist, ist es in Bezug auf den Suchvorgang eine würdige Alternative zu Google.

4. Pipl

Was ist das

Pipl ist ein System zur Suche nach Informationen über eine bestimmte Person.

Je besser

Die Autoren von Pipl behaupten, dass ihre speziellen Algorithmen effizienter suchen als „normale“ Suchmaschinen. Insbesondere Profilen wird Vorrang eingeräumt soziale Netzwerke, Kommentare, Teilnehmerlisten und verschiedene Datenbanken, in denen Informationen über Personen veröffentlicht werden, beispielsweise Datenbanken mit Gerichtsentscheidungen. Die Führungsrolle von Pipl in diesem Bereich wird durch Bewertungen von Lifehacker.com, TechCrunch und anderen Publikationen bestätigt.

Warum brauchen Sie das?

Wenn Sie Informationen über eine in den USA lebende Person suchen müssen, ist Pipl viel effektiver als Google. Die Datenbanken russischer Gerichte sind für die Suchmaschine offenbar nicht zugänglich. Deshalb kommt er mit russischen Bürgern nicht so gut zurecht.

Was ist das

FindSounds ist eine weitere spezialisierte Suchmaschine. Hereinschauen offene Quellen verschiedene Geräusche: Haus, Natur, Autos, Menschen und so weiter. Der Dienst unterstützt keine Abfragen auf Russisch, es gibt jedoch eine beeindruckende Liste russischsprachiger Tags, die Sie für die Suche verwenden können.

Je besser

Die Ausgabe enthält nur Sounds und nichts Extras. In den Einstellungen können Sie das gewünschte Format und die Tonqualität einstellen. Alle gefundenen Sounds stehen zum Download bereit. Es gibt eine Suche nach Muster.

Warum brauchen Sie das?

Wenn Sie schnell das Geräusch eines Musketenschusses, die Schläge eines säugenden Spechts oder den Schrei von Homer Simpson finden müssen, dann ist dieser Service genau das Richtige für Sie. Und wir haben dies nur aus den verfügbaren russischsprachigen Abfragen ausgewählt. An Englische Sprache Das Spektrum ist noch größer.

Im Ernst, ein spezialisierter Dienst erfordert ein spezialisiertes Publikum. Aber was ist, wenn es auch für Sie nützlich ist?

Was ist das

Wolfram|Alpha ist eine computergestützte Suchmaschine. Anstelle von Links zu Artikeln mit Schlüsselwörtern bietet es eine vorgefertigte Antwort auf die Anfrage des Benutzers. Wenn Sie beispielsweise „compare the populations of New York and San Francisco“ auf Englisch in das Suchformular eingeben, zeigt Wolfram|Alpha sofort Tabellen und Grafiken mit dem Vergleich an.

Je besser

Dieser Dienst eignet sich besser als andere, um Fakten zu finden und Daten zu berechnen. Wolfram|Alpha sammelt und organisiert im Web verfügbares Wissen aus verschiedenen Bereichen, darunter Wissenschaft, Kultur und Unterhaltung. Wenn diese Datenbank eine vorgefertigte Antwort auf eine Suchanfrage enthält, zeigt das System diese an; wenn nicht, berechnet es das Ergebnis und zeigt es an. In diesem Fall sieht der Benutzer nur nichts Überflüssiges.

Warum brauchen Sie das?

Wenn Sie beispielsweise Student, Analyst, Journalist oder Forscher sind, können Sie mit Wolfram|Alpha Daten zu Ihrer Arbeit finden und berechnen. Der Dienst versteht nicht alle Anfragen, entwickelt sich aber ständig weiter und wird intelligenter.

Was ist das

Die Metasuchmaschine Dogpile zeigt eine kombinierte Ergebnisliste von an Suchergebnisse Google, Yahoo und andere beliebte Systeme.

Je besser

Erstens zeigt Dogpile weniger Werbung an. Zweitens verwendet der Dienst einen speziellen Algorithmus, um die besten Ergebnisse verschiedener Suchmaschinen zu finden und anzuzeigen. Nach Angaben der Dogpile-Entwickler generieren ihre Systeme die umfassendsten Suchergebnisse im gesamten Internet.

Warum brauchen Sie das?

Wenn Sie bei Google oder einer anderen Standardsuchmaschine keine Informationen finden können, suchen Sie mit Dogpile in mehreren Suchmaschinen gleichzeitig danach.

Was ist das

BoardReader ist ein System zur Textsuche in Foren, Frage-Antwort-Diensten und anderen Communities.

Je besser

Mit dem Dienst können Sie Ihr Suchfeld auf soziale Plattformen eingrenzen. Dank spezieller Filter können Sie schnell Beiträge und Kommentare finden, die Ihren Kriterien entsprechen: Sprache, Veröffentlichungsdatum und Site-Name.

Warum brauchen Sie das?

BoardReader kann für PR-Spezialisten und andere Medienspezialisten nützlich sein, die an der Meinung der Massen zu bestimmten Themen interessiert sind.

Abschließend

Das Leben alternativer Suchmaschinen ist oft vergänglich. Lifehacker fragte den ehemaligen Generaldirektor der ukrainischen Niederlassung von Yandex, Sergei Petrenko, nach den langfristigen Aussichten solcher Projekte.


Sergej Petrenko

Ehemaliger Generaldirektor von Yandex.Ukraine.

Was das Schicksal alternativer Suchmaschinen angeht, ist es einfach: Es handelt sich um Nischenprojekte mit einem kleinen Publikum, daher ohne klare kommerzielle Aussichten oder im Gegenteil mit völliger Klarheit über deren Abwesenheit.

Schaut man sich die Beispiele im Artikel an, erkennt man, dass sich solche Suchmaschinen entweder auf eine enge, aber beliebte Nische spezialisieren, die vielleicht noch nicht so groß geworden ist, dass sie auf dem Radar von Google oder Yandex auffällt, oder sie testen eine ursprüngliche Hypothese im Ranking, die in der regulären Suche noch nicht anwendbar ist.

Wenn sich beispielsweise herausstellt, dass eine Suche auf Tor plötzlich gefragt ist, das heißt, dass Ergebnisse von dort von mindestens einem Prozentsatz des Google-Publikums benötigt werden, dann beginnen natürlich normale Suchmaschinen, das Problem zu lösen, wie das geht Finden Sie sie und zeigen Sie sie dem Benutzer. Wenn das Verhalten des Publikums zeigt, dass für einen erheblichen Teil der Benutzer bei einer erheblichen Anzahl von Suchanfragen Ergebnisse ohne Berücksichtigung benutzerabhängiger Faktoren relevanter erscheinen, dann werden Yandex oder Google damit beginnen, solche Ergebnisse zu liefern.

„Besser sein“ bedeutet im Kontext dieses Artikels nicht „in allem besser sein“. Ja, in vielerlei Hinsicht sind unsere Helden weit von Yandex entfernt (sogar weit von Bing). Aber jeder dieser Dienste bietet dem Benutzer etwas, das die Giganten der Suchbranche nicht bieten können. Sicher kennen Sie auch ähnliche Projekte. Teilen Sie es mit uns – lassen Sie uns diskutieren.

Die Maschinen müssen funktionieren.
Die Menschen müssen nachdenken.

Der Kurs „Professionelle Internetsuche“ ist eine komfortable Möglichkeit, das kompetente und effektive Suchen und Finden zu erlernen notwendige Informationen im Netz.

Was Fachmann suchen?

Internet-Paradoxon ist, dass Informationen immer mehr werden Mehr, aber finden notwendig Informationen werden es wird schwieriger. Professionelle Suche ist effiziente Suche notwendig Und zuverlässig Information.
IN moderne Welt Informationen werden zu Kapital und das Internet wird zu einem bequemen Mittel, um sie zu erhalten, weshalb die Fähigkeit, wertvolle Informationen zu finden, eine Person auszeichnet erstklassiger Profi. Eine professionelle Suche sollte immer effektiv sein. Darüber hinaus suchen Fachleute bei der Suche nicht nur nach dem Ort, an dem die Informationen gespeichert sind, sondern bewerten auch die Autorität der Ressource, Relevanz, Genauigkeit und Vollständigkeit der veröffentlichten Informationen. Dabei helfen uns Internet-Heuristiken – eine Reihe nützlicher Suchregeln, Auswahlkriterien und Auswertung von Netzwerkinformationen.

Was wirst du lernen und was wirst du lernen?

Haben Sie gesucht und konnten es nicht finden? Dann wird Ihnen der Kurs von großem Nutzen sein. Du wirst kriegen ausführliche Suchhinweise etwas, das es bereits im Internet gibt, aber auf den ersten Blick scheint es einfach unmöglich zu sein, es zu finden... Vielleicht! Du wirst es lernen, So suchen Sie, um zu finden! Jede Lektion basiert auf einer Kombination aus Wissen und Erfahrung. alle erhalten Wissen wird in der Praxis getestet.

Während des Kursunterrichts Du wirst es lernen, wie sich das moderne Internet entwickelt und wie elektronische Informationen verbreitet werden, wie Kataloge erstellt werden und wie Suchmaschinen funktionieren, warum Metasuchmaschinen benötigt werden und woher das „verborgene“ Web kommt, wie sich Foren von Blogs unterscheiden und was Fundraising ist.

Während Workshops Du wirst es lernen Verwenden Sie die Abfragesprache richtig, wählen Sie Schlüsselwörter mit Bedacht aus, finden Sie Informationen im „versteckten“ Web, finden Sie die erforderlichen Bilder und Dateien, bewerten Sie die öffentliche Meinung in der Blogosphäre, suchen Sie Persönliche Angaben und vor allem - die Zuverlässigkeit, Relevanz und Vollständigkeit der gefundenen Informationen richtig einzuschätzen.

Mit dem Internet-Suchkurs können Sie Ihre Kenntnisse deutlich weiterentwickeln kognitive, Informations- und Kommunikationsfähigkeiten.

Welche Themen werden im Kurs „Professional Search“ behandelt?

Ziel des Kurses ist es, in einem Monat die Möglichkeiten und Feinheiten der modernen Suche nach beruflichen Informationen im Internet zu vermitteln.

Jede Lektion (Modul) beinhaltet Vorlesung, Seminar in einem Forumformat, prüfen den behandelten Stoff zu beherrschen, sowie mehrere Übungen und Suchaufgaben.

Der aktualisierte Kurs umfasst wöchentliche einstündige Webinare – interaktive virtuelle Online-Seminare, die sich der Diskussion der Schlüsselaufgaben der professionellen Internetsuche widmen.

Jedes Schulungsmodul ist ausgestattet nützliche Zusatzmaterialien zu Kursthemen und handouts zum Ausdrucken.

Der thematische Plan des Kurses besteht aus 10 miteinander verbundenen Modulen:

1. Internet: Geschichte, Technologie und Internetforschung.

2. Informationssuche. Verzeichnisse durchsuchen.

3. Informationsabrufsysteme. IPS-Nahaufnahme (Google, Yandex und andere).

4. Metasuchmaschinen und Programme.

5. Internet-Helpdesk: Sachverhaltssuche in Enzyklopädien, Nachschlagewerken, Wörterbüchern.

6. Bibliografische Suche: Bibliotheken, Kataloge, Programme.

7. Dokumentarische Suche: elektronische Dokumente, elektronische Bibliotheken, elektronische Zeitschriften.

8. „Verstecktes“ Web: Durchsuchen Sie Multimedia, Datenbanken, Wissensdatenbanken und Dateien.

9. Suchen Sie nach Nachrichten(Blogs und Foren), Kontakte, Institutionen, Fundraising.

10. Informationsabrufstrategien: Verallgemeinerung der Internet-Heuristik-Fähigkeiten.

Warum ist das Studium ein Fernstudium?

Der Fernstudiengang hat ein Ganzes verschiedene Vorteile.

Erstens sind jeder Unterrichtsstunde nicht eine oder zwei Unterrichtsstunden pro Woche zugeteilt, sondern ganze Woche. Sie können den Vorlesungsstoff ohne Eile beherrschen und verarbeiten, Übungen und Suchaufgaben durchführen.

Zweitens ein Fernstudium interaktiv. Das bedeutet, dass Sie jederzeit nachfragen, klären und beim Lehrer herausfinden können, was Ihnen wichtig erscheint. Ihre Frage bleibt nicht unbeantwortet und komplexe Suchaufgaben können in der Gruppe besprochen werden, um die einzelnen Fähigkeiten im Vergleich zu bewerten.

Drittens können Sie Lernen Sie zu einem für Sie passenden Zeitpunkt und Sie müssen keine Zeit damit verschwenden, zu den Kursen zu fahren. Darüber hinaus können Sie überall auf der Welt studieren, wo es Zugang zum Internet gibt.

Was ist am besten für den Kurs?

Der Kurs „Internet-Heuristik“ dauert einen Monat und besteht aus 10 Modulen. Jedes Modul besteht aus „Quanten“-Lektionen – sie ermöglichen es Ihnen, das für die Beherrschung neuer Materialien erforderliche Tempo beizubehalten. Preis pro Modul – nur 300 Rubel Für alle Kurse zahlen Sie nur 3000 Rubel. Bitte beachten Sie, dass Sie keine zusätzlichen Lehrbücher kaufen müssen; der Kurs ist vollständig mit allen notwendigen Lehrmaterialien ausgestattet. Wenn Sie den Kurs erfolgreich abschließen, erhalten Sie ein Zertifikat der Moskauer Staatlichen Universität für den Abschluss des Kurses „Professionelle Internetsuche“.

Wenn Sie den Einfallsreichtum des Internets erlernen möchten, müssen Sie einen geeigneten Zeitpunkt für die Teilnahme am Kurs und die Anmeldung auswählen (klicken Sie einfach auf den Anmeldelink gegenüber dem geeigneten Zeitfenster oben auf der Seite)!

Nach der Anmeldung haben Sie noch Zeit zum Nachdenken und zur endgültigen Entscheidung. Übrigens können Sie sich treffen

Einführung

Derzeit verbindet das Internet Hunderte Millionen Server, auf denen Milliarden verschiedener Websites und Websites gehostet werden separate Dateien enthält verschiedene Arten von Informationen. Dies ist ein riesiger Informationsspeicher. Für die Suche nach Informationen im Internet gibt es verschiedene Methoden.

Suche nach bekannter Adresse. Die notwendigen Adressen werden aus Verzeichnissen entnommen. Wenn Sie die Adresse kennen, geben Sie sie einfach in die Adressleiste des Browsers ein.

Beispiel 1. www.gov.ru ist ein Server russischer Regierungsbehörden.

Konstruieren einer Adresse durch den Benutzer. Wenn Sie das System zur Bildung von Internetadressen kennen, können Sie bei der Suche nach Websites Adressen erstellen.

Zum Schlüsselwort (dem Namen eines Unternehmens, Unternehmens, einer Organisation oder einem einfachen englischen Substantiv) müssen Sie eine thematische oder geografische Domäne hinzufügen und Ihre Intuition verbinden.

Beispiel 2. Kommerzielle Webseitenadressen:

www.samsung.com (SAMSUNG-Unternehmen),

www.mtv.com (MTV-Musiknachrichten).

Beispiel 3. Adressen von Bildungseinrichtungen:

www.ntu.edu ( Nationaluniversität USA).

Internet-Suchmaschinen

Für die Suche nach Informationen im Internet wurden spezielle Informationsabrufsysteme entwickelt. Suchmaschinen haben eine reguläre Adresse und werden als Webseite mit Inhalt angezeigt besondere Mittel um die Suche zu organisieren (Suchbegriff, Themenkatalog, Links). Um eine Suchmaschine aufzurufen, geben Sie einfach deren Adresse in die Adresszeile des Browsers ein.

Nach Angaben des Statistikdienstes LiveInternet.ru ist die Verteilung der Suchmaschinen in Russland ungefähr wie folgt:

2) Google – 35,0 %

3) Suche Mail.ru – 8,3 %

4) Wanderer – 0,9 %

Entsprechend der Methode zur Organisation von Informationen werden Informationsabrufsysteme in zwei Typen unterteilt: Klassifizierung (Rubrikatoren) und Wörterbuch.

Kategorien (Klassifikatoren)- Suchmaschinen, die eine hierarchische (Baum-)Organisation von Informationen verwenden. Bei der Suche nach Informationen durchsucht der Benutzer thematische Überschriften und schränkt das Suchfeld schrittweise ein (wenn Sie beispielsweise die Bedeutung eines Wortes ermitteln müssen, müssen Sie zuerst ein Wörterbuch im Klassifikator suchen und es dann darin finden). das richtige Wort).



Wörterbuchsuchmaschinen- Dies sind leistungsstarke automatische Software- und Hardwaresysteme. Mit ihrer Hilfe werden Informationen im Internet eingesehen (gescannt). Daten zum Standort dieser oder jener Informationen werden in spezielle Indexverzeichnisse eingetragen. Als Antwort auf eine Anfrage wird eine Suche gemäß der Abfragezeichenfolge durchgeführt. Dadurch werden dem Nutzer diejenigen Adressen (URLs) angeboten, unter denen das gesuchte Wort oder die gesuchte Wortgruppe zum Zeitpunkt des Scanvorgangs gefunden wurde. Durch Auswahl einer der vorgeschlagenen Linkadressen können Sie zum gefundenen Dokument gelangen. Die meisten modernen Suchmaschinen sind gemischt.

Die bekanntesten und beliebtesten Suchmaschinen:

Es gibt Systeme, die sich auf die Suche spezialisiert haben Informationsressourcen in verschiedene Richtungen.

https://my.mail.ru

https://ru-ru.facebook.com

https://twitter.com

https://www.tumblr.com

https://www.instagram.com usw.

Themensuchmaschinen:

Suchen Software:

Kataloge (thematische Linksammlungen mit Anmerkungen):

http://www.atrus.ru

Regeln für die Ausführung von Anfragen

Der Hilfebereich jeder Suchmaschine bietet Informationen zur Suche und zum Erstellen einer Abfragezeichenfolge. Nachfolgend finden Sie Informationen zu einer typischen, „durchschnittlichen“ Abfragesprache.

Einfache Anfrage

Geben Sie ein Wort ein, das das Suchthema definiert. In der Suchmaschine Rambler.ru reicht es beispielsweise aus, Folgendes einzugeben: Automatisierung.

Es werden Dokumente gefunden, die die in der Anfrage angegebenen Wörter enthalten. Alle Formen russischer Wörter werden erkannt; die Groß-/Kleinschreibung wird in der Regel ignoriert.

Sie können in der Abfrage das Zeichen „*“ oder „?“ verwenden. Zeichen "?" In einem Schlüsselwort wird ein Zeichen ersetzt, an dessen Stelle ein beliebiger Buchstabe stehen kann, und das „*“-Zeichen ist eine Folge von Zeichen.

Mit der Abfrage „Automatik“* können Sie beispielsweise Dokumente finden, die die Wörter „Automatik“, „Automatisierung“ usw. enthalten.

Komplexe Anfrage

Oft besteht die Notwendigkeit, Schlüsselwörter zu kombinieren, um spezifischere Informationen zu erhalten. In diesem Fall werden zusätzliche Verknüpfungswörter, Funktionen, Operatoren, Symbole, Operatorkombinationen, getrennt durch Klammern, verwendet.

Beispielsweise bedeutet die Abfrage „Musik &“ (Beatles Beatles), dass der Benutzer nach Dokumenten sucht, die die Wörter „Musik und Beatles“ oder „Musik und Beatles“ enthalten.

Liste der Suchserver und Verzeichnisse

Adresse Beschreibung
www.excite.com Suchmaschine mit Website-Bewertungen und Leitfäden
www.alta-vista.com Suchserver, erweiterte Suchfunktionen verfügbar
www.hotbot.com Suchserver
www.ifoseek.com Suchserver (einfach zu bedienen)
www.ipl.org Internet Public Library, eine öffentliche Bibliothek, die im Rahmen des World Village-Projekts betrieben wird
www.wisewire.com WiseWire – Organisation der Suche mit künstliche Intelligenz
www.webcrawler.com WebCrawler – Suchserver, einfach zu bedienen
www.yahoo.com CatalogWeb und Schnittstelle für den Zugriff auf die Volltextsuche auf dem AltaVista-Server
www.aport.ru Aport – Russischsprachiger Suchserver
www.yandex.ru Yandex – Russischsprachiger Suchserver
www.rambler.ru Rambler – Russischsprachiger Suchserver
Internet-Hilferessourcen
www.yellow.com Gelbe Seiten im Internet
monk.newmail.ru Suchmaschinen mit verschiedenen Profilen
www.top200.ru Top 200 Websites
www.allru.net
www.ru Katalog russischer Internetressourcen
www.allru.net/z09.htm Bildungsressourcen
www.students.ru Russischer Studentenserver
www.cdo.ru/index_new.asp Zentrum für Fernunterricht
www.open.ac.uk UK Open University
www.ntu.edu US-Nationaluniversität
www.translate.ru Elektronischer Textübersetzer
www.pomorsu.ru/guide.library.html Liste der Links zu Netzwerkbibliotheken
www.elibrary.ru Wissenschaftliche elektronische Bibliothek
www.citforum.ru Digitale Bibliothek
www.infamed.com/psy Psychologische Tests
www.pokoleniye.ru Website der Internet Education Federation
www.metod.narod.ru Bildungsressourcen
www.spb.osi.ru/ic/distant Fernunterricht im Internet
www.examen.ru Prüfungen und Tests
www.kbsu.ru/~book/ Lehrbuch der Informatik
Mega.km.ru Enzyklopädien und Wörterbücher

Professionelle Informationssuche im Internet

Die Suche nach Informationen ist eine der häufigsten und gleichzeitig schwierigsten Aufgaben, denen sich jeder Benutzer im Internet stellen muss. Wenn jedoch für ein normales Mitglied der Online-Community Kenntnisse über Methoden zur effektiven Informationsbeschaffung eine wünschenswerte, aber keineswegs obligatorische Eigenschaft sind, dann ist dies für Fachleute der Fall Informationsaktivitäten Die Fähigkeit, sich schnell in Internetressourcen zurechtzufinden und die benötigten Quellen zu finden, gehört zu den Grundqualifikationen.

Der Grund für die Schwierigkeiten, die bei der Suche nach Informationen im Internet auftreten, wird durch zwei Hauptfaktoren bestimmt. Erstens ist die Anzahl der Quellen im Internet extrem groß. Grobste Schätzungen gehen Ende 2001 von einer geschätzten Zahl von 7,5 Milliarden Dokumenten aus, die sich auf Servern rund um den Globus befinden. Zweitens ist das Informationsangebot im Internet nicht nur enorm umfangreich, sondern auch äußerst dynamisch. In der halben Minute, die Sie damit verbracht haben, die ersten Zeilen dieses Abschnitts zu lesen, erschienen etwa hundert neue oder geänderte Dokumente im virtuellen Universum, Dutzende wurden an neue Adressen verschoben und einige hörten für immer auf zu existieren. Das Internet „schläft“ nie, so wie auch unser Planet nie „schläft“, auf dem sich eine Welle menschlicher Geschäftsaktivitäten kontinuierlich in exakter Übereinstimmung mit dem Wechsel der Zeitzonen bewegt.

Im Gegensatz zu einer stabilen und kontrollierten Sammlung von Dokumenten in einer Bibliothek haben wir es im Internet mit einem riesigen und sich ständig verändernden Informationsangebot zu tun, dessen Suche nach Daten ein sehr, sehr komplexer Prozess ist. Die Situation erinnert oft stark an das bekannte Problem, die Nadel im Heuhaufen zu finden, und manchmal bleiben Informationen von großem Wert allein aufgrund der Schwierigkeit, sie zu finden, unbeansprucht.

Die meisten Benutzer von global Computernetzwerke. Sowohl Amateure als auch Profis verwenden oft die gleichen Werkzeuge. Allerdings variieren die Ergebnisse der Recherchen und der dafür aufgewendete Zeitaufwand stark.

Der Zweck dieses Abschnitts besteht darin, sich ausführlich mit den Werkzeugen und Methoden des Informationsabrufs vertraut zu machen und stabile Fähigkeiten für die professionelle Suche im Internet nach allen Arten von Daten zu entwickeln: von Texten in jedem Format bis hin zu Videos und Animationen.

Es ist manchmal sehr schwierig, die notwendigen und relevanten Informationen im Internet zu finden. Die Menge an Informationsmüll im Internet wächst wie ein Schneeball, und manchmal ist es einfach unmöglich, mit herkömmlichem Yandex und Google an die Daten zu gelangen, die Sie wirklich benötigen. Das Buch, das Sie in Ihren Händen halten, wird die Effizienz Ihrer Informationssuche im Internet um ein Vielfaches steigern. Es beschreibt Techniken, Suchseiten und Programme zum Abrufen spezialisierter Informationen. Berücksichtigt werden moderne Arten der Internetsuche: universelle Suche, vertikale Suche, Metasuchsysteme, Aufbau persönlicher Suchmaschinen, Suche nach audiovisuellen Inhalten, Suche im versteckten Internet. Für alle betrachteten Systeme werden deren Eigenschaften und Tipps für eine möglichst effektive Nutzung angegeben.

Einführung

Die Internetsuche ist ein wichtiger Bestandteil der Arbeit im Internet. Kaum jemand weiß genau, wie viele Webressourcen es im modernen Internet gibt. Auf jeden Fall geht die Zahl in die Milliarden. Um die zu einem bestimmten Zeitpunkt benötigten Informationen nutzen zu können, sei es für die Arbeit oder für Unterhaltungszwecke, müssen Sie sie zunächst in diesem sich ständig erneuernden Ozean an Ressourcen finden. Dies ist keine leichte Aufgabe, da die Informationen im modernen Internet nicht strukturiert sind, was zu Problemen beim Auffinden führt. Es ist kein Zufall, dass die eigentümlichen „Fenster“ dazu führen Informationsraum Internet-Suchmaschinen sind geworden

Es ist unwahrscheinlich, dass es unter den Internetnutzern Menschen gibt, die noch nie große universelle Suchmaschinen genutzt haben. Die Namen Google, Yandex und einige andere große Maschinen sind in aller Munde. Sie meistern die alltäglichen Suchaufgaben im Internet erstaunlich gut, und oft machen sich Nutzer gar nicht erst auf die Suche nach einem Ersatz. Gleichzeitig beläuft sich die Zahl der Internet-Suchmaschinen unserer Zeit auf Tausende. Die Gründe für eine solche Vielfalt an alternativen Maschinen haben unterschiedliche Wurzeln. Einige Projekte versuchen, durch sorgfältige Arbeit mit nationalen Internetressourcen direkt mit den Weltmarktführern zu konkurrieren. Andere bieten Abfragefunktionen, die bei bekannten Suchmaschinen nicht verfügbar sind. Eine beträchtliche Anzahl alternativer Suchmaschinen ist auf die Suche nach einem bestimmten Themenbereich oder einer bestimmten Art von Inhalten spezialisiert und erzielt bei der Lösung dieser Probleme beeindruckende Ergebnisse. Wie dem auch sei, die Aufnahme solcher Suchmaschinen in das eigene Arsenal an Internet-Suchwerkzeugen des Benutzers kann dessen Qualität erheblich verbessern. Allerdings gibt es hier eine Nuance: Man muss über solche Maschinen Bescheid wissen und deren Fähigkeiten nutzen können.

Wir gehen davon aus, dass die Leser dieses Buches bereits mit den Suchtechniken mithilfe universeller Suchmaschinen vertraut sind. Es war so gut, dass sie die mit ihrer Verwendung verbundenen Einschränkungen spürten. Höchstwahrscheinlich haben solche Leute bereits versucht, nach bestimmten zusätzlichen Tools zu suchen und diese zu verwenden. Das gedruckte Wort ignoriert das Thema der Internetsuche nicht: In regelmäßigen Abständen erscheinen Artikel und Bücher werden veröffentlicht. Aber ihre Helden sind in der Regel dieselben – mehrere führende universelle Suchmaschinen. Das Besondere an diesem Buch ist, dass es versucht, das gesamte Spektrum moderner Suchlösungen abzudecken. Hier finden Sie Beschreibungen und Empfehlungen zur Nutzung der besten modernen Dienste zur Lösung der häufigsten Suchprobleme. Dieses Buch richtet sich an Personen, die viel im Internet arbeiten und das Netzwerk nutzen, um die Informationen zu finden, die sie benötigen – sei es geschäftlich, im Studium oder im Hobbybereich.

Damit eine Internetsuche erfolgreich ist, müssen zwei Bedingungen erfüllt sein: Die Suchanfrage muss gut formuliert sein und sie muss an den richtigen Stellen gestellt werden. Mit anderen Worten: Der Nutzer muss einerseits seine Suchinteressen in die Sprache der Suchanfrage übersetzen können und andererseits über gute Suchmaschinenkenntnisse verfügen. verfügbaren Werkzeuge Suche, ihre Vor- und Nachteile, die es Ihnen ermöglichen, im Einzelfall die am besten geeigneten Suchwerkzeuge auszuwählen.

Derzeit gibt es keine einzige Ressource, die alle Anforderungen der Internetsuche erfüllt. Wenn Sie Ihre Suche ernst nehmen, müssen Sie daher zwangsläufig unterschiedliche Tools verwenden, und zwar jeweils im jeweils am besten geeigneten Fall.

Kapitel 1

Universelle Internet-Suchmaschinen

Universelle Internetsuchmaschinen sind das wichtigste und bekannteste Mittel zur Internetsuche. Solche Suchmaschinen bieten eine maximale Abdeckung verschiedener Ressourcen. Die größten und beliebtesten Suchmaschinen gehören zum universellen Typ. Das sind wirklich leistungsstarke Lösungen mit Große anzahl Funktionen und Tools, die vielen Benutzern oft nicht bewusst sind. Wenn Sie die Merkmale und Möglichkeiten der universellen Suche verstehen, können Sie die Stärken und Schwächen solcher Systeme erkennen und bewusst die effektivsten Suchwerkzeuge auswählen.

Der Markt für universelle Suchmaschinen ist recht groß. In diesem Kapitel betrachten wir nur die leistungsstärksten Maschinen, die mit Abfragen auf Russisch angemessen arbeiten können. Das Kapitel beginnt mit Geschichten über die Anführer der russischen Suche – die Systeme Google.ru und Yandex. Über jede dieser Suchmaschinen wurden Bücher und viele Artikel geschrieben. Wir konzentrieren uns auf die Hauptfunktionen, die für den Endbenutzer wichtig sind, und versuchen auch, deren Stärken zu identifizieren.

Sie werden von einer neuen Suchentwicklung der Microsoft Corporation begleitet – dem Bing-System, das bisher merklich an Aufmerksamkeit verloren hat, sowie einer nützlichen und recht leistungsstarken Suchmaschine Exalead, deren Vorteil darin liegt gute Unterstützung Suche in europäischen Internetressourcen. Dieses System– ist immer noch ein seltener Gast im Sucharsenal unserer Nutzer und wird daher ausführlicher betrachtet als die anderen.

In diesem Kapitel, bei der Überprüfung Google-Systeme und Yandex konzentrieren wir uns nur auf Websuchfunktionen. Die Suche in speziellen Datenbanken dieser Projekte wird in den folgenden Kapiteln zur Bild- und Videosuche besprochen. Bei anderen universellen Suchmaschinen werden Informationen zur Multimedia-Suche sofort nach der Einführung bereitgestellt.

Da drei der vier Helden dieses Kapitels ausländischer Herkunft sind, stellen wir sofort fest, dass wir nur die Fähigkeiten ihrer russischen Versionen analysieren. Tatsache ist, dass einige Funktionen ausländischer Systeme, insbesondere experimenteller, häufig nur in den ursprünglichen, meist englischsprachigen Versionen der Dienste verfügbar sind.

Google

Die Google-Suchmaschine gilt zu Recht als weltweit führend in der modernen Internetsuche. Gegründet 1998 Google-Unternehmen zählt bis heute zu den führenden Trendsettern im Bereich Internetsuche und Webservices.

Google-Entwickler zeichnen sich seit jeher durch ein erhöhtes Augenmerk auf die Verbesserung der Algorithmen ihrer Suchmaschine sowie einen angemessenen Konservatismus im Bereich der Benutzeroberfläche aus. Die Möglichkeiten zum Verfassen einer Suchanfrage bei Google können als klassisch bezeichnet werden, auch die Methoden zur Anzeige von Suchergebnissen sind zu einer Art Standard geworden. In letzter Zeit Google-Entwickler nahm in diesen Bereichen gravierende Änderungen vor – die größte Suchmaschine begann im Vergleich zu ihren jungen Konkurrenten zu altmodisch auszusehen.

Google verfügt über eine der weltweit größten Indexdatenbanken, die ein breites Spektrum an Informationsquellen bereitstellt. Die Google-Indexinformationen werden in mehreren vertikalen Datenbanken konsolidiert. Neben der bekanntesten „Web“-Datenbank gibt es mehrere Multimedia-Datenbanken („Bilder“, „Video“), die mit Quellen aktueller Informationen und Nachrichten in RSS-Feeds arbeiten, die „News“-Datenbank sowie die „Blogs“-Datenbank, die Online-Tagebücher indiziert. Darüber hinaus bietet Google eine große Auswahl an zusätzlichen Ressourcen, darunter einen Kartendienst, ein Website-Verzeichnis und einen Frage-Antwort-Dienst. Diese Ressourcen können auch als Suchwerkzeuge betrachtet werden.

In der Datenbank „Web“ bietet Google einfache und erweiterte Suchmodi zum Verfassen einer Suchanfrage. Im einfachen Suchmodus stehen nur die folgenden zusätzlichen Tools zur Verfügung: virtuelle Tastatur. Die erweiterte Suche bietet mehr Optionen. Da das erweiterte Suchformular in fast allen Google-Suchprodukten verfügbar ist, schauen wir uns es genauer an (Abb. 1.1).

Yandex

1997 offiziell der breiten Öffentlichkeit vorgestellt, entwickelte sich die Suchmaschine Yandex erfolgreich und wurde zehn Jahre später erstmals zu einer der zehn größten Suchmaschinen der Welt. Im russischen Segment des Internets hat er sich eine Spitzenposition erarbeitet, die er trotz wachsender Konkurrenz noch nicht aufgeben will. Die Besonderheiten von Yandex seit Beginn seiner Existenz sind eigene originelle Algorithmen zur Bestimmung der Relevanz von Suchergebnissen, flexible Tools für die Arbeit mit Abfragetexten und die Berücksichtigung der Besonderheiten der Morphologie der russischen Sprache bei deren Verarbeitung.

Yandex setzt auf eigene Indexdatenbanken. Neben der Suche nach Webdokumenten bietet das System eine gute Auswahl an Fachressourcen und Zusatzdiensten. Yandex arbeitet derzeit mit Bildern, Videos, Nachrichten, Blogs und Wörterbüchern. Leistungsstarke Suchfunktionen sind auch in unserem eigenen Kartendienst und Produktsuchsystem enthalten. Darüber hinaus unterhält Yandex ein eigenes Website-Verzeichnis. Die Stärke von Yandex ist sein entwickeltes lokales Suchprogramm, das für unsere Benutzer besonders wichtig ist. Yandex bietet Drittentwicklern Zugriff auf seine Datenbanken. Daher nutzen viele russische alternative Internetsuchprojekte auf die eine oder andere Weise Yandex-Ressourcen. Außer konventionelles System Die Suche bietet auch eine verkürzte Version von Yandex an, verfügbar unter ya.ru. Die Oberfläche dieser Version besteht nur aus einem Abfrageeingabefeld und einer Suchschaltfläche.

Die Webdokumentsuche bietet einfache und erweiterte Suchmodi. Eine einfache Suche bietet keine Filter, was durch die Möglichkeit zur automatischen Analyse von Abfragen in natürlicher Sprache, die sichere Verarbeitung relativ langer Abfragen sowie ein System zur automatischen Abfragevervollständigung ausgeglichen wird. Die maximale Länge einer Anfrage beträgt vierzig Wörter.

Das erweiterte Suchformular bietet nur ein Feld zum Stellen einer Anfrage. Es wird empfohlen, logische Operatoren, die Abfragewörter verbinden, glücklicherweise manuell einzugeben. Yandex verfügt über eine ziemlich detaillierte Abfragesprache. Die restlichen Werkzeuge des erweiterten Suchformulars sind verschiedene Filter (1.4).

Bing

Die Geschichte der Internetsuche von Microsoft kann nicht als einfach bezeichnet werden. Algorithmen, verwendete Datenbanken und natürlich auch Namen haben sich bei Diensten, die der Öffentlichkeit regelmäßig angeboten werden, immer wieder geändert. Bis Anfang der 2000er Jahre verfügte die Suchmaschine über keine eigenen Datenbanken und arbeitete mit externen Indizes von AltaVista, Inktomi und Looksmart. Der ursprüngliche Name MSN Search wurde bis 2006 verwendet, dann wurde die Änderung von Suchmaschinennamen für mehrere Jahre zur Microsoft-Tradition.

Zusammen mit der endgültigen Umstellung auf die Suche in eigenen Indizes wurde MSN Search zunächst in Windows LiveLive Search umbenannt. Schließlich wurde Live Search im Frühsommer 2009 durch ein neues Suchprojekt, Bing, ersetzt.

„Bing wird es Ihnen ermöglichen, die Suche nach Informationen im Internet aus einer anderen Perspektive zu betrachten und Benutzern dabei zu helfen, wichtige Entscheidungen zu treffen“, lautete der Anfang der Pressemitteilung von Microsoft zum Start von Bing. Die Bestrebungen der Entwickler waren klar: Suchmaschinen von Microsoft waren trotz aller Bemühungen im Westen den Spitzenreitern Google und Yahoo! durchweg in der Beliebtheit unterlegen. Wenn wir über die russischsprachigen Versionen früherer Microsoft-Suchprojekte sprechen, dann waren sie hinsichtlich der Menge und Qualität der gefundenen Links den großen russischen Suchmaschinen deutlich unterlegen. Um mit der Konkurrenz gleichzuziehen, setzten die Bing-Entwickler auf die Verbesserung der Suchqualität und die Einführung neuer Technologien, von denen viele zusammen mit den Unternehmen, die sie entwickelt hatten, übernommen wurden.

Es ist zu beachten, dass der russischen Version von Bing, wie den meisten anderen lokalisierten Versionen, einiges fehlt zusätzliche Funktionen, zum Beispiel Einkaufssuche. Da sie tatsächlich nur im Norden arbeiten. Amerika, es hat keinen Sinn, im Detail darauf einzugehen.

Exalead

Eine Besonderheit Europas, auch im Bereich der Internetsuche, ist die große Zahl an Landessprachen. Eine Suchmaschine, die behauptet, die führende in Europa zu sein, muss einfach nationale Segmente des Internets gut indizieren und Anfragen in zahlreichen europäischen Sprachen – sowohl den größten als auch den weniger verbreiteten – effizient verarbeiten. Gerade in diesem Bereich kann die europäische Entwicklung einen erheblichen Wettbewerbsvorteil gegenüber mächtigen ausländischen Konkurrenten erlangen. Das Exalead-System konkurriert derzeit ernsthaft um die Rolle einer solchen europäischen Suchmaschine. Dieses Projekt wurde im Rahmen des von der Europäischen Union geförderten Forschungsprogramms Quaere entwickelt.

Exalead verfügt über eigene Indexdatenbanken. Die wichtigsten Suchressourcen des Systems sind Datenbanken mit Webdokumenten, Bildern, Videos und Nachrichten. Startseite Exalead bietet Anpassungsoptionen. Auf dieser Seite können Sie Links zu Ihren Lieblingsseiten platzieren – diese werden in Form von grafischen Miniatur-Screenshots angezeigt. Dazu müssen Sie jedoch kostenlos ein Konto registrieren und Ihrem Browser erlauben, Exalead-Cookies zu speichern.

Exalead Web Search bietet einfache und erweiterte Suchmodi. Das erweiterte Suchformular wird wie in Bing direkt auf der Suchergebnisseite geöffnet. Beachten Sie, dass Exalead nicht nur ein bekanntes Formular mit einer Reihe zusätzlicher Felder bietet, sondern ein komplexes Dropdown-Menü, das die Rolle eines Assistenten zum Verfeinern eines Suchvorgangs übernimmt Abfrage (Abb. 1.7). Wenn Sie das eine oder andere Element im Assistentenmenü auswählen, werden der Abfragezeichenfolge neue Elemente und bei Bedarf Operatoren und Sonderzeichen hinzugefügt.


Sprechen Sie darüber, was in unserer Zeit passiert Informationstechnologien und das endlose Wachstum des Datenvolumens, das sowohl dem Einzelnen als auch der Gesellschaft zur Verfügung steht, gibt es viele Probleme bei der Verarbeitung von Informationen und der Suche danach – das ist bereits Blasphemie. Wer wirft dieses Thema nicht auf? Und um Sie nicht mit subjektiven und teilweise objektiven Urteilen aus verschiedenen Informationsquellen zum Problem zu belasten, werde ich direkt zu seiner Lösung übergehen. Heute sprechen wir über die Suche. Also um Programme und seriöse Informationssysteme, die nach den Dokumenten und Daten suchen, die wir brauchen.

Upgrade „Direktsuche“

Vor nicht allzu langer Zeit, als Bäume noch groß waren und es noch Informationen gab lokales Netzwerk Es gab nicht so viele Unternehmen, jede Suche wurde durch eine banale Suche einer Handvoll durchgeführt verfügbare Dateien und konsequente Überprüfung ihrer Namen und Inhalte. Eine solche Suche wird als direkte Suche bezeichnet, und Programme (Dienstprogramme), die die direkte Suchtechnologie verwenden, sind traditionell in allen vorhanden Betriebssysteme und Werkzeugpakete. Aber auch die Kraft moderne Computer für eine schnelle und adäquate Suche in riesigen Datenmengen bei der Direktsuche nicht aus. Ein paar hundert Dokumente auf einer Festplatte zu durchsuchen und eine riesige Bibliothek und mehrere Dutzend Postfächer zu durchsuchen, sind zwei verschiedene Dinge. Daher geraten Direktsuchprogramme heute deutlich in den Hintergrund – wenn es um universelle Tools geht.

Natürlich ist diese Art der Suche im Unternehmensbereich schon lange nicht mehr gefragt. Die Volumina sind nicht gleich. Und deshalb gibt es seit vielen Jahren und in letzter Zeit eindeutig Technologien, die in der Lage sind, schnelle und schnelle Ergebnisse zu erzielen genaue Suche Dokumente verschiedener Formate und aus verschiedenen Quellen sind mehr als relevant. Vor nicht allzu langer Zeit verkündete Microsofts „Vater“ Bill Gates, offenbar neidisch auf den phänomenalen Erfolg der Internetsuchmaschine Google, auf einer Pressekonferenz den Wunsch der Softwareindustrie (und nicht nur), auf jede erdenkliche Weise einen Beitrag zu leisten. Entwicklung und Vertiefung der Entwicklung von Suchmaschinen und Technologien. Aber es ist noch zu früh, um ein phänomenal funktionierendes Programm von Microsoft oder einen konkurrierenden Server im Internet zu erstellen (MSN erreicht Google immer noch nicht). Wenden wir uns daher den bestehenden Entwicklungen zu. Index, Abfrage, Relevanz

Moderne Technologien basieren auf zwei grundlegenden Prozessen. Zunächst erfolgt die Indizierung der verfügbaren Informationen und die Bearbeitung der Anfrage mit anschließender Ausgabe der Ergebnisse. Was das erste betrifft, kann jedes Programm (sei es eine Desktop-Suchmaschine, ein Unternehmensprogramm) verwendet werden Informationssystem oder Internetsuchmaschine) erstellt einen eigenen Suchbereich. Das heißt, es verarbeitet Dokumente und generiert einen Index dieser Dokumente (eine organisierte Struktur, die Informationen über die verarbeiteten Daten enthält). In Zukunft wird der erstellte Index für die Arbeit verwendet – um schnell eine Liste der erforderlichen Dokumente entsprechend der Anfrage zu erhalten. Was folgt, ist zwar technisch keineswegs einfach, aber für den Durchschnittsnutzer durchaus verständlich. Das Programm verarbeitet die Anfrage (unter Verwendung einer Schlüsselwortphrase) und zeigt eine Liste von Dokumenten an, die diese Schlüsselwortphrase enthalten. Da die Informationen in einem strukturierten Index enthalten sind, ist die Abfrageverarbeitung deutlich (zehn- und hundertmal!) schneller als bei der direkten Suche (die Auswahl der Dokumente erfolgt nicht durch Durchsuchen von Dateien, sondern durch Analyse). Textinformationen im Index).

Das Programm zeigt die gefundenen Dokumente in der resultierenden Liste nach Relevanz an – der Übereinstimmung des Dokuments mit dem Abfragetext. In verschiedenen Technologien gibt es natürlich unterschiedliche Methoden zur Suche und Bestimmung der Relevanz eines Dokuments (die Anzahl der „Vorkommen“ eines Wortes und seine Häufigkeit der Erwähnung im Dokument, das Verhältnis dieser Parameter zur Gesamtzahl der Wörter). im Dokument, der Abstand zwischen den Wörtern der Suchphrase in den durchsuchten Dateien usw.). Anhand dieser Parameter wird das „Gewicht“ des Dokuments ermittelt und abhängig davon erscheint eine bestimmte Datei in der Ergebnisliste an einer bestimmten Position. Bei der Internetsuche ist die Situation noch komplizierter. Tatsächlich müssen in diesem Fall viele andere Faktoren berücksichtigt werden (der Page Rank von Google ist ein Beispiel dafür). Dies ist jedoch ein Thema für einen separaten Artikel, daher gehen wir nicht auf die Bewertung von Suchmaschinen ein

In diesem Material werden die Fähigkeiten mehrerer beliebter Suchprogramme untersucht, die sich sowohl durch gute Geschwindigkeit als auch durch gute Funktionalität auszeichnen. Aber in Broschüren anzugeben ist eine Sache, aber unter den Blicken eines Experten zu stehen, eine ganz andere. Und es gab keine Experten mehr, nicht weniger ein Büro voller Leute, die gerne an der Software herumbastelten, um sie benutzerfreundlicher zu machen. Auf einem experimentellen Computer (Athlon 2,2 MHz, mit einer Kapazität Arbeitsspeicher 1 GB, 160 GB IDE Festplatte Seagate bei 7200 U/min und Windows-System XP) wurde eine Reihe von Programmen installiert: dtSearch Desktop, Ischeyka Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Für Tests wurde eine Textdatenbank mit Dokumenten erstellt Dokumentformate, txt und html mit einer Gesamtgröße von weder mehr noch weniger, sondern 20 Gigabyte. Eine Gruppe von Kameraden unter der Leitung Ihres bescheidenen Dieners testete, verglich und teilte ihre subjektiven Eindrücke von jeder Software. Lesen Sie unten eine Zusammenfassung der Ergebnisse. dtSearch Desktop

Ein Programm, das laut den Entwicklern den Anspruch erhebt, das schnellste, bequemste und beste zu sein Suchmaschine. Wie im Allgemeinen alle anderen aus dieser Rezension. Die dtSearch-Oberfläche ist recht einfach, einige Fenster oder Registerkarten sind jedoch etwas mit Elementen überladen, was die Verwendung schwierig erscheinen lässt. Aber in Wirklichkeit gibt es keine besonderen Schwierigkeiten. Der einzige wirklich unangenehme Punkt ist die fehlende Unterstützung der russischen Sprache durch die Software (obwohl das Programm nach Dokumenten in mehreren Sprachen suchen kann, ist seine Benutzeroberfläche ausschließlich auf Englisch).

Aber dtSearch ist eines der wenigen Programme, das Webseiten indizieren kann vom Benutzer angegeben„Tiefe“ (allerdings unter Berücksichtigung des „zusätzlichen Kaufs“ des dtSearch Spider-Zusatzkits). Dies gilt zusätzlich zur Unterstützung von Dateien auf der Festplatte in verschiedenen Textformaten und E-Mails aus Briefkasten Ausblick. Gleichzeitig kann das Programm nicht mit Datenbanken arbeiten, die aufgrund der darin enthaltenen großen Informationsmengen und ihrer weiten Verbreitung in Unternehmen und damit in Unternehmensnetzwerken ein Leckerbissen für Suchmaschinen sind. Es stellte sich heraus, dass die Geschwindigkeit der Indizierung von dtSearch-Dokumenten auf dem richtigen Niveau war. Mit Blick auf die Zukunft möchte ich sagen, dass dieses Programm die Indizierung einer bestimmten Informationsmenge auf einem Niveau mit einem anderen Konkurrenten – iSYS – bewältigt hat und mit ihm den zweiten Platz in der Liste der Top-Programme geteilt hat schnelle Systeme. dtSearch indizierte einen Test von 20 Gigabyte an Informationen in 6 Stunden und 13 Minuten und erstellte einen Index von 7,9 GB für spätere Suchanforderungen.

Was die Suchfunktionen betrifft, sind sie hier auf dem richtigen Niveau. Erstens verfügt dtSearch über eine morphologische Suche (Suche nach einem Wort in all seinen morphologischen Formen). Nutzen Sie diese Gelegenheit und befreien Sie sich beispielsweise von Gedanken wie „In welchem ​​Fall wurde ein bestimmtes Wort in dem von mir benötigten Dokument verwendet?“ Der Einsatz der morphologischen Suche ist fast immer gerechtfertigt und sollte daher in jeder professionellen Suchmaschine vorhanden sein.

Die Suche nach Ton ist selbst für professionelle Suchmaschinen eine nicht standardmäßige Funktion. Sein Kern besteht darin, dass das Programm nach Wörtern sucht, die genauso klingen wie das von Ihnen eingegebene Wort. Und das Beste daran ist, diese Funktion funktioniert auch für die russische Sprache! Wenn Sie beispielsweise in einer Suchanfrage das Wort „Ohr“ eingeben, werden Ihnen als Ergebnis nicht nur die Wörter „Ohr“, sondern auch „Ohr“ angezeigt.

Die Suche mit Fehlerkorrektur ist eine sehr wichtige Funktion. Wird verwendet, um nach Wörtern zu suchen, die enthalten Syntaxfehler- Dabei kann es sich beispielsweise sowohl um Tippfehler als auch um Fehler in Dokumenten handeln, die mithilfe von Zeichenerkennungssystemen erstellt wurden. Ein einfaches Beispiel: Sie suchen nach dem Wort Tastatur. In einigen Dokumenten ist das Wort „Tastatur“ enthalten. Es ist offensichtlich, dass es sich tatsächlich um das Wort „Tastatur“ handelt. Die Person hat beim Tippen nur einen Tippfehler gemacht. Bei einer Fehlerkorrektursuche wird also ein Dokument mit dem Wort „Tastatur“ erkannt und in das Ergebnis aufgenommen. Darüber hinaus gibt es in dtSearch eine Einstellung, mit der Sie den Grad möglicher fehlerhafter Zeichen ermitteln können.

Suche mit Synonymen. Diese Funktion verwendet eine Liste von Synonymen für verschiedene Wörter. Wenn Sie beispielsweise das Wort „schnell“ eingeben, findet das Programm auch die Wörter „hohe Geschwindigkeit“ und andere, die Synonyme für das Wort „schnell“ sind, sofern diese natürlich in der Synonymliste enthalten sind . Eine vorgefertigte Synonymliste wird nicht mit dem dtSearch-Programm geliefert, Sie können jedoch Listen im Internet verwenden (dafür ist eine Verbindung erforderlich, was nicht immer bequem ist) oder Sie können eine eigene Synonymliste erstellen .

Zusätzlich zu den aufgeführten Funktionen kann dtSearch nach Phrasen suchen, die aus Wörtern bestehen, die durch logische Operationen verbunden sind. Jedem Wort in einer Abfrage kann eine eigene „Gewichtung“, also Bedeutung, zugewiesen werden. Eine sinnvolle Möglichkeit besteht darin, ein Wörterbuch mit unwichtigen Wörtern zu verwenden, um diese bei der Suche nicht zu berücksichtigen. Dieses Wörterbuch ist jedoch ebenfalls leer und muss von Ihnen selbst ausgefüllt werden.

Schauen wir uns als Nächstes die Fähigkeiten des Programms bei der Arbeit im Netzwerk an. Tatsächlich bietet dtSearch keine spezifischen Funktionen für die Arbeit mit dem Netzwerk. Es ist jedoch durchaus möglich, es online zu nutzen. Alternativ können Sie eine Art Index erstellen und ihn in einem öffentlichen (freigegebenen) Ordner ablegen. Das Programm selbst kann auf dem Computer jedes Benutzers installiert oder auch in einem geöffneten Ordner abgelegt werden öffentlicher Zugang, und erstellen Sie mithilfe der Parameter spezielle Verknüpfungen für jeden Benutzer separat Befehlszeile, dessen Zweck in der mit dem Programm gelieferten Hilfedatei beschrieben ist. Es besteht auch die Möglichkeit automatische Installation Programme über eine MSI-Datei ins Netzwerk einbinden. Dabei werden die Einstellungen für jeden verbundenen Benutzer berücksichtigt.

Generell handelt es sich um ein gutes Programm aus der Kategorie der professionellen Suchmaschinen. Es kann für eine gute Bewertung in Frage kommen, aber aufgrund bestimmter Faktoren ist es für dtSearch möglicherweise nicht einfach, Vertrauen und Respekt von den Benutzern zu gewinnen (nicht alles ist reibungslos mit der Benutzeroberfläche, russische Benutzer sind benachteiligt, es gibt keine guten Funktionen für die Arbeit mit dem Netzwerk). . Bei der direkten Suche nach Dokumenten hatte das Programm keine Probleme mit russischen Texten. Da es keine mit der angegebenen Morphologie oder mit einer Fuzzy-Suche gab. Das System ist völlig ausreichend gefunden Notwendige Dokumente und durch eine einfache Aufforderung in einem Wort und durch die Verwendung einiger Absätze oder eines Dokuments als Schlüsselsatz.

Offiziellen Website:
Verteilungsgröße: 23 MBIschika Prof Deluxe

Anhand des Namens können Sie vermuten, dass dieses Programm die russische Sprache unterstützt. Das ist schon schön. Die Benutzeroberfläche ist im Allgemeinen etwas ungewöhnlich, aber optisch sehr ansprechend. Eine andere Sache ist Bequemlichkeit. Ein sehr umstrittenes Kriterium, aber dennoch ist eine Mehrfensterlösung wahrscheinlich nicht die erfolgreichste Option (die Anfrage wird in einem Fenster eingegeben, das Ergebnis wird in einem anderen angezeigt usw.).

Snoop verwendet dieselben Indizes, um eine schnelle Suche durchzuführen, die Indizierung ist jedoch viel langsamer als bei anderen Programmen. Das ist sehr seltsam, insbesondere wenn man bedenkt, dass seine Fähigkeiten zur Verarbeitung von Suchanfragen sehr schwach sind und die Indexstruktur daher nicht komplex ist. Dies ist höchstwahrscheinlich auf nicht optimierte Algorithmen zurückzuführen. Dieses Programm erwies sich als klarer Außenseiter bei der Indexierungs- und Suchgeschwindigkeit: Der Zeitaufwand für die Indexerstellung ist sechsmal länger als bei dtSearch und iSYS. Die Indexierung von 20 Gigabyte Texten für den Bluthund erforderte 38 Stunden und 46 Minuten Arbeit. Und der erstellte „Suchbereich“ nahm mit einem kleinen Minus von 19 Gigabyte die gleiche Größe auf der Festplatte ein wie die Originaldaten.

Bloodhound kann als Alternative zur Standardsuche in Windows vorgestellt werden; es ist unwahrscheinlich, dass es mehr kann. Dass die primäre Aufgabe des Snoopers die einfachste Suche nach Dateien ist, belegen nicht nur die wenigen Funktionen zur Textanalyse von Suchanfragen und eine erweiterte Suche nach Dateiattributen, sondern auch ein Ergebnisfenster, das direkte Links zu den Dateien bietet gefundenen Dateien sowie auf die Ordner, die diese Dateien enthalten. Das Ergebnisfenster ist in dem Sinne nicht sehr informativ, dass Sie die gesamte gefundene Datei nur lesen können, indem Sie es ausführen, d. h. es verfügt nicht über einen integrierten Dateibetrachter. Allerdings wird ein Auszug aus der Datei angezeigt, in der das gesuchte Wort gefunden wurde; im Allgemeinen erinnert dieses Anzeigeschema stark an Internet-Suchmaschinen.

Wenn es um spezifische Möglichkeiten zur Verarbeitung von Suchanfragen geht, ist anzumerken, dass es keinen „Suchtext“ gibt, der maximal nach einer Phrase durchsucht werden kann, schon allein deshalb, weil es kein mehrzeiliges Texteingabefeld gibt. Sie können jedoch die eingegebene Phrase analysieren, und Snoop bietet uns hier einen Standardsuchsatz an: logische Operationen, Maskensuche und Zitatsuche ... nicht viel. Das Programm enthält einige Ansätze der morphologischen Suche, aber wahrscheinlich so grob, dass es eher stört korrekte Bedienung(Während des Tests wurden viele Überlagerungen mit falscher Verwendung der Morphologie festgestellt.)

Das Programm ermöglicht Ihnen jedoch, bei der Suche Dateiattribute anzugeben (Dokumentdatum, Dateiname, Ordnername) und bei diesen Abfragen können Sie auch denselben Suchsatz verwenden. Sie können auch nach Briefen suchen, indem Sie die Parameter angeben (Von, Betreff... usw.).

Also, wir haben die Suche selbst herausgefunden, was ist sonst noch interessant an dem Programm, für das es laut Informationen der offiziellen Website so viele Auszeichnungen erhielt? Es ist schwer zu sagen, was das Besondere daran ist; höchstwahrscheinlich ist die Bloodhound-Benutzeroberfläche attraktiv (genau vom Aussehen, ganz zu schweigen von der Benutzerfreundlichkeit).

Operationen mit Indizes sind sehr standardmäßig; eine nette Funktion ist die Möglichkeit, Indizes nach einem Zeitplan zu aktualisieren. Darüber hinaus können Indizes auch online genutzt werden. Von nun an benötigen wir weitere Details.

Trotz der Primitivität von Suchanfragen kann das Programm zur Suche nach Dateien verwendet werden, sodass sein Einsatz in Netzwerken gerechtfertigt ist. Das ist zwar weit hergeholt, denn in einem großen Netzwerk geht es aufgrund der großen Informationsmenge vor allem um die schnelle Suche nach Daten über komplexe Suchanfragen – und es gibt eindeutig Probleme mit der Geschwindigkeit der Suche und des Programms. Ich muss sagen, dass die Arbeit mit dem Netzwerk bei Izhishika so durchdacht ist, wie sie sollte. Speziell dafür entwickelt separater Antrag- Bloodhound-Server. Es funktioniert genauso wie einfach Snooper (sie haben eine Suchmaschine), nur für Dokumente, die sich auf einem zentralen Server oder auf gemeinsam genutzten Ressourcen im Unternehmensnetzwerk befinden. Snooper Server erstellt neue Indizes für gemeinsam genutzte Ressourcen oder verwendet zuvor erstellte. Jeder Benutzer des Unternehmensnetzwerks kann sich mit dem Suchserver verbinden und über ihn über einen Internetbrowser auf jedes Dokument (im aktuellen Index) zugreifen. Stimmen Sie zu, dieses Schema ist äußerst praktisch: Es stellt sich heraus, dass Dateien in Ihrem eigenen Netzwerk auf die gleiche Weise durchsucht werden können wie Informationen im Internet, beispielsweise über Google.

Wenn man alle Vor- und Nachteile dieses Programms abwägt, liegt die Schlussfolgerung nahe, dass seine Fähigkeiten höchstwahrscheinlich nicht für Unternehmensnetzwerke ausreichen (trotz der guten Organisation der Arbeit mit dem Netzwerk), sondern für einen Heimcomputer oder sogar für Heimnetzwerk Im Prinzip könnte es passen. Obwohl weder die Arbeitsgeschwindigkeit noch die Suchmöglichkeiten optimistisch sind ...

Offizielle Website auf Russisch:
Verteilungsgröße: 6 MBGoogle Desktop Search + GDS Enterprise

Natürlich konnten wir einen so berühmten Entwickler nicht ignorieren. Der Name Google sagt schon viel. Menschen, die seit Jahren die leistungsfähigste Internet-Suchmaschine nutzen, werden sich zweifellos dazu entschließen, diese spezielle Suchmaschine auf ihrem Computer zu installieren. Denken Sie nur: Google auf Ihrem Heimcomputer! Versuchen wir jedoch, ohne Provokationen mit einer weit verbreiteten Marke nachzugeben, nüchtern und vor allem objektiv die Fähigkeiten der „Desktop“-Suchmaschine von Google zu betrachten.

Das erste, was ins Auge fällt, ist das Fehlen einer eigenen Shell für das Programm. Google Desktop Search befindet sich weiterhin im Browserfenster bzw. die gesamte Oberfläche der Desktop-Version wurde von der Software des älteren Internet-Bruders übernommen. Ob das gut oder schlecht ist, darüber lässt sich streiten: Einige Leute mögen das minimalistische Design dieser Suchmaschine, während andere eine vollwertige Anwendung mit allen möglichen Schaltflächen usw. sehen möchten.

Was fällt Ihnen direkt nach dem Entwurf ins Auge? Und die Tatsache, dass dieselbe Google Desktop-Suche beginnt, alles auf dem Computer zu indizieren, ohne dass eine Nachfrage besteht! Und was am interessantesten ist, ist die Auswahl der Indizierungspfade Google-Hilfe Desktop-Suche ist nicht möglich. Sie müssen ein separates Programm (TweakGDS) herunterladen, mit dem Sie eine leichte Erweiterung durchführen können Google-Einstellungen Desktop, einschließlich der Angabe der für die Indizierung erforderlichen Orte. Obwohl, wenn Sie das alles herausgefunden haben, bereits eine Standardfestplatte indiziert ist, ist diese Einstellung eher bei der Arbeit mit großen Datenmengen erforderlich, was bei der Verwendung in Unternehmensnetzwerken (Enterprise-Versionen) sehr wichtig ist. . Es ist jedoch keine Tatsache, dass Ihre Probleme nach dem Herunterladen von TweakGDS gelöst sind. Schließlich braucht sie Microsoft, um zu funktionieren. NET Framework und Microsoft Scripting Runtime. Ja... die Installation sowie der Zugriff auf die Einstellungen hätten einfacher gestaltet werden können, obwohl die Entwickler wahrscheinlich verstehen können: Warum etwas Neues schreiben, wenn es eine fertige Suchmaschine gibt, auf die man sie portiert lokalen Computer und lassen Sie den Benutzer „genießen“ und lassen Sie den berühmten Namen daraus ein weiteres Meisterwerk machen. Komm schon, lass uns diesen lyrischen Exkurs beenden und mit der Suche fortfahren.

Was die Analyse von Suchanfragen und die Bereitstellung von Ergebnissen angeht, ist hier alles absolut identisch mit Google im Internet: das gleiche System zur Anzeige der Ergebnisse, der gleiche Standardsatz logischer Operationen für Suchanfragen. Im Allgemeinen ist Google Desktop Search wie das Vorgängerprogramm ausschließlich für die Suche nach Dateien konzipiert – es verfügt natürlich nicht über einen internen Viewer für diese Dateien. Die Anzahl der von Google Desktop Search unterstützten Dateiformate ist völlig ausreichend und schön ist auch, dass besuchte Internetseiten durchsucht werden und dabei Daten aus dem Cache entnommen werden. Die Such- und Indexierungsgeschwindigkeiten sind durchaus akzeptabel. Stimmt, für den Heimgebrauch. Google Desktop Search bewältigte beeindruckende 20 Gigabyte an Texten in 8 Stunden und 17 Minuten. Verbringen Sie mehrere Tage damit, Informationen aus dem Unternehmensnetzwerk zu verarbeiten großes Unternehmen lächelt keinen Systemadministrator an. Positiv: Die Größe des erstellten Index lag auf dem gleichen Niveau (4,5 GB) wie bei einer anderen in diesem Test getesteten Suchmaschine – SearchInform.

Der große Vorteil (oder Nachteil – Sie entscheiden) von Google Desktop Search besteht darin, dass es Plugins unterstützt, was viel zum Besseren verändern kann. Eine andere Sache ist, dass das Anschließen und Einrichten von Plugins die Installation einer Suchmaschine so sehr erschwert, dass man sich fragt, ob das alles notwendig ist, wenn man ein normales, vollwertiges Programm installieren kann, in dem alles bereits vorhanden ist. Um jede Funktion nutzen zu können, müssen Sie schließlich ein neues Plugin installieren. Auch damit das Programm vollständig mit Archiven arbeiten kann, ist ein separates Gadget erforderlich. Es ist faszinierend und verführerisch, dass all diese Zusatzmodule kostenlos sind. Wenn Sie jedoch die Desktop-Version der Suchmaschine nicht berücksichtigen, liegt die kompetente Konfiguration von GDS Enterprise möglicherweise nicht in Ihrer Macht – schließlich bieten Spezialisten von Google nicht umsonst ihre Dienste für die eigene Einrichtung an Software für Ihr Netzwerk für nur 10.000 US-Dollar.

Wenn Sie die Einrichtungs- und Installationsprozedur durchlaufen (oder 10.000 US-Dollar an ein Schnellreaktionsteam von Google zahlen), werden Sie verstehen, dass die Komplexität der Installation durch die sehr flexiblen Einstellungen beim Einsatz in Unternehmensnetzwerken mehr als ausgeglichen wird. Ein wichtiger Punkt Google funktioniert Desktop in einem Unternehmensnetzwerk ist die Verwendung von Gruppenrichtlinien, die es ermöglichen, Einstellungen für jeden Benutzer festzulegen.

Zusammenfassend lässt sich sagen, dass die sinnvollste Verwendung dieses Programms ein Heim- oder Arbeitscomputer ist. Schließlich reicht es bei einem gewöhnlichen Computer aus, nur das Programm zu installieren – den Rest erledigt es von selbst (es wird Sie nicht einmal etwas fragen).

Google Desktop Search Enterprise wird jedoch in Fällen akzeptabel sein, in denen ein dringender Bedarf an einer flexiblen Konfiguration der Netzwerkrichtlinien für die Verwendung der Suchmaschine besteht, während die Fähigkeit zur Verarbeitung von Suchanfragen an zweiter Stelle steht und an Zeit (oder Geld) mangelt ), die für die Einrichtung des Programms aufgewendet wurden, stehen an erster Stelle.

Offiziellen Website:
Verteilungsgröße einschließlich TweakGDS: 1,2 MBCopernic Desktop Search

Klicken Sie auf das Bild, um es zu vergrößern

Die Programmoberfläche weckt äußerst positive Emotionen – alles ist nach allgemein anerkannten Standards gestaltet, nichts Überflüssiges, kurzum ein angenehmes Design. Für einen Anfänger wird es sehr einfach sein, die Benutzeroberfläche von Copernic Desktop Search zu verstehen. Allerdings ist es etwas verwirrend, dass die Designer die Programmoberfläche eindeutig unter Berücksichtigung der Tatsache erstellt haben, dass das Programm in einem Standardthema funktioniert Windows-Design XP. Bei Verwendung des klassischen Themes sieht das Programm nicht so schön aus. Aber das ist eher Geschmackssache.

Beim ersten Start fordert das Programm Sie auf, Indizes für die Suche zu erstellen. Es schien etwas ungewöhnlich, dass das Programm nach der Auswahl der Ordner für die Indizierung nicht anbot, eine beliebige Taste zu drücken, z. B. „Indizierung starten“, und die Indizierung nicht automatisch startete. Erst dann wurde bemerkt, dass Copernic versuchte, die Indizierung zu starten, während der Computer eingeschaltet war war untätig. Sie müssen etwas tiefer in die Programmoptionen eintauchen, um alles richtig zu konfigurieren. Es ist zu beachten, dass es recht umfangreiche Möglichkeiten zum Einrichten der automatischen Indexerstellung gibt: integrierter Scheduler, die Möglichkeit zur Indizierung, während der Computer im Leerlauf ist, Hintergrund, mit niedriger Priorität. Die Indizierung war nicht zu schnell – 10 Stunden 51 Minuten – das ist langsamer als bei anderen Suchmaschinen (mit Ausnahme von Isle of Bloodhound, aber Copernic ist immer noch eine Größenordnung schneller als die Entwicklung von iSleuthHound Technologies.

Nun zur Struktur des Index. Im Allgemeinen ist daran nichts Besonderes. Es ist möglich, Dateitypen sowohl in allgemeiner als auch in detaillierter Form auszuwählen. Das heißt, Sie können zunächst auswählen, was Sie indizieren möchten – Dokumente, Bilder, Videos, Musik. Auf der anderen Registerkarte des Optionsfensters können Sie bestimmte Dateitypen nach Erweiterung auswählen. Darüber hinaus können Sie den Index so konfigurieren, dass beispielsweise Bilder, die kleiner als 16x16 sind, nicht indiziert werden oder Audiodateien mit einer Länge von weniger als 10 Sekunden nicht indiziert werden. Neben der Indizierung von Dateien aus Ordnern kann Copernic auch mit E-Mails und Kontakten aus dem Adressbuch arbeiten Microsoft Outlook und Microsoft Outlook Express ist eine Indizierung von Favoriten und Verlauf aus dem Internet Explorer möglich.

Die Suchfunktionen sind hier sehr schwach. Bei Tests stellte sich sogar heraus, dass das Programm nicht nach Dokumenten im TXT- und HTML-Format auf Russisch sucht, sodass Sie sie nur anhand des Titels und nicht anhand des Inhalts finden können. Das einzige, was das Programm zur Verbesserung der Sucheffizienz bietet, ist die Verwendung eines Standardsatzes logischer Operationen, und selbst dann wurde diese Funktion experimentell entdeckt, da sie nicht dokumentiert wurde. Übrigens ist auch mit der Hilfe des Programms nicht alles in Ordnung – es ist nur über das Internet verfügbar, was, wie Sie sehen, sehr umständlich ist, und sogar im Internet Referenzinformationen nicht zu viel. Anscheinend haben die Entwickler entschieden, dass die einfache Benutzeroberfläche des Programms nicht das Vorhandensein einer normalen Hilfe impliziert. Wenn wir das Gespräch über Suchfunktionen fortsetzen, ist anzumerken, dass das Programm trotz der schwachen Analyse von Abfragen ein interessantes Suchsystem bietet – der Benutzer kann den Dateityp (Bilder, Videos, Musik usw.) auswählen und eine Suche eingeben Fragen Sie Attribute ab und wählen Sie sie aus, die für den ausgewählten Dateityp spezifisch sind. Bei Sounddateien können dies beispielsweise Werte aus MP3-Tags (Künstler, Album, Datum usw.) sein, bei Bildern kann man beispielsweise deren Größe (nach Auflösung) auswählen, im Allgemeinen hat jeder Typ seine eigenen eigene Einstellungen. Nachdem Sie nach einem bestimmten Dateityp gesucht haben, zeigt das Programm im Ergebnisfenster eine sehr informative Liste an. Wenn Ihre Anfrage Dateien anderer Typen enthält, können Sie diese durch Klicken auf einen bestimmten Link öffnen.

Unabhängig davon ist das Ergebnisanzeigefenster zu erwähnen. Unterhalb der Liste der gefundenen Dateien wird der Inhalt dieser Dateien angezeigt (ein ähnliches Schema wird häufig in E-Mail-Clients verwendet). Die Textanzeige ist zwar nur im nativen Format möglich und es gibt keinen Nur-Text-Anzeigemodus, was nicht immer praktisch ist, da das Öffnen eines Dokuments in diesem Fall mehr Zeit in Anspruch nimmt. Da Copernic jedoch nach Bildern und Musik suchen kann, ist es möglich, diese Multimediadateien anzuzeigen.

Die Grundprinzipien der Funktionsweise dieses Programms werden beschrieben, nun wollen wir sehen, was uns Copernic Desktop Search für die Arbeit mit dem Netzwerk bieten kann... Im Prinzip kann man sehr lange zuschauen, aber kaum etwas sehen . Mit anderen Worten: Dieses Programm sollte nicht netzwerkbasiert sein. Copernic Desktop Search ist ausschließlich eine Home-Suchmaschine.

Offensichtlich ist die einzige (logischste) Anwendung dieses Programms ein Heimcomputer. Hier wird es alle einfachen Benutzersuchanfragen, die aus einem oder zwei Wörtern bestehen, vollständig bewältigen, die erforderlichen Informationen finden und die Aufteilung der Suche nach Dateityp und die Unterstützung von Multimediadateien sowie die Hintergrundindizierung im Modus mit niedriger Priorität gepaart mit einem angenehmen Ergebnis Benutzeroberfläche geben dem Programm nur die Kraft, Vertrauen bei unerfahrenen Benutzern zu gewinnen.

Offiziellen Website
Verteilungsgröße: 2,6 MBISYS Desktop

Klicken Sie auf das Bild, um es zu vergrößern

Ein sehr leistungsstarkes Programm. Von der Ausstattung mit allerlei Funktionen her liegt es in der Nähe des nächsten SearchInform-Suchsystems auf der Liste. In diesem Fall die Größe Installationsdatei mehr als 40 MB! Es ist schwer zu sagen, was in solche Dimensionen gepresst werden könnte, da dasselbe SearchInform mit ähnlicher Funktionalität 15 MB beansprucht.

Auch hier ist der Installationsprozess nicht sehr angenehm bzw. nicht einmal der Installationsprozess. Schon vor dem Download des Programms werden Sie aufgefordert, sich zu registrieren, sonst geht es nicht. Als nächstes die Schnittstelle. Es ist sehr schön gemacht, nichts Unnötiges fällt ins Auge, aber das sind die Eindrücke einer Person, die schon einigermaßen daran gewöhnt ist. Für einen Anfänger wird es nicht einfach sein, herauszufinden, wo und was sich befindet, wo man klicken und wo man schließlich suchen muss. Es wird dringend empfohlen, die Hilfe vor Arbeitsbeginn zu lesen – Sie sparen viel Nerven und Zeit. Hinzu kommt, dass das Programm die russische Sprache überhaupt nicht unterstützt. Nicht gut. Zudem sind die Fenster hier nicht mit Bedienelementen überladen, was wir allerdings mit Multimodulen und dem Einsatz zusätzlicher Fenster erkaufen mussten. Beispielsweise erfolgt die Eingabe von Suchanfragen durch den Start eines Programms und die Indexverwaltung erfolgt über ein anderes Programm. Auch Suchanfragen werden hier in separaten Popup-Fenstern eingegeben. Es ist schwer zu sagen, was besser ist – eine überladene Benutzeroberfläche oder allgegenwärtige Multi-Fenster; es ist vielmehr Geschmackssache.

Beim Erstellen von Indizes bietet das Programm Funktionen, die das Festlegen von Optionen für einen neuen Index vereinfachen. Zu diesen Funktionen gehören mehrere vorgefertigte Vorlagen zum Erstellen von Indizes für die Ordner „Eigene Dateien“, „Mail“, „Mail und Dokumente“, „Bestimmter Ordner“, „Ordner mit einer Auswahl an Dateitypen“ usw. Solche Vorlagen vereinfachen die Erstellung von Indizes in der ersten Phase. Das Dienstprogramm zum Arbeiten mit Indizes verfügt nicht über eine sehr gute Benutzeroberfläche, was angesichts der Komplexität einschüchternd wirkt (um ehrlich zu sein, ist dies eine sehr subjektive Einschätzung), aber wenn man es sich anschaut, bietet es viele nützliche Optionen und im Allgemeinen , seine Verwendung bereitet keine großen Schwierigkeiten. ISYS Desktop kann Daten aus verschiedenen Datenquellen indizieren und bietet außerdem viele flexible Einstellungen für eine solche Indizierung. Unter Zusatzfunktionen für die Indizierung: Unterstützung für SQL, FTP, TRIM Context, WORLDOX 2002, Skripte. Wenn Sie beim Erstellen eines Indexes den Punkt „Ordner mit Auswahl von Dateitypen“ ausgewählt haben, haben Sie die Möglichkeit, Dateitypen für die Indizierung manuell (per Erweiterung) auszuwählen. Es muss gesagt werden, dass es einfach eine große Anzahl unterstützter Dateitypen gibt, Sie jedoch keinen eigenen Typ (Erweiterung) zur bestehenden Liste hinzufügen können. Sie können auch das Vorhandensein eines Indexierungsplaners beachten. Das Erstellen eines Index und die Verarbeitung von 20 Gigabyte an Informationen dauerte mit ISYS Desktop 6 Stunden und 13 Minuten, was letztendlich eine gute Zeit und die Größe der erstellten Datei zeigte – 7,9 GB.

Die Suchfunktionen dieses Programms sind recht gut. Was in ISYS zum Einsatz kommt, ist wesentlich leistungsfähiger als die herkömmliche Unterstützung logischer Operationen. Unter den erweiterten Suchfunktionen bietet das Programm die Verwendung von Synonymen und einen Sortierfilter (nach Pfad, Name und Datum der Dateierstellung). Bausatz logische Operatoren etwas breiter als das Standardset. Neben logischen Operationen ermöglicht das Programm die Arbeit mit vielen anderen Operatoren, die im Prinzip einige Sucharten ersetzen können, beispielsweise kann die Suche mit Parsing durch die Verwendung spezieller Operatoren vollständig ersetzt werden. Ich war sehr überrascht, dass das Programm keine Suche anhand der Morphologie hat. Dies ist ein schwerwiegendes Versäumnis, da die Sucheffizienz durch die Verwendung der morphologischen Analyse erheblich verbessert wird. Darüber hinaus gibt es keine Liste bedeutender Wörter, dafür aber eine umfangreiche Liste unbedeutender Wörter. Angesagt sind auch Suchfunktionen wie „ungefähre Suche“ und „heuristische Analyse“.

ISYS bietet die Wahl zwischen mehreren Arten von Suchanfragen, nämlich visuellen Typen. Dies geschieht mit verschiedene Typen Fenster zur Eingabe von Suchanfragen, tatsächlich erlaubt jedoch kein einziges Fenster die Verwendung anderer als der oben aufgeführten Technologien.

Die Suchergebnisse sind sehr aufschlussreich und werden als nach Relevanz sortierte Dokumentenliste angezeigt. Unten wird eine Vorschau des ausgewählten Dokuments angezeigt. Im Gegensatz zur Copernic Desktop Search ist die Vorschau hier nur in Form von reinem Text verfügbar. Es war nicht möglich, Dokumente in ihrem nativen Format anzuzeigen, sei es Word, HTML oder PDF, obwohl dies im Prinzip nicht allzu kritisch ist. Mit dem Programm können Sie gefundene Dokumente nach bestimmten Kriterien in Gruppen einteilen (standardmäßig sind sie nach Relevanz unterteilt). Sie können auch bereits gefundene Dokumente anzeigen, indem Sie auswählen separate Ordner(Dies ist praktisch, wenn das Ergebnis eine sehr große Anzahl von Dokumenten ergibt).

Auch der Einsatz des Programms in einem Unternehmensnetzwerk ist durchaus berechtigt, da es gute Möglichkeiten zur Organisation von Netzwerksuchen bietet. Das Suchsystem basiert auf der Erstellung eines öffentlichen Indexes, der indizierte Daten aus öffentlich zugänglichen Online-Ressourcen enthält.

Tatsächlich verdient das Programm von ISYS Aufmerksamkeit, zumindest wenn man sich damit vertraut macht. Dieses Programm ist ein ausgereiftes Projekt mit einer Vielzahl von Funktionen (natürlich braucht sie nicht immer und nicht jeder, aber trotzdem). Die Chancen, dass das Programm Verbesserungen bei der Verarbeitung von Suchanfragen erfährt, sind nicht bekannt, können aber derzeit für einen nahezu universellen Einsatz empfohlen werden. Und da es für Heimsysteme immer noch zu schwer ist, wird es hauptsächlich in Unternehmensnetzwerken installiert.

Offiziellen Website:
Verteilungsgröße: 40 MbSearchInform

Klicken Sie auf das Bild, um es zu vergrößern

Es lohnt sich wahrscheinlich nicht, gleich mit der Beschreibung der SearchInform-Schnittstelle zu beginnen. Wir sollten zunächst den Installationsprozess bzw. eines seiner Details beschreiben: Ohne Internetverbindung können Sie das Programm nicht installieren. Tatsache ist, dass das Programm vor dem ersten Start eine Benutzerregistrierung (kostenlos) erfordert und alle eingegebenen Daten an den Server sendet. Offenbar mussten die Entwickler solche Maßnahmen im Kampf gegen Piraterie ergreifen, was sich jedoch nicht positiv auf die einfache Installation auswirkte.

Die Programmoberfläche ist nach allen allgemein anerkannten Regeln gestaltet, wirkt jedoch auf den ersten Blick etwas umständlich. Wenn man das Programm zum ersten Mal nutzt, scheint es zu kompliziert zu sein, manchmal ist es nicht einfach, sich zu merken, in welchem ​​Menü oder auf welcher Registerkarte sich die gewünschte Option befindet, bei längerer Nutzung erscheint die Benutzeroberfläche jedoch nicht mehr so ​​furchtbar kompliziert . Die Hauptsache ist, zuerst das Zertifikat zu lesen.

Nachdem Sie die Benutzeroberfläche ein wenig verstanden haben, können Sie mit der Erstellung eines Index beginnen. Der Vorgang selbst ist sehr einfach und die Indexierungsgeschwindigkeit ist selbst nach Augenmaß deutlich höher als bei allen anderen Suchmaschinen im Testbericht. Eindeutige Testzahlen zeigen, dass SearchInform in puncto Indexierungsgeschwindigkeit doppelt so schnell ist wie dtSearch und iSYS! Das Programm indizierte die bereitgestellten Daten im Umfang von 20 Gigabyte in einer Rekordzeit von 3 Stunden 17 Minuten. Und die Größe des erstellten Index betrug die kleinsten 4,4 GB – 100 Megabyte weniger als bei Google Desktop Search.

Das Programm unterstützt neben gewöhnlichen Dateien und Ordnern auch die Indizierung von E-Mails, die Anbindung und Indizierung von Datenbanken (!) und anderen externen Quellen (DMS, CRM). Direkt während der Indizierung können Sie ein Wörterbuch zur Durchführung einer morphologischen Suche und alle Attribute angeben können indizierte Dateien sein. Nach der Erstellung des Index kann es bei der ersten Testsuche nach Dokumenten zu Verwirrung kommen: „Hier gibt es zwei Arten der Suche, aber welche benötige ich?“ Wie bereits erwähnt, ist es wichtig, die Hilfe zu lesen, dann wird alles klar. Das Programm kann tatsächlich zwei Arten von Suchen durchführen: Phrasensuche und Suche nach Dokumenten, deren Inhalt dem Abfragetext ähnelt.

Oben wurde eine Beschreibung aller Hauptfunktionen zur Analyse einer Suchanfrage gegeben, daher werden wir jetzt nur die Suchfunktionen auflisten, die dieses Programm bietet. Beginnen wir mit der Phrasensuche: natürlich morphologische Suche, Zitatsuche, logische Operationen, Suche mit Wortanalyse (Suche am Wortanfang, am Ende, im Mittelteil oder einer vollständigen Übereinstimmung), gemischte Zitatsuche ( wenn alle Wörter aus der Suchanfrage im Dokument vorhanden sein müssen, aber nicht unbedingt in der eingegebenen Reihenfolge), Suche mit Fehlerkorrektur, Verwendung von Synonymen, „Fast-Zitat-Suche“ (Suche nach der eingegebenen Phrase als Zitat, aber auch nach anderen Wörtern zwischen den eingegebenen Wörtern vorhanden sein) usw. Einige der aufgeführten Optionen haben ihre eigenen spezifischen Einstellungen. Darüber hinaus ist es möglich, ein Wörterbuch mit unwichtigen Wörtern zu verwenden, und das Programm verfügt bereits über eine vorgefertigte Liste dieser Wörter. Sie können für die Suche auch ein Wörterbuch mit vorrangigen Wörtern verwenden (dieses müssen Sie natürlich ausfüllen). selbst).

Hier haben wir im Prinzip kurz alle Hauptfunktionen der Phrasensuche besprochen.

Betrachten wir nun die Funktionen dieses Programms – die Suche nach ähnlichen Dokumenten. Die Entwickler behaupten, dass es sich hierbei keineswegs um eine einfache Textsuche handelt, sondern vielmehr um eine „Suche nach ähnlichen“ – genau so wird es überall beschrieben, aber na ja, man kann es nennen wie man will – der Kernpunkt ist . Eine schnelle Suche im Internet kann schnell erkennen, dass es sich bei der sogenannten „Ähnlichen Suche“ um eine Neuentwicklung im Bereich der Textanalyse handelt. Mit diesem System können Sie Texte finden, die im semantischen Inhalt ähnlich sind. Das Erfreulichste war, dass sich nach Durchführung von Test-Suchanfragen herausstellte, dass die Theorie recht gut mit der Praxis übereinstimmt! Das Programm sucht tatsächlich nach Dokumenten mit ähnlichem Inhalt, zeigt sie in einer Liste an und sortiert sie nach dem Prozentsatz der Ähnlichkeit.

Schauen wir uns als Nächstes an, was SearchInform (insbesondere seine Unternehmensversion SearchInform Corporate) für die Arbeit in einem Unternehmensnetzwerk bietet. Es gibt zwei Arten von Anwendungen: serverseitig und benutzerseitig. Der Serverteil verarbeitet die angegebenen Indizes selbstständig und Benutzer können sie abhängig von den ihnen zugewiesenen Zugriffsrechten für die Suche verwenden. Benutzer können automatisch mit konfiguriert werden Konten Windows (in professioneller Hinsicht verwendet SearchInform die NTFS-Windows-Authentifizierung) und manuell (Benutzer müssen separat hinzugefügt werden). Jedem Benutzer kann der Zugriff auf bestimmte Indizes gestattet oder verweigert werden, außerdem können Benutzer zu Gruppen zusammengefasst werden. Im Allgemeinen liegen die Einstellungen von SearchInform für die Arbeit im Netzwerk in puncto Flexibilität vor Google und in puncto Komfort und Einfachheit vor Ishcheika Server.

Offiziellen Website:
Verteilungsgröße: 14,7 MB Vergleich der Indizierungsgeschwindigkeiten

SuchsystemIndexierungszeitIndexgröße
Bloodhound Prof Deluxe 4.538 Stunden 46 Minuten19 GB
Isys Desktop 7.06 Stunden 13 Minuten7,9 GB
DtSearch 7.06 Stunden 3 Minuten8,6 GB
Google Desktop Search Enterprise8 Stunden 17 Minuten4,5 GB
Copernic Desktop-Suche *10 Stunden 51 Minuten7 GB
SearchInform 1.5.023 Stunden 17 Minuten4,4 GB

* Die meisten Dokumente.html und .txt mit russischem Text waren zwar indiziert, konnten aber nur anhand ihrer Namenszusammenfassung gefunden werden

Alle Programme verdienen Aufmerksamkeit.

Basierend auf Tests und einer sorgfältigen Prüfung jedes im Test vorgestellten Programms können bestimmte Schlussfolgerungen gezogen werden. Daher ist Google Desktop Search Copernic Desktop Search für den unerfahrenen Benutzer als Suchsystem für Hausinformationen durchaus geeignet. Sie bewältigen einfache Abfragen gut, überfordern den Benutzer nicht mit Einstellungen und sind darüber hinaus völlig kostenlos. Der Versuch von Google, in den Markt der Unternehmenssuchmaschinen einzusteigen, ist noch nicht sehr gerechtfertigt: Damit das Programm richtig funktioniert, muss es mit zusätzlichen Modulen ausgestattet werden, und die Einrichtung ist alles andere als einfach. Die selbsterklärenden Namen Desktop Search, Copernic und Google reservieren daher die Nische der „Desktop“-Suchmaschinen.

Echte, leistungsfähigere Lösungen – dtSearch, iSYS und SearchInform – sind ebenfalls nicht narrensicher und bieten Benutzern ihre „Desktop“-Versionen an. Aber zu einem vernünftigen Preis, im Gegensatz zu kostenloser Software von Google und Copernic. Natürlich müssen Sie für Leistung, Geschwindigkeit und Funktionalität bezahlen. Das Hauptaugenmerk der Entwickler von dtSearch, iSYS und SearchInform liegt aber natürlich auf dem Unternehmensbereich. Vernetzung, Funktionalität, Indexierung und Suchgeschwindigkeit zeichnen diese Produkte von ihren „Konkurrenten“ aus. Basierend auf den Testergebnissen wurde der Favorit identifiziert – SearchInform. Das Programm bietet die Möglichkeit, nach ähnlichen Dokumenten zu suchen, verfügt über die schnellsten Indexierungs- und Suchgeschwindigkeiten und verfügt über einen guten Funktionsumfang.