Fr:FAQ
Aus YaCyWiki
Généralités
Qu'est-ce qu'un proxy?
Ein Proxy ist ein Programm, das man auf einem Computer installiert, damit ein anderer Computer aus dem Netzwerk über diesen Proxy ins Internet kann. Ein caching Proxy speichert dabei die Dokumente zwischen, sodass wenn 2 Computer die gleiche Seite laden, sie nur einmal geladen werden muss.
Qu'appelons-nous Indexation?
Indexieren heißt, eine Webseite in die darin enthaltenen Worte aufzuteilen, und unter diesen Wörtern die URL der Webseite in der Datenbank zu speichern. Wenn man dann nach diesen Wörtern sucht, können alle Webseiten die diese Wörter enthalten schnell gefunden werden.
Qu'appelons-nous Crawler?
Ein sogenannter Crawler beginnt mit einer Seite, und folgt dann allen Links bis zu einer bestimmten Tiefe (manchmal auch unbegrenzte Suchtiefe). Das ist die Methode, die die meisten herkömmlichen Suchmaschinen verwenden um an ihre Links zu kommen. Vor allem empfehlenswert, wenn man eine Seite komplett indexieren will, ohne alle Unterseiten zu besuchen.
Qu'est-ce qu'un réseau P2P?
P2P heißt Peer to Peer. Das bedeutet, dass die Programme(Peers) nicht von einem zentralem Server abhängen, sondern unter sich ein Netz bilden.
Qu'est-ce qu'un pair?
Ein YACY-Peer ist ein Computer, der mit dem YACY-Netz verbunden ist.
Le P2P est-il illegal?
Nein.
P2P (Peer-to-Peer) heißt nur, dass die Programme Daten untereinander austauschen, ohne einen zentralen Server zu benötigen.
Das hat mit der Legalität der Daten nichts zu tun.
Nur weil man über P2P-Tauschbörsen illegale Dateien tauschen kann, ist die Technik nicht zwangsläufig auch illegal.
Généralités sur YaCy
Was hat es mit globalem und lokalem Index auf sich?
Sobald man den Proxy verwendet, wird automatisch ein lokaler Index erstellt. Aber erst wenn das Programm eine Verbindung zum YACY-Netz hat, kann man auf den globalen Index zugreifen. Dieser ist sozusagen die Kombination aller lokalen Indexe.
Que signifient les modes Junior, Senior, Virgin et Principal?
Der Status virgin heißt, dass YACY noch keinen Kontakt zum Netzwerk hat. Man ist also sozusagen offline. Der Status junior heißt, dass man Kontakt zum YACY-Netz hat, aber sich hinter einer Firewall befindet. Juniors können suchen, aber bisher noch keine eigenen Ergebnisse beisteuern. Den Status senior hat man, wenn man eine Verbindung zum YACY-Netz hat, und andere Peers einen erreichen können. principal heißt, dass man eine Peer Liste zu einem Server hochläd. Diese Liste können andere Peers sich dann herunterladen, um eine Verbindung zum YACY-Netz aufzunehmen.
Generell sollte man den senior Status anstreben. Wenn man eine Möglichkeit hat eine Datei auf einen FTP-Server zu laden, dann kann man auch principal werden, und so dem Netz helfen.
Et comment devient on Senior?
Pour devenir un senior, vous devez avoir le port du proxy (8080 si vous ne l'avez pas changé) ouvert dans le pare-feu pour les connexions entrantes. Si vous utilisez un routeur à l'avenir, vous avez les connexions entrantes sur le port 8080 en cours d'exécution sur YaCy.
YaCy menace-t-il mes données privées?
Alle Seiten, die beim Laden GET- oder POST-Paramter verwenden, sowie die Seiten die Cookies oder Passwortschutz verwenden werden vom Indexieren ausgenommen. Es werden also nur Seiten indexiert, die auch ohne Passwort geladen werden können. Siehe auch: [[1]]
Les autres personnes peuvent-elles découvrir mon Surfverhalten?
Man kann nicht abfragen welche Seiten alle auf einem Peer gespeichert sind. Man kann höchstens herrausfinden, welche Seiten zu einem bestimmtem Wort bei ihnen gespeichert sind. Da die Wörter aber mit Hilfe von Distributed Hashtables (DHT) zu anderen Peers wandern, und Sie ebenfalls Wörter von anderen Peers erhalten, ist Ihr Surfverhalten nicht offensichtlich.
La page YaCy (localhost:8080) ne s'affiche pas
Wenn Sie den Internet Explorer benutzen, ist es wichtig, dass Sie die Adresse mit http:// eingeben. Wenn Sie den YaCy Port geändert haben, dann müssen Sie 8080 durch den neuen Port ersetzten. Außerdem müssen Sie natürlich sicherstellen dass YaCy läuft ;-).
Les résultats de YaCy sont complétement différents de ceux de Google.
Sicher hat YaCy andere Ergebnisse als Google. Im Moment hat YaCy zu wenig Peers um genausoviele Ergebnisse wie Google zu liefern, und gerade deshalb ist es wichtig, dass möglichst viele Leute einen eigenen Peer betreiben. Aber auch wenn YaCy genug Peers hat, wird es trotzdem andere Ergebnisse als Google liefern. Schließlich soll es besser als Google werden, nicht ein zweites Google.
Technique
Quelque chose ne va pas. Qu'est-ce que je fais?
Stelle zuerst sicher das Du die aktuellste stabile Version von YaCy benutzt. Tritt der Fehler immernoch auf benutze das Forum unter http://www.yacy-forum.de/ um nach bekannten Problemen oder Deiner Fehlermeldung zu suchen. Ist der Fehler unbekannt poste dort, wenn möglich bitte mit Angabe der Versionsnummer Deiner YaCy-Installation.
Comment puis-je indexer les pages Tor- ou Freenet?
Das indexieren von Tor- oder Freenetseiten wird bewußt zum Teil im Sourcecode verhindert, da es im jetzigen Stadium der Entwicklung nicht erwünscht ist derartige Seiten zu indexieren. Es ist jedoch geplant zukünftig das crawlen solcher Seiten zu ermöglichen, allerdings werden es dann vermutlich die Crawl-Ergebnisse nicht global verteilt, sondern stehen nur dem jeweiligen Peer zur Verfügung.
Comment obtient-on l'index d'un pair à l'autre?
Dies geschieht eigentlich automatisch durch die DHT-Verteilung der Worte. Jedoch gibt es auch die Möglichkeit, den gesamten Index auf einen anderen Peer zu übertragen. Dies kann entweder durch einen sogenannten Index-Transfer oder einen Index-Import geschehen.
Quels types de données/type de MIME sont indexés par YaCy?
Per default werden von YaCy nur Html- und Text-Dateien, also Dateien mit den MimeTypes
- text/plain
- text/html
- application/xhtml+xml
indexiert. Um auch andere Datei-Typen zu indexieren kann man sich die Optionalen Erweiterungen zu YaCy ruterladen und installieren. Dieses Zusatzpackage enthält neben anderen nützlichen Features zusätzliche Content Parsers für PDF, Doc, Rtf, Rss und andere Formate. Eine vollständige Liste der unterstützten Formate findet sich hier.
Werden bereits Indexierte seiten (zb via dht getauschte usw) automatisch reindexiert nach X jahren/tagen?
nein.
Sind DHT einträge einmalig oder können urls auch doppelt/dreifach vorkommen?
Sie sollen mehrfach vorkommen, damit beim Wegbleiben eines Peers dessen Index nicht verloren ist. Mehrere Peers haben gewisse Indexdaten redundant gespeichert.
Comment puis-je changer le Délai de connexion
Dies kann über die Konfigurationsseite http://127.0.0.1:<port>/Config_p.html gemacht werden. Einfach nach dem Property mit dem Namen "clientTimeout" suchen und den dortigen Wert ändern. Das Timeout wird in Millisekunden angegeben.
Nach der Wertänderung einen Neustart von YaCy nicht vergessen.
Alternativ dazu kann die Konfiguration auch über das Config-File httpProxy.conf im Verzeichnis DATA/SETTINGS geändert werden. Wird diese Art der Konfiguration gewählt sollte YaCy allerdings zuvor schon beendet worden sein.
Pour que le robot d'exploration n'index pas mes pages. Que dois-je faire?
Si vous ne voulez pas que notre robot explore vos pages, vous pouvez créer un fichier robots.txt robots.txt avec le contenu suivant:
User-Agent: yacy Disallow: /
Den Bot selber können wir nicht beeinflussen, da er von einem unserer User, nicht von uns gestartet wurde.
Ich kann mich nicht mehr einloggen. Wie kann ich mein Passwort zurücksetzen
Zum Zurücksetzen des Passworts muss YaCy zunächst gestoppt werden (im Zweifelsfall gekillt, wenn man ohne Passwort keinen Shutdown hinbekommt).
Danach editiert man die Datei DATA/SETTINGS/httpProxy.conf und entfernt die adminAccountBase64MD5 Zeile, und falls vorhanden die adminAccount Zeile.
Nach einem Neustart kann man nun das neue Passwort festlegen.
Speicherplatz
Wie kann ich die Dateigrösse der zu herunterladenden Dateien begrenzen?
Die Dateigrösse kann man unter erweiterte Einstellungen->Crawler Einstellungen vornehmen. Dabei können für HTTP und FTP verschiedene Grössen angegeben werden. Die Dateigrösse wird in Byte angegeben. Einen Umrechner findet man unter Bit und Byte (Bits and Bytes)
Wieviele Links/Wörter kann eine YaCy Instanz verwalten und wieviel Plattenplatz benötigt das?
Die Anzahl der speicherbaren Links/Wörter ist prinzipiell unbegrenzt, jedoch wird die Anzahl durch eine Verlangsamung des Indexierungsprozesses mit anwachsender Link/Wort-Zahl begrenzt. Es gibt User mit mehr als 10 Mio Webseiten in einer YaCy-Instanz. Für den Index einer Webseite muss man ungefähr 10kb veranschlagen (das ist ja je nach Dokument unterschiedlich). Bei 10 Mio Webseiten würde der Index also rund 100GB betragen.
Kann ich die Größe des Indexes auf meiner Platte begrenzen?
Momentan nicht. Begrenzung bedeuten automatisch Löschung, was von den meisten User noch weniger gefordert wird als Begrenzung. Die Indexgröße stellt bei aktuell verfügbaren Plattenplatz kaum ein Problem dar.
FAQ Wunschliste / TODO
Fragen die noch aufgenommen werden sollten ...
- Warum gibt es keine mySQL Unterstützung für YaCy?
Retour à la table des matières
Von dieser Seite existiert auch eine deutsche Version.
There is an english version of this page.
