Hilfe: Profile
Profile definieren Regeln für Online Dienste die benutzt werden, um Anfragen an einen beliebigen Server zu senden und um die Resultate zu verarbeiten.
HTTP Anfragen untertützen die GET und POST Methode und diverse Text Codierungen.
Profile sind eigentlich nur reine Textdateien in der UTF-8 Kodirung und sind unterteilt in Sektionen unter Verwendung eines einfachen Syntaxes. Jeder Abschnitt beginnt mit einer neuen Zeile mit dem Namen in Kleinbuchstaben und in eckigen Klammern. Einige Kapitel können mehrere Instanzen haben, andere haben nur eine.
Um ein Profil zu erstellen, folgende Sektionen werden verwendet:
[profile] - Der Profilname, der zusammen mit dem Ergebins angezeigt wird
[url] - Abfragezeichenfolge das normalerweise die Parameterzeichenfolge %s enthält, die als Platzhalter für das Suchwort steht. (Diese Zeichenfolge ist diejenige, die man normalerweise in der Webbrowser-URL sieht.) Es ist sehr einfach, solch eine Ebfargezeichenkette zu erstellen: Auf einer gewünschten Webseite einfach nach einem Wort suchen, dann die Abfrage-URL kopieren und das zuvor eingegebene Suchwort mit %s ersetzen, um TranslateIt! mit zu teilen, wo es in Zukunft das Sucheworwt einsetzen soll.
[post] - Wenn ein Server nur POST und/oder GET + POST Methoden unterstüzt, der Abfragestring kann direkt in den Abfragekopf kopiert werden und das Suchwort muss dann nur noch durch %s Parameter als Platzhaler eingesetzt werden.
[encoding] - Das ist ein sehr wichtiger Parameter, der als Zahl gefolgt von der dazugehörigen Codierung in eckige Klammern gesetzt wird. Die Zahl definiert die Codierung im System und der Name (in eckiger Klammer) ist das lesbare Pendant dazu. Um die benötigte Codierung für die Webseite zu setzen, kann man einfach den Online Services Einstellungen Dialog benutzen.
[begin+] - Ein nicht geändertes HTML Schnippsel innerhalb der Ergebnisseite die als Startmarkierung benutzt wird, um das Ergebins zu extrahieren. Dieser This HTML Schnippsel ist seinerseits in der Ergebisseite enthalten. Ein Profil kann mehrere begin+ Sektionen enthalten. In solch einem Fall werden Sektionen abgearbeitet in der Reihenfolge von Oben nach unten bis die erste relevante Sektion erreicht ist, welche dann zur Anzeige des Erbenisses benutzt wird. Wenn keine Sektion funktioniert, dann wiwrd die Ergbnisseite als ganzes dargestellt. Tipp: Den Webbrowser benutzen um die Ergebnisseite als HTML Code zu sehen.
[begin] - Diese Sektion ist ähnlich wie die oben beschriebene Sektion, mit dem einzigen Unterschied, dass der HTML Schnippsel NICHT in der Ergebnisseite angezeigt wird.
Wenn mehrere begin+/begin Sektionen abgearbeitet werden, "plus-sections" haben Priorität gegenüber "begin-sections". Wenn Sektionen eines Typs mit anderen Typen von Sektionen gemischt werden, dann werden sie zuerst in einer Liste gesammelt.
[end+] - Sektionen diesen Typs sind ähnlich den begin+ Sektionen: Sie enthalten HTML Schnippsel die als Endmarkierung zur Darstellung des Ergebisses der Webseite benutzt werden. (HTML Schnippsel seinerseits sind im extrahierten Quellcode enthalten)
[end] - Gleich wie end+ Sektionen, aber ohne aber ohne Einbeziehung von HTML-Schnippsel in extrahierten Quellcode.
[not-found] - Eine weitere wichtige Sektion, die vor jeder begin(+) Sektion durchlaufen wird: Wenn das abgefragte Wort nicht gefunden wird, so wird kein irrelevanter "Müll" angezeigt.
Desshalb ist es empfohlen, den Quellcode einer solchen "no-results-page" zu finden; ein eindeutiges HTML Schnippsel muss als Signal definiert werden, um die weitere Verabeitung zu stoppen.
[not-found+] - Das selbe wie not-found Sektion, aber mit unterschiedlichen Konditionen:
Der HTML Schnippsel der in dieser Sektion definiert wurde soll in der Ergbisseite enthalten sein, sonst wird Angenommen, dass keine Ergebnisse gefunden wurden.
[fix] - Ein regulärer Ausdruck (für die Anpassung der Ansicht der angezeigten Ergebnisse) im FROM#to#REPL, oder FROM#caseless-to#REPL
Format gemäss ICU Syntax (Zeilenumbrüche erlaubt), z.B. (\d+)#to##$1)
[header] - Ein HTML Schnippsel der der Ergebnisseite als Kopf zur Anzeige hinzu gefügt wird (um individuell Angezeigt zu werden).
[footer] - Ein HTML Schnippsel der der Ergebnisseite als Fuss zur Anzeige hinzu gefügt wird (um individuell Angezeigt zu werden).
[agent] - Eine ID-Zeichenkette, die TranslateIt!! veranlasst sich als IE, Firefox, Safari, Opera oder jeden anderen Webbrowser aus zu geben.
[ref] - Einige Dienste überprüfen unter umständen die Bezugnehmenden-Seiten. Diese Sektion wird dazu benutzt, eine gefälschte Bezugs-URL zu definieren.
[synchronize] - Eine alphabetische Zeichenkette (NUR Latin Zeichen) die als interner Profilname für die automatische Aktualisierung von unsererm Server benutzt wird.
[version] - Profil Versions Nummer
[group] - Sprachgruppe(n) (Definiert als lang1-lang2 oder einfach lang1 (in Englisch); mehrere alternative Gruppen sind pro Zeile erlaubt)
Regel Verarbeitungs-Algorithmus. Maximale Anzahl der Sektionen
Nach Erhalt einer Antwort eines x-beliebigen Servers wird die Roh-HTML-Seite "normalisiert": Nicht-Standard-Zeilenumbrüche (\r\n, \n\r, \r) werden ersetzt durch \n und der Regeltext wird normalisiert für die Verarbeitung. Der Analyzer trennt die Sektionen und verarbeitet diese dann in der folgenden Reihenfolge:
not-found+/not-found - Mehrere Abschnitte zulässig; wenn mindestens eine der Abschnitte dieser Art "funktioniert", die Verarbeitung wird mit einer leeren Zeichenkette als Ergebnis beendet.
Style-Definitionen werden von der Seite Quelle kopiert (Die "Style" Sektion und Verweise zu externen CSS Dateien.)
begin+/begin - Mehrere Abschnitte zulässig; wenn es nicht möglich ist, den Anfang der Seite zu entfernen, wird es unmodifiziert für die weitere Verarbeitung weitergeleitet.
end+/end - Mehrere Abschnitte zulässig; wenn es nicht möglich ist, den Anfang der Seite zu entfernen, wird es unmodifiziert für die weitere Verarbeitung weitergeleitet.
Gesammelte Stile werden zurück geschrieben in die Kopfzeile. (Normalerweise extrahieren begin(+) Sektionen den Code in solcher Weise, dass keine doppelten Stile übrig bleiben (diese werden während der Extraktion entfernt), wenn trotzdem einige doppelte Stile übrig bleiben, sollte dies KEIN Problem darstellen.)
internal-fix - Eine Utility-Funktion um in den Ergebnis-Quellseiten die href-Links mit absoluten Pfaden zu den Ressourcen zu ersetzen.
fix - Mehrere Abschnitte sind; eine Funktion die eine Feinabstimmung der Ergebnisseite durchführt.
header and footer - Nur eine Instanz in jeder Sektion erlaubt
profile, url, post, encoding, agent, ref, synchronize, version, group - Nur eine Instanz in jeder Sektion erlaubt
Bitte in der Liste der vordefinierten Profile für Beispiele von Dienstregeln nachschauen.
Eigenen Profile können
werden und wir werden Sie zu unserer Liste der vordefinierten Profile hinzu fügen.
|
|
|
|
|
|
Statistiken
|
|
|
|
|
|