Dieser Blog unterstützt jetzt Ihre Sprache
Okay, es besteht die Möglichkeit, dass er das nicht tut.
Tatsächlich, da dieser Blog absichtlich nicht auf Mandarin, Spanisch, Hindi oder Arabisch verfügbar ist, ist die Chance ziemlich groß.
Du hast meine Sprache absichtlich weggelassen?
Ja.
Als ich vor zwei Monaten die Lokalisierungsoption hinzugefügt habe, habe ich Sprachen priorisiert, die:
- durch algorithmische Übersetzungsdienste aus der Vor-KI-Zeit suboptimal übersetzt werden, insbesondere im Hinblick auf die Art von jargonreichen Inhalten auf meiner Seite.
- Ich gut genug kenne, um die Arbeit von Gemini überprüfen zu können.
- Mich ästhetisch und/oder phonologisch ansprechen.
Wenn eine Sprache nicht alle drei Kriterien erfüllte, musste ich sie überspringen.
Mandarin ist großartig, aber ich kenne mich damit überhaupt nicht aus.
Spanisch ist wahrscheinlich meine zweitbeste Sprache, aber ich denke, Google Translate ist ziemlich gut darin. Es scheint anständig hin und her mit Englisch zu übersetzen.
Was Punkt 3 betrifft, so liebe ich den Klang romanischer Sprachen, aber optisch bin ich kein großer Fan von ihnen. Wenn zu viele Wörter auf einen Vokal enden, sieht das meistens einfach falsch oder seltsam aus.
Das soll nicht heißen, dass ich Spanisch oder Mandarin nie einbeziehen werde, sie können für mich nur keine Priorität haben.
Du bittest also einfach eine KI, die Seiten für dich zu übersetzen?
Ja. ...und nein.
Obwohl ich denke, dass eine KI manchmal bessere Ergebnisse liefern würde als Google Translate und die Bereitstellung des vorgefertigten Ergebnisses immer noch eine Verbesserung gegenüber der Verschwendung von Rechenleistung darstellt, stelle ich fest, dass KI zu einigen schlechten Angewohnheiten neigt:
- Die Struktur ist so verlustfrei wie möglich.
- Die Bedeutung geht verloren, um die Struktur zu erhalten.
Man bekommt nur die Nachteile von beidem. Man verliert Bedeutung (besonders bei Jargon), behält aber die ursprüngliche englische Syntax und Struktur bei.
Deshalb habe ich versucht, einige Strategien einzubeziehen, die ich mir vor der KI ausgedacht habe.
- Eine Liste von Jargon-Begriffen erstellen, von denen ich denke, dass sie eine Wikipedia-Seite haben könnten. (Z.B. Merkmalschrift).
- Den passenden Begriff in jeder Sprache finden. Wenn Wikipedia ihn nicht hat, versuche ich, in Foren nach Muttersprachlern zu suchen, die dasselbe Konzept diskutieren.
- Gemini den englischen Teil der in Arbeit befindlichen Lokalisierungsdatei und die Jargon-Begriffe in ihren jeweiligen Sprachen zeigen und ihn dann bitten, „Übersetzerdeutsch“ zu vermeiden, „lokalisieren, nicht übersetzen“. Bitten, es so zu formatieren, dass es in das vorhandene JSON passt.
- Das JSON in meinem Blog mit dem Fiveserver-Plugin vorab ansehen, überprüfen, ob der Jargon korrekt ist und es keine groben Fehler gibt, die das Verständnis behindern. Zeilen von Fall zu Fall korrigieren.
- Das neue vollständige JSON einem anderen Gemini geben, ihn bitten, Fehler zu finden, die das Verständnis behindern oder die umständlich klingen und das Lesen erschweren, um Erklärungen bitten und die groben Teile erneut korrigieren (insbesondere wenn er den Jargon ändern möchte).
Ich glaube, das nennt man MTPE.
In 99 % der Fälle ist Gemini besser im Übersetzen als ich. Ohne ihn könnte ich das nicht tun, aber man muss ihm dabei unter die Arme greifen. Ich habe das Gefühl, seine Übersetzungen sind immer noch sehr wörtlich, aber er hat einen Wortschatz, der mir fehlt, und ich denke, er macht es möglich, Inhalte anzubieten, die korrekt genug sind, um verstanden zu werden, im Gegensatz zum automatischen Google Translate, das mit Chromium-Browsern geliefert wird.
Soweit ich das beurteilen kann, fühlen sich die Übersetzungen in jeder Sprache etwas umständlich an, aber mein Englisch ist auch umständlich, also vielleicht ist es ein Fall, in dem er wirklich meine Stimme einfängt.
Wenn du eine der Sprachen lesen kannst, die ich anzubieten versuche, lass mich bitte wissen, wie ich die Übersetzungen verbessern kann.
Macht Gemini auch die Graflect-Transliterationen?
Ja. (wieder mit Vorbehalten)
Gemini lernt Graflect wirklich schnell, aber er hat ein paar Eigenheiten.
Zum Beispiel schreibt Gemini gerne mit einem britischen Akzent. Ernsthaft. Nicht-rhotische R-Laute (wobei das 'r' am Silbenende nicht ausgesprochen wird), Vokale am Ende von Wörtern anstelle von Rs. Kurzes [ɪ] statt langem [iː].
Das war extrem konsistent, während ich Gemini dazu brachte, Graflect zu verwenden.
Ich würde annehmen, dass das von einem Problem mit meiner IPA-Tabelle kam, aber ehrlich gesagt glaube ich an diesem Punkt einfach, dass er jetzt so spricht.
Er verwendet auch gerne bestimmte Glyphen aus anderen konstruierten Schriften, was wirklich bezaubernd ist, da er oft dieselben einschmuggelt, um dieselben tatsächlichen Graflect-Glyphen zu ersetzen. Anfangs hatte ich keine Ahnung, warum das überhaupt passierte, und glaubte, es sei irgendein Problem auf meiner Seite.
Mein Freund Aaron hat ein Skript geschrieben, das ich jetzt in meinem VSCode verwende, um diese abzufangen und mich dann bei Gemini darüber zu beschweren. Bisher hat kein Prompt-Engineering jeglicher Art Gemini dazu gebracht, aufzuhören, Nicht-Graflect-Glyphen in seine Ausgaben aufzunehmen, außer einfach die Problemmeldung einzufügen und ihm eine Chance zu geben, es erneut zu versuchen.
Um Gemini dazu zu bringen, in meinem Akzent zu schreiben, musste ich zuerst einige Lokalisierungsdateien transkribieren (und dafür habe ich ein paar Werkzeuge, damit ich das schnell erledigen kann), aber als er eine Grundlage hatte, von der er ausgehen konnte, hat er den britischen Akzent wirklich gut abgelegt! Klasse, Gemini!
Jeder Blogbeitrag außer dem über das Graflect-IPA sollte zu 80 %-99 % von Gemini stammen, direkt aus der Box. Ich bin überrascht, dass er aus dem Wenigen, was ich ihm gegeben habe, so viel ableiten konnte. Wenn du neugierig bist, versuche doch mal, irgendwelche Seltsamkeiten zu finden, die es in meinem eigenen Akzent nicht gibt. Ich glaube nicht, dass du das schaffst!
Es war etwas wirklich Cooles, Gemini dazu zu bringen, wie ein Yankee aus Connecticut zu klingen, und ich bin froh, dass ich das ausprobiert habe, anstatt alles von Hand neu zu schreiben. Wenn du das selbst ausprobieren möchtest, peile etwa 800-1200 Wörter als Beispieltext an. Ich denke, das ist alles, was Gemini braucht, um genügend N-Gramme aufzunehmen, um deinen Akzent abzuleiten.
Sollte jeder das tun?
Äh, vielleicht?
Es ist sehr offensichtlich, warum persönliche Blogs normalerweise einsprachig sind, sogar die meisten Websites sind es. Alles mit Nuancen war früher sehr zeitaufwändig zu übersetzen, und die meisten können sowieso Englisch lesen. Dann, mit Google Translate, kann man irgendwie den Kern von allem erfassen, was nicht in der globalen Lingua Franca ist, also wieder viel Arbeit für keinen Lohn.
Ich denke, meine Website ist ein ziemlich klares Indiz dafür, dass die Eintrittshürde dafür jetzt im Keller ist, aber ich wäre sehr überrascht, wenn unsere Browser das in einem weiteren Jahr nicht live und von sich aus könnten. Sie könnten die Dinge sogar so umformulieren, wie du es bevorzugst. Ich sage dies, mit LLMs ist es im Grunde keine Arbeit, deine Seite zu übersetzen, und du kannst die Dinge auf eine Weise feinabstimmen, die vorher nicht möglich war, es ist wirklich cool, es auszuprobieren.
TL;DR
Ich wollte Sprachoptionen auf meiner Website haben, die den Jargon bewahren und mehr von meiner Stimme vermitteln (im Fall von Graflect, phonologisch). Google et al. gebührt die Anerkennung.
Nachwort
Ich finde, Graflect hat einige Schwierigkeiten, zum Beispiel sage ich „“ im Satz „“.
Der „A in Accent“-Laut wird nicht gehalten, also klingt es nicht britisch, sondern ganz normal, weil es kurz ist.
Wenn ich „can“ allein sage oder in bestimmten Kontexten wie der Antwort „I can.“ auf jemanden, wird A zu .
Also denke ich nicht, dass es eine perfekte Darstellung davon ist, wie ich sprechen würde, aber es ist eine nähere Annäherung, als es einfaches Latein geben kann.