Etwa drei Millionen Webseiten im Internet sind in thailändischer Sprache geschrieben. Die Zahl der englischsprachigen Webseiten hingegen liegt irgendwo in der Dimension von Milliarden. Thailänder, welche die englische Sprache nicht beherrschen müssen, sich mit einem Bruchteil des im Internet verfügbaren Wissen zufrieden geben. Asia Online, ein neuer Dienst, will dies radikal ändern. Das englischsprachige Internet wird in die thailändische Sprache übersetzt.
Englisch wird heutzutage als Pflichtsprache in wahrscheinlich jeder thailändischen Schule vermittelt. Und natürlich während des Studiums. Dennoch ist es häfug schwierig sich mit einem studierten Menschen in Englisch zu unterhalten. Das Problem ist dann häufig die fehlende Möglichkeit, das erworbene Wissen umzusetzen und zu trainieren.
In Deutschland wächst man zwangsläufig mit englsichsprachiger Musik auf. Bereits in der Jugend wächst das Interesse die Texte zu verstehen. Ähnliche Möglichkeiten gibt es in Thailand derzeit kaum. Über thailändischen Radiostationen gibt es soweit ich das beurteilen kann, strikt thailändische Musik. Terristisches Radio und Fernsehen in Thailand kennt keine englsichsprachigen Sender. Satellit kommt für viele aus Kostengründen nicht in Frage.
Internet gibt es flächendeckend in ganz Thailand. Dennoch ist Internet längst kein Volksmedium geworden. Preiswertes Internet ist häufig von geringer Qualität und verdirbt die Laune am Internet. Schnelles Internet ist relativ teuer und vor allem in Ballungsgebieten verfügbar. Hinzu kommt die beschränkte Anzahl von Informationen, die in thailändischer Sprache verfügbar sind. An diesem Punkt setzt Asia Online an. Das englischsprachige Internet soll in die thailändische Sprache übertragen werden. Das ist kein leichtes Unterfangen, denn Thailändisch unterscheidet sich erheblich von der englischen Sprache.
Die Aufgabe kann wegen ihres Umfanges nur maschinenbasiert gelöst werden. Asia Online setzt auf statistische Übersetzungsmethoden. Konventionelle Übersetzung basiert auf strengen Regeln, die der Sprache zugeordnet sind. Die statistische Übersetzung setzt auf mathematische Lernmethoden. Mit mathematischer Wahrscheinlichkeit ensteht die Übersetzung. Das Prinzip wurde in den 80’er Jahrem von IBM entwickelt und wird heute u.a. von Google angewandt. Die Google Sprachtools decken bereits einige wichtige Sprachen ab. Thailändisch ist jedoch nicht dabei. Thailändisch ist eine der schwierigsten, maschinell zu übersetzenden Sprachen.
Mit steigender Anzahl übersetzter Dokumente steigt die Qualität der Übersetzungen. Asia Online veröffentlicht den Qualitätsindex tagesaktuell auf der Startseite. Hat der Qualitätsindex der Übersetzungen 65% erreicht, sollen die Übersetzungen für Heimarbeit und Studium tauglich sein. Heute steht der Index auf 56,04 %. Asia Online bittet seine Besucher, an der Übersetzung von Dokumenten mitzuwirken. Da die Qualität menschlicher Übersetzungen wesentlich besser ist als die Maschinenübersetzung wird das System sehr schnell lernen und die Qualität der Übersetzungen erhöhen. Fehler wiederholt das System nicht, sobald es aus dem Fehler gelernt hat. Etwa 10 Millionen überstzte Sätze sollen genügen um excellente Übersetzungsergebnisse zu erzielen.
In Thailand will Asia Online gerne die Marktführerschaft für den Zugriff auf Informationen übernehmen. Die Übersetzung der Wikipedia wird allein mehr Webseiten ergeben, als Südostasien derzeit an Internetseiten bietet.
Innerhalb von 12 Monaten sollen fast 100 Millionen Webseiten übersetzt werden.
Zunächst werden Inhalte in die thailändische Sprache übersetzt werden. Später ist die Übersetzung in andere südostasiatische Sprachen geplant.
Noch im 3. Quartal 2008 ist der Start des Portals für Malaysia und Indonesien geplant. Innerhalb der nächsten 18 Monate will der Dienst für Asien insgesamt verfügbar sein. Neben konventionellen Webseiten sollen auch e-Mails, Chats, Blogs und andere Online Services übersetzt werden.
Die Übersetzungssoftware wird Asia Online u.a. für die Nutzung durch Übersetzungsbüros kommerziell lizensieren. Die Software kann in Content Management Systeme (CMS) integriert werden. Der Service wird von Firmen auf Anforderung eingesetzt und verringert so die Kosten für maschinenbasierte Übersetzungen.
In einer Pressemitteilung vom 5. Juni 2008 erklärte Asia Online, zum Start des Dienstes 203 Sprachpaare anzubieten. Darunter zahlreiche europäische Sprachen. Bis zum Ende des Jahres 2008 soll die Zahl auf 408 Sprachpaare steigen, basierend auf den Anforderungen der Kunden. Derzeit werden u.a diese Sprachen von der kommerziellen Übersetzungsplattform bedient:
Arabisch, Bulgarisch, Chinesisch, Dänisch, Deutsch, Englisch, Estonisch, Finnisch, Französisch, Griechisch, Hindu, Ungarisch, Irisch, Italienisch, Lettisch, Littauisch, Maltesisch, Niederländisch, Polnisch, Portugiesisch, Romänisch, Slowakisch, Slowenisch, Spanisch, Schwedisch, Thai, Tschechisch.
Asia Online argumentiert, kein andere Anbieter maschinenbasierter Übersetzungssoftware biete mehr als 200 Sprachpaare.