Die Illusion von maschinellen Übersetzungen

(Da glaubt man sich nach Ablauf der obligatorischen Schulpflicht von
aller Grammatik befreit und kaum hockt man 5 Jahre später in einer Vorlesung über maschinelle Textverarbeitung wird man damit wieder konfrontiert.)

Was ich nicht wusste: Maschinelle Übersetzung gilt als eine der ersten Computeranwendungen überhaupt. Man dachte in den 50er Jahren dass wenn Kleinkinder Sprachen erlernen können, dies für eine Maschine kein grösseres Problem darstellen sollte. Auch wenn automatisierte Rumpf-Übersetzungen schon seit dem 2. Weltkrieg gute Dienste leisten konnten, machte sich schnell Ernüchterung breit.

Heutzutage ist man trotz Fortschritten noch weit von einer generellen automatischen Übersetzung entfernt. Das einzige oft zititierte Beispiel funktioniernder Automatisation sind Wettervorhersagen mit streng limitierter Vokabular- und Phrasensammlung. Die Systeme funktionieren generell besser je technischer die Quelltexte sind.

Ein einfaches Testverfahren um die Qualität von Übersetzungen zu testen sind übrigens Nebensätze: Kaum ein System erkennt diese zuverlässig oder schafft es die grammatikalischen Strukturen überhaupt zu erkennen.

Desweiteren können Maschinen bei der Übersetzung den kulturellen Kontext (D.h. Redewendungen, bekannte Fakten die nicht explizit erwähnt sind usw.) nicht benutzen und haben somit keine Chance bei umgangssprachlichen oder belletristischen Texten.

Das Gebiet bleibt dennoch ein beliebtes Forschungsfeld: Der Markt ist riesig. Alleine die EU muss all ihre öffentlichen Dokumente in sämtliche Sprachen ihrer Mitgliedsstaaten übersetzen (Derzeit ca. 25 verschiedene). Der Bedarf an Übersetzungen hat in den letzen Jahren so weit zugenommen, dass weltweit ein Mangel an menschlichen Experten besteht.

Weiterführende Literatur:

Herrliche Middleware: iPhotoToGallery

Ich kann nicht ganz immer nachvollziehen warum sich Softwarehersteller so dagegen wehren ihre Systeme zu öffnen. Durch Middleware werden viele Anwendungen erst recht interessant. Opensource-Programmieren haben das schon längst begriffen.

Hier mein Lieblingsstück Middleware für den Moment: Man nehme Apples iPhoto (Dessen HTML-Export mehr als zu wüschen übrig lässt, zumindest in der Version 4) sowie die populäre Online-Galerie Gallery und verknüpfe die beiden bequem mit dem Plugin iPhotoToGallery.

Kreativer Umgang mit Technologie: Festplatten-Bewegungssensor

Ich bin immer wieder überrascht wie kreativ neue Technologien plötzlich eingesetzt werden. Findige Enthusiasten finden neuartige Anwendungsmöglichkeiten die den Designern nicht im Traum eingefallen wären. Prominente Beispiele sind Sonys Aibo oder die Lego Mindstorms.

Neuester Zugang: Der Beschleunigungssensor in den neuen Festplatten der Apple Powerbooks wird ausgewertet um die Position des Powerbooks im Raum zu bestimmen.

Auf Kernelthread.com gibt es den Original-Hackbericht und auf Interconnected.org findet sich die erste Anwendung: Eine iTunes-Steuerung…

Du magst das aktuelle Lied nicht? Ein Schlag auf die Seite et voilà, der nächste Track ertönt.

Via habi.gna.ch und fscklog.com

Link zum Wochenende: Anti-Telefonmarketing-Skript

Telefonmarketing ist störend, das wissen nicht nur Blogger sondern auch Bundesräte (Obwohl letzterer da etwas zu verwechseln scheint.).

Die holländische EGBG (Fragt mich nicht was das heisst…) hat ein Anti-Telefonmarketing-Skript zum ausdrucken & ausfüllen herausgegeben. Es ist grundsätzlich eine Anleitung um einen Anrufer in ein Gespräch zu verwickeln in dem er mehr Informationen preisgeben muss als der Angerufene. Und damit auch seine wichtigste Ressource verschwenden muss: Zeit.

Neue Suchdialoge braucht das Land

Wer schon einmal unter Windows und unter Mac OS X nach Dateien gesucht hat, weiss wie ein intelligent gestalteter Suchdialog die Arbeit vereinfacht, bzw. diese Funktionalität erst zum brauchbar macht. Das haben nicht zuletzt Google und Yahoo mit ihren Desktop-Suchmaschinen begriffen.

Einen neuen Ansatz für Bildersuchmaschinen bietet Fliker: Anstatt Bilder über eine ganze Seite zu zerstreuen, sieht man sie alle an einem Ort. Etwas gewöhnungsbedürftig ist dass die Suche gleich bereits während des Eintippens des Suchbegriffs startet. (Eine Suche nach Zeitung wird zuerst Bilder zum Thema Zeit liefern.)

Via We-Make-Money-Not-Art.com