Zeerak Ahmed hat jahrelang in den USA für einige der größten Tech-Unternehmen der Welt gearbeitet. Aber eine Sache, die ihn frustriert hat, ist, wie “Computing nicht-lateinische Sprachen als Bürger zweiter Klasse behandelt”. Eine solche Sprache ist seine Muttersprache Urdu, die Nationalsprache und Lingua franca Pakistans, die auch in Indien weit verbreitet ist. Ahmed, der aus Lahore stammt, hat viele Gespräche mit seinen Freunden und seiner Familie über die Schwierigkeiten geführt, existierende Urdu-Tastaturen zu verwenden oder Urdu-Texte zu lesen. Und er hat beobachtet, wie viele junge Leute stattdessen auf Englisch oder sogenanntes Roman Urdu zurückgreifen und die lateinische Schrift verwenden, um eine phonetische Transliteration zu erzeugen, in Ermangelung einer besseren Lösung.
Während er seinen Master-Abschluss in Engineering Design an der Harvard University machte, fand er seine eigene Lösung. Nach fünf Jahren Arbeit an dem Projekt startete er im vergangenen Jahr die iOS-App Matnsaz. Die App bietet den Nutzern eine raffiniertere Urdu-Tastatur, die Buchstaben nach Form gruppiert, autocorrects und sogar nachfolgende Wörter vorschlägt. Es ist eine deutliche Verbesserung gegenüber den Standard-Urdu-Tastaturen, die auf Mainstream-Geräten verfügbar sind.
Obwohl es sich um die 10. meistgesprochene Sprache der Welt handelt, laut dem Referenzwerk Ethnologue, ist Urdu im digitalen Zeitalter aufgrund mehrerer Einschränkungen zurückgeblieben. Viele Pakistaner außerhalb der Tech-Branche glauben, dass Urdu-Text mit Computing unvereinbar ist, sagt Ahmed. Aber er argumentiert, dass dies ein Mangel des Computings und nicht der Sprache ist. Es läuft eine Anstrengung, um die Erzählung zu ändern.
Die Herausforderungen der Urdu-Schrift
“Wir leben in einer textgesättigten Gesellschaft, so dass die Exposition der jüngeren Generationen gegenüber typografischer Komplexität sehr hoch ist”, sagt die Grafikdesignerin und Webentwicklerin Abeera Kamran. “Sie erwarten anspruchsvolle Ergebnisse.” Was auf Urdu verfügbar ist, erfüllt diese Erwartungen oft nicht, weil sich Schriftsteller aufgrund der Komplexität der geschriebenen Form der Sprache lange Zeit einer Digitalisierung widersetzt haben. (Urdu verwendet die Nastaliq-Schrift, eine verzierte und fließende Variation der arabischen Schrift, die besonders komplex ist, weil die Form eines jeden Buchstaben vom folgenden Buchstaben abhängt.) Das bedeutet jetzt, dass es sehr wenig digitale Inhalte in Urdu gibt, die mit dem konkurrieren können, an das die Nutzer bei lateinischen Schriften gewöhnt sind. Roman Urdu wird online oft als Ersatz verwendet. Frühere Versuche, die Urdu-Schrift zu digitalisieren, stützten sich auf die Naskh-arabische Schrift, die geradliniger und daher leichter zu codieren ist. Aber einige haben argumentiert, dass die Naskh-Schrift der Nastaliq-Schrift unterlegen ist, wenn sie verwendet wird, um die Urdu-Sprache schriftlich auszudrücken. Da unser Leben immer abhängiger von digitalen Informationen und Kommunikation wird, machen sich einige Sorgen, dass das Fehlen einer zugänglichen digitalen Version der wahren schriftlichen Form der Sprache dazu führen könnte, dass Urdu für jüngere Generationen, die mehr Zeit online als ihre Älteren verbringen, irrelevant wird.
“Es gibt diesen Glauben, dass man Urdu nicht für moderne Zwecke verwenden kann, und das macht es für die Sprache schwierig, sich weiterzuentwickeln und für junge Menschen relevant zu bleiben”, sagt Ahmed.
Ahmed und Kamran gehören zu denen, die an vorderster Front daran arbeiten, dies zu verhindern. Die Matnsaz App ist Teil einer größeren Initiative gleichen Namens, die darauf abzielt, Verbraucher- und Entwicklertools für Urdu online zu entwickeln. Derzeit umfasst Ahmeds Arbeit Makhzan, ein offenes Urdu-Textkorpus, und Naqqash, eine Zeichenfolgenverarbeitungsbibliothek für arabische Schrift.
Ahmed sagt, er habe jahrelang mit der Idee gespielt, bevor er 2017 ernsthaft damit begann. “In Europa nutzen die meisten Menschen Computer in ihren Muttersprachen, aber in Pakistan tun wir das nicht”, sagt er. “Wenn Sie mit Pakistanern außerhalb der Tech-Branche sprechen, glauben sie, dass Sie keine moderne Computertechnik auf Urdu anwenden können.” Ahmed glaubt, dass Urdu genauso leicht in der Computertechnik verwendet werden könnte, wenn ihm die gleiche Bedeutung beigemessen würde wie lateinischen Schriften und wenn Tools entwickelt würden, um es zu unterstützen. Diese Idee wurde zur Grundlage für Matnsaz, weil so viel Fortschritt in Urdu einfach dadurch behindert wurde, dass die grundlegenden Bausteine nicht vorhanden waren, sagt er.
Urdu wird von etwa 230 Millionen Menschen weltweit gesprochen – hauptsächlich in Pakistan und Indien sowie in Diaspora-Gemeinschaften auf der ganzen Welt. Während es einzelne Versuche gab, die Sprache zu digitalisieren, müssen zwischen den verschiedenen Bemühungen noch Lücken geschlossen werden, um globalen Einfluss zu haben, sagt Kamran. Sie weist darauf hin, dass die Einführung typografischen Drucks in Urdu erst spät im 20. Jahrhundert erfolgte, aufgrund der Komplexität der Nastaliq-Schrift und des mangelnden Interesses der pakistanischen Gesellschaft an Naskh als Alternative. Davor wurden Zeitungen und Bücher handschriftlich verfasst und dann vervielfältigt, um bei Bedarf mehrere Kopien anzufertigen.
Kulturelle Komplexität
Pakistan hat eine langjährige kulturelle Bindung an Nastaliq und insbesondere Lahori Nastaliq – den Stil, in dem Urdu geschrieben wird – der mit bestehenden Datensätzen komplex zu codieren sein kann, sagt Kamran. Die kulturellen Assoziationen mit der Sprache sind bei den Bemühungen um die Digitalisierung von Urdu ebenfalls wichtig zu verstehen und zu berücksichtigen, fügt sie hinzu. “Ich habe erkannt, dass wir nichts davon tun können, ohne eine kulturelle Abrechnung damit, wie Urdu und Nastaliq ideologisch miteinander verbunden sind.”
Die sozio-politischen Kämpfe Pakistans und der Versuch, eine muslimisch-pakistanische nationale Identität zu schaffen, haben zu Widerstand gegen bestimmte Veränderungen geführt, die als westlich oder fremd beeinflusste Entwicklungen angesehen werden, sagt Kamran. Urdu ist mit der pakistanischen Identität verflochten und ist die offizielle Sprache des Landes, obwohl dort eine Reihe anderer Sprachen gesprochen werden. Im vor der Teilung liegenden Indien nutzten Urdu-Sprecher die Sprache als Mittel, um sich gegen die britische Kolonialisierung aufzulehnen. Heute bleibt sie ein Streitpunkt in Indien, wo sie immer noch von Millionen von Menschen gesprochen wird, aber bedroht ist. Obwohl Urdu nicht ausschließlich von Muslimen gesprochen wird, ist sie eng mit der Ausübung des Glaubens in der Region verbunden. “Wenn es um Lahori Nastaliq geht, denken wir sowohl an Pakistaner als auch an muslimische Identität zusammen, und deswegen haben wir Widerstand gegen Veränderungen geleistet”, sagt Kamran.
Diese Verbindung ist es, die Zeeshan Nasar und seinen Vater Nasrullah Mehr dazu veranlasste, MehrType zu gründen, eine digitale Schriftgießerei, die sich auf maßgeschneiderte Urdu-, Arabisch- und Persisch-Schriften konzentriert. Mehr, ein gefeierter Kalligraph in Pakistan, arbeitet in der Lahori Nastaliq-Schrift. Für ihn waren die verfügbaren ligaturbasierten Tastaturen – die für Skripte wie Arabisch und Nastaliq eine Flexibilität beim Tippen ermöglichen, indem sie sich an sich ändernde Buchstabenstile anpassen, je nachdem, was getippt wird – einfach nicht genug. Nasar bezeichnet ligaturbasierte Ansätze für Urdu als eine “Jugad”, ein Urdu-Begriff für eine provisorische Lösung. “Bei ligaturbasierten Schriften, wenn Sie ein neues Wort in die Tastatur eingeben und sie es nicht erkennt, zerlegt sie es und ruiniert das Wort und den Stil der Buchstaben”, sagt Nasar.
Aus diesem Grund konzentrierte sich MehrType auf die Erstellung von characterbasierten leichtgewichtigen Schriften, die sich gut für die Webeinbettung eignen. Nasar sagt, dass eine zu große Datei zu lange braucht, um bei Einbettung in einen Link zu funktionieren, und Websites verlangsamen kann. Das Team testet derzeit ein neues Einstellungstool, das ihren Schriften nicht nur eine bessere Online-Sicherheit verleihen, sondern auch Typografiefunktionen beinhalten wird. In der